ES2902044T3 - Variantes de promotor - Google Patents

Variantes de promotor Download PDF

Info

Publication number
ES2902044T3
ES2902044T3 ES16751266T ES16751266T ES2902044T3 ES 2902044 T3 ES2902044 T3 ES 2902044T3 ES 16751266 T ES16751266 T ES 16751266T ES 16751266 T ES16751266 T ES 16751266T ES 2902044 T3 ES2902044 T3 ES 2902044T3
Authority
ES
Spain
Prior art keywords
promoter
seq
poi
sequence
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16751266T
Other languages
English (en)
Inventor
Diethard Mattanovich
Brigitte Gasser
Roland Prielhofer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lonza AG
Original Assignee
Lonza AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lonza AG filed Critical Lonza AG
Application granted granted Critical
Publication of ES2902044T3 publication Critical patent/ES2902044T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/16Yeasts; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/001Vector systems having a special element relevant for transcription controllable enhancer/promoter combination

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mycology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Botany (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

Un promotor pG1-x aislado y/o artificial, que es una variante funcional del promotor pG1 regulable por fuente de carbono de Pichia pastoris identificado por SEQ ID 1, cuyo promotor pG1-x consiste en, o comprende, al menos una parte de SEQ ID 1, cuya parte de SEQ ID 1 tiene una longitud de al menos 293 pb, cuyo promotor pG1-x comprende las siguientes regiones promotoras a) al menos dos copias de una región promotora reguladora central, cuya región promotora reguladora central comprende las secuencias de nucleótidos de SEQ ID 2 y SEQ ID 3, en donde SEQ ID 2 y/o SEQ ID 3 comprenden uno o más sitios de unión al factor de transcripción (TFBS); y b) una región promotora reguladora no central, que es cualquier región dentro de la secuencia promotora de pG1- x distinta de la región reguladora central; en donde el promotor pG1-x tiene una identidad de secuencia con la región correspondiente de SEQ ID 1, que es al menos 80% con SEQ ID 2 y SEQ ID 3, y al menos 50% en cualquier región distinta de SEQ ID 2 o SEQ ID 3; y adicionalmente en donde el promotor pG1-x está caracterizado por un aumento de la fuerza del promotor y/o la razón de inducción en comparación con el promotor pG1, en donde - la fuerza del promotor aumenta al menos 1,1 veces en el estado inducido en comparación con el promotor pG1, y/o - la razón de inducción aumenta al menos 1,1 veces en comparación con el promotor pG1.

Description

DESCRIPCIÓN
Variantes de promotor
Campo técnico
La invención se refiere a un promotor artificial aislado, que es una variante o derivado funcional del promotor pG1 regulable por fuente de carbono de Pichia pastoris identificado por SEQ ID 1, cuyo promotor se denomina en el presente documento pG1-x que se caracteriza por elementos y rasgos específicos del promotor.
Antecedentes
La levadura metilotrófica Pichia pastoris (sin. Komagataella sp.) es un anfitrión de producción de proteínas bien establecido. Numerosos enfoques de ingeniería de cepas para P. pastoris han mejorado la productividad de diversos productos y también se han dedicado esfuerzos a los promotores con fines productivos (Prielhofer, R., M. Maurer, J. Klein, J. Wenger, C. Kiziak, B. Gasser y D. Mattanovich, (2013) Induction without methanol: novel regulated promoters enable high-level expression in Pichia pastoris. Microb Cell Fact 12: 5). Los promotores génicos son rasgos clave para la expresión de un gen de interés (GOI): la transcripción del ARN de un GOI aguas abajo (3') está dirigida por la secuencia promotora aguas arriba (5'). La ARN polimerasa II (RNAPII) es responsable de la transcripción del ARNm en eucariotas. Los promotores de RNAPII consisten en un promotor central y varios elementos de ADN que actúan en cis: promotor proximal, potenciadores, silenciadores y elementos limítrofes/aislantes. Los promotores centrales de levadura se encuentran típicamente cerca (-75/+50 pb) del sitio principal de inicio de la transcripción, con frecuencia contienen recuadros TATA inadecuadas (hasta 2 bases de diferencia con la secuencia consenso TATA) y carecen de elementos promotores que se encuentran típicamente en otros organismos. La regulación transcripcional responde a diferentes condiciones y se lleva a cabo mediante elementos que actúan en cis y las proteínas reguladoras correspondientes (factores de transcripción (TF)).
Para aplicaciones biotecnológicas, se utilizan promotores que permiten la expresión génica constitutiva o regulada/inducible. Los procedimientos de producción que utilizan P. pastoris se aplican favorablemente a promotores dependientes de la fuente de carbono, tales como el Pa o x inducible por metanol. De ese modo, la fase de crecimiento se puede separar de la fase de producción de proteínas potencialmente difícil. Recientemente se informó sobre un conjunto de promotores (Prielhofer et al., 2013), que también está controlado por la fuente de carbono, pero no depende del metanol para su inducción: estos promotores comparten el rasgo de represión por exceso de glicerol e inducción por glucosa limitante. pG1 (SEQ ID 1), el más fuerte de estos promotores, se induce completamente por debajo de 0,05 g/L de glucosa; controla de forma nativa la expresión de un gen transportador de glucosa de alta afinidad GTH1. Las características de captación de glucosa dependen de la presencia de transportadores de glucosa de alta y baja afinidad. Diecisiete genes de transporte de hexosa (HXT) en S. cerevisiae (HXT1-17) se expresan en función de la concentración de glucosa, pero solo dos HXT homólogos se encuentran en P. pastoris (pAS_chr1-4_0570 y PAS_chr2-1_0054, denominados PpHxt1 y PpHxt2). Se identificó que PpHxt1 es el principal transportador de baja afinidad en P. pastoris, mientras que el transporte de glucosa de alta afinidad es facilitado por otros dos genes, a saber, PAS_chr3_0023 y PAS_chr1-3_0011 (GTH1, el gen controlado por pG1) Prielhofer et al., 2013).
Mientras que S. cerevisiae presenta una gran capacidad de absorción de glucosa y metabolismo de la glucosa (fermentativo), P. pastoris tiene una tasa de absorción de glucosa y un metabolismo respiratorio de la glucosa más bajos. Además, P. pastoris es capaz de absorber glucosa en concentraciones extracelulares mucho más bajas que S. cerevisiae (Km de transportadores de alta afinidad en el rango pM en P. pastoris frente al rango mM en S. cerevisiae). La diferencia fundamental en el comportamiento de absorción de glucosa también se muestra en el control transcripcional de genes relacionados y también se puede observar en las funciones evolucionadas de los reguladores transcripcionales p. ej. PpAft1 y PpMxr1 (homólogo de ScAdr1).
Los estudios de promotores de P. pastoris y la mutagénesis aleatoria de Pa o x 1 y del promotor de gliceraldehído-3-fosfato deshidrogenasa Pg a p dieron como resultado bibliotecas con variantes del promotor que poseían diferentes actividades, alteración del comportamiento de inducción en comparación con el promotor de tipo salvaje e identificación de varios sitios importantes de unión al factor de transcripción (TFBS) de Pa o x 1 (documento WO2006/089329 A2).
El promotor pG1 y sus fragmentos se describen con más detalle en el documento WO2013/050551 A1.
El documento WO2014067926A1 divulga la expresión de una proteína de interés empleando secuencias líder específicas. El líder se utilizó con varios promotores. Como promotor ilustrativo, se utiliza el promotor pG1.
Struhl K. (Proceedings of the National Academy of Sciences of the United States of America 1982, 78(7):4461-4465) describe el mapeo de deleciones de la región promotora his3 de levadura. Concluye que la caja T-A-T-A, una secuencia delante de la mayoría de los genes eucarióticos no es suficiente para la función del promotor de tipo salvaje y sugiere que el promotor de levadura parece ser más complejo que un simple sitio de interacción entre la ARN polimerasa y el ADN.
Quandt et al. (Nucleic Acids Research 1995, 23(23) 4878-4884) describen herramientas para la detección de coincidencias consenso en datos de secuencias de nucleótidos para identificar motivos reguladores basados en el análisis de datos de secuencias. Se creó una biblioteca de patrones consenso y se detectaron posibles coincidencias de secuencia utilizando una herramienta de soporte lógico (MatInspector).
Compendio de la invención
El objeto de la invención es proporcionar promotores regulables mejorados con respecto a la regulación de la fuente de carbono y la fuerza del promotor. Otro objeto es proporcionar tal promotor para una producción mejorada de POI y/o una producción de POI dentro de un período de tiempo reducido.
El objeto se resuelve por el tema en cuestión reivindicado.
De acuerdo con la invención, se proporciona un promotor pG1 -x aislado y/o artificial, que es una variante funcional del promotor pG1 regulable por fuente de carbono de Pichia pastoris identificado por SEQ ID 1, cuya parte de SEQ ID 1 tiene una longitud de al menos 293 pb, cuyo promotor pG1-x comprende las siguientes regiones promotoras:
a) al menos dos copias de una región reguladora central, cuya región promotora reguladora central comprende las secuencias de nucleótidos de SEQ ID 2 y SEQ ID 3, en donde SEQ ID 2 y/o SEQ ID 3 comprenden uno o más sitios de unión al factor de transcripción (TFBS); y
b) una región reguladora no central, que es cualquier región dentro de la secuencia promotora pG1-x distinta de la región reguladora central;
en donde el promotor pG1-x tiene una identidad de secuencia con la región correspondiente de SEQ ID 1, que es al menos 80% en SEQ ID 2 y SEQ ID 3, y al menos 50% en cualquier región distinta de SEQ ID 2 o SEQ ID 3; y adicionalmente en donde el promotor pG1-x se caracteriza por un aumento de la fuerza del promotor y/o la razón de inducción en comparación con el promotor pG1, en donde
- la fuerza del promotor aumenta al menos 1,1 veces en el estado inducido en comparación con el promotor pG1, y/o
- la razón de inducción aumenta al menos 1,1 veces en comparación con el promotor pG1.
Específicamente, el promotor pG1 de Pichia pastoris identificado por SEQ ID 1 es cualquiera de SEQ ID 7, 8 o 9, más específicamente SEQ ID 9 como se utiliza en el presente documento como referencia en los Ejemplos.
Específicamente, el promotor pG1-x no es ninguno de los promotores de la técnica anterior denominados pG1 (SEQ ID 264), ni pG1a (SEQ ID 265), pG1b (SEQ ID 266), pG1c (SEQ ID 267), pG1d (SEQ ID 268), pG1e (SEQ ID 269) o pG1f (SeQ ID 270), como se describe en el documento WO2013050551 A1.
Según una realización específica, el promotor pG1-x según la invención es un promotor regulable por fuente de carbono que se caracteriza por
- una fuerza del promotor al menos 1,1 veces, o al menos 1,2 veces, o al menos 1,3 veces, o al menos 1,4 veces, o al menos 1,5 veces, o al menos 1,6 veces, o al menos 1,7 veces, o al menos 1,8 veces, o al menos 1,9 veces, o al menos 2 veces, o al menos 2,1 veces, o al menos 2,2 veces, o al menos 2,3 veces, o al menos 2,4 veces, o al menos 2,5 veces, o al menos 2,6 veces, o al menos 2,7 veces, o al menos 2,8 veces mayor, o al menos 2,9 veces, o al menos 3 veces, o al menos 3,3 veces, o al menos 3,5 veces, o al menos 3,8 veces, o al menos 4 veces, o al menos 4,5 veces, o al menos 5 veces, o al menos 5,5 veces, o al menos 6 veces mayor en el estado inducido en comparación con el promotor pG1, y
- la capacidad de ser regulado por fuente de carbono determinada por una razón de inducción que es igual o superior en comparación con la razón de inducción conseguida con el promotor pG1.
Según una realización adicional específica, el promotor pG1-x según la invención es un promotor regulable por fuente de carbono que se caracteriza por
- la misma o mayor fuerza del promotor en el estado inducido en comparación con el promotor pG1, y
- la capacidad de ser regulado por fuente de carbono determinada por una razón de inducción que es al menos 1.1 veces, o al menos 1,2 veces, o al menos 1,3 veces, o al menos 1,4 veces, o al menos 1,5 veces, o al menos 1.6 veces, o al menos 1,7 veces, o al menos 1,8 veces, o al menos 1,9 veces, o al menos 2 veces, o al menos 2.1 veces, o al menos 2,2 veces, o al menos 2,3 veces, o al menos 2,4 veces, o al menos 2,5 veces, o al menos 2.6 veces, o al menos 2,7 veces, o al menos 2,8 veces mayor, o al menos 2,9 veces, o al menos 3 veces, o al menos 3,3 veces, o al menos 3,5 veces, o al menos 3,8 veces, o al menos 4 veces, o al menos 4,5 veces o al menos 5 veces, o al menos 5,5 veces, o al menos 6 veces mayor en comparación con la razón de inducción lograda con el promotor pG1.
Según una realización adicional específica, el promotor pG1-x según la invención es un promotor regulable por fuente de carbono que se caracteriza por
- una fuerza del promotor al menos 1,1 veces, o al menos 1,2 veces, o al menos 1,3 veces, o al menos 1,4 veces, o al menos 1,5 veces, o al menos 1,6 veces, o al menos 1,7 veces, o al menos 1,8 veces, o al menos 1,9 veces, o al menos 2 veces, o al menos 2,1 veces, o al menos 2,2 veces, o al menos 2,3 veces, o al menos 2,4 veces, o al menos 2,5 veces, o al menos 2,6 veces, o al menos 2,7 veces, o al menos 2,8 veces mayor, o al menos 2,9 veces, o al menos 3 veces, o al menos 3,3 veces, o al menos 3,5 veces, o al menos 3,8 veces, o al menos 4 veces, o al menos 4,5 veces, o al menos 5 veces, o al menos 5,5 veces, o al menos 6 veces mayor en el estado inducido en comparación con el promotor pG1, y
- la capacidad de ser regulado por fuente de carbono determinada por una razón de inducción que es al menos 1.1 veces, o al menos 1,2 veces, o al menos 1,3 veces, o al menos 1,4 veces, o al menos 1,5 veces, o al menos 1.6 veces, o al menos 1,7 veces, o al menos 1,8 veces, o al menos 1,9 veces, o al menos 2 veces, o al menos 2.1 veces, o al menos 2,2 veces, o al menos 2,3 veces, o al menos 2,4 veces, o al menos 2,5 veces, o al menos 2.6 veces, o al menos 2,7 veces, o al menos 2,8 veces mayor, o al menos 2,9 veces, o al menos 3 veces, o al menos 3,3 veces, o al menos 3,5 veces, o al menos 3,8 veces, o al menos 4 veces, o al menos 4,5 veces o al menos 5 veces, o al menos 5,5 veces, o al menos 6 veces mayor en comparación con la razón de inducción lograda con el promotor pG1.
Específicamente, la fuerza del promotor está determinada por el nivel de expresión de una proteína de interés (POI), tal como una proteína modelo (p. ej., Proteína Fluorescente Verde, GFP, que incluye, p. ej., GFP mejorada, eGFP, número de acceso Genbank U57607), y/o la tasa de transcripción, en comparación con el promotor pG1. La fuerza del promotor de pG1-x es específicamente al menos 1,2 veces, o al menos 1,3 veces, o al menos 1,4 veces, o 1,5 veces, o al menos 1,6 veces, o al menos 1,7 veces, o al menos 1,8 veces, o al menos 1,9 veces, o al menos 2 veces, o al menos 2,1 veces, o al menos 2,2 veces, o al menos 2,3 veces, o al menos 2,4 veces, o al menos 2,5 veces, o al menos 2,6 veces, o al menos 2,7 veces, o al menos 2,8 veces mayor, o al menos 2,9 veces, o al menos 3 veces, o al menos 3,5 veces, o al menos 4 veces, o al menos 4,5 veces, o al menos 5 veces, o al menos 5,5 veces, o al menos 6 veces, o al menos 6,5 veces, o al menos 7 veces, o al menos 7,5 veces, o al menos 8 veces, o al menos 8,5 veces, o al menos 9 veces, o al menos 9,5 veces, o al menos 10 veces mayor en comparación, por ejemplo, con el promotor pG1.
En el presente documento, el promotor pG1 puede servir como referencia o control para determinar la función mejorada del promotor. Tal promotor pG1 de control se puede utilizar en experimentos de control en paralelo utilizando la misma célula anfitriona y sistema de expresión, o como control interno dentro del mismo cultivo de células anfitrionas. Tales experimentos de control para calificar la función del promotor en comparación con el promotor pG1 se llevan a cabo preferiblemente en cultivos de células anfitrionas de P. pastoris, en particular P. pastoris que expresa una proteína modelo, tal como GFP o eGFP.
La inducción del promotor pG1-x se refiere específicamente a la inducción de la transcripción, que incluye específicamente la traducción adicional y la expresión opcional de dicha POI.
Dicha tasa de transcripción se determina como una medida de la fuerza del promotor y se refiere específicamente a la cantidad de transcritos obtenidos al inducir completamente dicho promotor.
Dicha tasa de transcripción se puede determinar por la fuerza de transcripción en el estado completamente inducido, que se obtiene, por ejemplo, en condiciones de cultivo en quimiostato con glucosa limitada y se expresa con relación a la tasa de transcripción del promotor pG1.
Preferiblemente, el análisis de transcripción es cuantitativo o semicuantitativo, preferiblemente empleando qRT-PCR, micromatrices de ADN, secuenciación de ARN y análisis del transcriptoma.
La fuerza del promotor en comparación con la fuerza del promotor pG1 se puede determinar mediante el siguiente ensayo convencional: las cepas de P. pastoris que expresan eGFP bajo el control del promotor que se va someter a ensayo se escrutan en placas de 24 pocillos profundos a 25°C con agitación a 280 rpm con 2 ml de cultivo por pocillo. Se utilizan cuentas de alimentación de glucosa (6 mm, Kuhner, CH) para generar condiciones de crecimiento que limitan la glucosa. Las células se analizan para determinar la expresión de eGFP en el estado inducido (cuenta de alimentación YP 1, durante 20-28 horas).
Dicho promotor se considera desreprimido y completamente inducido, si las condiciones de cultivo proporcionan una inducción aproximadamente máxima, p. ej. a concentraciones de glucosa de menos de 0,4 g/L, preferiblemente menos de 0,04 g/L, específicamente menos de 0,02 g/L. El promotor completamente inducido muestra preferiblemente una tasa de transcripción de al menos 20%, más preferiblemente al menos 30%, 40%, 50%, 60%, 70%, 80%, 90% y al menos 100% o incluso mayor tasa de transcripción de al menos 150% o al menos 200% en comparación con el promotor pGAP nativo. La tasa de transcripción se puede determinar, por ejemplo, por la cantidad de transcritos de un gen indicador, tal como eGFP, tal como se describe en la sección de Ejemplos a continuación, al cultivar un clon en cultivo líquido. Alternativamente, la tasa de transcripción se puede determinar por la fuerza de la transcripción en una micromatriz, donde los datos de la micromatriz muestran la diferencia de nivel de expresión entre el estado reprimido y desreprimido y una alta intensidad de señal en el estado completamente inducido en comparación con un control.
Dicho promotor pGAP nativo específicamente es un promotor endógeno u homólogo a la célula eucariótica que se puede utilizar como célula anfitriona para determinar la expresión de una POI, y sirve como promotor patrón o de referencia con fines de comparación.
Por ejemplo, un promotor pGAP nativo de P. pastoris es la secuencia promotora endógena no modificada en P. pastoris, como se utiliza para controlar la expresión de GAPDH en P. pastoris, p.ej. que tiene la secuencia mostrada en la Figura 7: secuencia del promotor pGAP nativo de P. pastoris (GS115) (Se C ID 260). Si P. pastoris se utiliza como anfitrión para producir una POI según la invención, la fuerza o tasa de transcripción del promotor pG1 -x según la invención se compara con tal promotor pGAP nativo de P. pastoris, y/o se compara con el promotor pG1 nativo.
Como otro ejemplo, un promotor pGAP nativo de S. cerevisiae es la secuencia promotora endógena no modificada en S. cerevisiae, utilizada para controlar la expresión de GAPDH en S. cerevisiae. Si S. cerevisiae se utiliza como anfitrión para producir una POI, la fuerza o tasa de transcripción del promotor pG1 -x se compara con tal promotor pGAP nativo de S. cerevisiae.
Por lo tanto, la fuerza o tasa de transcripción relativa de un promotor de acuerdo con la invención se compara habitualmente con el promotor pGAP nativo de una célula de la misma especie o cepa que se utiliza como anfitriona para producir una POI.
La razón de inducción es un parámetro clave para determinar la regulación del presente promotor pG1-x, y establece la actividad o fuerza del promotor en el estado inducido con relación a la actividad o fuerza del promotor en el estado reprimido. Por ejemplo, el nivel de expresión de una proteína modelo (p. ej., GFP o eGFP) y/o la tasa de transcripción en el estado reprimido se determinan tras la represión por exceso de glicerol, y el nivel de expresión de la proteína modelo y/o la tasa de transcripción son determinados en el estado inducido tras la inducción limitando la alimentación de glucosa.
Específicamente, la razón de inducción está determinada por la razón del nivel de expresión (p. ej., GFP o eGFP) en el estado inducido frente al reprimido. La razón de inducción del promotor pG1 -x es específicamente la misma o mayor en comparación con el promotor pG1. En casos específicos, la razón de inducción es al menos 2 veces, o al menos 3 veces, o al menos 4 veces, al menos 5 veces, o al menos 6 veces, o al menos 7 veces, al menos 8 veces, o al menos 9 veces, o al menos 10 veces mayor, en comparación con el promotor pG1.
La razón de inducción en comparación con la fuerza del promotor pG1 se puede determinar mediante el siguiente ensayo patrón: las cepas de P. pastoris que expresan eGFP bajo el control del promotor que se va a someter a prueba se escrutan en placas de 24 pocillos profundos a 25°C con agitación a 280 rpm con 2 mL de cultivo por pocillo. Se utilizan cuentas de alimentación de glucosa (6 mm, Kuhner, CH) para generar condiciones de crecimiento que limitan la glucosa. Las células se analizan para determinar la expresión de eGFP durante la represión (YP glicerol al 1%, fase exponencial) y la inducción (YP 1 cuenta de alimentación, durante 20-28 horas).
Específicamente, el promotor pG1-x tiene una actividad o fuerza promotora (p. ej., actividad transcripcional o fuerza transcripcional) en el estado desreprimido (inducido), que es al menos 2,5 veces, o al menos 3 veces, o al menos 4 veces, al menos 5 veces, o al menos 6 veces, o al menos 7 veces, al menos 8 veces, o al menos 9 veces, o al menos 10 veces más alta que en el estado reprimido.
Específicamente, la región reguladora central incorpora las secuencias de nucleótidos de SEQ ID 2 y SEQ ID 3, lo que significa que las secuencias de SEQ ID 2 y 3 están comprendidas en la secuencia del promotor pG1-x en cualquier orden, preferiblemente muy próximas entre sí, p. ej. con hasta 10, 20, 50 o 100 pb entre las secuencias de SEQ ID 2 y 3.
Específicamente, SEC ID 2 y/o SEC ID 3 contienen uno o más sitios de unión al factor de transcripción (TFBS).
Específicamente, las secuencias de nucleótidos de SEQ ID 2 y SEQ ID 3, cada una de las cuales o ambas secuencias juntas representan un TFBS o al menos una parte del mismo que se considera funcional, se reconoce por el factor de transcripción respectivo. Tal secuencia de nucleótidos de s Eq ID 2 o SEQ ID 3 (o una variante funcional de las mismas) se considera esencial y se incorpora en el promotor pG1 -x ya sea en forma no modificada o como una variante funcional de la misma con al menos 80% de identidad de secuencia, o al menos 85%, o al menos 90%, o al menos 95%, hasta 100% de identidad de secuencia.
Específicamente, el promotor pG1-x comprende una secuencia de nucleótidos distinta de SEQ ID 2 y SEQ ID 3, que tiene al menos 50% de identidad de secuencia con una región correspondiente en el promotor pG1, específicamente, al menos 60% o al menos 70%, o al menos 80%, o al menos 90% de identidad de secuencia en la región reguladora central o en la región reguladora no central. Específicamente, la secuencia de nucleótidos dentro de la región reguladora central que es cualquier otra distinta de SEQ ID 2 y SEQ ID 3 tiene al menos 60%, o al menos 70%, o al menos 80%, o al menos 90%, o al menos 95%, o al menos 98% de identidad de secuencia con la región correspondiente en el promotor pG1. Específicamente, la secuencia de nucleótidos en la región reguladora no central puede tener menos de 90%, o menos de 80%, o menos de 70%, o menos de 60% de identidad de secuencia con una región correspondiente en el promotor pG1.
Específicamente, la región reguladora central comprende o consiste en la secuencia de nucleótidos de SEQ ID 4, o una variante funcional de la misma que comprende el TFBS, preferiblemente una variante funcional con al menos 80%, o al menos 90%, o al menos 95%, o al menos 98% de identidad de secuencia.
Específicamente, la región reguladora central se incorpora a una región reguladora principal representada por SEQ ID 5, o una variante funcional de la misma que comprende el TFBS, preferiblemente una variante funcional con al menos 80%, o al menos 90%, o al menos 95%, o al menos 98% de identidad de secuencia.
Específicamente, los uno o más TFBS son un TFBS para cualquiera de los factores de transcripción seleccionado del grupo que consiste en Rgt1, Cat8-1 y Cat8-2.
Específicamente, los TFBS son reconocidos por los factores de transcripción Rgt1 y/o Cat8-1 y/o Cat8-2. Los TFBS se caracterizan por ciertas secuencias consenso, que pueden variar para el mismo factor. Los factores de transcripción específicos se identifican de la siguiente manera:
Rgt1 es un activador y represor transcripcional que responde a la glucosa y regula la expresión de varios genes transportadores de glucosa (HXT). Rgt1 de P. pastoris se caracteriza por la secuencia de aminoácidos de SEQ ID 261 (Figura 7).
Cat8-1 y Cat8-2 son activadores transcripcionales de grupos de cinc que se unen a elementos de respuesta a la fuente de carbono, necesarios para la desrepresión de una variedad de genes en condiciones de crecimiento no fermentativas. Cat8-1 y Cat8-2 de P. pastoris se caracterizan por las secuencias de aminoácidos de SEQ ID 262 y 263, respectivamente (Figura 7).
Específicamente, la región reguladora central comprende una deleción de uno o más nucleótidos entre las secuencias de nucleótidos de SEQ ID 2 y SEQ ID 3. Las deleciones pueden ser una o más mutaciones puntuales, y se refieren a 1, 2, 3, 4, 5, 6, 7, 8 o los 9 nucleótidos situados entre SEQ ID 2 y SEQ ID 3, en comparación con la región correspondiente de SEQ ID 1.
Específicamente, la región reguladora central comprende una inserción de uno o más nucleótidos entre las secuencias de nucleótidos de SEQ ID 2 y SEQ ID 3. Las inserciones pueden ser una o más mutaciones puntuales, y se refieren a al menos 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 nucleótidos situados entre SEQ ID 2 y SEQ ID 3.
Específicamente, la región reguladora central comprende una sustitución de uno o más nucleótidos entre las secuencias de nucleótidos de SEQ ID 2 y SEQ ID 3. Las sustituciones pueden ser una o más mutaciones puntuales, y se refieren a 1,2, 3, 4, 5, 6, 7, 8 o los 9 nucleótidos situados entre SEQ ID 2 y SEQ ID 3.
Cualquiera de las deleciones, inserciones o sustituciones específicas se puede combinar para obtener el promotor pG1-x.
Según un aspecto específico, el promotor pG1-x comprende al menos dos copias de la región reguladora central o de la región reguladora principal, ya sea la región reguladora central original o la variante funcional que comprende al menos una mutación. Específicamente, el promotor pG1-x puede comprender al menos dos, tres o cuatro copias de la región reguladora central y/o al menos dos, tres o cuatro copias de la región reguladora principal.
Según otro aspecto específico, el promotor pG1-x comprende al menos dos, tres, cuatro, cinco, seis, siete u ocho copias de uno o más TFBS seleccionados del grupo formado por Rgt1, Cat8-1 y Cat8-2.
Específicamente, el promotor pG1-x es una variante funcional mejorada del promotor pG1 que comprende una deleción de uno o más nucleótidos en el extremo 5' de la secuencia pG1, dejando preferiblemente al menos 280 nucleótidos de la región 3' de la secuencia pG1 o una variante funcional de la región 3'.
Según una realización específica, el promotor pG1 -x comprende al menos uno o al menos dos motivos T identificados por cualquiera de SEQ ID 12-29. El motivo T consiste específicamente en cualquiera de
a) una secuencia de T (timinas) contiguas que en el presente documento se denomina Tn o (T)n , preferiblemente en donde n = 13-20; preferiblemente en donde el motivo T es T14, T15 o T16;
b) una secuencia caracterizada por A (adenina) en la primera posición, seguida de una secuencia de T (timinas) contiguas, que en el presente documento se denomina ATn o A(T)n, preferiblemente en donde n = 13-20, en algunos casos preferiblemente en donde n = 13-22;
c) una secuencia caracterizada por T (timina) en la primera posición, y A (adenina) en la segunda posición, seguida de una secuencia de T (timinas) contiguas, que en el presente documento se denomina TATn o TA(T)n, preferiblemente en donde n = 13-20;
d) una secuencia caracterizada por una secuencia de T (timinas) contiguas y A (adenina) en la última posición, que en el presente documento se denomina TnA o (T)nA, preferiblemente en donde n = 13-20;
e) una secuencia caracterizada por una secuencia de T (timinas) contiguas seguida de A (adenina) en la penúltima posición, y T (timina) en la última posición, que en el presente documento se denomina TnAT o (T)nAT, preferiblemente en donde n = 13-20; o
d) una secuencia de c) o e) en donde la A (adenina) está sustituida por T (timina), que en el presente documento se denomina TTTn o TnTT o T(A/T)Tn o T(A/T)(T)n, o Tn(A/T)T o (T)n(A/T)T, preferiblemente en donde n = 13-20, p. ej. dando como resultado un motivo T que consiste en una secuencia de (T)n en donde n = 15-22.
Cualquiera de los motivos T especificados en a) a d) anteriores se puede combinar en una secuencia promotora, p. ej., de modo que la secuencia promotora comprenda un motivo T que sea un motivo TA(T)n en donde n = 13-20, y otro motivo T que sea un motivo (T)n, en donde n = 13-22.
El motivo T comprende opcionalmente una extensión, de manera que se extiende en una o más "A" (p. ej., 1, 2 o 3 adeninas) y opcionalmente se extiende adicionalmente en "T" (p. ej., 1,2 o 3 timinas) en el extremo 3' y/o en el extremo 5' del motivo T, cuya extensión también se denomina en el presente documento motivo T extendido.
En el presente documento, el término "motivo T" siempre incluirá el motivo T que está extendido o no, por lo tanto, el término incluye específicamente tanto el motivo T que no comprende la extensión, como el motivo T extendido. Específicamente, el motivo T comprende o consiste en la secuencia de nucleótidos que es cualquiera de las SEQ ID 12-29. Se pueden incorporar uno, dos o más cualesquiera de los motivos T al promotor pG1-x con o sin la extensión del motivo.
Según un aspecto específico, la extensión del motivo T es un alargamiento de secuencia "TA" en su extremo 5', para obtener un extremo 5' "TAT".
Según otro aspecto específico, la extensión del motivo T es un alargamiento de secuencia "TAA" en su extremo 5', para obtener un extremo 5' "TAAT".
Según otro aspecto específico, la extensión del motivo T es un alargamiento de secuencia "AT" en su extremo 3', para obtener un extremo 3' "TAT".
Según otro aspecto específico, la extensión del motivo T es un alargamiento de secuencia "AAT" en su extremo 3', para obtener un extremo 3' de "TAAT".
Según un aspecto específico, el motivo T está situado aguas arriba de la región reguladora central y, opcionalmente, aguas arriba de la región reguladora principal.
Según otro aspecto específico, el motivo T está situado aguas abajo de la región reguladora central y, opcionalmente, aguas abajo de la región reguladora principal.
Específicamente, el promotor pG1-x comprende una secuencia de nucleótidos 3' terminal que incorpora al menos parte de un sitio de inicio de la traducción. Un sitio de inicio de la traducción se conoce específicamente como secuencia consenso de Kozak en eucariotas, y una secuencia adecuada para soportar la expresión génica.
Específicamente, el sitio de inicio de la traducción
a) se origina a partir del promotor pG1 y consiste en o comprende la secuencia de nucleótidos de SEQ ID 6, o una variante funcional de la misma con al menos 90% de identidad de secuencia; o
b) se origina a partir de cualquier otro promotor de Pichia pastoris, o una variante funcional del mismo con al menos 90% de identidad de secuencia.
Las regiones promotoras 3' terminales alternativas ilustrativas que se pueden utilizar en lugar de la región 3' terminal del promotor pG1, o en lugar de la secuencia de nucleótidos de SEQ ID 6, se obtienen, p. ej., a partir de cualquiera de los siguientes promotores: pAOX1, pAOX2, pDAS1, pDAS2, pFLD, pGAP o pTEF2.
Según una realización específica, el promotor tiene una longitud de hasta 2000 pb. El promotor pG1 -x específico tiene una longitud que es más corta que la del promotor pG1, tal como con una longitud de al menos 293 pb o 300 pb, o de al menos 328 pb, o al menos 350 pb o al menos 400 pb, o al menos 500 pb.
Específicamente, el promotor pG1-x puede comprender una secuencia que se origina a partir de un fragmento del promotor pG1. Según un aspecto específico, el promotor pG1-x es una variante o derivado de un fragmento parental de pG1, que comprende al menos la región 3' de SEQ ID 1 que se extiende al menos 50%, o 60%, o 70%, u 80%, o al menos 90% de la secuencia de pG1.
Específicamente, la secuencia de nucleótidos de pG1 -x se obtiene a partir de la secuencia de nucleótidos del promotor pG1 que comprende una deleción de, o en, la región 5' terminal, p. ej. un corte de la secuencia de nucleótidos en el extremo 5', para obtener una longitud específica con un rango desde el extremo 3' hasta un extremo 5' variable, tal como con una longitud de la secuencia de nucleótidos de al menos 293 pb o 300 pb, o de al menos 328 pb, o al menos 350 pb, o al menos 400 pb, o al menos 500 pb hasta la longitud del fragmento del promotor pG1 que comprende una deleción de al menos 1, o al menos 10, o al menos 100 pb.
Sin embargo, la longitud del promotor también se puede aumentar, para obtener una longitud que sea más larga que la longitud del promotor pG1, específicamente una longitud de hasta 1500 pb, o hasta 2000 pb. Específicamente, la longitud puede estar dentro de cualquiera de los rangos: 293 pb - 1500 pb, 293 pb - 2000 pb, 328 pb -1500 pb o 328­ 2000 pb.
Según un aspecto específico, la invención proporciona un promotor pG1-x aislado y/o artificial, que comprende o consiste en la secuencia de nucleótidos seleccionada del grupo que consiste en cualquiera de
a) SEQ ID 37-44, preferiblemente cualquiera de SEQ ID 45-76;
b) SEQ ID 77-80, preferiblemente cualquiera de SEQ ID 81-112;
c) SEQ ID 113-114, preferiblemente cualquiera de SEQ ID 115-130;
d) SEQ ID 131-132, preferiblemente cualquiera de SEQ ID 133-148; o
e) SEQ ID 185-186, preferiblemente cualquiera de SEQ ID 187-202;
o una secuencia de nucleótidos que tiene al menos 80% de identidad de secuencia con cualquiera de las anteriores, en donde el promotor pG1-x se caracteriza por un aumento de la fuerza del promotor y/o la razón de inducción en comparación con el promotor pG1 de Pichia pastoris identificado por SEQ ID 1, en donde
- la fuerza del promotor es al menos 1,1 veces mayor en el estado inducido en comparación con el promotor pG1, y/o
- la razón de inducción es al menos 1,1 veces mayor en comparación con el promotor pG1.
Una variante funcional de tal promotor pG1-x de los apartados a) - e) anteriores se caracteriza preferiblemente por cualquiera de las características específicas descritas para la variante funcional del promotor pG1 como se describe en el presente documento.
Específicamente, la variante funcional de cualquiera de los promotores pG1-x de los apartados a) - e) anteriores, preferiblemente una variante funcional de cualquiera de SEQ ID 45-76, se caracteriza por uno o más de los siguientes rasgos
a) la secuencia es una variante funcional de la secuencia promotora de cualquiera de los promotores pG1-x de los apartados a) - e) anteriores que comprende una deleción de uno o más nucleótidos en el extremo 5' de la secuencia promotora, preferiblemente dejando al menos 280 nucleótidos de la región 3' de la secuencia promotora o una variante funcional de la región 3', preferiblemente que comprende una deleción 5' de la secuencia promotora de 50, 100, 150, 200, 250 o 300 nucleótidos hasta, pero sin incluir, la región reguladora principal junto con cualquier secuencia aguas abajo o 3' de dicha región reguladora principal, en el caso de más de 1 región reguladora principal, la deleción del extremo 5' de la secuencia promotora es hasta, pero sin incluir, la primera o la mayor parte de la región reguladora principal 5';
b) la secuencia comprende uno o más TFBS, preferiblemente en donde el TFBS es para cualquiera de los factores de transcripción seleccionados del grupo que consiste en Rgt1, Cat8-1 y Cat8-2;
c) la región reguladora central comprende la secuencia de nucleótidos de SEQ ID 4, o una variante funcional de la misma que comprende uno o más TFBS, preferiblemente una variante funcional con al menos 80% de identidad de secuencia,
d) la región reguladora central se incorpora a una región reguladora principal representada por SEQ ID 5, o una variante funcional de la misma que comprende el TFBS, preferiblemente una variante funcional con al menos 80% de identidad de secuencia;
e) la región reguladora central comprende una deleción de uno o más nucleótidos entre las secuencias de nucleótidos de SEQ ID 2 y SEQ ID 3;
f) la secuencia comprende al menos dos copias de la región reguladora central o de la región reguladora principal; g) la secuencia comprende adicionalmente al menos uno o al menos dos motivos T identificados por cualquiera de SEQ ID 12-29; preferiblemente en donde el motivo T está situado aguas arriba o aguas abajo de la región reguladora central y, opcionalmente, aguas arriba o aguas abajo de la región reguladora principal;
h) la secuencia comprende una secuencia de nucleótidos 3' terminal que comprende al menos parte de un sitio de inicio de la traducción;
i) la secuencia se alarga hasta una longitud de hasta 2000 pb.
La invención proporciona adicionalmente el promotor pG1-x en forma aislada.
Específicamente, se proporciona el ácido nucleico del promotor pG1-x aislado que comprende el promotor pG1-x como se describe en el presente documento, o un ácido nucleico que comprende la secuencia complementaria. Específicamente, la secuencia complementaria es una secuencia que hibrida en condiciones rigurosas con el promotor pG1-x.
Específicamente, el ácido nucleico está conectado operablemente a una secuencia de nucleótidos que codifica una proteína de interés (POI), cuyo ácido nucleico no está asociado de forma nativa con la secuencia de nucleótidos que codifica la POI. La POI es específicamente un polipéptido o proteína heterólogos.
Específicamente, la secuencia de nucleótidos comprende adicionalmente una secuencia de nucleótidos que codifica un péptido señal que permite la secreción de la POI, preferiblemente en donde la secuencia de nucleótidos que codifica el péptido señal está situada adyacente al extremo 5' de la secuencia de nucleótidos que codifica la POI.
Específicamente, el péptido señal se selecciona del grupo que consiste en secuencias señal del prepro-péptido del factor de apareamiento alfa de S. cerevisiae , los péptidos señal del gen de la fosfatasa ácida de P. pastoris (PHO1) y la proteína X extracelular (EPX1) (Heiss, S., V. Puxbaum, C. Gruber, F. Altmann, D. Mattanovich y B. Gasser, (2015) Multistep processing of the secretion leader of the extracellular protein Epx1 in Pichia pastoris and implications on protein localization. Microbiology).
Específicamente, la POI es una proteína eucariótica, preferiblemente una proteína de mamífero.
En casos específicos, una POI es una proteína multimérica, específicamente un dímero o tetrámero.
Según realizaciones específicas, la POI es una proteína heteróloga, preferiblemente seleccionada entre proteínas terapéuticas, incluyendo anticuerpos o fragmentos de los mismos, enzimas y péptidos, antibióticos proteicos, proteínas de fusión de toxinas, productos conjugados carbohidrato - proteína, proteínas estructurales, proteínas reguladoras, vacunas y proteínas o partículas similares a vacunas, enzimas de procedimiento, factores de crecimiento, hormonas y citocinas, o un metabolito de una POI, incluyendo específicamente un metabolito celular del cultivo celular recombinante que expresa un gen de interés bajo el control transcripcional de un promotor de la invención.
Una POI específica es una molécula de unión a antígeno, tal como un anticuerpo, o un fragmento del mismo. Entre las POI específicas se encuentran anticuerpos tales como anticuerpos monoclonales (mAb), inmunoglobulina (Ig) o inmunoglobulina de clase G (IgG), anticuerpos de cadena pesada (HcAb) o fragmentos de los mismos tales como fragmentos de unión a antígeno (Fab), Fd, fragmento variable de cadena sencilla (scFv), o variantes modificadas genéticamente de los mismos tales como, por ejemplo, dímeros de Fv (dianticuerpos), trímeros de Fv (trianticuerpos), tetrámeros de Fv o minianticuerpos y anticuerpos de dominio único como VH o v Hh o V-NAR. Se pueden seleccionar moléculas de unión a antígeno adicionales de proteínas armazón (alternativas) tales como p. ej. dominios de Kunitz, Adnectinas, Affibodies, Anticalinas y DARPins modificados genéticamente. El término "armazón " describe un grupo multifacético de proteínas compactas y plegadas de manera estable, que difieren en tamaño, estructura y origen, que sirven como punto de partida para la generación de moléculas de unión a antígenos. Inspirado por las relaciones estructura-función de los anticuerpos (inmunoglobulinas), tal armazón proteico alternativo proporciona un marco estructural robusto y conservado que soporta un sitio de interacción que se puede remodelar para el reconocimiento estricto y específico de una diana (bio)molecular determinada.
Según una realización específica, se fabrica un producto de fermentación utilizando la POI, un metabolito o un derivado de la misma.
La invención proporciona adicionalmente una construcción de expresión que comprende el ácido nucleico como se describe en el presente documento, preferiblemente un vector o plásmido de replicación autónoma, o un vector o plásmido que se integra en el ADN cromosómico de una célula anfitriona.
Específicamente, la construcción de expresión comprende el promotor pG1-x, conectado operablemente a una secuencia de nucleótidos que codifica una POI bajo el control transcripcional de dicho promotor, cuyo promotor no está asociado de forma nativa con la secuencia codificante de la POI. Específicamente, la construcción de expresión es un vector.
La invención proporciona adicionalmente una célula anfitriona recombinante que comprende la construcción de expresión como se describe en el presente documento, preferiblemente una célula eucariótica, tal como una célula de mamífero, insecto, levadura, hongo filamentoso o planta, preferiblemente una levadura o una célula fúngica filamentosa, más preferiblemente una célula de levadura del género Saccharomyces o Pichia.
Específicamente, la levadura se selecciona del grupo que consiste en Pichia, Candida, Torulopsis, Arxula, Hansenula, Yarrowia, Kluyveromyces, Saccharomyces, Komagataella, preferiblemente una levadura metilotrófica.
Una levadura específicamente preferida es Pichia pastoris, Komagataella pastoris, K. phaffii, o K. pseudopastoris, como, p. ej., cualquiera de las cepas de P. pastoris CBS 704, CBS 2612, CBS 7435, CBS 9173-9189, DSm Z 70877, X-33, GS115, KM71 y SMD1168.
Según un aspecto específico, la célula anfitriona recombinante comprende múltiples copias de la secuencia de ácido nucleico y/o múltiples copias de la construcción de expresión. Por ejemplo, la célula recombinante comprende 2, 3, 4 o más copias (número de copias del gen, GCN).
La invención proporciona adicionalmente un cultivo estable de la célula anfitriona recombinante como se describe en el presente documento.
De acuerdo con una realización específica, se emplea una célula, que tiene una tasa de crecimiento específica más alta en presencia de un excedente de fuente de carbono con relación a condiciones de fuente de carbono limitada.
La invención proporciona adicionalmente un método para producir una POI mediante el cultivo de una línea celular anfitriona recombinante como se describe en el presente documento, que comprende las etapas de
a) cultivar la línea celular en condiciones para expresar dicha POI, y
b) recuperar la POI.
Específicamente, dicho método se lleva a cabo bajo el control transcripcional del promotor pG1-x regulable por fuente de carbono, en donde dicho promotor pG1-x tiene al menos uno de los rasgos de fuerza del promotor y regulables mejorados en comparación con el promotor pG1.
Según una realización específica, la línea celular se cultiva en condiciones de cultivo discontinuo, por lote alimentado o continuo, y/o en medios que contienen sustrato de carbono limitado.
Específicamente, el cultivo se realiza en un biorreactor comenzando con una fase discontinua como primera etapa, seguida de una fase por lote alimentado o una fase de cultivo continuo como segunda etapa.
Específicamente, las células anfitrionas se cultivan en un medio rico en fuente de carbono durante la fase de alta tasa de crecimiento (p. ej., al menos 50%, o al menos 60%, al menos 70%, al menos 80%, al menos 90%, al menos 95%, al menos 98%, al menos 99% o hasta la tasa máxima de crecimiento) y producen la POI durante una fase de baja tasa de crecimiento (p. ej., menos de 90%, preferiblemente menos de 80%, menos de 70%, menos de 60%, menos de 50% o menos de 40%, menos de 30%, menos de 20%, menos de 10%, menos de 5%, menos de 3%, menos de 2%, menos de 1%, menos de 0,5%, menos de 0,4%, menos de 0,3% o menos de 0,2% de la tasa de crecimiento máxima) p. ej. mientras se limita la fuente de carbono, preferiblemente alimentando un medio mínimo definido.
Específicamente, la POI se expresa en condiciones que limitan el crecimiento, p. ej. cultivando la línea celular a una tasa de crecimiento menor que la tasa de crecimiento máxima, típicamente menos de 90%, preferiblemente menos de 80%, menos de 70%, menos de 60%, menos de 50%, menos de 40%, menos de 30%, menos de 20%, menos de 10%, menos de 5%, menos de 3%, menos de 2%, menos de 1%, menos de 0,5%, menos de 0,4%, menos de 0,3%, o menos de 0,2% de la tasa de crecimiento máxima de las células. Típicamente, la tasa de crecimiento máxima se determina individualmente para una célula anfitriona específica.
Específicamente, el método de cultivo comprende
a) una primera etapa que utiliza una fuente de carbono basal que reprime el promotor pG1-x, seguida de
b) una segunda etapa que no utiliza o utiliza una cantidad limitada de una fuente de carbono complementaria que desreprime o induce el promotor pG1-x para inducir la producción de la POI.
Específicamente, la fase discontinua se realiza hasta que la fuente de carbono basal que se añade inicialmente al cultivo celular es consumida por la línea celular. El método de incremento de oxígeno disuelto (OD) se puede utilizar para determinar el consumo de la fuente de carbono basal durante la fase discontinua.
Según una realización específica, la fase discontinua se caracteriza por una disminución continua de la señal de presión parcial de oxígeno (pO2) y en donde el final de la fase discontinua se caracteriza por un aumento de pO2. Típicamente, mientras se consume la fuente de carbono basal durante la fase discontinua y sin añadir fuentes de carbono adicionales como es típico en las fases discontinuas, la señal de presión parcial de oxígeno (pO2) disminuirá continuamente hasta, por ejemplo, por debajo de 65%, tal como por ejemplo 30%. Tras el consumo de la fuente de carbono basal, la pO2 puede aumentar, p. ej., por encima del 30% tal como, por ejemplo, por encima de 65%, o más indicando el punto de tiempo apropiado para cambiar al sistema lote alimentado utilizando medio de alimentación para añadir una fuente de carbono adicional en condiciones limitadas de fuente de carbono.
Específicamente, la pO2 se reduce a menos de 65% o menos de saturación durante la fase discontinua seguido de un aumento por encima de 65% o más de saturación al final del lote. Específicamente, la fase discontinua se realiza hasta un aumento de la señal de presión parcial de oxígeno (pO2) por encima de 65% de saturación, específicamente por encima de cualquiera de 70%, 75%, 80% u 85%.
Específicamente, la fase discontinua se realiza durante alrededor de 20 a 36 h.
El término "alrededor de" con respecto al tiempo de cultivo significará /- 5% o /- 10%.
Por ejemplo, el tiempo de ejecución del lote específico de alrededor de 20 a 36 h significa una duración de 18 a 39,6 h, específicamente de 19 a 37,8 h.
Según una realización específica, la fase discontinua se realiza utilizando de 40 a 50 g/L de glicerol, específicamente 45 g/L de glicerol como fuente de carbono basal en medios discontinuos, y el cultivo se realiza a 25°C durante alrededor de 27 a 30 h, o a 30°C durante alrededor de 23 a 36 h, o a cualquier temperatura entre 25°C y 30°C durante un tiempo de cultivo de 23 a 36 h. La disminución de la concentración de glicerol en el medio por lotes disminuiría la duración de la fase discontinua, mientras que el aumento del glicerol en el medio por lotes incluso prolongaría la fase discontinua. Como alternativa al glicerol, se puede utilizar glucosa, p. ej. en aproximadamente las mismas cantidades.
En un sistema típico de cultivo celular y expresión de POI, en donde una fase discontinua va seguida de una fase de lote alimentado, específicamente, el cultivo en la fase de lote alimentado se realiza durante cualquiera de, alrededor de 15 a 80 h, alrededor de 15 a 70 h, alrededor de 15 a 60 h, alrededor de 15 a 50 h, alrededor de 15 a 45 h, alrededor de 15 a 40 h, alrededor de 15 a 35 h, alrededor de 15 a 30 h, alrededor de 15 a 35 h, alrededor de 15 a 25 h, o alrededor de 15 a 20 h; preferiblemente alrededor de 20 a 40 h. Específicamente, el cultivo en la fase de lote alimentado se realiza durante cualquiera de alrededor de 80 h, alrededor de 70 h, alrededor de 60 h, alrededor de 55 h, alrededor de 50 h, alrededor de 45 h, alrededor de 40 h, alrededor de 35 h, alrededor de 33 h, alrededor de 30 h, alrededor de 25 h, alrededor de 20 h, o alrededor de 15 h.
Cualquiera de tales cultivos de lote alimentado de menos de 120 h o menos de 100 h o hasta 80 h, que da como resultado una producción satisfactoria de POI obteniendo de ese modo un alto rendimiento, se denomina en el presente documento "fermentación rápida". Específicamente, la tasa de formación de producto específico de volumen (rP) es la cantidad de producto (mg) formado por Unidad de Volumen (L) y Unidad de tiempo (h) (mg(L h)-1). La tasa de formación de producto específico de volumen también se denomina rendimiento espacio-temporal (STY) o productividad volumétrica.
Específicamente, el cultivo por lote alimentado se realiza de manera que un rendimiento espacio-temporal de alrededor de 30 mg (L h)-1 (es decir, 30 mg (L h)-1 /- 5% o /- 10%). Específicamente un rendimiento espacio-temporal de alrededor de 30 mg (L h)-1 se logra en aproximadamente 30 horas de lote alimentado, específicamente se puede lograr al menos cualquiera de 27, 28, 29, 30, 31, 32 o 33 mg (L h)'1 en menos de cualquiera de 33 h, 32 h, 31 h, 30 h, 29 h, 28 h, 27 h, 26 h o 25 h de tiempo de lote alimentado.
Específicamente, la fase discontinua se realiza como una primera etapa a) y la fase de lote alimentado se realiza como una segunda etapas b).
Específicamente, la segunda etapa b) emplea un medio de alimentación en una fase de lote alimentado que proporciona la fuente de carbono complementaria en una cantidad limitante del crecimiento para mantener la tasa de crecimiento específica dentro del rango de 0,04 I r1 a 0,2 h-1, preferiblemente menos de 0,2, 0,15, 0,1 Ir1 o 0,15 h-1.
Específicamente, el método de cultivo discontinuo y por lote alimentado emplea una célula anfitriona de levadura, p. ej. una levadura de cualquiera del género Saccharomyces o género Pichia o género Komagataella, o una levadura de un género distinto de Pichia, tal como de K. lactis, Z. rouxii, P. stipitis, H. polymorpha, o Y. lipolítica, preferiblemente Pichia pastoris o Komagataella pastoris. Específicamente, la levadura se utiliza en una fermentación rápida.
Específicamente, el método de cultivo discontinuo y por lote alimentado emplea el promotor pG1-x que es cualquiera de SEQ ID 37-44, preferiblemente cualquiera de SEQ ID 45-76. En particular, el promotor pG1-x se caracteriza por SEC ID 39, preferiblemente SEC ID 49.
Específicamente, la POI se produce a una tasa de transcripción de al menos 15% en comparación con el promotor pGAP nativo de la célula.
Según una realización específica, la fuente de carbono basal es diferente de la fuente de carbono complementaria, p. ej. cuantitativa y/o cualitativamente diferente. La diferencia cuantitativa puede proporcionar las diferentes condiciones para reprimir o desreprimir la actividad promotora.
Según una realización específica adicional, las fuentes de carbono basal y complementaria comprenden el mismo tipo de moléculas o carbohidratos, preferiblemente a concentraciones diferentes. Según una realización específica adicional, la fuente de carbono es una mezcla de dos o más fuentes de carbono diferentes.
Se puede utilizar cualquier tipo de carbono orgánico adecuado para el cultivo de células eucarióticas. Según una realización específica, la fuente de carbono es una hexosa, tal como glucosa, fructosa, galactosa o manosa, un disacárido, tal como sacarosa, un alcohol, tal como glicerol o etanol, o una mezcla de los mismos.
Según una realización específicamente preferida, la fuente de carbono basal se selecciona del grupo que consiste en glucosa, glicerol, etanol o mezclas de los mismos, y material nutriente complejo. Según una realización preferida, la fuente de carbono basal es glicerol.
Según una realización específica adicional, la fuente de carbono complementaria es una hexosa tal como glucosa, fructosa, galactosa y manosa, un disacárido tal como sacarosa, un alcohol tal como glicerol o etanol, o una mezcla de los mismos. Según una realización preferida, la fuente de carbono complementaria es glucosa.
Específicamente,
a) la fuente de carbono basal se selecciona del grupo que consiste en glucosa, glicerol, etanol, una mezcla de los mismos y material nutriente complejo; y
b) la fuente de carbono complementaria es una hexosa, tal como glucosa, fructosa, galactosa o manosa, un disacárido, tal como sacarosa, un alcohol, tal como glicerol o etanol, o una mezcla de cualquiera de los anteriores.
Dichas etapas de cultivo comprenden específicamente cultivar la línea celular en presencia de dichas fuentes de carbono, por tanto, en un medio de cultivo que comprende dichas fuentes de carbono, o en la etapa b) también en ausencia de una fuente de carbono complementaria.
Las condiciones desrepresoras (o inductoras) se pueden lograr adecuadamente por medios específicos. La segunda etapa b) emplea opcionalmente un medio de alimentación que no proporciona la fuente de carbono complementaria o la proporciona en una cantidad limitada.
Específicamente, el medio de alimentación está químicamente definido y libre de metanol.
El medio de alimentación se puede añadir al medio de cultivo en forma líquida o también en una forma alternativa, tal como un sólido, p. ej. en forma de un comprimido u otro medio de liberación sostenida, o un gas, p. ej. dióxido de carbono. Sin embargo, según una realización preferida, la cantidad limitada de una fuente de carbono complementaria añadida al medio de cultivo celular puede incluso ser cero. Preferiblemente, en condiciones de un sustrato de carbono limitado, la concentración de una fuente de carbono complementaria en el medio de cultivo es 0-1 g/L, preferiblemente menos de 0,6 g/L, más preferido menos de 0,3 g/L, más preferido menos de 0,1 g/L, preferiblemente 1-50 mg/L, más preferido 1 -10 mg/L, específicamente preferido 1 mg/L o incluso por debajo, tal como por debajo del límite de detección medido con un ensayo convencional adecuado, p. ej. determinada como concentración residual en el medio de cultivo tras el consumo por el cultivo de células en crecimiento.
En un método preferido, la cantidad limitada de la fuente complementaria proporciona una cantidad residual en el cultivo celular que está por debajo del límite de detección determinado en el caldo de fermentación al final de una fase de producción o en la salida de un procedimiento de fermentación, preferiblemente al cosechar el producto de fermentación.
Específicamente, la segunda etapa b) emplea un medio de alimentación que proporciona la fuente de carbono complementaria en una cantidad limitante del crecimiento para mantener la tasa de crecimiento específica dentro del rango de 0,001 h-1 a 0,2 h-1, preferiblemente 0,005 h-1 a 0,15 h-1.
Figuras
Figura 1: Análisis de secuencia de pG1 para TFBS relacionado con la fuente de carbono utilizando MatInspector. pG1 (también conocido como Pg t h 1), se amplificó y clonó inicialmente desde la posición -965 a -1 (longitud de 965 pb, la secuencia se proporciona en Figura 6 ( SEQ ID 1, en particular se ha utilizado SEQ ID 9). Los números indican TFBS que se seleccionaron para su deleción (enumerados en la Tabla 2). Las familias de matrices asociadas son F$CSRE (elementos de respuesta a fuente de carbono, recuadros rayados), F$ADR (Regulador metabólico de levadura, recuadros punteados), F$MGCM (Motivos monoméricos de clase Gal4, recuadros rellenos) y F$YMIG (proteínas de la Caja GC de levadura, recuadros de color blanco). Otros TFBS pueden verse afectados por las deleciones (la información detallada de coincidencia de matriz se proporciona en Tabla 1). El recuadro sombreado de color negro indica la principal región reguladora de pG1 que se identificó mediante el escrutinio de variantes de pG1 acortadas. El asterisco indica la posición del motivo t At prominente (posición -390 a -374) que también se seleccionó para deleción y mutación. Los inicios 5' alternativos de las variantes acortadas del promotor pG1 están marcados con flechas y la longitud de la variante correspondiente.
Figura 2: Datos de escrutinio de las variantes del promotor pG1 acortadas La media geométrica de la fluorescencia de eGFP específica de la población (fluorescencia relacionada con el volumen celular) se muestra para los clones que expresan eGFP bajo el control de pG1 (clon núm. 8, GCN verificado de 1) o una variante de pG1 acortada (cada 2 clones cultivados por triplicado, seleccionados en pre-escrutinios) en condiciones de represión e inducción del crecimiento. Se utilizaron células de P. pastoris de tipo salvaje sin expresión como control negativo. Se tomaron muestras durante el precultivo represivo y después de 24 y 48 horas de inducción con cuentas de alimentación.
Figura 3: Datos de escrutinio de las variantes de deleción de TFBS y mutación TAT La media geométrica de la fluorescencia de eGFP específica de la población (fluorescencia relacionada con el volumen celular) se muestra para los clones que expresan eGFP bajo el control de pG1 (clon núm. 8, GCN verificado de 1) o una variante de pG1 (se reunieron hasta 9 clones cultivados en 3 pocillos) en condiciones de represión e inducción del crecimiento. Se utilizaron células de P. pastoris de tipo salvaje como control negativo.
Figura 4: Datos de escrutinio de las variantes de duplicación de pG1 La media geométrica de la fluorescencia de eGFP específica de la población (fluorescencia relacionada con el volumen celular) se muestra para los clones que expresan eGFP bajo el control de pG1 (clon núm. 8, GCN verificado de 1) o una variante de pG1 (se reunieron hasta 9 clones cultivados en 3 pocillos, seleccionados en pre-escrutinios) en condiciones de represión e inducción del crecimiento. Se utilizaron células de P. pastoris de tipo salvaje como control negativo.
Figura 5: Cultivo por lote alimentado de pG1 y variantes de pG1 que expresan eGFP La fluorescencia relativa de eGFP se midió a partir de muestras de biorreactor (diluidas a densidades de biomasa similares) utilizando un lector de placas y se muestra durante el tiempo de alimentación (final del lote establecido en 0) en el lote (A) y el cultivo por lote alimentado (B). Se comparó un clon que expresaba eGFP bajo control de pG1 (núm. 8) con clones que expresaban bajo control de una variante de deleción de pG1 (pG1-A2, SEQ ID 211), una mutación TAT (pG1-T16, SEQ ID 257, y una variante por duplicación (pG1-D1240) (SEQ ID 49).
Figura 6: Secuencias promotoras pG1 y pG1-x
Figura 6a: Secuencias de referencia
Figura 6b: Secuencias del promotor pG1-x
Elementos de Secuencia Individual:
Posición 8 (SEQ ID 2): ATAAATGGA (p. ej., posición -293 a -285 en SEQ ID 8):
Posición 9 (SEQ ID 3): CATATTTTTCCGGTT (p. ej., posición -275 a-261 en SEQ ID 8)
Región central: (SEQ ID 4): ATAAATGGACGCCTGCTCCATATTTTTCCGGTT (p. ej., posición -293 a -261 en SEQ ID 8)
Región reguladora principal: (SEQ ID 5): (p. ej., posición -328 a -211 en SEQ ID 8):
CCGGATAAGAGAATTTT GTTT GATTAT CCGTT CGGA TAAA TGGACGCCTGC
TCCA TA 7"nT7~CCGG7TATTACCCCACCTGGAAGTGCCCAGAATTTTCCGGGGATT
ACGGATAATAC
secuencia de nucleótidos 3'-terminal (SEQ ID 6): TTC.CACC.C.T.T
Indicaciones en secuencias:
• Región reguladora principal: negrita
• Región reguladora central: negrita, cursiva y subrayado , SEQ ID 2 y 3 doble subrayado
Motivo T: Cursiva y subrayado, puede estar opcionalmente extendido (en el extremo 5’-terminal del motivo T) por una secuencia TA precedente, o (en el extremo 3'-terminal del motivo T) por una secuencia AT subsiguiente
• región 3'-terminal: subay.a.dñ .c.on Jíne.a..discontinua
• La región menos relevante para la actividad promotora en la secuencias de pG1 de referencia (Pg t h 1):
subray_adj3_co_n_una_!Ln_ea _de_g.uiones _y_Ru_nlo_s: uno o más nucleótidos hasta todos los nucleótidos dentro de la región que va desde el extremo 5'-terminal hasta -328 (región subrayada en la Fig. 6a con una línea de guiones y puntos) puede estar sustituida o suprimida, o pueden insertar nucleótidos adicionales dentro de tal región, sin embargo, las realizaciones preferidas todavía comprenden al menos un motivo T que es (T)n (n = 13-20) con o sin nucleótidos A o TA precedentes; o con o sin nucleótidos A o AT subsiguientes. Tal región menos relevante que se puede suprimir parcial o totalmente es la región que va desde el extremo 5' terminal hasta la primera región o región reguladora principal 5' (negrita) en uno cualquiera de SEQ ID 37 a SEQ ID 202; preferiblemente, se pueden suprimir hasta 50, 100, 150, 200, 250, 300, 320 o 325 nucleótidos del extremo 5'-terminal de uno cualquiera de SEQ ID 37 a SEQ ID 202.
Deleción: de] (subrayado)
Motivos (T)n (n = 13-20): se pueden extender opcionalmente en su extremo 5' , p. ej. por "A" o "TA"; o en su extremo 3' , p. ej. por "A" o "AT"
o (T)13: SEC ID 12: TTTTTTTTTTTTT
o (T)14: SEC ID 13: TTTTTTTTTTTTTT
o (T)15: SEC ID 14: TTTTTTTTTTTTTTT
o (T)16: SEC ID 15: TTTTTTTTTTTTTTTT
o (T)17: SEC ID 16: TTTTTTTTTTTTTTTTT
o (T)18: SEC ID 17: TTTTTTTTTTTTTTTTTT
o (T)19: SEQ ID 18: TTTTTTTTTTTTTTTTTTT
o (T)20: SEC ID 19: TTTTTTTTTTTTTTTTTTTT
Motivos TA(T) n (n = 13-20), se pueden mutar opcionalmente para sustituir la "A" en la posición 2 por una "T" (A/T)
o TA(T)13: SEC ID 20: TATTTTTTTTTTTTT
o TA(T)13 (sustituida por A/T),
SEQ ID 14 (véase (T)15): TTTTTTTTTTTTTTT
o TA(T)14: SEQ ID 21: TATTTTTTTTTTTTTT
o TA(T)14 (sustituida por A/T),
SEQ ID 15 (véase (T)16): TTTTTTTTTTTTTTTT
o TA(T)15: SEC ID 22: TATTTTTTTTTTTTTTT
o TA(T)15 (sustituida por A/T),
SEQ ID 16 (véase (T)17): TTTTTTTTTTTTTTTTT
o TA(T)16: SEQ ID 23: TATTTTTTTTTTTTTTTT
o TA(T)16 (sustituida por A/T),
SEQ ID 17 (véase (T)18): TTTTTTTTTTTTTTTTTT
o TA(T)17: SEC ID 24: TATTTTTTTTTTTTTTTTT
o TA(T)17 (sustituida por A/T),
SEQ ID 18 (véase (T)19): TTTTTTTTTTTTTTTTTTT
o TA(T)18: SEQ ID 25: TATTTTTTTTTTTTTTTTTT
o TA(T)18 (sustituida por A/T),
SEQ ID 19 (véase (T)2ü): TTTTTTTTTTTTTTTTTTTT
o TA(T)19: SEQ ID 26: TATTTTTTTTTTTTTTTTTTT
o TA(T)19 (A/T sustituido),
SEQ ID 28 (es decir, (T)21): TTTTTTTTTTTTTTTTTTTTT
o TA(T)20: SEC ID 27: TATTTTTTTTTTTTTTTTTTTT
o TA(T)20 (sustituida por A/T),
o SEQ ID 29 (es decir, (T)22): TTTTTTTTTTTTTTTTTTTTTT
Figura 7: Secuencia promotora de pGAP nativa de P. pastoris (GS115) (SEC ID 260)
Figure imgf000015_0001
Figura 7 continuación: Secuencias de factores de transcripción
Rgt1 (PAS_chr1-3_0233) (SEQ ID 261)
Cat8-2 (PAS_chr4_0540) (SEQ ID 262)
Cat8-1 (PAS_chr2-1_0757) (SEQ ID 263)
Figura 8 : Secuencias de la técnica anterior pG1 (SEQ ID 264), pG1a (SEQ ID 265), pG1b (SEQ ID 266), pG1c (SEQ ID 267), pG1d (SEQ ID 268), pG1e (SEQ ID 269) o pG1f (SEQ ID 270), como se describe en el documento WO2013050551 A1
Figura 9: Cultivo por lote alimentado de la realización pG1-3 seleccionada de SEQ ID 39 (pG1-D1240 (SEQ ID 49)) que expresa una proteína armazón alternativa como una proteína modelo utilizando (A) el protocolo convencional por lote alimentado, (B) protocolo optimizado por lote alimentado con rendimiento espacio-temporal ("fermentación rápida") adaptado de Maurer et al. (Microbial Cell Factories, 2006, 5:37)
Descripción detallada de la invención
Los términos específicos que se utilizan a lo largo de la memoria descriptiva tienen el siguiente significado.
El término "fuente de carbono", también referido como "sustrato de carbono", como se emplea en el presente documento, significará un sustrato de carbono fermentable, típicamente una fuente de carbohidrato, adecuada como fuente de energía para microorganismos, tales como aquellos capaces de ser metabolizados por organismos anfitriones o líneas celulares de producción, en particular fuentes seleccionadas del grupo que consiste en monosacáridos, oligosacáridos, polisacáridos, alcoholes que incluyen glicerol, en forma purificada, en medios mínimos o proporcionados en materias primas, tales como un material nutriente complejo. La fuente de carbono se puede utilizar según la invención como una única fuente de carbono o como una mezcla de diferentes fuentes de carbono.
Una "fuente de carbono basal" tal como se emplea según la invención es típicamente una fuente de carbono adecuada para el crecimiento celular, tal como un nutriente para células eucarióticas. La fuente de carbono basal se puede proporcionar en un medio, tal como un medio basal o un medio complejo, pero también en un medio químicamente definido que contiene una fuente de carbono purificada. La fuente de carbono basal se proporciona típicamente en una cantidad para proporcionar el crecimiento celular, en particular durante la fase de crecimiento en un procedimiento de cultivo, por ejemplo para obtener densidades celulares de al menos 5 g/L de masa seca celular, preferiblemente al menos 10 g/L de masa seca celular, o al menos 15 g/L de masa seca celular, p. ej. exhibiendo viabilidades de más de 90% durante las etapas de subcultivo convencionales, preferiblemente más de 95%.
De acuerdo con la invención, la fuente de carbono basal se utiliza típicamente en una cantidad en exceso o sobrante, lo que se entiende como un exceso que proporciona energía para aumentar la biomasa, p. ej. durante el cultivo de una línea celular con una alta tasa de crecimiento específica, tal como durante la fase de crecimiento de una línea celular en un procedimiento de cultivo discontinuo o por lote alimentado. Esta cantidad sobrante es particularmente superior a la cantidad limitada de una fuente de carbono complementaria (como se emplea en condiciones de crecimiento limitado) para lograr una concentración residual en el caldo de fermentación que sea medible y típicamente al menos 10 veces mayor, preferiblemente al menos 50 veces o al menos 100 veces mayor que durante la alimentación de la cantidad limitada de la fuente de carbono complementaria.
Una "fuente de carbono complementaria" tal como se emplea de acuerdo con la invención es típicamente un sustrato complementario que facilita la producción de productos de fermentación por líneas celulares de producción, en particular en la fase de producción de un procedimiento de cultivo. La fase de producción sigue específicamente una fase de crecimiento, p. ej. en un procedimiento de cultivo discontinuo, por lote alimentado y continuo. La fuente de carbono complementaria específicamente puede estar contenida en la alimentación de un procedimiento por lote alimentado. La fuente de carbono complementaria se emplea típicamente en un cultivo celular en condiciones limitadas de sustrato de carbono, es decir, utilizando la fuente de carbono en una cantidad limitada.
En el presente documento se entiende que una "cantidad limitada" de una fuente de carbono o una "fuente de carbono limitada" se refiere específicamente al tipo y cantidad de un sustrato de carbono que facilita la producción de productos de fermentación por líneas celulares de producción, en particular en un procedimiento de cultivo con tasas de crecimiento controladas inferiores a la tasa máxima de crecimiento. La fase de producción sigue específicamente una fase de crecimiento, p. ej. en un procedimiento de cultivo discontinuo, por lote alimentado y continuo. Los procedimientos de cultivo celular pueden emplear cultivo discontinuo, cultivo continuo y cultivo por lote alimentado. El cultivo discontinuo es un procedimiento de cultivo mediante el cual se añade una pequeña cantidad de una solución de cultivo de siembra a un medio y las células se cultivan sin añadir un medio adicional o descargar una solución de cultivo durante el cultivo. El cultivo continuo es un procedimiento de cultivo mediante el cual un medio se añade y descarga continuamente durante el cultivo. El cultivo continuo también incluye cultivo de perfusión. El cultivo por lote alimentado, que es un intermedio entre el cultivo discontinuo y el cultivo continuo y también conocido como cultivo semicontinuo, es un procedimiento de cultivo mediante el cual se añade un medio de manera continua o secuencial durante el cultivo pero, a diferencia del cultivo continuo, un solución de cultivo no se descarga continuamente.
Se prefiere específicamente un procedimiento por lote aimentado que se basa en la alimentación de un sustrato de nutrientes que limita el crecimiento a un cultivo. La estrategia de lote alimentado, incluida la fermentación por lote alimentado única o por lote alimentado repetida, se utiliza típicamente en procedimientos bioindustriales para alcanzar una alta densidad celular en el biorreactor. La adición controlada del sustrato de carbono afecta directamente a la tasa de crecimiento del cultivo y ayuda a evitar el metabolismo por desbordamiento o la formación de subproductos metabólicos no deseados. En condiciones limitadas de fuente de carbono, la fuente de carbono puede estar contenida específicamente en la alimentación de un procedimiento por lote alimentado. Por tanto, el sustrato de carbono se proporciona en una cantidad limitada.
Asimismo, en el cultivo en quimiostato o continuo como se describe en el presente documento, la tasa de crecimiento se puede controlar estrictamente.
En el presente documento se entiende particularmente que la cantidad limitada de una fuente de carbono es la cantidad de una fuente de carbono necesaria para mantener una línea celular de producción en condiciones de crecimiento limitado, p. ej. en una fase de producción o modo de producción. Tal cantidad limitada se puede emplear en un procedimiento por lote alimentado, donde la fuente de carbono está contenida en un medio de alimentación y se suministra al cultivo a tasas de alimentación bajas para un suministro de energía sostenido, p. ej. para producir una POI, manteniendo la biomasa a tasas de crecimiento específicas bajas. Típicamente, se añade un medio de alimentación a un caldo de fermentación durante la fase de producción de un cultivo celular.
La cantidad limitada de una fuente de carbono se puede determinar, por ejemplo, por la cantidad residual de la fuente de carbono en el caldo de cultivo celular, que está por debajo de un umbral predeterminado o incluso por debajo del límite de detección medido en un ensayo convencional (carbohidrato). La cantidad residual típicamente se determinaría en el caldo de fermentación al recolectar un producto de fermentación.
La cantidad limitada de una fuente de carbono también se puede determinar definiendo la tasa de alimentación promedio de la fuente de carbono al fermentador, p. ej. según lo determinado por la cantidad añadida durante todo el procedimiento de cultivo, p. ej. la fase por lote alimentado, por tiempo de cultivo, para determinar una cantidad media calculada por tiempo. Esta tasa de alimentación promedio se mantiene baja para garantizar el uso completo de la fuente de carbono complementaria por parte del cultivo celular, p. ej. entre 0,6 g L-1 h-1 (g de fuente de carbono por L de volumen de fermentación inicial y h de tiempo) y 25 g L-1 h-1, preferiblemente entre 1,6 g L-1 h-1 y 20 g L-1 h-1.
La cantidad limitada de una fuente de carbono también se puede determinar midiendo la tasa de crecimiento específica, cuya tasa de crecimiento específica se mantiene baja, p. ej. menor que la tasa de crecimiento específica máxima, durante la fase de producción, p. ej. dentro de un rango predeterminado, tal como en el rango de 0,001 h-1 a 0,20 h-1, o 0,005 h-1 a 0,20 h-1, preferiblemente entre 0,01 h-1 y 0,15 h-1.
Específicamente, se utiliza un medio de alimentación químicamente definido y libre de metanol.
El término "químicamente definido" con respecto al medio de cultivo celular, tal como un medio mínimo o medio de alimentación en un procedimiento de alimentación por lotes, significará un medio de cultivo adecuado para el cultivo celular in vitro de una línea celular de producción, en la que se conocen todos los componentes químicos y (poli)péptidos. Típicamente, un medio químicamente definido está completamente libre de componentes derivados de animales y representa un entorno de cultivo celular puro y uniforme.
El término "línea celular", como se emplea en el presente documento, se refiere a un clon establecido de un tipo celular particular que ha adquirido la capacidad de proliferar durante un período de tiempo prolongado. El término "línea celular anfitriona" se refiere a una línea celular como la empleada para expresar un gen endógeno o recombinante o productos de una ruta metabólica para producir polipéptidos o metabolitos celulares mediados por tales polipéptidos.
Una "línea de células anfitrionas de producción" o "línea celular de producción" se entiende comúnmente como una línea celular lista para su uso para el cultivo en un biorreactor para obtener el producto de un procedimiento de producción, tal como una POI. Los términos "anfitrión eucariótico" o "línea celular eucariótica" significará cualquier célula u organismo eucariótico, que pueda cultivarse para producir una POI o un metabolito de la célula anfitriona. Está bien entendido que el término no incluye a los seres humanos.
Los términos "cultivo celular" o "cultivo", también denominado "fermentación", con respecto a una línea de células anfitrionas, significa el mantenimiento de células en un entorno artificial, p. ej., in vitro, en condiciones favorables al crecimiento, diferenciación o viabilidad continuada, en estado activo o quiescente, de las células, específicamente en un biorreactor controlado según métodos conocidos en la industria.
Cuando se cultiva un cultivo celular utilizando el medio de cultivo de la presente invención, el cultivo celular se pone en contacto con el medio en un recipiente de cultivo o con el sustrato en condiciones adecuadas para soportar el cultivo del cultivo celular. En determinadas realizaciones, se utiliza un medio de cultivo como se describe en el presente documento para cultivar células de acuerdo con mecanismos de cultivo celular convencionales que son bien conocidos en la técnica. En varios aspectos de la invención, se proporciona un medio de cultivo que se puede utilizar para el crecimiento de células eucarióticas, específicamente levaduras u hongos filamentosos.
Los medios de cultivo celular proporcionan los nutrientes necesarios para mantener y hacer crecer las células en un entorno controlado, artificial e in vitro. Las características y composiciones de los medios de cultivo celular varían dependiendo de los requisitos celulares particulares. Los parámetros importantes incluyen la osmolalidad, el pH y las formulaciones de nutrientes. La alimentación de nutrientes se puede realizar de forma continua o discontinua de acuerdo con métodos conocidos en la técnica. Los medios de cultivo utilizados según la invención son particularmente útiles para producir proteínas recombinantes.
Mientras que un procedimiento discontinuo es un modo de cultivo en el que todos los nutrientes necesarios para el cultivo de las células están contenidos en el medio de cultivo inicial, sin un suministro adicional de nutrientes adicionales durante la fermentación, en un procedimiento por lote alimentado, después de una fase discontinua, tiene lugar una fase de alimentación en la que se suministran uno o más nutrientes al cultivo mediante la alimentación. El propósito de la alimentación con nutrientes es aumentar la cantidad de biomasa para aumentar también la cantidad de proteína recombinante. Aunque en la mayoría de los procedimientos de cultivo el modo de alimentación es crítico e importante, la presente invención que emplea el promotor de la invención no está restringida con respecto a un cierto modo de cultivo.
En determinadas realizaciones, el método de la invención es un procedimiento por lote alimentado. Específicamente, una célula anfitriona transformada con una construcción de ácido nucleico que codifica una POI recombinante deseada, se cultiva en un medio en fase de crecimiento y se pasa a un medio en fase de producción para producir una POI recombinante deseada.
En otra realización, las células anfitrionas de la presente invención se cultivan en modo continuo, p. ej. en un quimiostato. Un procedimiento de fermentación continua se caracteriza por una velocidad definida, constante y continua de alimentación de medio de cultivo de nueva aportación al biorreactor, mediante el cual el caldo de cultivo se retira al mismo tiempo del biorreactor a la misma tasa de eliminación definida, constante y continua. Al mantener el medio de cultivo, la tasa de alimentación y la tasa de eliminación al mismo nivel constante, los parámetros de cultivo y las condiciones en el biorreactor permanecen constantes.
Se entiende específicamente que un cultivo celular estable como se describe en el presente documento se refiere a un cultivo celular que mantiene las propiedades genéticas, específicamente manteniendo alto el nivel de producción de POI, p. ej. al menos a un nivel de pg, incluso después de aproximadamente 20 generaciones de cultivo, preferiblemente al menos 30 generaciones, más preferiblemente al menos 40 generaciones, lo más preferido de al menos 50 generaciones. Específicamente, se proporciona una línea celular anfitriona recombinante estable que se considera una gran ventaja cuando se utiliza para producción a escala industrial.
El cultivo celular de la invención es particularmente ventajoso para métodos a escala de fabricación industrial, p. ej. con respecto al volumen y al sistema técnico, combinado con un modo de cultivo que se basa en la alimentación de nutrientes, en particular un procedimiento por lote alimentado o discontinuo, o un procedimiento continuo o semicontinuo (p. ej., quimiostato).
Los términos "expresión" o "sistema de expresión" o "casete de expresión" se refieren a moléculas de ácido nucleico que contienen una secuencia codificante deseada y secuencias de control en conexión operable, de modo que los anfitriones transformados o transfectados con estas secuencias son capaces de producir las proteínas codificadas o los metabolitos de las células anfitrionas. Para efectuar la transformación, el sistema de expresión se puede incluir en un vector; sin embargo, el ADN relevante también se puede integrar en el cromosoma del anfitrión. La expresión se puede referir a productos de expresión secretados o no secretados, incluidos polipéptidos o metabolitos.
"Construcciones de expresión" o "vectores" o "plásmido" utilizados en el presente documento se definen como secuencias de ADN que se requieren para la transcripción de secuencias de nucleótidos recombinantes clonadas, es decir, de genes recombinantes y la traducción de su ARNm en un organismo anfitrión adecuado. Los vectores de expresión o plásmidos generalmente comprenden un origen para la replicación autónoma en las células anfitrionas, marcadores seleccionables (p. ej., un gen de síntesis de aminoácidos o un gen que confiere resistencia a antibióticos tales como zeocina, kanamicina, G418 o higromicina), varios sitios de escisión para enzimas de restricción, una secuencia promotora adecuada y un terminador de la transcripción, cuyos componentes están conectados operablemente entre sí. Los términos "plásmido" y "vector", como se emplean en el presente documento, incluyen secuencias de nucleótidos que se replican de forma autónoma, así como secuencias de nucleótidos que integran el genoma.
La construcción de expresión de la invención comprende específicamente un promotor de la invención, conectado operablemente a una secuencia de nucleótidos que codifica una POI bajo el control transcripcional de dicho promotor, cuyo promotor no está asociado de forma nativa con la secuencia codificante de la POI.
El término "heterólogo" como se emplea en el presente documento con respecto a una secuencia de nucleótidos o aminoácidos o proteína, se refiere a un compuesto que es foráneo, es decir "exógeno", por ejemplo, que no se encuentra en la naturaleza, con respecto a una célula anfitriona dada; o que se encuentra naturalmente en una célula anfitriona dada, por ejemplo, es "endógeno", sin embargo, en el contexto de una construcción heteróloga, p. ej., que emplea un ácido nucleico heterólogo. La secuencia de nucleótidos heteróloga que se encuentra endógenamente también se puede producir en una cantidad no natural, p. ej. mayor de la esperada o mayor de la que se encuentra naturalmente, en la célula. La secuencia de nucleótidos heteróloga, o un ácido nucleico que comprende la secuencia de nucleótidos heteróloga, posiblemente tenga una secuencia diferente de la secuencia de nucleótidos endógena pero codifique la misma proteína que se encuentra endógenamente. Específicamente, las secuencias de nucleótidos heterólogas son aquellas que no se encuentran en la misma relación con una célula anfitriona en la naturaleza. Se entiende que cualquier secuencia de nucleótidos recombinante o artificial es heteróloga. Un ejemplo de un polinucleótido heterólogo es una secuencia de nucleótidos no asociada de forma nativa con el promotor según la invención, p. ej. para obtener un promotor híbrido, o conectada operablemente a una secuencia codificante, como se describe en el presente documento. Como resultado, se puede obtener un polinucleótido híbrido o quimérico. Un ejemplo adicional de un compuesto heterólogo es un polinucleótido que codifica una POI conectado operablemente a un elemento de control de la transcripción, p. ej., un promotor de la invención, al que una secuencia codificante de POI endógena de origen natural no está normalmente conectada operablemente.
El término "variante" como se emplea en el presente documento en el contexto de la presente invención se referirá a cualquier secuencia con una identidad de secuencia específica u homología con una secuencia parental comparable. Una variante es específicamente cualquier secuencia obtenida a partir de una secuencia parental, p. ej., por variación de tamaño, tal como elongación (terminal o no terminal, tal como "intersticial", es decir, con deleciones o inserciones dentro de la secuencia de nucleótidos) o fragmentación, mutación, hibridación (incluyendo combinación de secuencias).
El promotor pG1-x como se describe en el presente documento es específicamente una variante artificial del promotor pG1 nativo (tipo salvaje). Aunque existe un cierto grado de identidad de secuencia con la estructura nativa, se entiende bien que los materiales, métodos y usos de la invención, p. ej. que se refieren específicamente a secuencias de ácido nucleico aisladas, secuencias de aminoácidos, construcciones de expresión, células anfitrionas transformadas y proteínas recombinantes, son "hechas por el hombre" o sintéticas y, por lo tanto, no se consideran un resultado de la "ley de la naturaleza".
El promotor denominado en el presente documento "promotor pG1-x" es una variante del promotor pG1 y su secuencia de nucleótidos se puede producir mediante mutagénesis del promotor pG1 que se utiliza como secuencia "parental" para producir una variante. Un promotor pG1-x incluye un promotor que comprende dos, tres, cuatro o más copias de SEQ ID 2, SEQ ID 3, SEQ ID 4 o SEQ ID 5.
Una serie de promotores pG1-x se ilustra, p. ej., por el promotor que comprende o consiste en cualquiera de las secuencias ilustradas en la Figura 6b, en particular cualquiera de las siguientes secuencias:
a) SEQ ID 37-44, preferiblemente cualquiera de SEQ ID 45-76;
b) SEQ ID 77-80, preferiblemente cualquiera de SEQ ID 81-112;
c) SEQ ID 113-114, preferiblemente cualquiera de SEQ ID 115-130;
d) SEQ ID 131-132, preferiblemente cualquiera de SEQ ID 133-148;
e) SEQ ID 185-186, preferiblemente cualquiera de SEQ ID 187-202
Un promotor pG1-x también incluye fragmentos 3' de uno cualquiera de SEQ ID 37 a SEQ ID 202 en donde parte o todo el extremo 5' terminal hasta la primera región o región reguladora principal 5' se ha eliminado; preferiblemente, se eliminan hasta 50, 100, 150, 200, 250, 300, 320 o 325 nucleótidos del extremo 5' terminal de uno cualquiera de SEQ ID 37 a SEQ ID 202.
El promotor pG1-x se caracteriza por tener un aumento de fuerza del promotor y/o razón de inducción en comparación con el promotor pG1, en donde
- la fuerza del promotor es al menos 1,1 veces mayor en el estado inducido en comparación con el promotor pG1, y/o
- la razón de inducción es al menos 1,1 veces mayor en comparación con el promotor pG1.
Otras variantes de pG1-x son factibles, por ejemplo, utilizando el promotor pG1-x ilustrado en la Figura 6b, o variantes de tamaño, en particular variantes alargadas o fragmentos de las mismas, como secuencias "parentales" para producir variantes por mutagénesis de ciertas regiones, en particular tales, que se mantengan o incluso mejoren los elementos y funciones esenciales del promotor. Las variantes del promotor pG1-x pueden, por ejemplo, obtenerse a partir de cualquiera de las secuencias del promotor pG1-x ilustradas mediante mutagénesis para producir secuencias adecuadas para su uso como promotor en líneas celulares recombinantes. Tal promotor variante se puede obtener a partir de una biblioteca de secuencias mutantes seleccionando los miembros de la biblioteca con propiedades predeterminadas. Los promotores variantes pueden tener propiedades iguales o incluso mejoradas, p. ej. mejoradas en la fuerza del promotor, la inducción de la producción de p O i, con un efecto diferencial aumentado en condiciones de represión y desrepresión (en particular, la razón de inducción). El promotor variante también puede comprender una secuencia de nucleótidos de secuencias análogas, p. ej. de especies eucariotas distintas de Pichia pastoris o de un género distinto de Pichia, tal como de K. lactis, Z. rouxii, P. stipitis, H. polymorpha.
El término "funcionalmente activo" como se utiliza en el presente documento con respecto a, p. ej., una variante del promotor, el promotor pG1-x o una variante de un promotor pG1-x como se describe en el presente documento o una variante del promotor pG1, significa una secuencia variante resultante de la modificación de una secuencia parental por mutagénesis, específicamente por inserción, deleción o sustitución de uno o más nucleótidos dentro de la secuencia o en uno o en ambos extremos distales de la secuencia, y cuya modificación no afecta a (en particular perjudica) la actividad de esta secuencia. Con respecto al promotor pG1 -x como se describe en el presente documento, la función y la actividad se caracterizan específicamente por la actividad y la fuerza del promotor, así como por la razón de inducción.
Las variantes del promotor funcionalmente activas como se describen en el presente documento se caracterizan específicamente por exhibir sustancialmente la misma actividad del promotor que el promotor pG1 (+/- 10%, o /- 5%), o incluso superior.
Las variantes de promotor funcionalmente activas como se describen en el presente documento se caracterizan específicamente por exhibir sustancialmente las mismas propiedades regulables que el promotor pG1, p. ej., medidas por la razón de inducción (+/- 10%, o /- 5%), o una razón de inducción incluso mayor.
El término "promotor", como se emplea en el presente documento, se refiere a una secuencia de ADN capaz de controlar la expresión de una secuencia codificante o ARN funcional. La actividad del promotor se puede evaluar por su eficacia transcripcional. Esto se puede determinarse directamente midiendo la cantidad de transcripción de ARNm del promotor, p. ej. mediante Transferencia Northern o indirectamente mediante la medición de la cantidad de producto génico expresado a partir del promotor.
El promotor pG1-x como se describe en el presente documento inicia, regula o media de otro modo o controla específicamente la expresión de un ADN codificante. El ADN promotor y el ADN codificante pueden ser del mismo gen o de diferentes genes, y pueden ser del mismo organismo o de diferentes organismos.
Se entiende específicamente que el promotor pG1-x como se describe en el presente documento es un promotor regulable, en particular un promotor regulable por fuente de carbono con diferente fuerza de promotor en el estado reprimido e inducido.
La fuerza del promotor de la invención se refiere específicamente a su fuerza de transcripción, representada por la eficiencia del inicio de la transcripción que se produce en ese promotor con alta o baja frecuencia. Cuanto mayor sea la fuerza de transcripción, más frecuentemente se producirá la transcripción en ese promotor. La fuerza del promotor es importante, porque determina la frecuencia con la que se transcribe una secuencia de ARNm determinada, lo que otorga una mayor prioridad a la transcripción de algunos genes sobre otros, lo que conduce a una mayor concentración del transcrito. Un gen que codifica una proteína que se requiere en grandes cantidades, por ejemplo, típicamente tiene un promotor relativamente fuerte. La ARN polimerasa solo puede realizar una tarea de transcripción a la vez y, por lo tanto, debe priorizar su trabajo para ser eficiente. Las diferencias en la fuerza del promotor se seleccionan para permitir esta priorización.
Según la invención, el promotor regulable es relativamente fuerte en el estado completamente inducido, que se entiende típicamente como el estado de actividad aproximadamente máxima.
La fuerza relativa se determina comúnmente con respecto a un promotor comparable, tal como el promotor pG1, o un promotor convencional, tal como el promotor pGAP respectivo de la célula que se utiliza como célula anfitriona. La frecuencia de transcripción se entiende comúnmente como la tasa de transcripción, p. ej. determinada por la cantidad de un transcrito en un ensayo adecuado, p. ej. RT-PCR o transferencia Northern. Por ejemplo, la fuerza de transcripción de un promotor según la invención se determina en la célula anfitriona que es P. pastoris y en comparación con el promotor pGAP nativo de P. pastoris.
La fuerza de un promotor para expresar un gen de interés se entiende comúnmente como la fuerza de expresión o la capacidad de soportar un nivel/tasa de expresión altos. Por ejemplo, la fuerza de expresión y/o transcripción de un promotor de la invención se determina en la célula anfitriona que es P. pastoris y se compara con el promotor pGAP nativo de P. pastoris.
La fuerza de transcripción comparativa que emplea el promotor pGAP como referencia (patrón) se puede determinar por medios convencionales, por ejemplo midiendo la cantidad de transcritos, p. ej. empleando una micromatriz, o también en un cultivo celular, tal como midiendo la cantidad de productos de expresión génica respectivos en células recombinantes. Una prueba ilustrativa se representa en la sección de Ejemplos.
En particular, la tasa de transcripción puede ser determinada por la fuerza de transcripción en una micromatriz, o con PCR cuantitativa en tiempo real (qRT-PCR) donde los datos de la micromatriz o qRT-PCR muestran la diferencia de nivel de expresión entre condiciones con alta tasa de crecimiento y condiciones con baja tasa de crecimiento, o condiciones que emplean diferentes composiciones de medios, y una alta intensidad de señal en comparación con el promotor pGAP nativo.
La tasa de expresión se puede determinar, por ejemplo, por la cantidad de expresión de un gen indicador, como eGFP.
El promotor pG1-x como se describe en el presente documento ejerce una fuerza de transcripción relativamente alta, reflejada por una tasa de transcripción o fuerza de transcripción de al menos 15% en comparación con el promotor pGAP nativo en la célula anfitriona, a veces llamado "promotor pGAP homólogo". Preferiblemente, la tasa o fuerza de transcripción es al menos 20%, en casos específicamente preferidos al menos 30%, al menos 40%, al menos 50%, al menos 60%, al menos 70%, al menos 80%, al menos 90% y al menos 100% o incluso más, tal como al menos 150% o al menos 200% en comparación con el promotor pGAP nativo, p. ej. determinada en la célula eucariótica seleccionada como célula anfitriona para producir la POI.
El promotor pGAP nativo típicamente inicia la expresión del gen gap que codifica gliceraldehído-3-fosfato deshidrogenasa (GAPDH), que es un promotor constitutivo presente en la mayoría de los organismos vivos. GAPDH (EC 1\2\1\12), una enzima clave de la glucólisis y la gluconeogénesis, juega un papel crucial en el metabolismo catabólico y anabólico de los carbohidratos.
El promotor pGAP nativo es específicamente activo en una célula eucariótica recombinante de una manera similar a la de una célula eucariótica nativa de la misma especie o cepa, incluyendo la célula eucariótica no modificada (no recombinante) o recombinante. Se entiende comúnmente que tal promotor pGAP nativo es un promotor endógeno, por lo tanto, homólogo a la célula eucariótica, y sirve como promotor convencional o de referencia con fines de comparación.
Por ejemplo, un promotor pGAP nativo de P. pastoris es la secuencia promotora endógena no modificada en P. pastoris, como se utiliza para controlar la expresión de GAPDH en P. pastoris, p.ej. que tiene la secuencia mostrada en la Figura 13: secuencia del promotor pGAP nativo de P. pastoris (GS115) (SEC ID 260). Si P. pastoris se utiliza como anfitrión para producir una POI según la invención, la fuerza o tasa de transcripción del promotor según la invención se compara con tal promotor pGAP nativo de P. pastoris.
Como otro ejemplo, un promotor pGAP nativo de S. cerevisiae es la secuencia promotora endógena no modificada en S. cerevisiae, que se emplea para controlar la expresión de GAPDH en S. cerevisiae. Si S. cerevisiae se utiliza como anfitrión para producir una POI según la invención, la fuerza o tasa de transcripción del promotor según la invención se compara con tal promotor pGAP nativo de S. cerevisiae.
Por tanto, la expresión relativa o la fuerza de transcripción de un promotor según la invención se compara habitualmente con el promotor pGAP nativo de una célula de la misma especie o cepa que se utiliza como anfitrión para producir una POI.
El término "regulable" con respecto a un promotor pG1 -x o un promotor pG1 como se utiliza en el presente documento se referirá a un promotor que está reprimido en una célula eucariótica en presencia de una cantidad en exceso de una fuente de carbono (nutriente o sustrato basal) en la fase de crecimiento de un cultivo discontinuo, y desreprimido para ejercer una fuerte actividad promotora en la fase de producción de una línea celular de producción, p. ej. tras la reducción de la cantidad de carbono, tal como tras la alimentación de una fuente de carbono que limita el crecimiento (nutriente o sustrato complementario) a un cultivo de acuerdo con la estrategia por lote alimentado. En este sentido, el término "regulable" se entiende como "regulable por límite de fuente de carbono" o "regulable por límite de glucosa", refiriéndose a la des-represión de un promotor por consumo, reducción, deficiencia o agotamiento de carbono, o por adición limitada de la fuente de carbono para que las células lo consuman fácilmente.
El promotor pG1-x funcionalmente activo como se describe en el presente documento es un promotor regulable relativamente fuerte que se silencia o reprime en condiciones de crecimiento celular (fase de crecimiento) y se activa o des-reprime en condiciones de producción (fase de producción) y, por lo tanto, es adecuado para inducir la producción de POI en una línea celular de producción limitando la fuente de carbono.
Específicamente, el promotor como se describe en el presente documento es regulable por fuente de carbono con una fuerza diferencial del promotor según se determina en una prueba que compara su fuerza en presencia de glucosa y limitación de glucosa, lo que demuestra que todavía está reprimido a concentraciones de glucosa relativamente altas, preferiblemente a concentraciones de al menos 10 g/L, preferiblemente al menos 20 g/L. Específicamente, el promotor de acuerdo con la invención se induce completamente a concentraciones limitadas de glucosa y concentraciones umbral de glucosa que inducen completamente el promotor, cuyo umbral es menos de 20 g/L, preferiblemente menos de 10 g/L, menos de 1 g/L, incluso menos de 0,1 g/L o menos de 50 mg/L, preferiblemente con una fuerza de transcripción completa de p. ej. al menos 50% de la del promotor pGAP homólogo nativo, a concentraciones de glucosa de menos de 40 mg/L.
Preferiblemente, la razón de inducción se entiende como una fuerza promotora diferencial que se determina mediante el inicio de la producción de POI al cambiar a condiciones inductoras por debajo de un umbral de fuente de carbono predeterminado, y se compara con la fuerza en el estado reprimido. La fuerza de la transcripción se entiende comúnmente como la fuerza en el estado completamente inducido, es decir, que muestra las actividades aproximadamente máximas en condiciones de desrepresión. La fuerza diferencial del promotor es, p. ej. determinada de acuerdo con la eficiencia o el rendimiento de la producción de POI en una línea celular anfitriona recombinante en condiciones de desrepresión en comparación con las condiciones de represión, o también por la cantidad de un transcrito. El promotor regulable de acuerdo con la invención tiene una fuerza de promotor diferencial preferida, que es al menos 2 veces, más preferiblemente al menos 5 veces, incluso más preferida al menos 10 veces, más preferida al menos 20 veces, más preferiblemente al menos 30, 40, 50 o 100 veces en el estado des-reprimido en comparación con el estado reprimido, también entendido como multiplicidad de inducción.
El término "identidad de secuencia" de una variante en comparación con una secuencia parental indica el grado de identidad (u homología) en el que dos o más secuencias de nucleótidos tienen pares de bases iguales o conservados en una posición correspondiente, hasta cierto grado, hasta un grado cercano al 100%. Una secuencia homóloga tiene típicamente al menos aproximadamente 50% de identidad de secuencia de nucleótidos, preferiblemente al menos aproximadamente 60% de identidad, más preferiblemente al menos aproximadamente 70% de identidad, más preferiblemente al menos aproximadamente 80% de identidad, más preferiblemente al menos aproximadamente 90% de identidad, más preferiblemente al menos aproximadamente 95% de identidad.
El "porcentaje (%) de identidad" con respecto a la secuencia de nucleótidos, p. ej., de un promotor o un gen, se define como el porcentaje de nucleótidos en una secuencia de ADN candidata que es idéntica a los nucleótidos en la secuencia de ADN, después de alinear la secuencia e introducir huecos, si fuera necesario, para lograr el porcentaje máximo de identidad de secuencia, y no considerar sustituciones conservativas como parte de la identidad de secuencia. El alineamiento con el propósito de determinar el porcentaje de identidad de la secuencia de nucleótidos se puede lograr de varias formas que están dentro del conocimiento práctico de la técnica, por ejemplo, utilizando soporta lógico informático disponible públicamente. Los expertos en la técnica pueden determinar los parámetros apropiados para medir el alineamiento, incluidos los algoritmos necesarios para lograr el alineamiento máximo en toda la longitud de las secuencias que se comparan. Para los fines de la presente invención, la identidad de secuencia entre dos secuencias de nucleótidos se determina utilizando el programa BLAST versión 2.2.29 (06-ene-2014) del NCBI con blastn establecido en los siguientes parámetros ilustrativos: Tamaño de Palabra: 11; Valor esperado: 10; Penalización por hueco: Existencia = 5, Extensión = 2; Filtro = activado por baja complejidad; Puntuaciones de emparejamiento/emparejamiento erróneo: 2, -3; Cordón “String” de filtro: L; m.
El término "mutagénesis" como se utiliza en el contexto de la presente invención se referirá a un método para proporcionar mutantes de una secuencia de nucleótidos, p. ej. mediante inserción, deleción y/o sustitución de uno o más nucleótidos, para obtener variantes de los mismos con al menos un cambio en la región codificante o no codificante. La mutagénesis puede ser por mutación aleatoria, semi-aleatoria o dirigida al sitio. Las variantes del promotor de pG1-x específicas se obtienen a partir de la secuencia del promotor pG1 mediante un método de mutagénesis utilizando la secuencia de nucleótidos de pG1 como secuencia parental. Tal método de mutagénesis abarca aquellos métodos de modificación mediante ingeniería genética del ácido nucleico o síntesis de novo de una secuencia de nucleótidos utilizando la información de la secuencia del promotor pG1 como molde. Los métodos de mutagénesis específicos aplican la modificación mediante ingeniería genética de promotores racional.
El promotor pG1-x se puede producir mediante mutagénesis del promotor pG1, y se pueden producir adicionalmente variantes del promotor pG1-x como se describe en el presente documento, incluidas variantes funcionalmente activas, empleando técnicas convencionales. El promotor puede, p. ej. modificarse para generar variantes del promotor con niveles de expresión y propiedades reguladoras alterados. Por ejemplo, se puede preparar una biblioteca de promotores mediante mutagénesis de secuencias de promotores seleccionadas, que se pueden utilizar como moléculas parentales, p. ej. para ajustar la expresión génica en células eucarióticas analizando variantes para su expresión bajo diferentes estrategias de fermentación y seleccionando variantes adecuadas. Se puede utilizar una biblioteca sintética de variantes, p. ej. para seleccionar un promotor que cumpla con los requisitos para producir una POI seleccionada. Tales variantes pueden tener una mayor eficiencia de expresión en células anfitrionas eucarióticas y una expresión diferencial en condiciones limitantes y ricas en fuentes de carbono. Típicamente, se producen grandes bibliotecas de genes aleatorizadas con una alta diversidad de genes, que se pueden seleccionar de acuerdo con un genotipo o fenotipo específicamente deseados.
Algunos de los promotores pG1-x preferidos como se describen en el presente documento son variantes de tamaño del promotor pG1 y comprenden más de una copia de ciertos elementos o regiones del promotor, o comprenden uno o más fragmentos (iguales o diferentes) del promotor pG1.
Los métodos de mutagénesis específicos proporcionan mutaciones puntuales de uno o más nucleótidos en una secuencia, en particular mutaciones puntuales en tándem, como para cambiar al menos 2, 3, 4, 5, 6, 7, 8, 9, 10 o incluso más nucleótidos continuos dentro de la secuencia de nucleótidos del promotor. Tal mutación es típicamente al menos una de una deleción, inserción y/o sustitución de uno o más nucleótidos. La secuencia promotora puede estar mutada en los extremos distales, en particular dentro de la región 5' que asciende hasta 50% de la secuencia de nucleótidos, que puede ser muy variable sin perder sustancialmente la actividad promotora. La secuencia promotora se puede mutar específicamente dentro de la región reguladora principal, sin embargo, se prefiere que la identidad de secuencia con la región reguladora principal parental de pG1 y en particular con la región reguladora central parental sea alta, tal como p. ej. al menos 80%. Dentro de la región reguladora principal, pero fuera de la región reguladora central, la variabilidad de la secuencia puede ser mayor para obtener una identidad de secuencia de menos de 80%.
La región reguladora central incorpora específicamente SEC ID 2 y SEC ID 3, que representan los sitios de unión del factor de transcripción (TFBS) y una región intersticial entre SEC ID 2 y SEC ID 3.
La secuencia de nucleótidos identificada como SEQ ID 2 comprende al menos parte del TFBS reconocido por Rgt1, Cat8-1 y Cat8-2.
La secuencia de nucleótidos identificada como SEQ ID 3 comprende al menos parte del TFBS reconocido por Rgt1, Cat8-1 y Cat8-2.
Específicamente, la secuencia de nucleótidos entre SEQ ID 2 y SEQ ID 3 (la secuencia intersticial) puede mutar a una secuencia no homóloga (p. ej., con una identidad de secuencia de menos de 50%) o incluso eliminarse.
Cualquier mutación dentro de SEQ ID 2 y SEQ ID 3 es específicamente conservativa, es decir, tal como para mantener (o mejorar) el reconocimiento por el factor de transcripción respectivo. Tras modificar por ingeniería genética tales mutantes conservativos, la identidad de secuencia dentro de la secuencia de nucleótidos de SEQ ID 2 y/o SEQ ID 3 es al menos 90%, preferiblemente al menos 95%.
La región reguladora principal comprende o consiste en la secuencia de nucleótidos identificada por SEQ ID 5. Tal región comprende la región reguladora central y la región reguladora no central adicional, que comprende elementos esenciales del promotor pG1 y que puede mutar hasta cierto punto para producir el promotor pG1 -x como se describe en el presente documento.
Las regiones específicas de mutagénesis dirigida al sitio son, p. ej., la región reguladora no central del promotor pG1 o pG1-x (dentro o fuera de la región reguladora principal). Sin embargo, también se pueden preparar mutantes específicos mediante métodos de mutagénesis dirigidos a la región reguladora central del promotor, manteniendo un cierto grado de identidad de secuencia para mantener la función del promotor. Otras regiones específicas están fuera o dentro de la región reguladora principal. Específicamente, el promotor puede comprender una secuencia de nucleótidos híbrida, p. ej. que comprende la región reguladora central del promotor pG1 y una o más regiones o promotores alternativos (nativos o artificiales), por ejemplo, se puede utilizar el sitio de inicio de la traducción en la región 3' (específicamente el extremo 3' que comprende al menos 10 nucleótidos terminales, o al menos 15 nucleótidos terminales) de un promotor que no sea el promotor pG1 para sustituir el sitio de inicio de la traducción del promotor pG1.
Las mutaciones específicas se refieren a la duplicación de regiones seleccionadas (o motivos) del promotor pG1, p. ej., el motivo T o el motivo T extendido. Tales motivos seleccionados se pueden alargar mediante nucleótidos adicionales o acortar en uno o ambos extremos distales del motivo, o dentro del motivo. La secuencia de pG1 nativa comprende un motivo TAT que consiste en los nucleótidos "T" seguido de "A" seguido de T15 (SEQ ID 14). Tal motivo TAT 5-TATTTTTTTTTTTTTTT-3' (SEQ ID 22) ha resultado tener un efecto positivo sobre la fuerza del promotor, que incluso puede incrementarse duplicando el motivo TAT, o insertando al menos 2, 3 o 4 copias del motivo TAT, ya sea el mismo motivo TAT o utilizando un motivo T alternativo, el motivo T extendido (p. ej., un motivo TAT), que comprende al menos el motivo T13 (SEQ ID 12).
La invención abarca adicionalmente una secuencia de nucleótidos que hibrida en condiciones rigurosas con el promotor pG1-x.
Como se utiliza en la presente invención, se pretende que el término "hibridación" o "hibridando" signifique el procedimiento durante el cual dos secuencias de ácido nucleico se reasocian entre sí con enlaces de hidrógeno estables y específicos para formar una doble hebra en condiciones apropiadas. La hibridación entre dos secuencias complementarias o secuencias suficientemente complementarias depende de las condiciones operativas que se utilicen, y en particular de la rigurosidad. Se puede entenderse que la rigurosidad indica el grado de homología; cuanto mayor sea la rigurosidad, mayor será el porcentaje de homología entre las secuencias. La rigurosidad puede definirse en particular por la composición de bases de las dos secuencias nucleicas y/o por el grado de emparejamientos erróneos entre estas dos secuencias nucleicas. Variando las condiciones, p. ej. concentración de sal y temperatura, se puede permitir que una secuencia de ácido nucleico dada hibride solo con su complemento exacto (alta rigurosidad) o con cualquier secuencia algo relacionada (baja rigurosidad). El aumento de la temperatura o la disminución de la concentración de sal pueden tender a aumentar la selectividad de una reacción de hibridación.
Como se emplea en el presente documento, se entiende preferiblemente que la frase "hibridación en condiciones rigurosas de hibridación" se refiere a hibridación en condiciones de cierta rigurosidad. En una realización preferida, las "condiciones rigurosas de hibridación" son condiciones en las que la homología de las dos secuencias de ácido nucleico es al menos de 70%, preferiblemente al menos 80%, preferiblemente al menos 90%, es decir, en condiciones en las que la hibridación solo es posible si la doble hebra obtenida durante esta hibridación comprende preferiblemente al menos 70%, preferiblemente al menos 80%, preferiblemente al menos 90% de enlaces AT y enlaces CG.
La rigurosidad puede depender de los parámetros de reacción, tales como la concentración y el tipo de especies iónicas presentes en la solución de hibridación, la naturaleza y concentración de los agentes desnaturalizantes y/o la temperatura de hibridación. Los expertos en la técnica pueden determinar las condiciones apropiadas, p. ej. como describen Sambrook et al. (Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, 1989).
Los términos "aislado" o "aislamiento" como se emplean en el presente documento con respecto a un ácido nucleico, una POI u otro compuesto se referirán a dicho compuesto que ha sido suficientemente separado del entorno con el que estaría asociado naturalmente, para existir en forma "sustancialmente pura". "Aislado" no significa necesariamente la exclusión de mezclas artificiales o sintéticas con otros compuestos o materiales, o la presencia de impurezas que no interfieren en la actividad fundamental, y que pueden estar presentes, por ejemplo, debido a una purificación incompleta. En particular, también se pretende que las moléculas de ácido nucleico aisladas de la presente invención incluyan aquellas sintetizadas químicamente", y en particular aquellas que no se encuentran naturalmente en P. pastoris o cualquier otro organismo, denominado en el presente documento "artificial". Con referencia a los ácidos nucleicos de la invención, a veces se utiliza el término "ácido nucleico aislado" o "secuencia de ácido nucleico aislada". Este término, cuando se aplica al ADN, se refiere a una molécula de ADN que se separa de las secuencias de las que es inmediatamente contigua en el genoma natural del organismo en el que se originó. Por ejemplo, un "ácido nucleico aislado" puede comprender una molécula de ADN insertada en un vector, tal como un vector plasmídico o viral, o integrada en el ADN genómico de una célula procariótica o eucariótica u organismo anfitrión. Un "ácido nucleico aislado" (ya sea ADN o ARN) puede representar adicionalmente una molécula producida directamente por medios biológicos o sintéticos y separada de otros componentes presentes durante su producción.
El término "conectado operablemente" como se emplea en el presente documento se refiere a la asociación de secuencias de nucleótidos en una única molécula de ácido nucleico, p. ej. un vector, de manera que la función de una o más secuencias de nucleótidos se vea afectada por al menos otra secuencia de nucleótidos presente en dicha molécula de ácido nucleico. Por ejemplo, un promotor está conectado operablemente con una secuencia codificante de un gen recombinante, cuando es capaz de efectuar la expresión de esa secuencia codificante. Como ejemplo adicional, un ácido nucleico que codifica un péptido señal está conectado operablemente a una secuencia de ácido nucleico que codifica una POl, cuando es capaz de expresar una proteína en la forma secretada, tal como una preforma de una proteína madura o la proteína madura. Específicamente, tales ácidos nucleicos conectados operablemente entre sí pueden conectarse inmediatamente, es decir, sin otros elementos o secuencias de ácido nucleico entre el ácido nucleico que codifica el péptido señal y la secuencia de ácido nucleico que codifica una POl.
Se entiende típicamente que una secuencia promotora está conectada operablemente a una secuencia codificante, si el promotor controla la transcripción de la secuencia codificante. Si una secuencia promotora no está asociada de forma nativa con la secuencia codificante, su transcripción no está controlada por el promotor en células nativas (de tipo salvaje) o las secuencias se recombinan con diferentes secuencias contiguas.
El término "proteína de interés (POl)", como se emplea en el presente documento, se refiere a un polipéptido o una proteína que se producen mediante tecnología recombinante en una célula anfitriona. Más específicamente, la proteína puede ser un polipéptido que no se encuentra naturalmente en la célula anfitriona, es decir, una proteína heteróloga, o puede ser nativa de la célula anfitriona, es decir, una proteína homóloga para la célula anfitriona, pero se produce, por ejemplo, por transformación con un vector autorreplicante que contiene la secuencia de ácido nucleico que codifica la POl, o tras la integración mediante técnicas recombinantes de una o más copias de la secuencia de ácido nucleico que codifica la POl en el genoma de la célula anfitriona, o mediante modificación recombinante de una o más secuencias reguladoras que controlan la expresión del gen que codifica la POl, p. ej. de la secuencia promotora. En algunos casos, el término POl como se emplea en el presente documento también se refiere a cualquier metabolito producto de la célula anfitriona mediado por la proteína expresada de manera recombinante.
La POl se puede recuperar específicamente del cultivo celular en forma purificada, p. ej. sustancialmente pura.
Los términos "sustancialmente pura" o "purificada" como se emplea en el presente documento se referirán a una preparación que comprende al menos 50% (p/p), preferiblemente al menos 60%, 70%, 80%, 90% o 95% de un compuesto, tal como una molécula de ácido nucleico o una POl. La pureza se mide mediante métodos apropiados para el compuesto (p. ej., métodos cromatográficos, electroforesis en gel de poliacrilamida, análisis por HPLC y similares).
El término "recombinante", como se emplea en el presente documento, significará "preparado por ingeniería genética o como resultado de esta". Por tanto, un "microorganismo recombinante" comprende al menos un "ácido nucleico recombinante". Un microorganismo recombinante comprende específicamente un vector de expresión o un vector de clonación, o ha sido modificado genéticamente para contener una secuencia de ácido nucleico recombinante. Una "proteína recombinante" se produce expresando un ácido nucleico recombinante respectivo en un anfitrión. Un "promotor recombinante" es una secuencia de nucleótidos no codificante modificada por ingeniería genética adecuada para su uso como un promotor funcionalmente activo como se describe en el presente documento.
En general, los ácidos nucleicos u organismos recombinantes a los que se hace referencia en el presente documento se pueden producir mediante mecanismos de recombinación bien conocidos por un experto en la técnica. De acuerdo con la presente invención, se pueden emplear mecanismos convencionales de biología molecular, microbiología y ADN recombinante dentro de los conocimientos de la técnica. Tales mecanismos se explican completamente en la bibliografía. Véase, p. ej., Maniatis, Fritsch & Sambrook, "Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, (1982).
Según una realización preferida de la presente invención, se obtiene una construcción recombinante ligando el promotor y los genes relevantes en un vector o construcción de expresión. Estos genes pueden integrarse de forma estable en el genoma de la célula anfitriona transformando la célula anfitriona utilizando tales vectores o construcciones de expresión.
Los vectores de expresión pueden incluir, pero sin limitarse a, vectores de clonación, vectores de clonación modificados y plásmidos diseñados específicamente. El vector de expresión preferido como se utiliza en la invención puede ser cualquier vector de expresión adecuado para la expresión de un gen recombinante en una célula anfitriona y se selecciona dependiendo del organismo anfitrión. El vector de expresión recombinante puede ser cualquier vector que sea capaz de replicarse o integrarse en el genoma de los organismos anfitriones, también llamado vector anfitrión.
Los vectores de expresión apropiados típicamente comprenden secuencias reguladoras adicionales adecuadas para expresar ADN que codifica una POI en una célula anfitriona eucariótica. Los ejemplos de secuencias reguladoras incluyen operadores, potenciadores, sitios de unión a ribosomas y secuencias que controlan el inicio y la terminación de la transcripción y la traducción. Las secuencias reguladoras se pueden conectar operablemente a la secuencia de ADN que se va a expresar.
Para permitir la expresión de una secuencia de nucleótidos recombinante en una célula anfitriona, el vector de expresión puede proporcionar el promotor según la invención adyacente al extremo 5' de la secuencia codificante, p. ej. aguas arriba del gen de interés (GOI) o un gen del péptido señal que permite la secreción de la POI. Por tanto, la transcripción está regulada e iniciada por esta secuencia promotora.
El término "péptido señal" como se emplea en el presente documento se referirá específicamente a un péptido señal nativo, un péptido señal heterólogo o un híbrido de un péptido señal nativo y heterólogo, y puede ser específicamente heterólogo u homólogo al organismo anfitrión que produce una POI. La función del péptido señal es permitir que la POI sea secretada para entrar en el retículo endoplásmico. Por lo general, es una cadena peptídica corta (de 3 a 60 aminoácidos de longitud) que dirige el transporte de una proteína fuera de la membrana plasmática, lo que facilita la separación y purificación de una proteína heteróloga. Algunos péptidos señal son escindidos de la proteína por la peptidasa señal después de que se transporten las proteínas.
Los péptidos señal ilustrativos son secuencias señal del prepro péptido del factor de apareamiento alfa de S. cerevisiae y los péptidos señal de gen de la fosfatasa ácida (PHO1) de P. pastoris y la proteína extracelular X (EPX1) (Heiss et al., 2015; documento WO2014067926A1).
Los vectores de expresión que comprenden uno o más de los elementos reguladores (tales como el promotor pG1-x y opcionalmente una secuencia señal) pueden construirse para impulsar la expresión de una POI, y el rendimiento expresado se compara con construcciones con elementos reguladores convencionales, con el fin de probar la función de las secuencias relevantes. Las secuencias de nucleótidos identificadas se pueden amplificar mediante PCR utilizando cebadores de nucleótidos específicos, clonarse en un vector de expresión y transformarse en una línea celular eucariótica, p. ej. utilizando un vector de levadura y una cepa de P. pastoris, para la producción de alto nivel de varias POI diferentes. Para estimar el efecto del promotor pG1 -x como se describe en el presente documento sobre la cantidad de POI recombinante así producida, la línea celular eucariótica se puede cultivar en experimentos en matraces agitados y fermentaciones de lote alimentado o de quimiostato en comparación con cepas que comprenden un promotor pG1 convencional o el promotor pGAP, en la célula respectiva. En particular, la elección del promotor tiene un gran impacto sobre la producción de proteínas recombinantes.
La POI se puede producir utilizando la línea celular anfitriona recombinante cultivando un transformante, así obtenido en un medio apropiado, aislando el producto expresado o metabolito del cultivo y, opcionalmente, purificándolo mediante un método adecuado.
Los transformantes de acuerdo con la presente invención se pueden obtener introduciendo tal vector de ADN, p. ej. ADN plasmídico, en un anfitrión y seleccionando transformantes que expresan la POI o el metabolito de la célula anfitriona con altos rendimientos. Las células anfitrionas se tratan para permitirles incorporar ADN foráneo mediante métodos utilizados convencionalmente para la transformación de células eucarióticas, tales como el método de pulso eléctrico, el método de protoplastos, el método de acetato de litio y métodos modificados de los mismos. P. pastoris se transforma preferiblemente por electroporación. Los métodos preferidos de transformación para la captación del fragmento de ADN recombinante por el microorganismo incluyen transformación química, electroporación o transformación por formación de protoplastos. Los transformantes de acuerdo con la presente invención se pueden obtener introduciendo tal vector de ADN, p. ej. ADN plasmídico, en un anfitrión y seleccionando transformantes que expresan la proteína relevante o el metabolito de la célula anfitriona con altos rendimientos.
Se prefieren varios enfoques diferentes para la producción de la POI según el método de la invención. Las sustancias pueden expresarse, procesarse y opcionalmente secretarse transformando una célula anfitriona eucariótica con un vector de expresión que alberga ADN recombinante que codifica una proteína relevante y al menos uno de los elementos reguladores como se describe anteriormente, preparando un cultivo de la célula transformada, haciendo crecer el cultivo, induciendo la transcripción y la producción de la POI, y recuperando el producto del procedimiento de fermentación.
La célula anfitriona de acuerdo con la invención se prueba preferiblemente para determinar su capacidad de expresión o rendimiento mediante la siguiente prueba: ELISA, ensayo de actividad, HPLC u otras pruebas adecuadas.
La invención permite específicamente el procedimiento de fermentación a escala piloto o industrial. La escala del procedimiento industrial preferiblemente emplearía un volumen de al menos 10 L, específicamente al menos 50 L, preferiblemente al menos 1 m3 , preferiblemente al menos 10 m3 , lo más preferiblemente al menos 100 m3.
Se prefieren las condiciones de producción a escala industrial, que se refieren p. ej. a cultivo por lote alimentado en volúmenes de reactor de 100 L a 10 m3 o más, empleando tiempos de procedimiento típicos de varios días, o procedimientos continuos en volúmenes de fermentador de aproximadamente 50 - 1000 L o más, con tasas de dilución de aproximadamente 0,02 - 0,15 h-1.
Las técnicas de cultivo adecuadas pueden abarcar el cultivo en un biorreactor comenzando con una fase discontinua, seguida de una fase discontinua de alimentación exponencial corta a una tasa de crecimiento específica alta, seguida adicionalmente de una fase por lote alimentado a una tasa de crecimiento específica baja. Otra técnica de cultivo adecuada puede abarcar una fase discontinua seguida de una fase de cultivo continuo a una tasa de dilución baja.
Una realización preferida incluye un cultivo discontinuo para proporcionar biomasa seguido de un cultivo por lote alimentado para una producción de POI de alto rendimiento.
Se prefiere cultivar la línea de células anfitrionas como se describe en el presente documento en un biorreactor en condiciones de crecimiento para obtener una densidad celular de al menos 1 g/L de peso seco celular, más preferiblemente al menos 10 g/L de peso seco celular, preferiblemente al menos 20 g/L de peso seco celular. Es ventajoso proporcionar tales rendimientos de producción de biomasa a escala piloto o industrial.
Un medio de crecimiento que permite la acumulación de biomasa, específicamente un medio de crecimiento basal, típicamente comprende una fuente de carbono, una fuente de nitrógeno, una fuente de azufre y una fuente de fosfato. Típicamente, tal medio comprende además oligoelementos y vitaminas, y puede comprender adicionalmente aminoácidos, peptona o extracto de levadura.
Las fuentes de nitrógeno preferidas incluyen NH4H2PO4 , o NH3 o (NH4)2SO4 ;
Las fuentes de azufre preferidas incluyen MgSO4 , o (NH4)2SO4 o K2SO4 ;
Las fuentes de fosfato preferidas incluyen NH4H2PO4 , o H3PO4 o NaH2PO4 , KH2PO4 , Na2HPO4 o K2HPO4;
Otros componentes de medios típicos incluyen KCI, CaCl2 y oligoelementos tales como: Fe, Co, Cu, Ni, Zn, Mo, Mn, I, B;
Preferiblemente, el medio se complementa con vitamina B7 ;
Un medio de crecimiento típico para P. pastoris comprende glicerol, sorbitol o glucosa, NH4H2PO4 , MgSO4 , KCl, CaCh, biotina y oligoelementos.
En la fase de producción, se utiliza específicamente un medio de producción con solo una cantidad limitada de una fuente de carbono complementaria.
Preferiblemente, la línea de células anfitrionas se cultiva en un medio mineral con una fuente de carbono adecuada, lo que simplifica aún más el procedimiento de aislamiento de manera significativa. Un ejemplo de un medio mineral preferido es uno que contiene una fuente de carbono utilizable (p. ej., glucosa, glicerol, sorbitol o metanol), sales que contienen los macroelementos (potasio, magnesio, calcio, amonio, cloruro, sulfato, fosfato) y oligoelementos (cobre, yoduro, manganeso, molibdato, cobalto, cinc y sales de hierro y ácido bórico) y opcionalmente vitaminas o aminoácidos, p. ej. para complementar las auxotrofías.
Específicamente, las células se cultivan en condiciones adecuadas para efectuar la expresión de la POI deseada, que puede purificarse a partir de las células o el medio de cultivo, dependiendo de la naturaleza del sistema de expresión y la proteína expresada, p. ej. si la proteína está fusionada a un péptido señal y si la proteína es soluble o está unida a la membrana. Como entenderá el experto en la técnica, las condiciones de cultivo variarán según los factores que incluyen el tipo de célula anfitriona y el vector de expresión particular empleado.
Un medio de producción típico comprende una fuente de carbono complementaria y adicionalmente NH4H2PO4 , MgSO4 , KCI, CaCl2 , biotina y oligoelementos.
Por ejemplo, la alimentación de la fuente de carbono complementaria añadida a la fermentación puede comprender una fuente de carbono con hasta 50% en peso de azúcares utilizables. La baja tasa de alimentación del medio complementario limitará los efectos de la inhibición del producto o subproducto sobre el crecimiento celular, por lo que será posible un alto rendimiento de producto basado en la provisión de sustrato.
La fermentación se realiza preferiblemente a un pH que varía de 3 a 7,5.
Los tiempos de fermentación típicos son aproximadamente de 24 a 120 horas con temperaturas en el intervalo de 20°C a 35°C, preferiblemente 22-30°C.
La POI se expresa preferiblemente empleando condiciones para producir rendimientos de al menos 1 mg/L, preferiblemente al menos 10 mg/L, preferiblemente al menos 100 mg/L, lo más preferido al menos 1 g/L.
Se entiende que los métodos divulgados en el presente documento pueden incluir adicionalmente el cultivo de dichas células anfitrionas recombinantes en condiciones que permitan la expresión de la POI, preferiblemente en la forma secretada o también como producto intracelular. A continuación, una POI producida de forma recombinante o un metabolito de la célula anfitriona se pueden aislar del medio de cultivo celular y adicionalmente purificar mediante mecanismos bien conocidos por un experto en la técnica.
La POI producida de acuerdo con la invención típicamente se puede aislar y purificar utilizando mecanismos del estado de la técnica, incluyendo el aumento de la concentración de la POI deseada y/o la disminución de la concentración de al menos una impureza.
Si la POI es secretada por las células, se puede aislar y purificar del medio de cultivo utilizando mecanismos del estado de la técnica. La secreción de los productos de expresión recombinantes a partir de las células anfitrionas es generalmente ventajosa por razones que incluyen la facilitación del procedimiento de purificación, ya que los productos se recuperan del sobrenadante del cultivo en lugar de la mezcla compleja de proteínas que resulta cuando las células de levadura se rompen para liberar proteínas intracelulares.
Las células transformantes cultivadas también se pueden romper sónicamente o mecánicamente, enzimáticamente o químicamente para obtener un extracto celular que contenga la POI deseada, a partir de la cual se aísla y purifica la POI.
Como métodos de aislamiento y purificación para obtener un polipéptido recombinante o un producto proteico, se pueden utilizar métodos, tales como métodos que utilizan diferencia en la solubilidad, tales como la precipitación por adición de sal y la precipitación con disolventes, métodos que utilizan la diferencia en el peso molecular, tales como la ultrafiltración y la electroforesis en gel, métodos que utilizan la diferencia en carga eléctrica, tales como la cromatografía de intercambio iónico, métodos que utilizan la afinidad específica, tales como la cromatografía de afinidad, métodos que utilizan la diferencia en el carácter hidrófobo, tales como la cromatografía líquida de alta resolución en fase inversa, y métodos que utilizan la diferencia en el punto isoeléctrico, tales como el enfoque isoeléctrico.
El producto altamente purificado está esencialmente libre de proteínas contaminantes y preferiblemente tiene una pureza de al menos 90%, más preferiblemente al menos 95%, o incluso al menos 98%, hasta 100%. Los productos purificados se pueden obtener mediante purificación del sobrenadante del cultivo celular o también a partir de restos celulares.
Como métodos de aislamiento y purificación, se prefieren los siguientes métodos convencionales: rotura celular (si la POI se obtiene intracelularmente), separación de células (restos) y lavado mediante Microfiltración o Filtro de Flujo Tangencial (TFF) o centrifugación, purificación de POI mediante precipitación o tratamiento térmico, activación de p O i por digestión enzimática, purificación de POI por cromatografía, tal como intercambio iónico (IEX), cromatografía de interacción hidrófoba (HlC), Cromatografía de afinidad, Cromatografía de exclusión por tamaño (SEC) o HPLC, precipitación de POI de concentración y lavado por etapas de ultrafiltración.
La POI aislada y purificada se puede identificar mediante métodos convencionales tales como transferencia Western, HPLC, ensayo de actividad o ELISA.
La POI puede ser cualquier polipéptido eucariótico, procariótico o sintético. Puede ser una proteína secretada o una proteína intracelular. La presente invención también proporciona la producción recombinante de homólogos funcionales, variantes funcionales equivalentes, derivados y fragmentos biológicamente activos de proteínas de origen natural. Los homólogos funcionales son preferiblemente idénticos a, o corresponden a, y tienen las características funcionales de una secuencia.
Una POI a la que se hace referencia en el presente documento puede ser un producto homólogo a la célula anfitriona eucariótica o heterólogo, preferiblemente para uso terapéutico, profiláctico, diagnóstico, analítico o industrial.
Las POI son preferiblemente polipéptidos o proteínas recombinantes heterólogos, producidos en una célula eucariótica, preferiblemente una célula de levadura, preferiblemente como proteínas secretadas. Los ejemplos de proteínas preferiblemente producidas son inmunoglobulinas, fragmentos de inmunoglobulina, aprotinina, inhibidor de la ruta del factor tisular u otros inhibidores de proteasa, e insulina o precursores de insulina, análogos de insulina, hormonas de crecimiento, interleucinas, activador del plasminógeno tisular, factor de crecimiento transformante a o b, glucagón, péptido 1 similar a glucagón (GLP-1), péptido 2 similar a glucagón (GLP-2), GRPP, factor VII, factor VIII, factor XIII, factor de crecimiento 1 derivado de plaquetas, albúmina sérica, enzimas, tales como lipasas o proteasas, o un homólogo funcional, variante funcional equivalente, derivado y fragmento biológicamente activo con una función similar a la de la proteína nativa. La POI puede ser estructuralmente similar a la proteína nativa y se puede obtener a partir de la proteína nativa mediante la adición de uno o más aminoácidos a uno o ambos extremos C- y N-terminal o la cadena lateral de la proteína nativa, sustitución de uno o más aminoácidos en uno o varios sitios diferentes en la secuencia de aminoácidos nativa, deleción de uno o más aminoácidos en uno o ambos extremos de la proteína nativa o en uno o varios sitios en la secuencia de aminoácidos, o inserción de uno o más aminoácidos en uno o más sitios de la secuencia de aminoácidos nativa. Tales modificaciones son bien conocidas para varias de las proteínas mencionadas anteriormente.
Una POI también se puede seleccionar entre sustratos, enzimas, inhibidores o cofactores que proporcionan reacciones bioquímicas en la célula anfitriona, con el objetivo de obtener el producto de dicha reacción bioquímica o una cascada de varias reacciones, p. ej. para obtener un metabolito de la célula anfitriona. Los productos ilustrativos pueden ser vitaminas, tales como riboflavina, ácidos orgánicos y alcoholes, que se pueden obtener con mayores rendimientos tras la expresión de una proteína recombinante o una POI según la invención.
En general, la célula anfitriona, que expresa un producto recombinante, puede ser cualquier célula eucariótica adecuada para la expresión recombinante de una POI.
los ejemplos de células de mamífero preferidas son células BHK, CHO (CHO-DG44, CHO-DUXB11, CHO-DUKX, CHO-K1, CHOK1SV, CHO-S), HeLa, HEK293, MDCK, NIH3T3, NS0, PER.C6, SP2/0 y VERO.
Los ejemplos de células de levadura preferidas utilizadas como células anfitrionas de acuerdo con la invención incluyen, pero no se limitan al género Saccharomyces (p. ej. Saccharomyces cerevisiae), el género Pichia (p. ej. P. pastoris o P. methanolica), el género Komagataella (K. pastoris, K. pseudopastoris o K. phaffii), Hansenula polymorpha, Yarrowia lipolytica, Schefferomyces stipitis o Kluyveromyces lactis.
La bibliografía más reciente divide y cambia de nombre Pichia pastoris a Komagataella pastoris, Komagataella phaffii y Komagataella pseudopastoris. En el presente documento se utiliza Pichia pastoris como sinónimo para todos, Komagataella pastoris, Komagataella phaffii y Komagataella pseudopastoris.
Las células anfitrionas de levadura preferidas se obtienen a partir de levadura metilotrófica, tal como a partir de Pichia o Komagataella, p. ej. Pichia pastoris, o Komagataella pastoris, o K. phaffii, o K. pseudopastoris. Los ejemplos del anfitrión incluyen levaduras tales como P. pastoris. Los ejemplos de cepas de P. pastoris incluyen CBS 704 (=NRRL Y-1603 = DSMZ 70382), CBS 2612 (=NRRL Y-7556), CBS 7435 (=NRRL Y-11430), CBS 9173-9189 (cepas CBS: CBS-KNAW Fungal Biodiversity Center, Centraalbureau voor Schimmelcultures, Utrecht, Países Bajos) y DSMZ 70877 (Colección alemana de microorganismos y cultivos celulares), pero también cepas de Invitrogen, tales como X-33, GS115, KM71 y SMD1168. Los ejemplos de cepas de S. cerevisiae incluyen W303, CEN.PK y la serie BY (colección EUROSCARF). Todas las cepas descritas anteriormente se han utilizado con éxito para producir transformantes y expresar genes heterólogos.
Una célula anfitriona de levadura preferida según la invención, tal como una célula anfitriona de P. pastoris o S. cerevisiae, contiene secuencias promotoras heterólogas o recombinantes, que se pueden obtener a partir de una cepa de P. pastoris o S. cerevisiae, diferente del anfitrión de producción. En otra realización específica, la célula anfitriona según la invención comprende una construcción de expresión recombinante según la invención que comprende el promotor procedente del mismo género, especie o cepa que la célula anfitriona.
Según la invención, se prefiere proporcionar una línea de células anfitrionas de P. pastoris que comprende una secuencia del promotor pG1-x como se describe en el presente documento conectada operablemente a la secuencia de nucleótidos que codifica la POI.
Si la POI es una proteína homologa para la célula anfitriona, es decir, una proteína que se encuentra naturalmente en la célula anfitriona, la expresión de la POI en la célula anfitriona se puede modular mediante el intercambio de su secuencia promotora nativa por una secuencia promotora de acuerdo con la invención.
Este propósito se puede lograr, p. ej. mediante la transformación de una célula anfitriona con una molécula de ADN recombinante que comprende secuencias homólogas del gen diana para permitir la recombinación específica de sitio, la secuencia promotora y un marcador selectivo adecuado para la célula anfitriona. La recombinación específica de sitio tendrá lugar para conectar operablemente la secuencia promotora con la secuencia de nucleótidos que codifica la POI. Esto da como resultado la expresión de la POI a partir de la secuencia promotora según la invención en lugar de a partir de la secuencia promotora nativa.
Se prefiere específicamente que el promotor pG1-x tenga una mayor actividad promotora con relación a la secuencia promotora nativa de la POI.
Según una realización específica, el método de producción de la POI emplea una secuencia de nucleótidos recombinante que codifica la POI, que se proporciona en un plásmido adecuado para la integración en el genoma de la célula anfitriona, en una sola copia o en múltiples copias por célula. La secuencia de nucleótidos recombinante que codifica la POI también se puede proporcionar en un plásmido de replicación autónoma en una sola copia o en múltiples copias por célula.
El método preferido como se describe en el presente documento emplea un plásmido, que es un vector de expresión eucariótico, preferiblemente un vector de expresión de levadura. Los vectores de expresión pueden incluir, pero sin limitarse a, vectores de clonación, vectores de clonación modificados y plásmidos diseñados específicamente. El vector de expresión preferido como se emplea en la invención puede ser cualquier vector de expresión adecuado para la expresión de un gen recombinante en una célula anfitriona y se selecciona dependiendo del organismo anfitrión. El vector de expresión recombinante puede ser cualquier vector que sea capaz de replicarse o integrarse en el genoma de los organismos anfitriones, también llamado vector anfitrión, tal como un vector de levadura, que porta una construcción de ADN de acuerdo con la invención. Un vector de expresión de levadura preferido es para la expresión en levadura seleccionada del grupo que consiste en levaduras metilotróficas representadas por los géneros Hansenula, Pichia, Candida y Torulopsis.
En la presente invención, se prefiere utilizar plásmidos obtenidos a partir de pPICZ, pGAPZ, pPIC9, pPICZalfa, pGAPZalfa, pPIC9K, pGAPHis o pPUZZLE como vector.
Según una realización preferida de la presente invención, se obtiene una construcción recombinante ligando los genes relevantes en un vector. Estos genes se pueden integrar de forma estable en el genoma de la célula anfitriona transformando la célula anfitriona utilizando tales vectores. Los polipéptidos codificados por los genes se pueden producir utilizando la línea celular anfitriona recombinante cultivando un transformante, así obtenido en un medio apropiado, aislando la POI expresada del cultivo y purificándolos mediante un método apropiado para el producto expresado, en particular para separar la POI de las proteínas contaminantes.
Los vectores de expresión pueden comprender uno o más marcadores seleccionables fenotípicos, p. ej. un gen que codifica una proteína que confiere resistencia a los antibióticos o que proporciona un requerimiento autótrofo. Los vectores de levadura contienen comúnmente un origen de replicación de un plásmido de levadura, una secuencia de replicación autónoma (ARS) o, alternativamente, una secuencia utilizada para la integración en el genoma del anfitrión, una región promotora, secuencias para poliadenilación, secuencias para la terminación de la transcripción y un marcador seleccionable.
Los procedimientos utilizados para ligar las secuencias de ADN y los elementos reguladores, p. ej. el promotor pG1-x y el gen o genes que codifican la POI, el promotor y el terminador, respectivamente, y para insertarlos en vectores adecuados que contienen la información necesaria para la integración o replicación del anfitrión, son bien conocidos por los expertos en la técnica, p. ej. descritos por J. Sambrook et al., (A Laboratory Manual, Cold Spring Harbor, 1989).
Se entenderá que el vector, que utiliza los elementos reguladores de acuerdo con la invención y/o la POI como diana de integración, se puede construir preparando primero una construcción de ADN que contenga la secuencia de ADN completa que codifica los elementos reguladores y/o la POI y posteriormente insertando este fragmento en un vector de expresión adecuado, o insertando secuencialmente fragmentos de ADN que contienen información genética para los elementos individuales, seguido de ligación.
También se pueden utilizar vectores de clonación múltiple, que son vectores que tienen un sitio de clonación múltiple, de acuerdo con la invención, en donde se puede incorporar un gen heterólogo deseado en un sitio de clonación múltiple para proporcionar un vector de expresión. En los vectores de expresión, el promotor se coloca aguas arriba del gen de la POI y regula la expresión del gen. En el caso de los vectores de clonación múltiple, debido a que el gen de la POI se introduce en el sitio de clonación múltiple, el promotor se coloca aguas arriba del sitio de clonación múltiple.
La construcción de ADN proporcionada para obtener una célula anfitriona recombinante de acuerdo con la invención se puede preparar sintéticamente mediante métodos convencionales establecidos, p. ej. el método de la fosforamidita.
La construcción de ADN también puede ser de origen genómico o de ADNc, por ejemplo, obtenida mediante la preparación de una biblioteca genómica o de ADNc y el escrutinio de secuencias de ADN que codifican todo o parte del polipéptido de la invención mediante hibridación utilizando sondas de oligonucleótidos sintéticos de acuerdo con técnicas convencionales (Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, 1989). Finalmente, la construcción de ADN puede ser de origen mixto sintético y genómico, mixto sintético y ADNc o mixto genómico y ADNc preparado por reasociación de fragmentos de origen sintético, genómico o de ADNc, según corresponda, correspondiendo los fragmentos a varias partes de la construcción de ADN completa, de acuerdo con las técnicas convencionales.
En otra realización preferida, el vector de expresión de levadura se puede integrar de manera estable en el genoma de la levadura, p. ej. mediante recombinación homóloga.
Una célula anfitriona transformante de acuerdo con la invención obtenida transformando la célula con los elementos reguladores de acuerdo con la invención y/o los genes de POI se puede cultivar preferiblemente en primer lugar en condiciones para que crezca eficientemente hasta un gran número de células. Cuando se prepara la línea celular para la expresión de la POI, se eligen técnicas de cultivo para producir el producto de expresión.
La descripción anterior se entenderá más completamente con referencia a los siguientes ejemplos. Sin embargo, tales ejemplos son simplemente representativos de métodos para poner en práctica una o más realizaciones de la presente invención y no se deben interpretar como limitantes del alcance de la invención.
Ejemplos
Ejemplo 1: El acortamiento 5' de pG1 revela la región reguladora principal de pG1
El promotor pG1 nativo (tipo salvaje) se ha aislado de P. pastoris (Komagatella phaffii) cepa CBS2612 (cepas CBS: CBS-KNAW Fungal Biodiversity Center, Centraalbureau voor Schimmelcultures, Utrecht, Países Bajos). Según lo determinado por la secuenciación de Sanger y el análisis BLAST posterior, la secuencia del promotor pG1 de CBS2612 tenía más de 95% de identidad de secuencia con las regiones respectivas en las secuencias genómicas de las cepas GS115 (Invitrogen) (aguas arriba de PAS_chr1-3_0011) y CBS7435 (aguas arriba de P7435_Chr1-0007) o K. pastoris DSMZ 70382 (cepas DSMZ: Colección Alemana de Microrganismos y Cultivos Celulares) (aguas arriba de PIPA00372). Durante el análisis de la región genómica de pG1, se descubrió que su gen GTH1 tiene una anotación de inicio diferente en las cepas CBS7435 (P7435_Chr1-0007) y DSMZ 70382 (PIPA00372) que en GS115 (PAS_chr1-3_0011). A diferencia de GS115 y CBS2612, la secuencia codificante tiene una anotación de inicio 36 pb más aguas abajo en las secuencias genómicas de las otras dos cepas.
Para identificar la región reguladora relevante de pG1, se clonaron 8 variantes de pG1 acortadas a partir de CBS2612 empezando en las posiciones 5' alternativas -858, -663, -492, -371, -328, -283, -211 y -66 a la posición -1 (véase la Figura 1, numeración basada en el inicio del locus del gen GTH1 PAS_chr1-3_0011). Estas variantes de promotor acortado se escrutaron para determinar la expresión de eGFP en placas de pocillos profundos como se describe en el Ejemplo 8 para probar las propiedades de represión (glicerol) e inducción (cuentas de alimentación de glucosa) en comparación con la versión original de 965 pb de pG1 (Figura 2). No se encontraron diferencias en la señal de eGFP para todas las variantes de longitud en la condición de represión, lo que demuestra que la represión del promotor no estaba restringida en ninguna de las variantes acortadas. Después de 48 horas de inducción, la capacidad de expresión permaneció completamente funcional para las variantes del promotor hasta una longitud de 328 pb. La variante de 283 pb tenía sólo aproximadamente dos tercios de la fuerza en comparación con el promotor pG1 original. Las dos variantes de longitud más corta (211 y 66 pb) parecían ser casi no funcionales. Estos resultados indican que la región entre la posición -400 y -200 contiene importantes características reguladoras.
Ejemplo 2: Una alta densidad de TFBS relacionados con la fuente de carbono pronosticada marca la principal región reguladora del promotor pG1
Se buscó la secuencia del promotor pG1 (1000 pb aguas arriba del gen PAS_chr1-3_0011) para familias de matriz pertenecientes a los grupos de matriz de "hongos" y "elementos promotores centrales generales" utilizando el Matlnspector de Genomatix. Se encontraron 111 supuestos TFBS pertenecientes a 46 familias de matrices diferentes.
(Tabla 1). Las familias de matrices más comunes en la secuencia analizada fueron motivos monoméricos de clase Gal4 (F$MGCM, 12 sitios de unión), reguladores transcripcionales que contenían homeodominio (F$HOMD, 6 sitios de unión), familia de cremalleras de leucina básica fúngica (F$BZIP, 5 sitios de unión) y proteínas de la Caja GC de levadura (F$YMIG, 5 sitios de unión). Se observó una densidad de sitios de unión de TFBS muy alta entre la posición -400 a -200 encontrándose allí aproximadamente dos tercios de los TFBS mencionados (familias de matrices más comunes) (18 de 28). Con respecto a los elementos promotores centrales generales, el Matlnspector no identificó motivos relacionados con levaduras u hongos, pero se puede encontrar una caja TATA comenzando en la posición -26.
Se identificó un motivo prominente, p. ej. en la posición -390 a -375, que se denominó TAT14 debido a su secuencia 5'-TATTTTTTTTTTTTTT-3' (SEC ID 21) o TAT15 debido a su secuencia 5'-TATTTTTTTTTTTTTTT-3' (SEC ID 22). Se sabe que tales tramos de poli (A:T) en las regiones promotoras afectan negativamente a la unión del nucleosomas y estimulan la unión de TF en sitios cercanos en la levadura.
Ejemplo 3: Se reveló que los factores de transcripción relacionados con la fuente de carbono Mxr1, Rgt1, Cat8-1, Cat8-2 y Mig1 son importantes para las propiedades reguladoras de pG1
Los sitios de unión del factor de transcripción con dependencia prevista de la fuente de glucosa o carbono se seleccionaron para un análisis adicional (véanse la Figura 1 y la Tabla 2). Las variantes de pG1 con deleciones de las respectivas regiones se generaron utilizando PCR de extensión por solapamiento.
La Tabla 3 enumera todos los TFBS seleccionados e indica todos los TFBS que están (parcialmente) afectados por la deleción (lista detallada en la Tabla 2). Para algunas deleciones (p. ej., A9 y A10), algunos nucleótidos del TFBS respectivo se dejaron intactos para mantener funcional el TFBS vecino cercano y examinar por separado su efecto.
Todas las variantes de deleción de TFBS y mutación de TAT se escrutaron para determinar la expresión de eGFP como se describe en el Ejemplo 8 en condiciones de represión (glicerol) e inducción (cuenta de alimentación de glucosa) (Figura 3). Es importante considerar que los TF/TFBS individuales generalmente no son suficientes para cumplir con la regulación de un promotor. Las deleciones de TFBS también implican que la secuencia promotora puede verse afectada por la secuencia adjunta recién formada, por distancias alteradas entre TFBS o por cambios de propiedades de orden superior (organización de la cromatina). El mismo TFBS en diferentes posiciones del promotor puede tener diferentes funciones, también debido a otros TFBS adyacentes. En TFBS muy próximos, los t F pueden actuar de forma sinérgica o restringir la unión de otros TF debido al impedimento estérico.
Se eliminaron cuatro familias diferentes de TF relacionadas con la fuente de carbono en las variantes del promotor pG1 (véanse la Tabla 2 y la Tabla 3): Regulador metabólico de levadura (F$ADR; matrices: F$ADR1.01), motivos monoméricos de clase Gal4 (F$MGCM; matrices: F$RGT1.01, F$RGT1.02), elementos sensibles a la fuente de carbono (F$CSRE, matrices: F$CSRE.01, F$SIP4.01) y Proteínas de la Caja GC de Levadura (F$YMIG; matrices: F$MIG1.01 y F$MIG1.02). Los factores de transcripción correspondientes en S. cerevisiae son Adr1, Rgt1, Sip4/Cat8 y Mig1, respectivamente.
Los promotores dependientes de la fuente de carbono están controlados por la represión de la glucosa y/o la inducción por carbohidratos u otras fuentes de carbono que no son azúcares. La represión de glucosa se lleva a cabo principalmente por el complejo de proteína quinasa Snf1, el represor transcripcional Mig 1 y la proteína fosfatasa 1. Los factores aguas abajo regulan, p. ej. genes respiratorios (Hap4), genes de gluconeogénesis (Cat8, Sip4) y transportadores de glucosa (Rgt1) en S. cerevisiae.
P. pastoris tiene dos homólogos de Mig1, llamados Mig 1 -1 y Mig 1 -2, el segundo de los cuales posiblemente actúa como represor del catabolito de carbono. Cuando hay glucosa disponible, Mig1 actúa como represor, mientras que Rgt1 actúa como activador transcripcional. Para cumplir la función represora, Mig 1 se desfosforila y se importa al núcleo donde recluta los correpresores Ssn6 y Tup1.
Al limitar la glucosa, Rgt1 se desfosforila y actúa como represor transcripcional. La función de Rgt1 está controlada por su estado de fosforilación (Rgt1 tiene cuatro sitios de fosforilación), y la inducción de promotores regulados no requiere la disociación de Rgt1 en S. cerevisiae, como se observa típicamente para los represores transcripcionales.
El factor de transcripción con dedos de cinc sensible a la fuente de carbono Adr1 es necesario para la activación transcripcional del gen de la alcohol deshidrogenasa reprimible por glucosa (ADH2) en S. cerevisae. El homólogo de Adr1 en P. pastoris es Mxr1 (PAS_chr4_0487), el regulador clave del metabolismo del metanol, y se informó que es un factor de transcripción de acción positiva que es esencial para una fuerte inducción de Pa o x sobre metanol. El motivo central de TFBS 5' CYCC 3' referido para Mxr1 coincide con ambos sitios F$ADR1.01 encontrados en la secuencia del promotor pG1.
El elemento de respuesta a la fuente de carbono (CSRE) está unido por los activadores transcripcionales Sip4 y Cat8 y funciona induciendo la expresión de genes de gluconeogénesis en S. cerevisiae. Se pueden encontrar dos homólogos de P. pastoris de ScCat8: Cat8-1 (PAS_chr2-1_0757) y Cat8-2 (PAS_chr4_0540), siendo ambos los mejores éxitos de blastp para ScSip4. Cat8-2 es débilmente similar a ScCat8, y potencialmente juega un papel importante en las condiciones de desrepresión.
Ejemplo 4: Las variantes de deleción del promotor pG1 revelan el TFBS responsable de su represión e inducción
De las 5 variantes de deleción que residen aguas arriba (5') de la región reguladora principal de pG1 identificadas anteriormente (véase recuadro sombreado en la Figura 1 y la Tabla 2), las variantes pG1-A1, -A2 y -A4 parecen tener un efecto beneficioso sobre la fuerza del promotor mientras que las variantes de deleción pG1-A3 y A5 no tuvieron efecto sobre la expresión de GFP en comparación con el promotor pG1 original (SEQ ID 9). Este resultado sugiere que el acortamiento 5' del promotor podría ser beneficioso para la modificación genética de pG1. Las deleciones de TFBS dentro de la región reguladora principal de pG1 (pG1-A6 a -A12, véanse la Figura 1 y la Tabla 2) tuvieron diferentes impactos en la expresión de eGFP, pero ninguno mostró un aumento de la inducción sin perder las propiedades de represión. Por lo tanto, se supone que la región reguladora principal de pG1 debe mantenerse en variantes del promotor pG1 modificadas genéticamente para mantener su estricta regulación. Por consiguiente, sin esta región, se observó una inducción mucho menor en la limitación de la glucosa en el Ejemplo 1 (pG1-328 y pG1-283, Figura 2 ).
Los sitios de unión de Mig1 se eliminaron en pG1-A3, -A4, -A10 y -A11 (F$MIG1.02 en A3, F$MIG1.01 en A4, A10 y A11), donde pG1-A10 y pG1-A11 también incluyen las deleciones F$ADR1.01 y F$RGT1.02, respectivamente. Se encontró una represión ligeramente más estricta para A3, mientras que A4 tuvo una represión sin cambios, pero niveles mejorados de eGFP después de la inducción.
La liberación de la represión observada para A10 y la inducción del promotor más débil de A10 y A11 también podrían conectarse a los sitios de unión de F$RGT1 en esta región (F$RGT1.01 y F$RGT1.02 suprimidos en A9 y A11). Además, Mig 1 podría desempeñar un papel bifuncional en la regulación de pG1: dos genes MIG1 se encuentran en P. pastoris (MIG1-1, MIG1-2) y se demostró que estaban regulados a la inversa según la disponibilidad de glucosa.
La deleción de F$ADR1.01 aumentó los niveles de eGFP en la variante pG1-A1, aunque se esperaría que la deleción del sitio de unión de Mxr1 (regulador positivo del metabolismo del metanol en Pp, homólogo de ScADR1) debilitara bastante el promotor. La deleción combinada de F$ADR1.01 con F$MIG1.01 en pG1-A10 liberó la represión del promotor sobre el glicerol y debilitó su inducción, que es una respuesta concluyente para la deleción de TFBS de Mig1.
En la región reguladora principal, el sitio de unión F$RGT1.02 se eliminó en las variantes pG1-A6 (dos sitios), -A7, -A8, -A11 y -A12, y F$RGT1.o1 se eliminó en A9. La variante que alberga la deleción del sitio F$RGTl.02 emparejado (A6, sitios de unión en hebras opuestas con un desplazamiento de 7 pb) mostró una ligera liberación de la represión y una reducción de la inducción. Las variantes A7 y A8 contienen sitios F$RGT1.02 muy cercanos, donde el primero se encuentra en la hebra negativa y el segundo en la hebra positiva; también A8 contiene la deleción de un sitio F$SIP4.01. El primero (A7) mostró una ligera liberación de la represión y un aumento de inducción, mientras que el segundo (A8) tuvo una inducción mucho más débil (pero tuvo una represión del promotor sin cambios). Esto indica un papel importante para el activador transcripcional Cat8-1 y/o Cat8-2 (homólogos más fuertes para ScSip4) para la inducción de pG1. La variante A9 se creó para suprimir los TFBS de F$RGT1.01 y F$CSRE.01 (sitios de unión en hebras opuestas) localizados muy próximos y la drástica pérdida de represión indica un papel importante de estos TFBS para controlar estrechamente pG1, muy probablemente a través de la unión de Rgt1, Cat8-1 y/o Cat8-2. La deleción de F$RGT1.02 en la variante pG1-Al2 no tuvo efecto sobre el rendimiento de expresión de eGFP. Curiosamente, la transcripción de CAT8-2 está fuertemente regulada al alza en la limitación de glucosa en comparación con el excedente de glucosa, mientras que RGT1 y CAT8-2 no fueron regulados transcripcionalmente en las condiciones probadas.
Ejemplo 5: La fuerza del promotor pG1 depende del tramo poli (A:T) TAT14
El motivo TAT está situado aproximadamente 80 pb aguas arriba (5', p. ej., posición -390 a -374) de la región reguladora principal de pG1. La secuenciación repetida de la región 5' de GTH1 en CBS2612, CBS7435 o GS115 de P. pastoris dio como resultado la detección de 15 /- 1 T en el motivo TAT. Para dilucidar su impacto en el rendimiento del promotor, se seleccionó el motivo TAT14 para la deleción (pG1-ATAT14) y mutación (en T16, T18 y T20; pG1-T16, pG1-T18, pG1-T20). Se diseñaron inicialmente cebadores (véanse cebadores núm. 37-42 en la Tabla 4) para obtener T18, T20 y T22, pero se obtuvieron y utilizaron variantes con diferentes longitudes (T16, T20 y T18, respectivamente). La deleción del motivo TAT14 dio como resultado señales de GFP más bajas, mientras que su prolongación aumentó la fuerza de expresión de pG1. Esto indica que el uso de un motivo TAT14 prolongado sería beneficioso para la modificación genética de pG1.
Ejemplo 6: Las duplicaciones de secuencias parciales de la región reguladora principal de pG1 mejoran significativamente su fuerza de expresión
Se generaron dos variantes de duplicación (pG1-D1240 (SEQ ID 49) y pG1-D1427 (SEQ ID 85), los números indican las longitudes de las respectivas variantes del promotor) del promotor pG1 mediante amplificación por PCR de dos fragmentos de secuencia (-472 a -188 y -472 a -1) e inserción utilizando los sitios de restricción Psi y BgIII (posiciones 509-514 y 525-530). Las secciones de duplicación comienzan aguas arriba de TFBS suprimido en pG1-A5 y terminan después de la región reguladora principal de pG1 para la primera variante (pG1-D1240), mientras que la segunda duplicación (pG1-D1427) llega hasta el extremo 3' del promotor pG1. Estas variantes se escrutaron para determinar la expresión de eGFP de la misma manera que se describe para las variantes de deleción de TFBS y mutación de TAT14 (véase el Ejemplo 8). Ambas variantes de duplicación mostraron una represión más estricta en exceso de glicerol y una inducción más fuerte al limitar la glucosa. (Figura 4).
La estabilidad postransformacional del clon variante de duplicación pG1-D1240 núm. 3 se probó realizando tres cultivos discontinuos consecutivos sin presión de selección, que es igual a aproximadamente 20 generaciones. La expresión de eGFP fue estable durante todo el tiempo de cultivo (datos no mostrados). En comparación, un procedimiento en biorreactor con P. pastoris típico comienza con DO600 = 1 (-0,2-0,4 g/L de YDM) en la fase discontinua y termina con ~ 100 g/L de YDM después de la fase por lote alimentado y por lo tanto tarda 10 generaciones aproximadamente.
Ejemplo 7: Verificación del rendimiento de la variante del promotor pG1 en cultivo de biorreactor por lote alimentado
Con el fin de verificar el rendimiento de las variantes del promotor generadas en condiciones de bioprocedimiento, se seleccionaron algunas variantes para el cultivo por lote alimentado en función de su comportamiento de expresión de eGFP alterado: pG1-A2 (SEQ ID 211) fue la variante más mejorada aguas arriba de la región reguladora principal , y pG1-T16 (SEQ ID 257) y pG1-D1240 (SEQ ID 49) mostraron niveles de expresión de eGFP más altos en la limitación de glucosa sin perder la represión del promotor en condiciones con glicerol. Se realizó un cultivo en biorreactor, que se inició con una fase discontinua de glicerol seguida de un lote alimentado optimizado para rendimiento espaciotemporal (Prielhofer et al., 2013), para un clon de cada uno y se comparó con la cepa de control pG1 núm. 8 para la expresión de eGFP (véanse la Figura 5 y la Tabla 5).
Las fermentaciones por lote alimentado se realizaron en reactores DASGIP con un volumen de trabajo final de 0,7 L.
Se utilizaron los siguientes medios:
Solución de partida de sales traza PTMi contenida por litro
6,0 g de CuSO*5H2O, 0,08 g de Nal, 3,36 g de MnSO4-H2O, 0,2 g de Na2MoO4^2H2O, 0,02 g de H3BO3 , 0,82 g de CoCl2 , 20,0 g de ZnCl2 , 65,0 g de FeSO*7H2O, 0,2 g de biotina y 5,0 mL de H2SO4 (95%-98%).
Medio de lote de glicerol contenido por litro
2 g de Ácido cítrico monohidrato (C6HsOyH 2O), 39,2 g de glicerol, 12,6 g de NH4H2PO4 , 0,5 g de MgSO4^7H2O, 0,9 g de KCI, 0,022 g de CaC ^2H 2O, 0,4 mg de biotina y 4,6 mL de solución de partida de sales traza de PTM1. Se añadió HCl para ajustar el pH a 5.
Medio de carga alimentado con glucosa contenido por litro
464 g de glucosa monohidrato, 5,2 g de MgSO4 ^7 H2O, 8,4 g de KCI, 0,28 g de CaCh^ 2 H2O, 0,34 mg de biotina y 10,1 mL de solución madre de sales traza PTM1.
El oxígeno disuelto se controló a OD = 20% con la velocidad del agitador (400 - 1200 rpm). La tasa de aireación fue de 24 L h' 1 de aire, la temperatura se controló a 25°C y el punto de ajuste de pH de 5 se controló con la adición de NH4OH (25%).
Para iniciar la fermentación, se filtraron en condiciones estériles 400 mL de medio discontinuo en el fermentador y se inocularon a partir de un precultivo selectivo del respectivo clon de P. pastoris con una densidad óptica inicial (DO600) de 1. La fase discontinua de aproximadamente 25 h (alcanzando una concentración de biomasa seca de aproximadamente 20 g/L) estuvo seguida por un lote alimentado limitado en glucosa comenzando con una alimentación exponencial durante 7 h y una tasa de alimentación constante de 15 g/L durante 13 h, lo que lleva a una concentración final de biomasa seca de aproximadamente 100 g/L. Se tomaron muestras durante la fase discontinua y por lote alimentado, y se analizaron para determinar la expresión de eGFP utilizando un lector de placas (Infinite 200, Tecan, CH). Por lo tanto, las muestras se diluyeron a una densidad óptica (DO600) de 5. Los resultados se muestran en la Figura 5 como fluorescencia relativa por biorreactor (FL/r).
El número de copias del gen de estos tres clones se analizó mediante PCR en tiempo real y dio como resultado un GCN para todos ellos (datos no mostrados). Todas las variantes de pG1 mostraron una buena represión en la fase discontinua y una fuerte expresión en el estado inducido (Tabla 5). La fuerte mejora de la variante de duplicación pG1-D1240 se pudo verificar en condiciones de biorreactor, el clon pG1-D1240 núm. 3 mostró un aumento de 50% en la fluorescencia de GFP en el extremo del lote alimentado en comparación con pG1. Aunque la señal ya había aumentado al final del lote, la razón de inducción fue incluso un poco más alta que para el pG1 original. Además de en el escrutinio, el clon pG1-A2 num. 3 tenía un ligero aumento de señal al final del lote, y aproximadamente 10% de debilitamiento de la señal al final del lote alimentado. El clon pG1-T16 núm. 3 de la variante de mutación TAT14 mostró la señal más fuerte al final del lote, y se quedó atrás de la variante de duplicación en el final del lote alimentado, alcanzando una mejora de aproximadamente 20% sobre pG1 núm. 8 de control, similar al resultado del escrutinio. El diferente comportamiento de inducción de los clones en la fase discontinua se explica por la desrepresión debida a la disminución de la concentración de glicerol a lo largo de la fase discontinua (véase la Figura 5A). En general, los cultivos por lote alimentado podrían confirmar en gran medida los resultados obtenidos en el escrutinio a pequeña escala.
Logros y Conclusiones
Los promotores de genes con regulación dependiente de la fuente de carbono son favorables para la aplicación de bioprocedimientos ya que la fase de producción se puede separarse de la de crecimiento. La mejora potencial de la producción de proteínas basada en el promotor se puede lograr encontrando las condiciones óptimas de crecimiento (p. ej., tasa de crecimiento, estrategia de alimentación) o manipulando directamente la secuencia del promotor (p. ej., mutaciones, deleciones).
Se construyeron varias variantes del promotor pG1 con longitud acortada, deleciones de TFBS, mutaciones del motivo TAT y duplicaciones de fragmentos. De ese modo, se identificó la región reguladora principal de pG1, incluido su importante TFBS. El análisis de las deleciones de TFBS indica que los factores de transcripción Rgt1 y Cat8-1 y/o Cat8-2 juegan un papel esencial para la represión e inducción de pG1: se suprimieron dos motivos que consistían en F$RGT1 y F$CSRE que se unen en la misma posición en las hebras opuestas. La deleción de la primera parte (pG1-A8, posición -293 a -285; RGT1: (+) -310 a -299, CSRE: (-) -299 a-285) provocó un debilitamiento de la inducción del promotor, mientras que la deleción de la segunda parte (pG1-A9, posición -275 a -261; RGT1: (-) -275 a -259, CSRE: (+) -276 a -260) condujo a una disminución de la represión del promotor. De ese modo, se identificaron motivos reguladores que son esenciales y característicos para la regulación de pG1.
El papel de los reguladores transcripcionales Mig1 (F$MIG1) y Mxr1 (F$ADR1) podría ser más importante en otras condiciones tales como el exceso de glucosa o la inducción por metanol. Otros factores de transcripción que se unen en esa región o cerca de ella también podrían contribuir a la regulación de pG1.
Se sabe que los tramos poli (A:T) desempeñan un papel en las secuencias promotoras, y se podría demostrar que el motivo TAT en pG1, que se encuentra aguas arriba (p. ej., posición -390 a -375) de la región reguladora principal, es esencial por su fuerza. El alargamiento de este motivo a T16, T18 y T20 tuvo un efecto positivo sobre el comportamiento del promotor.
Las variantes de deleción de pG1 revelaron que el acortamiento en 5' también podría ser beneficioso para la modificación genética del promotor. Los TFBS para Mxr1, Mig1, Rgt1 y Cat8 suprimidos aguas arriba de la principal región reguladora de pG1 mejoraron la expresión de eGFP, aunque este efecto no se observó para las variantes del promotor acortadas en 5'.
Dos variantes con duplicaciones de secuencia parciales alcanzaron capacidades de expresión muy mejoradas en comparación con el pG1 de tipo salvaje.
Se podrían asignar características distintivas del buen comportamiento de expresión de pG1, que es una base sólida para la modificación genética racional del promotor: acortamiento en 5', uso del motivo TAT y mutación/elongación opcionales y duplicación de fragmentos. El comportamiento de la variante pG1 en el escrutinio a pequeña escala se pudo verificar con éxito en los cultivos por lote alimentado.
Abreviaturas:
CSRE: elemento de respuesta a fuente de carbono, F$: matriz TF específica de hongos, GCN: número de copia del gen, GOI: gen de interés, Pp: Pichia pastoris, Sc: Saccharomyces cerevisiae, TF: factor o factores de transcripción, TFBS: sitio o sitios de unión del factor de transcripción, YDM: masa seca de levadura
Ejemplo 8: Determinación de la represión, inducción, nivel de expresión de pG1-x (nivel de expresión en comparación con pG1), razón de inducción
La fuerza del promotor en comparación con el promotor pG1 y la razón de inducción se pueden determinar mediante el siguiente ensayo convencional: se escrutan cepas de P. pastoris en placas de 24 pocillos profundos a 25°C con agitación a 280 rpm con 2 mL de cultivo por pocillo. Se utilizan cuentas de alimentación de glucosa (6 mm, Kuhner, CH) para generar condiciones de crecimiento que limitan la glucosa. Las células se analizan para determinar la expresión de eGFP durante la represión (YP glicerol al 1%, fase exponencial) y la inducción (YP 1 cuenta de alimentación, durante 20-28 horas) utilizando citometría de flujo. La fluorescencia de eGFP específica se calcula a partir de la intensidad de la fluorescencia y la dispersión directa para al menos 3000 puntos de datos de los datos de citometría de flujo. La dispersión directa es una medida relativa del volumen celular. La fluorescencia de eGFP específica equivale a la intensidad de fluorescencia (FI) dividida por la dispersión directa (FSC) a 1,5, es decir, FI/FSC15 (Hohenblum, H., N. Borth y D. Mattanovich, (2003) Assessing viability and cell-associated product of recombinant protein producing Pichia pastoris with flow cytometry. J Biotechnol 102: 281-290). A partir de estos datos, se utiliza la media geométrica de la fluorescencia específica de la población, y se normaliza restando la señal de fondo de las células de tipo salvaje de P. pastoris no productoras. La fluorescencia de eGFP específica de la condición de glicerol se denomina "Represión", y la fluorescencia de eGFP específica de la condición de glucosa limitada (cuentas de alimentación de glucosa) se denomina "Inducción". Por lo tanto, solo los valores de Represión e Inducción del mismo escrutinio y medición de citometría de flujo se pueden comparar y utilizar para los cálculos. Para determinar la fuerza relativa del promotor pG1-x, los niveles de expresión de eGFP en el estado inducido de los promotores pG1-x se compararon con el promotor pG1 original dividiendo el valor de Inducción de una cepa que comprende el promotor pG1-x por el valor de Inducción de una cepa que comprende el promotor pG1 original. La razón de Inducción se calcula dividiendo el valor de Inducción por el valor de Represión de la misma cepa/promotor. La Represión, la Inducción, la fuerza relativa del promotor pG1-x y la razón de Inducción se muestran en la Tabla 6 para diversas variantes del promotor.
Otros ejemplos han demostrado que mediante el uso de un promotor pG1 -x que comprende o consiste en la secuencia de nucleótidos de SEQ ID 49 se produjo una proteína modelo (POI) en P. pastoris con rendimientos mucho más altos (una multiplicidad de aumento de más de 3,5 veces), experimentos por lote alimentado) en comparación con el promotor pG1 no modificado (SEQ ID 7 de referencia).
Ejemplo 9: Comparación de "fermentación rápida" y fermentación convencional
Resumen: Se podrían obtener tiempos de fermentación significativamente reducidos para la expresión de una proteína armazón alternativa como proteína modelo bajo el control de una realización de pG1-3 del promotor de SEQ ID 39 (pG1-D1240 (SEQ ID 49)) empleando un protocolo de lote alimentado con rendimiento espacio-temporal optimizado en lugar de utilizar un régimen por lote alimentado convencional.
Se seleccionó un clon que expresaba una proteína modelo bajo el control de pG1-D1240 (SEQ ID 49) para los cultivos por lote alimentado. Los cultivos por lote alimentado se realizaron en reactores DASGIP (Eppendorf, Alemania) con un volumen de trabajo final de 0,5 L. Se prepararon medios y solución de oligoelementos como se describió previamente en el Ejemplo 7, excepto por la concentración de glicerol en el medio discontinuo de glicerol que fue de 45 g/L. Durante el cultivo, el nivel de oxígeno disuelto se controló a OD = 30% con la velocidad del agitador (400 -1200 rpm). La tasa de aireación fue de 1 vvm de aire, la temperatura se controló a 25°C y el punto de ajuste de pH de 5,0 se controló con la adición de NH4OH (25%). Para iniciar el cultivo del biorreactor, se inocularon 250 mL de medio discontinuo a partir de un precultivo del respectivo clon de P. pastoris con una densidad óptica inicial (DO600) de 1,0. La fase discontinua con glicerol duró aproximadamente 30 horas y alcanzó una concentración de biomasa seca de 25 a 29 g/L. La fase por lote alimentado de glicerol estuvo seguida por un lote alimentado limitado en glucosa. Se compararon dos modos de cultivo por lotes alimentados diferentes: (A) un protocolo por lote alimentado convencional que utiliza una velocidad de alimentación constante, (B) un protocolo por lote alimentado con rendimiento espaciotemporal optimizado ("Fermentación rápida"), donde la tasa de alimentación de glucosa se optimizó para maximizar la productividad volumétrica de la fermentación.
Para el cultivo convencional, se selección una tasa de alimentación de glucosa constante de 1,25 mL I r 1. El cultivo por lote alimentado se mantuvo durante 100 h (126 h de tiempo de cultivo total), lo que dio como resultado una concentración final de biomasa seca de aproximadamente 90 g L-1. Para la "Fermentación rápida", se adoptó un algoritmo de optimización basado en modelos (Maurer et al., Microbial Cell Factories, 2006, 5:37), donde la velocidad de alimentación de glucosa volumétrica optimizada F(t) se aproximó mediante una función linealmente creciente: F(t) [mL h-1] = 0,3234 mL Ir2 * t 3,3921 mL h-1. La fase por lote alimentado se mantuvo durante t = 33 h (60 h de tiempo total de cultivo), lo que dio como resultado una concentración final de biomasa seca de aproximadamente 140 g L-1.
Se tomaron muestras al final del lote y durante la fase por lote alimentado. Los títulos de producto se analizaron a partir de sobrenadantes clarificados utilizando un kit de reactivos HT de expresión de proteína de bajo peso molecular y el sistema Caliper LabChip GXI (Perkin Elmer, EE. UU.). Como patrón de referencia para la cuantificación absoluta se utilizó un patrón purificado de proteína armazón alternativa.
La Figura 9 muestra la generación de producto y biomasa durante el tiempo total de cultivo para el cultivo convencional. (A) y la "Fermentación rápida" (B). En comparación, se pudieron alcanzar títulos de producto final de 6,4 g L-1 y 4,3 g L-1 después de 60 h y 126 h para la "Fermentación rápida" y la fermentación convencional, respectivamente. En otras palabras, se pudo encontrar un título 1,4 veces más alto (títulos de caldo 1,2 veces superiores resp.) en un tiempo de fermentación significativamente más corto (-66 h) cuando se complementa la alimentación de glucosa durante la expresión bajo el promotor pG1-D1240 (SEQ ID 49) como se describe para la "Fermentación rápida" en lugar de utilizar el régimen de alimentación convencional descrito.
a as
Figure imgf000035_0001
Figure imgf000036_0001
Figure imgf000037_0001
Figure imgf000038_0001
Figure imgf000039_0001
Figure imgf000040_0001
Figure imgf000041_0001
Figure imgf000042_0001
Figure imgf000043_0001
Figure imgf000044_0001
Figure imgf000045_0001
Figure imgf000046_0001
Figure imgf000047_0001
Figure imgf000048_0001
Figure imgf000049_0001
Figure imgf000050_0001
Figure imgf000051_0001
Figure imgf000052_0001
Figure imgf000053_0001
Tabla 2: TFBS afectado de la secuencia promotora de pG1 en los mutantes de deleción pG1-A1 a A12. El análisis de secuencia se realizó utilizando MatInspector de Genomatix. Los TFBS relacionados con la glucosa y el carbono que se seleccionaron para la deleción se muestran en negrita y el ID correspondiente (1-12) y las posiciones suprimidas se indican en las columnas 1 y 2.
Figure imgf000054_0001
Figure imgf000055_0001
Figure imgf000056_0001
Figure imgf000057_0001
Tabla 3: Posiciones y deleciones de TFBS de las variantes de deleción de TFBS de pG1 Se enumeran los TFBS elegidos como diana y afectados en las variantes de deleción de TFBS de pG1 (pG1-A1 a A12). Los TFBS específicos relacionados con la fuente de carbono se muestran en negrita. La información detallada para todos los TFBS y para los TFBS suprimidos se proporciona en la Tabla 1 y la Tabla 2, respectivamente.
Figure imgf000058_0001
Tabla 4: Secuencias de cebadores
Figure imgf000058_0002
Figure imgf000059_0001
Figure imgf000060_0001
Figure imgf000061_0001
Tabla 5: Cultivo por lote alimentado de pG1 (denominado en el presente documento pG1 núm. 8) y variantes de pG1-x (denominadas también en el presente documento variantes de pG1) que expresan eGFP Se muestra la fluorescencia relativa de eGFP para el final del lote y para el final del lote alimentado. Los puntos de tiempo se establecieron en 0 al final del lote. Se comparó un clon que expresaba eGFP bajo control de pG1 (núm. 8) con clones que expresaban bajo control de una deleción de pG1 (pG1-A2), una mutación de TAT14 (pG1-T16) y una variante por duplicación (pG1-D1240). Las concentraciones de biomasa (YDM) en el lote y el lote alimentado fueron las esperadas.
Figure imgf000061_0002
Tabla 6: La fuerza del promotor en comparación con pG1 y la razón de inducción del prom otor de las variantes de pG1, a partir de un escrutinio comparativo de pocillos profundos. La fuerza de expresión de las variantes de pG1-x (inducidas) está relacionada con el nivel de expresión de eGFP obtenido con el promotor pG1 original. La razón de inducción se calcula a partir del nivel de GFP en el estado inducido y reprimido.
Figure imgf000061_0003
Figure imgf000062_0001

Claims (20)

REIVINDICACIONES
1. Un promotor pG1-x aislado y/o artificial, que es una variante funcional del promotor pG1 regulable por fuente de carbono de Pichia pastoris identificado por SEQ ID 1, cuyo promotor pG1-x consiste en, o comprende, al menos una parte de SEQ ID 1, cuya parte de SEQ ID 1 tiene una longitud de al menos 293 pb, cuyo promotor pG1-x comprende las siguientes regiones promotoras
a) al menos dos copias de una región promotora reguladora central, cuya región promotora reguladora central comprende las secuencias de nucleótidos de SEQ ID 2 y SEQ ID 3, en donde SEQ ID 2 y/o SEQ ID 3 comprenden uno o más sitios de unión al factor de transcripción (TFBs ); y
b) una región promotora reguladora no central, que es cualquier región dentro de la secuencia promotora de pG1-x distinta de la región reguladora central;
en donde el promotor pG1-x tiene una identidad de secuencia con la región correspondiente de SEQ ID 1, que es al menos 80% con SEQ ID 2 y SEQ ID 3, y al menos 50% en cualquier región distinta de SEQ ID 2 o SEQ ID 3; y adicionalmente en donde el promotor pG1-x está caracterizado por un aumento de la fuerza del promotor y/o la razón de inducción en comparación con el promotor pG1, en donde
- la fuerza del promotor aumenta al menos 1,1 veces en el estado inducido en comparación con el promotor pG1, y/o
- la razón de inducción aumenta al menos 1,1 veces en comparación con el promotor pG1.
2. El promotor pG1-x de la reivindicación 1, en donde la región reguladora central comprende la secuencia de nucleótidos de SEQ ID 4, o una variante funcional de SEQ ID 4 con al menos 80% de identidad de secuencia, que comprende uno o más TFBS.
3. El promotor pG1-x de la reivindicación 1 o 2, en donde la región reguladora central está incorporada a una región reguladora principal representada por SEQ ID 5, o una variante funcional de SEQ ID 5 con al menos 80% de identidad de secuencia, que comprende uno o más TFBS.
4. El promotor pG1-x de cualquiera de las reivindicaciones 1 a 3, que comprende uno o más TFBS para cualquiera de los factores de transcripción seleccionados del grupo que consiste en Rgt1, Cat8-1 y Cat8-2.
5. El promotor pG1-x de cualquiera de las reivindicaciones 1 a 4, en donde dicha región promotora reguladora central comprende una deleción de uno o más nucleótidos entre las secuencias de nucleótidos de SEQ ID 2 y SEQ ID 3 en comparación con la región correspondiente de SEQ ID 1.
6. El promotor pG1 -x de cualquiera de las reivindicaciones 1 a 5, que comprende al menos uno o al menos dos motivos T identificados por cualquiera de SEQ ID 12-29.
7. Un promotor pG1-x aislado y/o artificial, que comprende o consiste en la secuencia de nucleótidos seleccionada del grupo que consiste en cualquiera de
a) SEQ ID 37-44, preferiblemente cualquiera de SEQ ID 45-76;
b) SEQ ID 77-80, preferiblemente cualquiera de SEQ ID 81-112;
c) SEQ ID 113-114, preferiblemente cualquiera de SEQ ID 115-130;
d) SEQ ID 131-132, preferiblemente cualquiera de SEQ ID 133-148; o
e) SEQ ID 185-186, preferiblemente cualquiera de SEQ ID 187-202;
o una secuencia de nucleótidos que tiene al menos 80% de identidad de secuencia con cualquiera de las anteriores, en donde el promotor pG1-x está caracterizado por un aumento de la fuerza del promotor y/o la razón de inducción en comparación con el promotor pG1 de Pichia pastoris identificado por SEQ ID 1, en donde
- la fuerza del promotor aumenta al menos 1,1 veces en el estado inducido en comparación con el promotor pG1, y/o
- la razón de inducción aumenta al menos 1,1 veces en comparación con el promotor pG1.
8. El promotor pG1-x de la reivindicación 7, que comprende o consiste en la secuencia de nucleótidos seleccionada del grupo que consiste en cualquiera de SEQ ID 37-44, preferiblemente cualquiera de SEQ ID 45-76.
9. El promotor pG1-x de cualquiera de las reivindicaciones 1 a 8, que está conectado operablemente a una secuencia de nucleótidos que codifica una proteína de interés (POI), cuyo ácido nucleico no está asociado de forma nativa con la secuencia de nucleótidos que codifica la POI.
10. El ácido nucleico de la reivindicación 9, que comprende adicionalmente una secuencia de nucleótidos que codifica un péptido señal que permite la secreción de la POI, preferiblemente en donde la secuencia de nucleótidos que codifica el péptido señal está situada adyacente al extremo 5' de la secuencia de nucleótidos que codifica la POI.
11. Una construcción de expresión que comprende el ácido nucleico de la reivindicación 9 o 10, preferiblemente un vector o plásmido de replicación autónoma, o un vector o plásmido que se integra en el ADN cromosómico de una célula anfitriona.
12. Una célula anfitriona recombinante que comprende la construcción de expresión de la reivindicación 11, preferiblemente una célula eucariótica, más preferiblemente una célula de levadura o fúngica filamentosa, más preferiblemente una célula de levadura del género Saccharomyces o Pichia.
13. Un método para producir una POI mediante el cultivo de una línea celular anfitriona recombinante de la reivindicación 12, que comprende las etapas de
a) cultivar la línea celular en condiciones para expresar dicha POI, y
b) recuperar la POI.
14. El método de la reivindicación 13, en donde el cultivo comprende
a) una primera etapa que utilizan una fuente de carbono basal que reprime el promotor pG1-x, preferiblemente en donde la fuente de carbono basal se selecciona del grupo que consiste en glucosa, glicerol, etanol, una mezcla de los mismos y material nutriente complejo, seguida de
b) una segunda etapa que no utiliza o utiliza una cantidad limitada de una fuente de carbono complementaria que desreprime el promotor pG1-x para inducir la producción de la POI, preferiblemente en donde la fuente de carbono complementaria es una hexosa tal como glucosa, fructosa, galactosa o manosa, un disacárido, tal como sacarosa, un alcohol, tal como glicerol o etanol, o una mezcla de cualquiera de los anteriores.
15. El método de la reivindicación 14, en donde la segunda etapa b) emplea un medio de alimentación que proporciona la fuente de carbono complementaria en una cantidad limitante del crecimiento para mantener la tasa de crecimiento específica dentro del rango de 0,001 h-1 a 0,2 Ir1, preferiblemente 0,005 h-1 a 0,15 h-1.
16. El método de las reivindicaciones 14 o 15, en donde el cultivo se realiza en un biorreactor comenzando con una fase discontinua como primera etapa, seguida de una fase por lote alimentado o una fase de cultivo continuo como segunda etapa, en donde la fase discontinua se realiza durante alrededor de las 20 a las 36h; y el cultivo en la fase por lote alimentado se realiza durante cualquiera de alrededor de 15 a 80 h, alrededor de 15 a 70 h, alrededor de 15 a 60 h, alrededor de 15 a 50 h, alrededor de 15 a 45 h, alrededor de 15 a 40 h, alrededor de 15 a 35 h, alrededor de 15 a 30h, alrededor de 15 a 25h, o alrededor de 15 a 20h; preferiblemente alrededor de 20 a 40 h.
17. El método de cualquiera de las reivindicaciones 13 a 16, en donde la célula anfitriona recombinante es levadura de cualquiera del género Saccharomyces o género Pichia o género Komagataella, preferiblemente Pichia pastoris o Komagataella pastoris.
18. El método de cualquiera de las reivindicaciones 13 a 17, en donde el promotor pG1 -x es cualquiera de SEQ ID 37­ 44, preferiblemente cualquiera de SEQ ID 45-76, preferiblemente en donde el promotor pG1-x comprende SEQ ID 39, más preferiblemente SEQ ID 49.
19. El método de cualquiera de las reivindicaciones 13 a 18, en donde la POI se produce a una tasa de transcripción de al menos 15% en comparación con el promotor pGAP nativo de la célula.
20. El método de cualquiera de las reivindicaciones 13 a 19, en donde la POI es una proteína heteróloga, preferiblemente seleccionada entre proteínas terapéuticas, incluyendo anticuerpos o fragmentos de los mismos, enzimas y péptidos, antibióticos proteicos, proteínas de fusión de toxinas, productos conjugados de carbohidrato -proteína, proteínas estructurales, proteínas reguladoras, vacunas y proteínas o partículas de tipo vacunas, enzimas de procedimiento, factores de crecimiento, hormonas y citocinas, o un metabolito de una POI.
ES16751266T 2015-08-05 2016-08-05 Variantes de promotor Active ES2902044T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP2015068024 2015-08-05
EP16163932 2016-04-05
PCT/EP2016/068784 WO2017021541A1 (en) 2015-08-05 2016-08-05 Promoter variants

Publications (1)

Publication Number Publication Date
ES2902044T3 true ES2902044T3 (es) 2022-03-24

Family

ID=56684642

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16751266T Active ES2902044T3 (es) 2015-08-05 2016-08-05 Variantes de promotor

Country Status (14)

Country Link
US (2) US10752907B2 (es)
EP (1) EP3332005B1 (es)
JP (1) JP6833812B2 (es)
KR (1) KR102253479B1 (es)
CN (1) CN108350447B (es)
AU (1) AU2016303026B2 (es)
BR (1) BR112018002395A2 (es)
CA (1) CA2992170C (es)
DK (1) DK3332005T3 (es)
ES (1) ES2902044T3 (es)
HK (1) HK1251256A1 (es)
IL (1) IL257000B (es)
TW (1) TW201718859A (es)
WO (1) WO2017021541A1 (es)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101954389B1 (ko) 2011-10-07 2019-03-06 론자 리미티드 조절가능한 프로모터
EP3752617A1 (en) 2018-02-12 2020-12-23 Lonza Ltd. Host cell for producing a protein of interest
EP3536784A1 (en) 2018-03-05 2019-09-11 ACIB GmbH Host cell engineered for improved metabolite production
US11866714B2 (en) * 2018-06-07 2024-01-09 Basf Se Promoter for yeast
JP2022501028A (ja) * 2018-09-24 2022-01-06 オルタ ドグ テクニク ユニヴェルシテシ プロモータ工学によるアルコールデヒドロゲナーゼ2(adh2)プロモータ変異体の設計
JP2022502018A (ja) * 2018-09-24 2022-01-11 オルタ ドグ テクニク ユニヴェルシテシ 改変されたaox1プロモータバリアント
CN116904331A (zh) 2019-01-11 2023-10-20 龙沙有限公司 重组宿主细胞中碳源调节的蛋白的产生
HRP20230560T1 (hr) * 2019-01-29 2023-08-18 Clariant Produkte (Deutschland) Gmbh Kimerni promotor za upotrebu u metaboličkom inženjeringu
WO2020200415A1 (en) 2019-04-01 2020-10-08 Lonza Ltd Mut- methylotrophic yeast
WO2020200414A1 (en) 2019-04-01 2020-10-08 Lonza Ltd Protein production in mut-methylotrophic yeast
BR112021019477A2 (pt) 2019-04-01 2022-02-08 Univ Wien Bodenkultur Uma célula hospedeira de levedura metilotrófica deficiente de via de utilização de metanol recombinante, um método de produção de uma proteína de interesse, e uso de uma célula hospedeira em um método de produção de um produto de fermentação
EP4127185A1 (en) 2020-04-01 2023-02-08 Lonza Ltd. Helper factors for expressing proteins in yeast
IL301312A (en) 2020-09-30 2023-05-01 Lonza Ag Host cells overexpress translation factors
CN117120618A (zh) 2021-02-12 2023-11-24 勃林格殷格翰 Rcv 两合公司 用于增加蛋白质分泌的信号肽
CN114657190B (zh) * 2022-04-06 2023-08-29 暨南大学 Msn2p作为负调控因子在提高宿主细胞中蛋白表达中的应用
CN114908092B (zh) * 2022-05-12 2023-07-18 华南理工大学 一种长效、高强度的杂合启动子及其重组菌株和应用
EP4353825A1 (en) * 2022-10-10 2024-04-17 bisy GmbH Modified promoter sequences
WO2024133538A1 (en) 2022-12-20 2024-06-27 Lonza Ltd Host cells with pat1 knockout for increased specific protein productivity

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AT501955B1 (de) 2005-02-23 2007-08-15 Univ Graz Tech Mutierte aox1-promotoren
US8105811B2 (en) * 2008-06-13 2012-01-31 Wisconsin Alumni Research Foundation Sugar transport sequences, yeast strains having improved sugar uptake, and methods of use
KR101954389B1 (ko) * 2011-10-07 2019-03-06 론자 리미티드 조절가능한 프로모터
ES2789299T3 (es) * 2012-10-29 2020-10-26 Lonza Ag Secuencias de expresión

Also Published As

Publication number Publication date
EP3332005A1 (en) 2018-06-13
CN108350447A (zh) 2018-07-31
KR20180037237A (ko) 2018-04-11
EP3332005B1 (en) 2021-09-22
CA2992170C (en) 2022-08-16
IL257000B (en) 2022-06-01
JP6833812B2 (ja) 2021-02-24
HK1251256A1 (zh) 2019-01-25
AU2016303026B2 (en) 2020-10-22
IL257000A (en) 2018-03-29
US10752907B2 (en) 2020-08-25
CN108350447B (zh) 2021-08-31
AU2016303026A1 (en) 2018-02-15
CA2992170A1 (en) 2017-02-09
US20180223293A1 (en) 2018-08-09
DK3332005T3 (da) 2022-01-03
JP2018522565A (ja) 2018-08-16
TW201718859A (zh) 2017-06-01
WO2017021541A1 (en) 2017-02-09
US20200347391A1 (en) 2020-11-05
BR112018002395A2 (pt) 2018-09-18
KR102253479B1 (ko) 2021-05-21

Similar Documents

Publication Publication Date Title
ES2902044T3 (es) Variantes de promotor
US11168117B2 (en) Constitutive promoter
US20220259608A1 (en) Regulatable promoter
ES2921137T3 (es) Producción de proteínas regulada por fuente de carbono en una célula huésped recombinante
US10428123B2 (en) Constitiutive promoter
KR20230075436A (ko) 번역 인자를 과발현하는 숙주 세포
WO2024133538A1 (en) Host cells with pat1 knockout for increased specific protein productivity
ES2730173T3 (es) Promotor regulable
CN114026239A (zh) Mut-甲醇营养型酵母