ES2902044T3 - Promoter variants - Google Patents

Promoter variants Download PDF

Info

Publication number
ES2902044T3
ES2902044T3 ES16751266T ES16751266T ES2902044T3 ES 2902044 T3 ES2902044 T3 ES 2902044T3 ES 16751266 T ES16751266 T ES 16751266T ES 16751266 T ES16751266 T ES 16751266T ES 2902044 T3 ES2902044 T3 ES 2902044T3
Authority
ES
Spain
Prior art keywords
promoter
seq
poi
sequence
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16751266T
Other languages
Spanish (es)
Inventor
Diethard Mattanovich
Brigitte Gasser
Roland Prielhofer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lonza AG
Original Assignee
Lonza AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lonza AG filed Critical Lonza AG
Application granted granted Critical
Publication of ES2902044T3 publication Critical patent/ES2902044T3/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/16Yeasts; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/001Vector systems having a special element relevant for transcription controllable enhancer/promoter combination

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mycology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Botany (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

Un promotor pG1-x aislado y/o artificial, que es una variante funcional del promotor pG1 regulable por fuente de carbono de Pichia pastoris identificado por SEQ ID 1, cuyo promotor pG1-x consiste en, o comprende, al menos una parte de SEQ ID 1, cuya parte de SEQ ID 1 tiene una longitud de al menos 293 pb, cuyo promotor pG1-x comprende las siguientes regiones promotoras a) al menos dos copias de una región promotora reguladora central, cuya región promotora reguladora central comprende las secuencias de nucleótidos de SEQ ID 2 y SEQ ID 3, en donde SEQ ID 2 y/o SEQ ID 3 comprenden uno o más sitios de unión al factor de transcripción (TFBS); y b) una región promotora reguladora no central, que es cualquier región dentro de la secuencia promotora de pG1- x distinta de la región reguladora central; en donde el promotor pG1-x tiene una identidad de secuencia con la región correspondiente de SEQ ID 1, que es al menos 80% con SEQ ID 2 y SEQ ID 3, y al menos 50% en cualquier región distinta de SEQ ID 2 o SEQ ID 3; y adicionalmente en donde el promotor pG1-x está caracterizado por un aumento de la fuerza del promotor y/o la razón de inducción en comparación con el promotor pG1, en donde - la fuerza del promotor aumenta al menos 1,1 veces en el estado inducido en comparación con el promotor pG1, y/o - la razón de inducción aumenta al menos 1,1 veces en comparación con el promotor pG1.An isolated and/or artificial pG1-x promoter, which is a functional variant of the Pichia pastoris carbon source-regulatable pG1 promoter identified by SEQ ID 1, which pG1-x promoter consists of, or comprises, at least a part of SEQ ID 1, whose part of SEQ ID 1 is at least 293 bp long, whose pG1-x promoter comprises the following promoter regions a) at least two copies of a core regulatory promoter region, whose core regulatory promoter region comprises the sequences of nucleotides of SEQ ID 2 and SEQ ID 3, wherein SEQ ID 2 and/or SEQ ID 3 comprise one or more transcription factor binding sites (TFBS); and b) a non-core regulatory promoter region, which is any region within the pG1-x promoter sequence other than the core regulatory region; wherein the pG1-x promoter has sequence identity to the corresponding region of SEQ ID 1, which is at least 80% to SEQ ID 2 and SEQ ID 3, and at least 50% to any region other than SEQ ID 2 or SEQ ID 3; and further wherein the pG1-x promoter is characterized by increased promoter strength and/or induction ratio compared to the pG1 promoter, wherein - promoter strength is increased by at least 1.1-fold in the state induced compared to the pG1 promoter, and/or - the induction ratio is increased by at least 1.1-fold compared to the pG1 promoter.

Description

DESCRIPCIÓNDESCRIPTION

Variantes de promotorPromoter variants

Campo técnicotechnical field

La invención se refiere a un promotor artificial aislado, que es una variante o derivado funcional del promotor pG1 regulable por fuente de carbono de Pichia pastoris identificado por SEQ ID 1, cuyo promotor se denomina en el presente documento pG1-x que se caracteriza por elementos y rasgos específicos del promotor.The invention relates to an isolated artificial promoter, which is a variant or functional derivative of the Pichia pastoris carbon source regulatable pG1 promoter identified by SEQ ID 1, whose promoter is referred to herein as pG1-x which is characterized by elements and promoter-specific traits.

AntecedentesBackground

La levadura metilotrófica Pichia pastoris (sin. Komagataella sp.) es un anfitrión de producción de proteínas bien establecido. Numerosos enfoques de ingeniería de cepas para P. pastoris han mejorado la productividad de diversos productos y también se han dedicado esfuerzos a los promotores con fines productivos (Prielhofer, R., M. Maurer, J. Klein, J. Wenger, C. Kiziak, B. Gasser y D. Mattanovich, (2013) Induction without methanol: novel regulated promoters enable high-level expression in Pichia pastoris. Microb Cell Fact 12: 5). Los promotores génicos son rasgos clave para la expresión de un gen de interés (GOI): la transcripción del ARN de un GOI aguas abajo (3') está dirigida por la secuencia promotora aguas arriba (5'). La ARN polimerasa II (RNAPII) es responsable de la transcripción del ARNm en eucariotas. Los promotores de RNAPII consisten en un promotor central y varios elementos de ADN que actúan en cis: promotor proximal, potenciadores, silenciadores y elementos limítrofes/aislantes. Los promotores centrales de levadura se encuentran típicamente cerca (-75/+50 pb) del sitio principal de inicio de la transcripción, con frecuencia contienen recuadros TATA inadecuadas (hasta 2 bases de diferencia con la secuencia consenso TATA) y carecen de elementos promotores que se encuentran típicamente en otros organismos. La regulación transcripcional responde a diferentes condiciones y se lleva a cabo mediante elementos que actúan en cis y las proteínas reguladoras correspondientes (factores de transcripción (TF)).The methylotrophic yeast Pichia pastoris (syn. Komagataella sp.) is a well-established protein-producing host. Numerous strain engineering approaches to P. pastoris have improved the productivity of various products and efforts have also been devoted to promoters for production purposes (Prielhofer, R., M. Maurer, J. Klein, J. Wenger, C. Kiziak , B. Gasser and D. Mattanovich, (2013) Induction without methanol: novel regulated promoters enable high-level expression in Pichia pastoris. Microb Cell Fact 12: 5). Gene promoters are key features for the expression of a gene of interest (GOI): RNA transcription from a downstream (3') GOI is directed by the upstream (5') promoter sequence. RNA polymerase II (RNAPII) is responsible for the transcription of mRNA in eukaryotes. RNAPII promoters consist of a core promoter and several cis-acting DNA elements: proximal promoter, enhancers, silencers, and border/insulator elements. Yeast core promoters are typically located close (-75/+50 bp) to the major transcriptional start site, often contain inappropriate TATA boxes (up to 2 bases different from the consensus TATA sequence), and lack promoter elements that they are typically found in other organisms. Transcriptional regulation responds to different conditions and is carried out by cis-acting elements and corresponding regulatory proteins (transcription factors (TFs)).

Para aplicaciones biotecnológicas, se utilizan promotores que permiten la expresión génica constitutiva o regulada/inducible. Los procedimientos de producción que utilizan P. pastoris se aplican favorablemente a promotores dependientes de la fuente de carbono, tales como el Pa o x inducible por metanol. De ese modo, la fase de crecimiento se puede separar de la fase de producción de proteínas potencialmente difícil. Recientemente se informó sobre un conjunto de promotores (Prielhofer et al., 2013), que también está controlado por la fuente de carbono, pero no depende del metanol para su inducción: estos promotores comparten el rasgo de represión por exceso de glicerol e inducción por glucosa limitante. pG1 (SEQ ID 1), el más fuerte de estos promotores, se induce completamente por debajo de 0,05 g/L de glucosa; controla de forma nativa la expresión de un gen transportador de glucosa de alta afinidad GTH1. Las características de captación de glucosa dependen de la presencia de transportadores de glucosa de alta y baja afinidad. Diecisiete genes de transporte de hexosa (HXT) en S. cerevisiae (HXT1-17) se expresan en función de la concentración de glucosa, pero solo dos HXT homólogos se encuentran en P. pastoris (pAS_chr1-4_0570 y PAS_chr2-1_0054, denominados PpHxt1 y PpHxt2). Se identificó que PpHxt1 es el principal transportador de baja afinidad en P. pastoris, mientras que el transporte de glucosa de alta afinidad es facilitado por otros dos genes, a saber, PAS_chr3_0023 y PAS_chr1-3_0011 (GTH1, el gen controlado por pG1) Prielhofer et al., 2013).For biotechnological applications, promoters are used that allow constitutive or regulated/inducible gene expression. Production methods using P. pastoris are favorably applied to carbon source-dependent promoters, such as the methanol-inducible P aox . In this way, the growth phase can be separated from the potentially difficult protein production phase. A set of promoters was recently reported (Prielhofer et al., 2013), which is also controlled by the carbon source, but does not depend on methanol for its induction: these promoters share the trait of repression by excess glycerol and induction by limiting glucose. pG1 (SEQ ID 1), the strongest of these promoters, is fully induced below 0.05 g/L glucose; natively controls the expression of a high-affinity glucose transporter gene GTH1. Glucose uptake characteristics depend on the presence of high- and low-affinity glucose transporters. Seventeen hexose transport ( HXT) genes in S. cerevisiae ( HXT1-17) are expressed as a function of glucose concentration, but only two homologous HXTs are found in P. pastoris (pAS_chr1-4_0570 and PAS_chr2-1_0054, designated PpHxt1 and PpHxt2). PpHxt1 was identified to be the main low-affinity transporter in P. pastoris, while high-affinity glucose transport is facilitated by two other genes, namely PAS_chr3_0023 and PAS_chr1-3_0011 ( GTH1, the gene controlled by pG1) Prielhofer et al., 2013).

Mientras que S. cerevisiae presenta una gran capacidad de absorción de glucosa y metabolismo de la glucosa (fermentativo), P. pastoris tiene una tasa de absorción de glucosa y un metabolismo respiratorio de la glucosa más bajos. Además, P. pastoris es capaz de absorber glucosa en concentraciones extracelulares mucho más bajas que S. cerevisiae (Km de transportadores de alta afinidad en el rango pM en P. pastoris frente al rango mM en S. cerevisiae). La diferencia fundamental en el comportamiento de absorción de glucosa también se muestra en el control transcripcional de genes relacionados y también se puede observar en las funciones evolucionadas de los reguladores transcripcionales p. ej. PpAft1 y PpMxr1 (homólogo de ScAdr1).While S. cerevisiae has a high glucose uptake capacity and glucose (fermentative) metabolism, P. pastoris has a lower glucose uptake rate and lower respiratory glucose metabolism. Furthermore, P. pastoris is able to take up glucose at much lower extracellular concentrations than S. cerevisiae (K m of high-affinity transporters in the pM range in P. pastoris vs. mM range in S. cerevisiae). The fundamental difference in glucose uptake behavior is also shown in the transcriptional control of related genes and can also be seen in the evolved functions of transcriptional regulators p. eg PpAft1 and PpMxr1 (homologue of ScAdr1).

Los estudios de promotores de P. pastoris y la mutagénesis aleatoria de Pa o x 1 y del promotor de gliceraldehído-3-fosfato deshidrogenasa Pg a p dieron como resultado bibliotecas con variantes del promotor que poseían diferentes actividades, alteración del comportamiento de inducción en comparación con el promotor de tipo salvaje e identificación de varios sitios importantes de unión al factor de transcripción (TFBS) de Pa o x 1 (documento WO2006/089329 A2).Studies of P. pastoris promoters and random mutagenesis of P aox 1 and the P gap glyceraldehyde-3-phosphate dehydrogenase promoter resulted in libraries with promoter variants possessing different activities, altered induction behavior compared to wild-type promoter and identification of several important P aox 1 transcription factor binding sites (TFBS) (WO2006/089329 A2).

El promotor pG1 y sus fragmentos se describen con más detalle en el documento WO2013/050551 A1.The pG1 promoter and its fragments are described in more detail in WO2013/050551 A1.

El documento WO2014067926A1 divulga la expresión de una proteína de interés empleando secuencias líder específicas. El líder se utilizó con varios promotores. Como promotor ilustrativo, se utiliza el promotor pG1.WO2014067926A1 discloses the expression of a protein of interest using specific leader sequences. The leader was used with various promoters. As an illustrative promoter, the pG1 promoter is used.

Struhl K. (Proceedings of the National Academy of Sciences of the United States of America 1982, 78(7):4461-4465) describe el mapeo de deleciones de la región promotora his3 de levadura. Concluye que la caja T-A-T-A, una secuencia delante de la mayoría de los genes eucarióticos no es suficiente para la función del promotor de tipo salvaje y sugiere que el promotor de levadura parece ser más complejo que un simple sitio de interacción entre la ARN polimerasa y el ADN. Struhl K. (Proceedings of the National Academy of Sciences of the United States of America 1982, 78(7):4461-4465) describes the mapping of deletions of the yeast his3 promoter region. It concludes that the TATA box, a sequence in front of most eukaryotic genes, is not sufficient for wild-type promoter function and suggests that the yeast promoter appears to be more complex than a simple RNA-polymerase interaction site. DNA.

Quandt et al. (Nucleic Acids Research 1995, 23(23) 4878-4884) describen herramientas para la detección de coincidencias consenso en datos de secuencias de nucleótidos para identificar motivos reguladores basados en el análisis de datos de secuencias. Se creó una biblioteca de patrones consenso y se detectaron posibles coincidencias de secuencia utilizando una herramienta de soporte lógico (MatInspector).Quandt et al. (Nucleic Acids Research 1995, 23(23) 4878-4884) describe tools for consensus matching of nucleotide sequence data to identify regulatory motifs based on analysis of sequence data. A consensus pattern library was created and possible sequence matches were detected using a software tool (MatInspector).

Compendio de la invenciónSummary of the invention

El objeto de la invención es proporcionar promotores regulables mejorados con respecto a la regulación de la fuente de carbono y la fuerza del promotor. Otro objeto es proporcionar tal promotor para una producción mejorada de POI y/o una producción de POI dentro de un período de tiempo reducido.The object of the invention is to provide improved regulatable promoters with respect to carbon source regulation and promoter strength. Another object is to provide such a promoter for improved POI production and/or POI production within a reduced period of time.

El objeto se resuelve por el tema en cuestión reivindicado.The object is resolved by the subject matter claimed.

De acuerdo con la invención, se proporciona un promotor pG1 -x aislado y/o artificial, que es una variante funcional del promotor pG1 regulable por fuente de carbono de Pichia pastoris identificado por SEQ ID 1, cuya parte de SEQ ID 1 tiene una longitud de al menos 293 pb, cuyo promotor pG1-x comprende las siguientes regiones promotoras:According to the invention, an isolated and/or artificial pG1-x promoter is provided, which is a functional variant of the Pichia pastoris carbon source-regulatable pG1 promoter identified by SEQ ID 1, whose part of SEQ ID 1 has a length of at least 293 bp, whose pG1-x promoter comprises the following promoter regions:

a) al menos dos copias de una región reguladora central, cuya región promotora reguladora central comprende las secuencias de nucleótidos de SEQ ID 2 y SEQ ID 3, en donde SEQ ID 2 y/o SEQ ID 3 comprenden uno o más sitios de unión al factor de transcripción (TFBS); ya) at least two copies of a central regulatory region, whose central regulatory promoter region comprises the nucleotide sequences of SEQ ID 2 and SEQ ID 3, where SEQ ID 2 and/or SEQ ID 3 comprise one or more binding sites transcription factor (TFBS); Y

b) una región reguladora no central, que es cualquier región dentro de la secuencia promotora pG1-x distinta de la región reguladora central;b) a non-core regulatory region, which is any region within the pG1-x promoter sequence other than the core regulatory region;

en donde el promotor pG1-x tiene una identidad de secuencia con la región correspondiente de SEQ ID 1, que es al menos 80% en SEQ ID 2 y SEQ ID 3, y al menos 50% en cualquier región distinta de SEQ ID 2 o SEQ ID 3; y adicionalmente en donde el promotor pG1-x se caracteriza por un aumento de la fuerza del promotor y/o la razón de inducción en comparación con el promotor pG1, en dondewherein the pG1-x promoter has sequence identity to the corresponding region of SEQ ID 1, which is at least 80% in SEQ ID 2 and SEQ ID 3, and at least 50% in any region other than SEQ ID 2 or SEQ ID 3; and further wherein the pG1-x promoter is characterized by increased promoter strength and/or induction ratio compared to the pG1 promoter, wherein

- la fuerza del promotor aumenta al menos 1,1 veces en el estado inducido en comparación con el promotor pG1, y/o- promoter strength is increased by at least 1.1-fold in the induced state compared to the pG1 promoter, and/or

- la razón de inducción aumenta al menos 1,1 veces en comparación con el promotor pG1.- the induction ratio is increased by at least 1.1-fold compared to the pG1 promoter.

Específicamente, el promotor pG1 de Pichia pastoris identificado por SEQ ID 1 es cualquiera de SEQ ID 7, 8 o 9, más específicamente SEQ ID 9 como se utiliza en el presente documento como referencia en los Ejemplos.Specifically, the Pichia pastoris pG1 promoter identified by SEQ ID 1 is any one of SEQ ID 7, 8 or 9, more specifically SEQ ID 9 as used herein by reference in the Examples.

Específicamente, el promotor pG1-x no es ninguno de los promotores de la técnica anterior denominados pG1 (SEQ ID 264), ni pG1a (SEQ ID 265), pG1b (SEQ ID 266), pG1c (SEQ ID 267), pG1d (SEQ ID 268), pG1e (SEQ ID 269) o pG1f (SeQ ID 270), como se describe en el documento WO2013050551 A1. Specifically, the pG1-x promoter is not one of the prior art promoters designated pG1 (SEQ ID 264), nor pG1a (SEQ ID 265), pG1b (SEQ ID 266), pG1c (SEQ ID 267), pG1d (SEQ ID 268), pG1e (SEQ ID 269) or pG1f (SeQ ID 270), as described in WO2013050551 A1.

Según una realización específica, el promotor pG1-x según la invención es un promotor regulable por fuente de carbono que se caracteriza porAccording to a specific embodiment, the pG1-x promoter according to the invention is a carbon source regulatable promoter characterized by

- una fuerza del promotor al menos 1,1 veces, o al menos 1,2 veces, o al menos 1,3 veces, o al menos 1,4 veces, o al menos 1,5 veces, o al menos 1,6 veces, o al menos 1,7 veces, o al menos 1,8 veces, o al menos 1,9 veces, o al menos 2 veces, o al menos 2,1 veces, o al menos 2,2 veces, o al menos 2,3 veces, o al menos 2,4 veces, o al menos 2,5 veces, o al menos 2,6 veces, o al menos 2,7 veces, o al menos 2,8 veces mayor, o al menos 2,9 veces, o al menos 3 veces, o al menos 3,3 veces, o al menos 3,5 veces, o al menos 3,8 veces, o al menos 4 veces, o al menos 4,5 veces, o al menos 5 veces, o al menos 5,5 veces, o al menos 6 veces mayor en el estado inducido en comparación con el promotor pG1, y- a promoter strength of at least 1.1-fold, or at least 1.2-fold, or at least 1.3-fold, or at least 1.4-fold, or at least 1.5-fold, or at least 1.6-fold times, or at least 1.7 times, or at least 1.8 times, or at least 1.9 times, or at least 2 times, or at least 2.1 times, or at least 2.2 times, or at least at least 2.3 times, or at least 2.4 times, or at least 2.5 times, or at least 2.6 times, or at least 2.7 times, or at least 2.8 times, or at least 2.9 times, or at least 3 times, or at least 3.3 times, or at least 3.5 times, or at least 3.8 times, or at least 4 times, or at least 4.5 times, or at least 5-fold, or at least 5.5-fold, or at least 6-fold higher in the induced state compared to the pG1 promoter, and

- la capacidad de ser regulado por fuente de carbono determinada por una razón de inducción que es igual o superior en comparación con la razón de inducción conseguida con el promotor pG1.- the ability to be regulated by carbon source determined by an induction ratio that is equal to or greater than the induction ratio achieved with the pG1 promoter.

Según una realización adicional específica, el promotor pG1-x según la invención es un promotor regulable por fuente de carbono que se caracteriza porAccording to a further specific embodiment, the pG1-x promoter according to the invention is a carbon source regulatable promoter characterized by

- la misma o mayor fuerza del promotor en el estado inducido en comparación con el promotor pG1, y- the same or greater strength of the promoter in the induced state compared to the pG1 promoter, and

- la capacidad de ser regulado por fuente de carbono determinada por una razón de inducción que es al menos 1.1 veces, o al menos 1,2 veces, o al menos 1,3 veces, o al menos 1,4 veces, o al menos 1,5 veces, o al menos 1.6 veces, o al menos 1,7 veces, o al menos 1,8 veces, o al menos 1,9 veces, o al menos 2 veces, o al menos 2.1 veces, o al menos 2,2 veces, o al menos 2,3 veces, o al menos 2,4 veces, o al menos 2,5 veces, o al menos 2.6 veces, o al menos 2,7 veces, o al menos 2,8 veces mayor, o al menos 2,9 veces, o al menos 3 veces, o al menos 3,3 veces, o al menos 3,5 veces, o al menos 3,8 veces, o al menos 4 veces, o al menos 4,5 veces o al menos 5 veces, o al menos 5,5 veces, o al menos 6 veces mayor en comparación con la razón de inducción lograda con el promotor pG1. - the ability to be regulated by carbon source determined by an induction ratio that is at least 1.1 times, or at least 1.2 times, or at least 1.3 times, or at least 1.4 times, or at least 1.5 times, or at least 1.6 times, or at least 1.7 times, or at least 1.8 times, or at least 1.9 times, or at least 2 times, or at least 2.1 times, or at least 2.2 times, or at least 2.3 times, or at least 2.4 times, or at least 2.5 times, or at least 2.6 times, or at least 2.7 times, or at least 2.8 times greater, or at least 2.9 times, or at least 3 times, or at least 3.3 times, or at least 3.5 times, or at least 3.8 times, or at least 4 times, or at least 4 0.5-fold or at least 5-fold or at least 5.5-fold or at least 6-fold higher compared to the rate of induction achieved with the pG1 promoter.

Según una realización adicional específica, el promotor pG1-x según la invención es un promotor regulable por fuente de carbono que se caracteriza porAccording to a further specific embodiment, the pG1-x promoter according to the invention is a carbon source regulatable promoter characterized by

- una fuerza del promotor al menos 1,1 veces, o al menos 1,2 veces, o al menos 1,3 veces, o al menos 1,4 veces, o al menos 1,5 veces, o al menos 1,6 veces, o al menos 1,7 veces, o al menos 1,8 veces, o al menos 1,9 veces, o al menos 2 veces, o al menos 2,1 veces, o al menos 2,2 veces, o al menos 2,3 veces, o al menos 2,4 veces, o al menos 2,5 veces, o al menos 2,6 veces, o al menos 2,7 veces, o al menos 2,8 veces mayor, o al menos 2,9 veces, o al menos 3 veces, o al menos 3,3 veces, o al menos 3,5 veces, o al menos 3,8 veces, o al menos 4 veces, o al menos 4,5 veces, o al menos 5 veces, o al menos 5,5 veces, o al menos 6 veces mayor en el estado inducido en comparación con el promotor pG1, y- a promoter strength of at least 1.1-fold, or at least 1.2-fold, or at least 1.3-fold, or at least 1.4-fold, or at least 1.5-fold, or at least 1.6-fold times, or at least 1.7 times, or at least 1.8 times, or at least 1.9 times, or at least 2 times, or at least 2.1 times, or at least 2.2 times, or at least at least 2.3 times, or at least 2.4 times, or at least 2.5 times, or at least 2.6 times, or at least 2.7 times, or at least 2.8 times, or at least 2.9 times, or at least 3 times, or at least 3.3 times, or at least 3.5 times, or at least 3.8 times, or at least 4 times, or at least 4.5 times, or at least 5-fold, or at least 5.5-fold, or at least 6-fold higher in the induced state compared to the pG1 promoter, and

- la capacidad de ser regulado por fuente de carbono determinada por una razón de inducción que es al menos 1.1 veces, o al menos 1,2 veces, o al menos 1,3 veces, o al menos 1,4 veces, o al menos 1,5 veces, o al menos 1.6 veces, o al menos 1,7 veces, o al menos 1,8 veces, o al menos 1,9 veces, o al menos 2 veces, o al menos 2.1 veces, o al menos 2,2 veces, o al menos 2,3 veces, o al menos 2,4 veces, o al menos 2,5 veces, o al menos 2.6 veces, o al menos 2,7 veces, o al menos 2,8 veces mayor, o al menos 2,9 veces, o al menos 3 veces, o al menos 3,3 veces, o al menos 3,5 veces, o al menos 3,8 veces, o al menos 4 veces, o al menos 4,5 veces o al menos 5 veces, o al menos 5,5 veces, o al menos 6 veces mayor en comparación con la razón de inducción lograda con el promotor pG1.- the ability to be regulated by carbon source determined by an induction ratio that is at least 1.1 times, or at least 1.2 times, or at least 1.3 times, or at least 1.4 times, or at least 1.5 times, or at least 1.6 times, or at least 1.7 times, or at least 1.8 times, or at least 1.9 times, or at least 2 times, or at least 2.1 times, or at least 2.2 times, or at least 2.3 times, or at least 2.4 times, or at least 2.5 times, or at least 2.6 times, or at least 2.7 times, or at least 2.8 times greater, or at least 2.9 times, or at least 3 times, or at least 3.3 times, or at least 3.5 times, or at least 3.8 times, or at least 4 times, or at least 4 0.5-fold or at least 5-fold or at least 5.5-fold or at least 6-fold higher compared to the rate of induction achieved with the pG1 promoter.

Específicamente, la fuerza del promotor está determinada por el nivel de expresión de una proteína de interés (POI), tal como una proteína modelo (p. ej., Proteína Fluorescente Verde, GFP, que incluye, p. ej., GFP mejorada, eGFP, número de acceso Genbank U57607), y/o la tasa de transcripción, en comparación con el promotor pG1. La fuerza del promotor de pG1-x es específicamente al menos 1,2 veces, o al menos 1,3 veces, o al menos 1,4 veces, o 1,5 veces, o al menos 1,6 veces, o al menos 1,7 veces, o al menos 1,8 veces, o al menos 1,9 veces, o al menos 2 veces, o al menos 2,1 veces, o al menos 2,2 veces, o al menos 2,3 veces, o al menos 2,4 veces, o al menos 2,5 veces, o al menos 2,6 veces, o al menos 2,7 veces, o al menos 2,8 veces mayor, o al menos 2,9 veces, o al menos 3 veces, o al menos 3,5 veces, o al menos 4 veces, o al menos 4,5 veces, o al menos 5 veces, o al menos 5,5 veces, o al menos 6 veces, o al menos 6,5 veces, o al menos 7 veces, o al menos 7,5 veces, o al menos 8 veces, o al menos 8,5 veces, o al menos 9 veces, o al menos 9,5 veces, o al menos 10 veces mayor en comparación, por ejemplo, con el promotor pG1.Specifically, promoter strength is determined by the level of expression of a protein of interest (POI), such as a model protein (eg, Green Fluorescent Protein, GFP, including, eg, enhanced GFP, eGFP, Genbank accession number U57607), and/or transcription rate, compared to the pG1 promoter. The promoter strength of pG1-x is specifically at least 1.2-fold, or at least 1.3-fold, or at least 1.4-fold, or 1.5-fold, or at least 1.6-fold, or at least 1.7 times, or at least 1.8 times, or at least 1.9 times, or at least 2 times, or at least 2.1 times, or at least 2.2 times, or at least 2.3 times , or at least 2.4 times, or at least 2.5 times, or at least 2.6 times, or at least 2.7 times, or at least 2.8 times greater, or at least 2.9 times, or at least 3 times, or at least 3.5 times, or at least 4 times, or at least 4.5 times, or at least 5 times, or at least 5.5 times, or at least 6 times, or at at least 6.5 times, or at least 7 times, or at least 7.5 times, or at least 8 times, or at least 8.5 times, or at least 9 times, or at least 9.5 times, or at least 10-fold higher compared to, for example, the pG1 promoter.

En el presente documento, el promotor pG1 puede servir como referencia o control para determinar la función mejorada del promotor. Tal promotor pG1 de control se puede utilizar en experimentos de control en paralelo utilizando la misma célula anfitriona y sistema de expresión, o como control interno dentro del mismo cultivo de células anfitrionas. Tales experimentos de control para calificar la función del promotor en comparación con el promotor pG1 se llevan a cabo preferiblemente en cultivos de células anfitrionas de P. pastoris, en particular P. pastoris que expresa una proteína modelo, tal como GFP o eGFP.Herein, the pG1 promoter can serve as a reference or control to determine improved function of the promoter. Such a control pG1 promoter can be used in parallel control experiments using the same host cell and expression system, or as an internal control within the same host cell culture. Such control experiments to qualify promoter function as compared to the pG1 promoter are preferably carried out in P. pastoris host cell cultures, in particular P. pastoris expressing a model protein, such as GFP or eGFP.

La inducción del promotor pG1-x se refiere específicamente a la inducción de la transcripción, que incluye específicamente la traducción adicional y la expresión opcional de dicha POI.Induction of the pG1-x promoter refers specifically to induction of transcription, specifically including further translation and optional expression of said POI.

Dicha tasa de transcripción se determina como una medida de la fuerza del promotor y se refiere específicamente a la cantidad de transcritos obtenidos al inducir completamente dicho promotor.Said transcription rate is determined as a measure of promoter strength and specifically refers to the amount of transcripts obtained by fully inducing said promoter.

Dicha tasa de transcripción se puede determinar por la fuerza de transcripción en el estado completamente inducido, que se obtiene, por ejemplo, en condiciones de cultivo en quimiostato con glucosa limitada y se expresa con relación a la tasa de transcripción del promotor pG1.Said transcription rate can be determined by the strength of transcription in the fully induced state, which is obtained, for example, under glucose-limited chemostat culture conditions and is expressed relative to the transcription rate of the pG1 promoter.

Preferiblemente, el análisis de transcripción es cuantitativo o semicuantitativo, preferiblemente empleando qRT-PCR, micromatrices de ADN, secuenciación de ARN y análisis del transcriptoma.Preferably, the transcription analysis is quantitative or semi-quantitative, preferably using qRT-PCR, DNA microarrays, RNA sequencing, and transcriptome analysis.

La fuerza del promotor en comparación con la fuerza del promotor pG1 se puede determinar mediante el siguiente ensayo convencional: las cepas de P. pastoris que expresan eGFP bajo el control del promotor que se va someter a ensayo se escrutan en placas de 24 pocillos profundos a 25°C con agitación a 280 rpm con 2 ml de cultivo por pocillo. Se utilizan cuentas de alimentación de glucosa (6 mm, Kuhner, CH) para generar condiciones de crecimiento que limitan la glucosa. Las células se analizan para determinar la expresión de eGFP en el estado inducido (cuenta de alimentación YP 1, durante 20-28 horas).Promoter strength compared to pG1 promoter strength can be determined by the following standard assay: P. pastoris strains expressing eGFP under the control of the promoter to be tested are screened in 24 deep-well plates at 25°C with shaking at 280 rpm with 2 ml of culture per well. Glucose feed beads (6mm, Kuhner, CH) are used to generate glucose-limiting growth conditions. Cells are analyzed for eGFP expression in the induced state (feed count YP 1, for 20-28 hours).

Dicho promotor se considera desreprimido y completamente inducido, si las condiciones de cultivo proporcionan una inducción aproximadamente máxima, p. ej. a concentraciones de glucosa de menos de 0,4 g/L, preferiblemente menos de 0,04 g/L, específicamente menos de 0,02 g/L. El promotor completamente inducido muestra preferiblemente una tasa de transcripción de al menos 20%, más preferiblemente al menos 30%, 40%, 50%, 60%, 70%, 80%, 90% y al menos 100% o incluso mayor tasa de transcripción de al menos 150% o al menos 200% en comparación con el promotor pGAP nativo. La tasa de transcripción se puede determinar, por ejemplo, por la cantidad de transcritos de un gen indicador, tal como eGFP, tal como se describe en la sección de Ejemplos a continuación, al cultivar un clon en cultivo líquido. Alternativamente, la tasa de transcripción se puede determinar por la fuerza de la transcripción en una micromatriz, donde los datos de la micromatriz muestran la diferencia de nivel de expresión entre el estado reprimido y desreprimido y una alta intensidad de señal en el estado completamente inducido en comparación con un control.Such a promoter is considered derepressed and fully induced, if the culture conditions provide approximately maximal induction, e.g. eg at glucose concentrations of less than 0.4 g/L, preferably less than 0.04 g/L, specifically less than 0.02 g/L. The fully induced promoter preferably exhibits a transcription rate of at least 20%, more preferably at least 30%, 40%, 50%, 60%, 70%, 80%, 90%, and at least 100% or even higher transcription rate. transcription of at least 150% or at least 200% compared to the native pGAP promoter. The rate of transcription can be determined, for example, by the amount of transcripts from a reporter gene, such as eGFP, as described in the Examples section below, by growing a clone in liquid culture. Alternatively, the rate of transcription can be determined by the strength of transcription in a microarray, where the microarray data shows the difference in expression level between the repressed and unrepressed state and a high signal intensity in the fully induced state compared to a control.

Dicho promotor pGAP nativo específicamente es un promotor endógeno u homólogo a la célula eucariótica que se puede utilizar como célula anfitriona para determinar la expresión de una POI, y sirve como promotor patrón o de referencia con fines de comparación.Said native pGAP promoter specifically is an endogenous or eukaryotic cell homologous promoter that can be used as a host cell to determine the expression of a POI, and serves as a standard or reference promoter for comparison purposes.

Por ejemplo, un promotor pGAP nativo de P. pastoris es la secuencia promotora endógena no modificada en P. pastoris, como se utiliza para controlar la expresión de GAPDH en P. pastoris, p.ej. que tiene la secuencia mostrada en la Figura 7: secuencia del promotor pGAP nativo de P. pastoris (GS115) (Se C ID 260). Si P. pastoris se utiliza como anfitrión para producir una POI según la invención, la fuerza o tasa de transcripción del promotor pG1 -x según la invención se compara con tal promotor pGAP nativo de P. pastoris, y/o se compara con el promotor pG1 nativo. For example, a native P. pastoris pGAP promoter is the unmodified endogenous promoter sequence in P. pastoris, as used to control GAPDH expression in P. pastoris, eg, having the sequence shown in Figure 7 : P. pastoris native pGAP promoter sequence (GS115) (Se C ID 260). If P. pastoris is used as a host to produce a POI according to the invention, the strength or transcription rate of the pG1-x promoter according to the invention is compared to such native P. pastoris pGAP promoter, and/or compared to the promoter native pG1.

Como otro ejemplo, un promotor pGAP nativo de S. cerevisiae es la secuencia promotora endógena no modificada en S. cerevisiae, utilizada para controlar la expresión de GAPDH en S. cerevisiae. Si S. cerevisiae se utiliza como anfitrión para producir una POI, la fuerza o tasa de transcripción del promotor pG1 -x se compara con tal promotor pGAP nativo de S. cerevisiae. As another example, a native S. cerevisiae pGAP promoter is the unmodified endogenous promoter sequence in S. cerevisiae, used to control GAPDH expression in S. cerevisiae. If S. cerevisiae is used as a host to produce a POI, the strength or rate of transcription from the pG1-x promoter is compared to that native S. cerevisiae pGAP promoter.

Por lo tanto, la fuerza o tasa de transcripción relativa de un promotor de acuerdo con la invención se compara habitualmente con el promotor pGAP nativo de una célula de la misma especie o cepa que se utiliza como anfitriona para producir una POI.Therefore, the relative transcription strength or rate of a promoter according to the invention is usually compared to the native pGAP promoter of a cell of the same species or strain that is used as a host to produce a POI.

La razón de inducción es un parámetro clave para determinar la regulación del presente promotor pG1-x, y establece la actividad o fuerza del promotor en el estado inducido con relación a la actividad o fuerza del promotor en el estado reprimido. Por ejemplo, el nivel de expresión de una proteína modelo (p. ej., GFP o eGFP) y/o la tasa de transcripción en el estado reprimido se determinan tras la represión por exceso de glicerol, y el nivel de expresión de la proteína modelo y/o la tasa de transcripción son determinados en el estado inducido tras la inducción limitando la alimentación de glucosa.The induction ratio is a key parameter in determining the regulation of the present pG1-x promoter, and establishes the activity or strength of the promoter in the induced state relative to the activity or strength of the promoter in the repressed state. For example, the expression level of a model protein (eg, GFP or eGFP) and/or the rate of transcription in the repressed state are determined after repression by excess glycerol, and the expression level of the protein Pattern and/or transcription rate are determined in the induced state after induction by limiting glucose feed.

Específicamente, la razón de inducción está determinada por la razón del nivel de expresión (p. ej., GFP o eGFP) en el estado inducido frente al reprimido. La razón de inducción del promotor pG1 -x es específicamente la misma o mayor en comparación con el promotor pG1. En casos específicos, la razón de inducción es al menos 2 veces, o al menos 3 veces, o al menos 4 veces, al menos 5 veces, o al menos 6 veces, o al menos 7 veces, al menos 8 veces, o al menos 9 veces, o al menos 10 veces mayor, en comparación con el promotor pG1.Specifically, the ratio of induction is determined by the ratio of the expression level (eg, GFP or eGFP) in the induced versus repressed state. The induction rate of the pG1 -x promoter is specifically the same or higher compared to the pG1 promoter. In specific cases, the induction ratio is at least 2 times, or at least 3 times, or at least 4 times, at least 5 times, or at least 6 times, or at least 7 times, at least 8 times, or at least at least 9-fold, or at least 10-fold higher, compared to the pG1 promoter.

La razón de inducción en comparación con la fuerza del promotor pG1 se puede determinar mediante el siguiente ensayo patrón: las cepas de P. pastoris que expresan eGFP bajo el control del promotor que se va a someter a prueba se escrutan en placas de 24 pocillos profundos a 25°C con agitación a 280 rpm con 2 mL de cultivo por pocillo. Se utilizan cuentas de alimentación de glucosa (6 mm, Kuhner, CH) para generar condiciones de crecimiento que limitan la glucosa. Las células se analizan para determinar la expresión de eGFP durante la represión (YP glicerol al 1%, fase exponencial) y la inducción (YP 1 cuenta de alimentación, durante 20-28 horas).The ratio of induction compared to the strength of the pG1 promoter can be determined by the following standard assay: P. pastoris strains expressing eGFP under the control of the promoter to be tested are screened in 24 deep-well plates. at 25°C with shaking at 280 rpm with 2 mL of culture per well. Glucose feed beads (6mm, Kuhner, CH) are used to generate glucose-limiting growth conditions. Cells are analyzed for eGFP expression during repression (YP 1% glycerol, exponential phase) and induction (YP 1 feed bead, over 20-28 hours).

Específicamente, el promotor pG1-x tiene una actividad o fuerza promotora (p. ej., actividad transcripcional o fuerza transcripcional) en el estado desreprimido (inducido), que es al menos 2,5 veces, o al menos 3 veces, o al menos 4 veces, al menos 5 veces, o al menos 6 veces, o al menos 7 veces, al menos 8 veces, o al menos 9 veces, o al menos 10 veces más alta que en el estado reprimido.Specifically, the pG1-x promoter has a promoter activity or strength (eg, transcriptional activity or transcriptional strength) in the derepressed (induced) state, which is at least 2.5-fold, or at least 3-fold, or at at least 4 times, at least 5 times, or at least 6 times, or at least 7 times, at least 8 times, or at least 9 times, or at least 10 times higher than in the repressed state.

Específicamente, la región reguladora central incorpora las secuencias de nucleótidos de SEQ ID 2 y SEQ ID 3, lo que significa que las secuencias de SEQ ID 2 y 3 están comprendidas en la secuencia del promotor pG1-x en cualquier orden, preferiblemente muy próximas entre sí, p. ej. con hasta 10, 20, 50 o 100 pb entre las secuencias de SEQ ID 2 y 3.Specifically, the core regulatory region incorporates the nucleotide sequences of SEQ ID 2 and SEQ ID 3, meaning that the sequences of SEQ ID 2 and 3 are comprised of the pG1-x promoter sequence in any order, preferably in close proximity to each other. Yep. eg with up to 10, 20, 50 or 100 bp between the sequences of SEQ ID 2 and 3.

Específicamente, SEC ID 2 y/o SEC ID 3 contienen uno o más sitios de unión al factor de transcripción (TFBS). Specifically, SEQ ID 2 and/or SEQ ID 3 contain one or more transcription factor binding sites (TFBS).

Específicamente, las secuencias de nucleótidos de SEQ ID 2 y SEQ ID 3, cada una de las cuales o ambas secuencias juntas representan un TFBS o al menos una parte del mismo que se considera funcional, se reconoce por el factor de transcripción respectivo. Tal secuencia de nucleótidos de s Eq ID 2 o SEQ ID 3 (o una variante funcional de las mismas) se considera esencial y se incorpora en el promotor pG1 -x ya sea en forma no modificada o como una variante funcional de la misma con al menos 80% de identidad de secuencia, o al menos 85%, o al menos 90%, o al menos 95%, hasta 100% de identidad de secuencia.Specifically, the nucleotide sequences of SEQ ID 2 and SEQ ID 3, each or both sequences together represent a TFBS or at least a part thereof that is considered functional, is recognized by the respective transcription factor. Such nucleotide sequence of s Eq ID 2 or SEQ ID 3 (or a functional variant thereof) is considered essential and is incorporated into the pG1-x promoter either in unmodified form or as a functional variant thereof with al least 80% sequence identity, or at least 85%, or at least 90%, or at least 95%, up to 100% sequence identity.

Específicamente, el promotor pG1-x comprende una secuencia de nucleótidos distinta de SEQ ID 2 y SEQ ID 3, que tiene al menos 50% de identidad de secuencia con una región correspondiente en el promotor pG1, específicamente, al menos 60% o al menos 70%, o al menos 80%, o al menos 90% de identidad de secuencia en la región reguladora central o en la región reguladora no central. Específicamente, la secuencia de nucleótidos dentro de la región reguladora central que es cualquier otra distinta de SEQ ID 2 y SEQ ID 3 tiene al menos 60%, o al menos 70%, o al menos 80%, o al menos 90%, o al menos 95%, o al menos 98% de identidad de secuencia con la región correspondiente en el promotor pG1. Específicamente, la secuencia de nucleótidos en la región reguladora no central puede tener menos de 90%, o menos de 80%, o menos de 70%, o menos de 60% de identidad de secuencia con una región correspondiente en el promotor pG1.Specifically, the pG1-x promoter comprises a nucleotide sequence other than SEQ ID 2 and SEQ ID 3, having at least 50% sequence identity with a corresponding region in the pG1 promoter, specifically, at least 60% or at least 70%, or at least 80%, or at least 90% sequence identity in the core regulatory region or in the non-core regulatory region. Specifically, the nucleotide sequence within the core regulatory region that is anything other than SEQ ID 2 and SEQ ID 3 is at least 60%, or at least 70%, or at least 80%, or at least 90%, or at least 95%, or at least 98% sequence identity with the region corresponding in the pG1 promoter. Specifically, the nucleotide sequence in the non-core regulatory region may have less than 90%, or less than 80%, or less than 70%, or less than 60% sequence identity with a corresponding region in the pG1 promoter.

Específicamente, la región reguladora central comprende o consiste en la secuencia de nucleótidos de SEQ ID 4, o una variante funcional de la misma que comprende el TFBS, preferiblemente una variante funcional con al menos 80%, o al menos 90%, o al menos 95%, o al menos 98% de identidad de secuencia.Specifically, the core regulatory region comprises or consists of the nucleotide sequence of SEQ ID 4, or a functional variant thereof that comprises the TFBS, preferably a functional variant with at least 80%, or at least 90%, or at least 95%, or at least 98% sequence identity.

Específicamente, la región reguladora central se incorpora a una región reguladora principal representada por SEQ ID 5, o una variante funcional de la misma que comprende el TFBS, preferiblemente una variante funcional con al menos 80%, o al menos 90%, o al menos 95%, o al menos 98% de identidad de secuencia.Specifically, the core regulatory region is incorporated into a major regulatory region represented by SEQ ID 5, or a functional variant thereof comprising the TFBS, preferably a functional variant with at least 80%, or at least 90%, or at least 95%, or at least 98% sequence identity.

Específicamente, los uno o más TFBS son un TFBS para cualquiera de los factores de transcripción seleccionado del grupo que consiste en Rgt1, Cat8-1 y Cat8-2.Specifically, the one or more TFBS is a TFBS for any of the transcription factors selected from the group consisting of Rgt1, Cat8-1, and Cat8-2.

Específicamente, los TFBS son reconocidos por los factores de transcripción Rgt1 y/o Cat8-1 y/o Cat8-2. Los TFBS se caracterizan por ciertas secuencias consenso, que pueden variar para el mismo factor. Los factores de transcripción específicos se identifican de la siguiente manera:Specifically, TFBS are recognized by the transcription factors Rgt1 and/or Cat8-1 and/or Cat8-2. TFBS are characterized by certain consensus sequences, which may vary for the same factor. Specific transcription factors are identified as follows:

Rgt1 es un activador y represor transcripcional que responde a la glucosa y regula la expresión de varios genes transportadores de glucosa (HXT). Rgt1 de P. pastoris se caracteriza por la secuencia de aminoácidos de SEQ ID 261 (Figura 7).Rgt1 is a glucose-responsive transcriptional activator and repressor that regulates the expression of several glucose transporter (HXT) genes. P. pastoris Rgt1 is characterized by the amino acid sequence of SEQ ID 261 (FIG. 7).

Cat8-1 y Cat8-2 son activadores transcripcionales de grupos de cinc que se unen a elementos de respuesta a la fuente de carbono, necesarios para la desrepresión de una variedad de genes en condiciones de crecimiento no fermentativas. Cat8-1 y Cat8-2 de P. pastoris se caracterizan por las secuencias de aminoácidos de SEQ ID 262 y 263, respectivamente (Figura 7).Cat8-1 and Cat8-2 are transcriptional activators of zinc groups that bind to carbon source response elements, required for derepression of a variety of genes under non-fermentative growth conditions. P. pastoris Cat8-1 and Cat8-2 are characterized by the amino acid sequences of SEQ ID 262 and 263, respectively (FIG. 7).

Específicamente, la región reguladora central comprende una deleción de uno o más nucleótidos entre las secuencias de nucleótidos de SEQ ID 2 y SEQ ID 3. Las deleciones pueden ser una o más mutaciones puntuales, y se refieren a 1, 2, 3, 4, 5, 6, 7, 8 o los 9 nucleótidos situados entre SEQ ID 2 y SEQ ID 3, en comparación con la región correspondiente de SEQ ID 1.Specifically, the core regulatory region comprises a deletion of one or more nucleotides between the nucleotide sequences of SEQ ID 2 and SEQ ID 3. Deletions may be one or more point mutations, and refer to 1, 2, 3, 4, 5, 6, 7, 8 or all 9 nucleotides between SEQ ID 2 and SEQ ID 3, compared to the corresponding region of SEQ ID 1.

Específicamente, la región reguladora central comprende una inserción de uno o más nucleótidos entre las secuencias de nucleótidos de SEQ ID 2 y SEQ ID 3. Las inserciones pueden ser una o más mutaciones puntuales, y se refieren a al menos 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 nucleótidos situados entre SEQ ID 2 y SEQ ID 3.Specifically, the core regulatory region comprises an insertion of one or more nucleotides between the nucleotide sequences of SEQ ID 2 and SEQ ID 3. The insertions may be one or more point mutations, and refer to at least 1, 2, 3, 4, 5, 6, 7, 8, 9 or 10 nucleotides located between SEQ ID 2 and SEQ ID 3.

Específicamente, la región reguladora central comprende una sustitución de uno o más nucleótidos entre las secuencias de nucleótidos de SEQ ID 2 y SEQ ID 3. Las sustituciones pueden ser una o más mutaciones puntuales, y se refieren a 1,2, 3, 4, 5, 6, 7, 8 o los 9 nucleótidos situados entre SEQ ID 2 y SEQ ID 3.Specifically, the core regulatory region comprises a substitution of one or more nucleotides between the nucleotide sequences of SEQ ID 2 and SEQ ID 3. The substitutions may be one or more point mutations, and refer to 1,2, 3, 4, 5, 6, 7, 8 or all 9 nucleotides located between SEQ ID 2 and SEQ ID 3.

Cualquiera de las deleciones, inserciones o sustituciones específicas se puede combinar para obtener el promotor pG1-x.Any of the specific deletions, insertions or substitutions can be combined to obtain the pG1-x promoter.

Según un aspecto específico, el promotor pG1-x comprende al menos dos copias de la región reguladora central o de la región reguladora principal, ya sea la región reguladora central original o la variante funcional que comprende al menos una mutación. Específicamente, el promotor pG1-x puede comprender al menos dos, tres o cuatro copias de la región reguladora central y/o al menos dos, tres o cuatro copias de la región reguladora principal.According to a specific aspect, the pG1-x promoter comprises at least two copies of the core regulatory region or the major regulatory region, either the original core regulatory region or the functional variant comprising at least one mutation. Specifically, the pG1-x promoter may comprise at least two, three or four copies of the core regulatory region and/or at least two, three or four copies of the major regulatory region.

Según otro aspecto específico, el promotor pG1-x comprende al menos dos, tres, cuatro, cinco, seis, siete u ocho copias de uno o más TFBS seleccionados del grupo formado por Rgt1, Cat8-1 y Cat8-2.According to another specific aspect, the pG1-x promoter comprises at least two, three, four, five, six, seven or eight copies of one or more TFBS selected from the group consisting of Rgt1, Cat8-1 and Cat8-2.

Específicamente, el promotor pG1-x es una variante funcional mejorada del promotor pG1 que comprende una deleción de uno o más nucleótidos en el extremo 5' de la secuencia pG1, dejando preferiblemente al menos 280 nucleótidos de la región 3' de la secuencia pG1 o una variante funcional de la región 3'.Specifically, the pG1-x promoter is an improved functional variant of the pG1 promoter that comprises a deletion of one or more nucleotides at the 5' end of the pG1 sequence, preferably leaving at least 280 nucleotides from the 3' region of the pG1 sequence or a functional variant of the 3' region.

Según una realización específica, el promotor pG1 -x comprende al menos uno o al menos dos motivos T identificados por cualquiera de SEQ ID 12-29. El motivo T consiste específicamente en cualquiera deAccording to a specific embodiment, the pG1-x promoter comprises at least one or at least two T motifs identified by any of SEQ ID 12-29. The T motif specifically consists of any of

a) una secuencia de T (timinas) contiguas que en el presente documento se denomina Tn o (T)n , preferiblemente en donde n = 13-20; preferiblemente en donde el motivo T es T14, T15 o T16;a) a sequence of contiguous T (thymines) which is referred to herein as T n or (T) n , preferably wherein n = 13-20; preferably wherein the T motif is T14, T15 or T16;

b) una secuencia caracterizada por A (adenina) en la primera posición, seguida de una secuencia de T (timinas) contiguas, que en el presente documento se denomina ATn o A(T)n, preferiblemente en donde n = 13-20, en algunos casos preferiblemente en donde n = 13-22;b) a sequence characterized by A (adenine) in the first position, followed by a sequence of contiguous T (thymines), which is referred to herein as ATn or A(T) n , preferably where n = 13-20, in some cases preferably where n = 13-22;

c) una secuencia caracterizada por T (timina) en la primera posición, y A (adenina) en la segunda posición, seguida de una secuencia de T (timinas) contiguas, que en el presente documento se denomina TATn o TA(T)n, preferiblemente en donde n = 13-20; c) a sequence characterized by T (thymine) in the first position, and A (adenine) in the second position, followed by a sequence of contiguous T (thymines), which is referred to herein as TATn or TA(T) n , preferably where n = 13-20;

d) una secuencia caracterizada por una secuencia de T (timinas) contiguas y A (adenina) en la última posición, que en el presente documento se denomina TnA o (T)nA, preferiblemente en donde n = 13-20;d) a sequence characterized by a sequence of contiguous T (thymines) and A (adenine) at the last position, which is referred to herein as TnA or (T) n A, preferably where n = 13-20;

e) una secuencia caracterizada por una secuencia de T (timinas) contiguas seguida de A (adenina) en la penúltima posición, y T (timina) en la última posición, que en el presente documento se denomina TnAT o (T)nAT, preferiblemente en donde n = 13-20; oe) a sequence characterized by a sequence of contiguous T (thymines) followed by A (adenine) at the penultimate position, and T (thymine) at the last position, which is referred to herein as TnAT or (T) n AT, preferably where n = 13-20; either

d) una secuencia de c) o e) en donde la A (adenina) está sustituida por T (timina), que en el presente documento se denomina TTTn o TnTT o T(A/T)Tn o T(A/T)(T)n, o Tn(A/T)T o (T)n(A/T)T, preferiblemente en donde n = 13-20, p. ej. dando como resultado un motivo T que consiste en una secuencia de (T)n en donde n = 15-22.d) a sequence of c) or e) wherein A (adenine) is substituted for T (thymine), which is referred to herein as TTTn or TnTT or T(A/T)Tn or T(A/T)( T) n , or Tn(A/T)T or (T) n (A/T)T, preferably wherein n = 13-20, e.g. eg resulting in a motif T consisting of a sequence of (T) n where n = 15-22.

Cualquiera de los motivos T especificados en a) a d) anteriores se puede combinar en una secuencia promotora, p. ej., de modo que la secuencia promotora comprenda un motivo T que sea un motivo TA(T)n en donde n = 13-20, y otro motivo T que sea un motivo (T)n, en donde n = 13-22.Any of the T motifs specified in a) to d) above may be combined in a promoter sequence, e.g. such that the promoter sequence comprises a T motif that is a TA(T) n motif, where n = 13-20, and another T motif that is a (T) n motif, where n = 13-22 .

El motivo T comprende opcionalmente una extensión, de manera que se extiende en una o más "A" (p. ej., 1, 2 o 3 adeninas) y opcionalmente se extiende adicionalmente en "T" (p. ej., 1,2 o 3 timinas) en el extremo 3' y/o en el extremo 5' del motivo T, cuya extensión también se denomina en el presente documento motivo T extendido.The T motif optionally comprises an extension, such that it extends by one or more "A"s (eg, 1, 2, or 3 adenines) and optionally further extends by "T" (eg, 1, 2 or 3 thymines) at the 3' end and/or at the 5' end of the T motif, the extension of which is also referred to herein as the extended T motif.

En el presente documento, el término "motivo T" siempre incluirá el motivo T que está extendido o no, por lo tanto, el término incluye específicamente tanto el motivo T que no comprende la extensión, como el motivo T extendido. Específicamente, el motivo T comprende o consiste en la secuencia de nucleótidos que es cualquiera de las SEQ ID 12-29. Se pueden incorporar uno, dos o más cualesquiera de los motivos T al promotor pG1-x con o sin la extensión del motivo.Herein, the term "T motif" will always include the T motif that is extended or not, therefore, the term specifically includes both the T motif that does not comprise the extension, and the extended T motif. Specifically, the T motif comprises or consists of the nucleotide sequence that is any of SEQ ID 12-29. Any one, two or more of the T motifs may be incorporated into the pG1-x promoter with or without extension of the motif.

Según un aspecto específico, la extensión del motivo T es un alargamiento de secuencia "TA" en su extremo 5', para obtener un extremo 5' "TAT".According to a specific aspect, the extension of the T motif is an elongation of the "TA" sequence at its 5' end, to obtain a 5' "TAT" end.

Según otro aspecto específico, la extensión del motivo T es un alargamiento de secuencia "TAA" en su extremo 5', para obtener un extremo 5' "TAAT".According to another specific aspect, the extension of the T motif is an elongation of the "TAA" sequence at its 5' end, to obtain a 5' "TAAT" end.

Según otro aspecto específico, la extensión del motivo T es un alargamiento de secuencia "AT" en su extremo 3', para obtener un extremo 3' "TAT".According to another specific aspect, the extension of the T motif is an elongation of the "AT" sequence at its 3' end, to obtain a 3' "TAT" end.

Según otro aspecto específico, la extensión del motivo T es un alargamiento de secuencia "AAT" en su extremo 3', para obtener un extremo 3' de "TAAT".According to another specific aspect, the extension of the T motif is an elongation of the "AAT" sequence at its 3' end, to obtain a 3' end of "TAAT".

Según un aspecto específico, el motivo T está situado aguas arriba de la región reguladora central y, opcionalmente, aguas arriba de la región reguladora principal.According to a specific aspect, the T motif is located upstream of the central regulatory region and, optionally, upstream of the main regulatory region.

Según otro aspecto específico, el motivo T está situado aguas abajo de la región reguladora central y, opcionalmente, aguas abajo de la región reguladora principal.According to another specific aspect, the T motif is located downstream of the central regulatory region and, optionally, downstream of the main regulatory region.

Específicamente, el promotor pG1-x comprende una secuencia de nucleótidos 3' terminal que incorpora al menos parte de un sitio de inicio de la traducción. Un sitio de inicio de la traducción se conoce específicamente como secuencia consenso de Kozak en eucariotas, y una secuencia adecuada para soportar la expresión génica.Specifically, the pG1-x promoter comprises a 3' terminal nucleotide sequence that incorporates at least part of a translation start site. A translation start site is specifically known as a Kozak consensus sequence in eukaryotes, and a sequence suitable for supporting gene expression.

Específicamente, el sitio de inicio de la traducciónSpecifically, the translation start site

a) se origina a partir del promotor pG1 y consiste en o comprende la secuencia de nucleótidos de SEQ ID 6, o una variante funcional de la misma con al menos 90% de identidad de secuencia; oa) originates from the pG1 promoter and consists of or comprises the nucleotide sequence of SEQ ID 6, or a functional variant thereof with at least 90% sequence identity; either

b) se origina a partir de cualquier otro promotor de Pichia pastoris, o una variante funcional del mismo con al menos 90% de identidad de secuencia.b) originates from any other Pichia pastoris promoter, or a functional variant thereof with at least 90% sequence identity.

Las regiones promotoras 3' terminales alternativas ilustrativas que se pueden utilizar en lugar de la región 3' terminal del promotor pG1, o en lugar de la secuencia de nucleótidos de SEQ ID 6, se obtienen, p. ej., a partir de cualquiera de los siguientes promotores: pAOX1, pAOX2, pDAS1, pDAS2, pFLD, pGAP o pTEF2.Illustrative alternative 3'-terminal promoter regions that can be used in place of the 3'-terminal region of the pG1 promoter, or in place of the nucleotide sequence of SEQ ID 6, are obtained, e.g. eg, from any of the following promoters: pAOX1, pAOX2, pDAS1, pDAS2, pFLD, pGAP, or pTEF2.

Según una realización específica, el promotor tiene una longitud de hasta 2000 pb. El promotor pG1 -x específico tiene una longitud que es más corta que la del promotor pG1, tal como con una longitud de al menos 293 pb o 300 pb, o de al menos 328 pb, o al menos 350 pb o al menos 400 pb, o al menos 500 pb.According to a specific embodiment, the promoter is up to 2000 bp in length. The specific pG1-x promoter has a length that is shorter than that of the pG1 promoter, such as at least 293 bp or 300 bp, or at least 328 bp, or at least 350 bp, or at least 400 bp in length. , or at least 500 bp.

Específicamente, el promotor pG1-x puede comprender una secuencia que se origina a partir de un fragmento del promotor pG1. Según un aspecto específico, el promotor pG1-x es una variante o derivado de un fragmento parental de pG1, que comprende al menos la región 3' de SEQ ID 1 que se extiende al menos 50%, o 60%, o 70%, u 80%, o al menos 90% de la secuencia de pG1. Specifically, the pG1-x promoter may comprise a sequence originating from a fragment of the pG1 promoter. According to a specific aspect, the pG1-x promoter is a variant or derivative of a parental fragment of pG1, comprising at least the 3' region of SEQ ID 1 that extends at least 50%, or 60%, or 70%, or 80%, or at least 90% of the pG1 sequence.

Específicamente, la secuencia de nucleótidos de pG1 -x se obtiene a partir de la secuencia de nucleótidos del promotor pG1 que comprende una deleción de, o en, la región 5' terminal, p. ej. un corte de la secuencia de nucleótidos en el extremo 5', para obtener una longitud específica con un rango desde el extremo 3' hasta un extremo 5' variable, tal como con una longitud de la secuencia de nucleótidos de al menos 293 pb o 300 pb, o de al menos 328 pb, o al menos 350 pb, o al menos 400 pb, o al menos 500 pb hasta la longitud del fragmento del promotor pG1 que comprende una deleción de al menos 1, o al menos 10, o al menos 100 pb.Specifically, the nucleotide sequence of pG1-x is derived from the nucleotide sequence of the pG1 promoter comprising a deletion at or in the 5' terminal region, e.g. eg a cut of the nucleotide sequence at the 5' end, to obtain a specific length ranging from the 3' end to a variable 5' end, such as with a nucleotide sequence length of at least 293 bp or 300 bp, or at least 328 bp, or at least 350 bp, or at least 400 bp, or at least 500 bp to the length of the pG1 promoter fragment comprising a deletion of at least 1, or at least 10, or at least minus 100 bp.

Sin embargo, la longitud del promotor también se puede aumentar, para obtener una longitud que sea más larga que la longitud del promotor pG1, específicamente una longitud de hasta 1500 pb, o hasta 2000 pb. Específicamente, la longitud puede estar dentro de cualquiera de los rangos: 293 pb - 1500 pb, 293 pb - 2000 pb, 328 pb -1500 pb o 328­ 2000 pb.However, the length of the promoter can also be increased, to obtain a length that is longer than the length of the pG1 promoter, specifically a length of up to 1500 bp, or up to 2000 bp. Specifically, the length can be within any of the ranges: 293 bp - 1500 bp, 293 bp - 2000 bp, 328 bp - 1500 bp, or 328 2000 bp.

Según un aspecto específico, la invención proporciona un promotor pG1-x aislado y/o artificial, que comprende o consiste en la secuencia de nucleótidos seleccionada del grupo que consiste en cualquiera deAccording to a specific aspect, the invention provides an isolated and/or artificial pG1-x promoter, comprising or consisting of the nucleotide sequence selected from the group consisting of any of

a) SEQ ID 37-44, preferiblemente cualquiera de SEQ ID 45-76;a) SEQ ID 37-44, preferably any of SEQ ID 45-76;

b) SEQ ID 77-80, preferiblemente cualquiera de SEQ ID 81-112;b) SEQ ID 77-80, preferably any of SEQ ID 81-112;

c) SEQ ID 113-114, preferiblemente cualquiera de SEQ ID 115-130;c) SEQ ID 113-114, preferably any of SEQ ID 115-130;

d) SEQ ID 131-132, preferiblemente cualquiera de SEQ ID 133-148; od) SEQ ID 131-132, preferably any of SEQ ID 133-148; either

e) SEQ ID 185-186, preferiblemente cualquiera de SEQ ID 187-202;e) SEQ ID 185-186, preferably any of SEQ ID 187-202;

o una secuencia de nucleótidos que tiene al menos 80% de identidad de secuencia con cualquiera de las anteriores, en donde el promotor pG1-x se caracteriza por un aumento de la fuerza del promotor y/o la razón de inducción en comparación con el promotor pG1 de Pichia pastoris identificado por SEQ ID 1, en dondeor a nucleotide sequence having at least 80% sequence identity to any of the foregoing, wherein the pG1-x promoter is characterized by increased promoter strength and/or rate of induction compared to promoter Pichia pastoris pG1 identified by SEQ ID 1, wherein

- la fuerza del promotor es al menos 1,1 veces mayor en el estado inducido en comparación con el promotor pG1, y/o- the strength of the promoter is at least 1.1-fold higher in the induced state compared to the pG1 promoter, and/or

- la razón de inducción es al menos 1,1 veces mayor en comparación con el promotor pG1.- the induction ratio is at least 1.1 times higher compared to the pG1 promoter.

Una variante funcional de tal promotor pG1-x de los apartados a) - e) anteriores se caracteriza preferiblemente por cualquiera de las características específicas descritas para la variante funcional del promotor pG1 como se describe en el presente documento.A functional variant of such a pG1-x promoter of a)-e) above is preferably characterized by any of the specific features described for the functional variant of the pG1 promoter as described herein.

Específicamente, la variante funcional de cualquiera de los promotores pG1-x de los apartados a) - e) anteriores, preferiblemente una variante funcional de cualquiera de SEQ ID 45-76, se caracteriza por uno o más de los siguientes rasgosSpecifically, the functional variant of any of the pG1-x promoters of sections a) - e) above, preferably a functional variant of any of SEQ ID 45-76, is characterized by one or more of the following features

a) la secuencia es una variante funcional de la secuencia promotora de cualquiera de los promotores pG1-x de los apartados a) - e) anteriores que comprende una deleción de uno o más nucleótidos en el extremo 5' de la secuencia promotora, preferiblemente dejando al menos 280 nucleótidos de la región 3' de la secuencia promotora o una variante funcional de la región 3', preferiblemente que comprende una deleción 5' de la secuencia promotora de 50, 100, 150, 200, 250 o 300 nucleótidos hasta, pero sin incluir, la región reguladora principal junto con cualquier secuencia aguas abajo o 3' de dicha región reguladora principal, en el caso de más de 1 región reguladora principal, la deleción del extremo 5' de la secuencia promotora es hasta, pero sin incluir, la primera o la mayor parte de la región reguladora principal 5';a) the sequence is a functional variant of the promoter sequence of any of the pG1-x promoters of sections a) - e) above that comprises a deletion of one or more nucleotides at the 5' end of the promoter sequence, preferably leaving at least 280 nucleotides of the 3' region of the promoter sequence or a functional variant of the 3' region, preferably comprising a 5' deletion of the promoter sequence of 50, 100, 150, 200, 250 or 300 nucleotides up to, but not including, the major regulatory region together with any sequence downstream or 3' of said major regulatory region, in the case of more than 1 major regulatory region, the deletion of the 5' end of the promoter sequence is up to, but not including, the first or most of the 5' major regulatory region;

b) la secuencia comprende uno o más TFBS, preferiblemente en donde el TFBS es para cualquiera de los factores de transcripción seleccionados del grupo que consiste en Rgt1, Cat8-1 y Cat8-2;b) the sequence comprises one or more TFBS, preferably wherein the TFBS is for any of the transcription factors selected from the group consisting of Rgt1, Cat8-1 and Cat8-2;

c) la región reguladora central comprende la secuencia de nucleótidos de SEQ ID 4, o una variante funcional de la misma que comprende uno o más TFBS, preferiblemente una variante funcional con al menos 80% de identidad de secuencia,c) the core regulatory region comprises the nucleotide sequence of SEQ ID 4, or a functional variant thereof comprising one or more TFBS, preferably a functional variant with at least 80% sequence identity,

d) la región reguladora central se incorpora a una región reguladora principal representada por SEQ ID 5, o una variante funcional de la misma que comprende el TFBS, preferiblemente una variante funcional con al menos 80% de identidad de secuencia;d) the core regulatory region is incorporated into a major regulatory region represented by SEQ ID 5, or a functional variant thereof comprising the TFBS, preferably a functional variant with at least 80% sequence identity;

e) la región reguladora central comprende una deleción de uno o más nucleótidos entre las secuencias de nucleótidos de SEQ ID 2 y SEQ ID 3;e) the core regulatory region comprises a deletion of one or more nucleotides between the nucleotide sequences of SEQ ID 2 and SEQ ID 3;

f) la secuencia comprende al menos dos copias de la región reguladora central o de la región reguladora principal; g) la secuencia comprende adicionalmente al menos uno o al menos dos motivos T identificados por cualquiera de SEQ ID 12-29; preferiblemente en donde el motivo T está situado aguas arriba o aguas abajo de la región reguladora central y, opcionalmente, aguas arriba o aguas abajo de la región reguladora principal;f) the sequence comprises at least two copies of the core regulatory region or the major regulatory region; g) the sequence further comprises at least one or at least two T motifs identified by any of SEQ ID 12-29; preferably wherein the T motif is located upstream or downstream of the core regulatory region, and optionally upstream or downstream of the core regulatory region;

h) la secuencia comprende una secuencia de nucleótidos 3' terminal que comprende al menos parte de un sitio de inicio de la traducción;h) the sequence comprises a 3' terminal nucleotide sequence comprising at least part of a translation start site;

i) la secuencia se alarga hasta una longitud de hasta 2000 pb.i) the sequence is elongated to a length of up to 2000 bp.

La invención proporciona adicionalmente el promotor pG1-x en forma aislada.The invention further provides the pG1-x promoter in isolated form.

Específicamente, se proporciona el ácido nucleico del promotor pG1-x aislado que comprende el promotor pG1-x como se describe en el presente documento, o un ácido nucleico que comprende la secuencia complementaria. Específicamente, la secuencia complementaria es una secuencia que hibrida en condiciones rigurosas con el promotor pG1-x.Specifically, provided is isolated pG1-x promoter nucleic acid comprising the pG1-x promoter as described herein, or a nucleic acid comprising complementary sequence. Specifically, the complementary sequence is a sequence that hybridizes under stringent conditions to the pG1-x promoter.

Específicamente, el ácido nucleico está conectado operablemente a una secuencia de nucleótidos que codifica una proteína de interés (POI), cuyo ácido nucleico no está asociado de forma nativa con la secuencia de nucleótidos que codifica la POI. La POI es específicamente un polipéptido o proteína heterólogos.Specifically, the nucleic acid is operably linked to a nucleotide sequence encoding a protein of interest (POI), which nucleic acid is not natively associated with the nucleotide sequence encoding the POI. The POI is specifically a heterologous polypeptide or protein.

Específicamente, la secuencia de nucleótidos comprende adicionalmente una secuencia de nucleótidos que codifica un péptido señal que permite la secreción de la POI, preferiblemente en donde la secuencia de nucleótidos que codifica el péptido señal está situada adyacente al extremo 5' de la secuencia de nucleótidos que codifica la POI.Specifically, the nucleotide sequence further comprises a nucleotide sequence that encodes a signal peptide that enables secretion of the POI, preferably wherein the nucleotide sequence that encodes the signal peptide is located adjacent to the 5' end of the nucleotide sequence that encodes the POI.

Específicamente, el péptido señal se selecciona del grupo que consiste en secuencias señal del prepro-péptido del factor de apareamiento alfa de S. cerevisiae , los péptidos señal del gen de la fosfatasa ácida de P. pastoris (PHO1) y la proteína X extracelular (EPX1) (Heiss, S., V. Puxbaum, C. Gruber, F. Altmann, D. Mattanovich y B. Gasser, (2015) Multistep processing of the secretion leader of the extracellular protein Epx1 in Pichia pastoris and implications on protein localization. Microbiology).Specifically, the signal peptide is selected from the group consisting of signal sequences from the S. cerevisiae alpha-mating factor prepro-peptide, the signal peptides from the P. pastoris acid phosphatase gene (PHO1), and extracellular protein X ( EPX1) (Heiss, S., V. Puxbaum, C. Gruber, F. Altmann, D. Mattanovich and B. Gasser, (2015) Multistep processing of the secretion leader of the extracellular protein Epx1 in Pichia pastoris and implications on protein localization Microbiology).

Específicamente, la POI es una proteína eucariótica, preferiblemente una proteína de mamífero.Specifically, the POI is a eukaryotic protein, preferably a mammalian protein.

En casos específicos, una POI es una proteína multimérica, específicamente un dímero o tetrámero.In specific cases, a POI is a multimeric protein, specifically a dimer or tetramer.

Según realizaciones específicas, la POI es una proteína heteróloga, preferiblemente seleccionada entre proteínas terapéuticas, incluyendo anticuerpos o fragmentos de los mismos, enzimas y péptidos, antibióticos proteicos, proteínas de fusión de toxinas, productos conjugados carbohidrato - proteína, proteínas estructurales, proteínas reguladoras, vacunas y proteínas o partículas similares a vacunas, enzimas de procedimiento, factores de crecimiento, hormonas y citocinas, o un metabolito de una POI, incluyendo específicamente un metabolito celular del cultivo celular recombinante que expresa un gen de interés bajo el control transcripcional de un promotor de la invención.According to specific embodiments, the POI is a heterologous protein, preferably selected from therapeutic proteins, including antibodies or fragments thereof, enzymes and peptides, protein antibiotics, toxin fusion proteins, carbohydrate-protein conjugates, structural proteins, regulatory proteins, vaccines and vaccine-like proteins or particles, procedural enzymes, growth factors, hormones, and cytokines, or a metabolite of a POI, specifically including a recombinant cell culture cell metabolite that expresses a gene of interest under the transcriptional control of a promoter of the invention.

Una POI específica es una molécula de unión a antígeno, tal como un anticuerpo, o un fragmento del mismo. Entre las POI específicas se encuentran anticuerpos tales como anticuerpos monoclonales (mAb), inmunoglobulina (Ig) o inmunoglobulina de clase G (IgG), anticuerpos de cadena pesada (HcAb) o fragmentos de los mismos tales como fragmentos de unión a antígeno (Fab), Fd, fragmento variable de cadena sencilla (scFv), o variantes modificadas genéticamente de los mismos tales como, por ejemplo, dímeros de Fv (dianticuerpos), trímeros de Fv (trianticuerpos), tetrámeros de Fv o minianticuerpos y anticuerpos de dominio único como VH o v Hh o V-NAR. Se pueden seleccionar moléculas de unión a antígeno adicionales de proteínas armazón (alternativas) tales como p. ej. dominios de Kunitz, Adnectinas, Affibodies, Anticalinas y DARPins modificados genéticamente. El término "armazón " describe un grupo multifacético de proteínas compactas y plegadas de manera estable, que difieren en tamaño, estructura y origen, que sirven como punto de partida para la generación de moléculas de unión a antígenos. Inspirado por las relaciones estructura-función de los anticuerpos (inmunoglobulinas), tal armazón proteico alternativo proporciona un marco estructural robusto y conservado que soporta un sitio de interacción que se puede remodelar para el reconocimiento estricto y específico de una diana (bio)molecular determinada.A specific POI is an antigen-binding molecule, such as an antibody, or a fragment thereof. Specific POIs include antibodies such as monoclonal antibodies (mAb), immunoglobulin (Ig) or class G immunoglobulin (IgG), heavy chain antibodies (HcAb) or fragments thereof such as antigen-binding fragments (Fab) , Fd, single chain variable fragment (scFv), or genetically modified variants thereof such as, for example, Fv dimers (diantibodies), Fv trimers (triantibodies), Fv tetramers or mini-antibodies and single-domain antibodies such as VH or vHh or V-NAR. Additional antigen-binding molecules may be selected from (alternative) scaffold proteins such as e.g. eg Genetically modified Kunitz domains, Adnectins, Affibodies, Anticalines and DARPins. The term "scaffold" describes a multifaceted group of stably folded and compact proteins, differing in size, structure, and origin, that serve as the starting point for the generation of antigen-binding molecules. Inspired by the structure-function relationships of antibodies (immunoglobulins), such an alternative protein scaffold provides a robust and conserved structural framework that supports an interaction site that can be remodeled for strict and specific recognition of a given (bio)molecular target.

Según una realización específica, se fabrica un producto de fermentación utilizando la POI, un metabolito o un derivado de la misma.According to a specific embodiment, a fermentation product is made using the POI, a metabolite or a derivative thereof.

La invención proporciona adicionalmente una construcción de expresión que comprende el ácido nucleico como se describe en el presente documento, preferiblemente un vector o plásmido de replicación autónoma, o un vector o plásmido que se integra en el ADN cromosómico de una célula anfitriona.The invention further provides an expression construct comprising the nucleic acid as described herein, preferably an autonomously replicating vector or plasmid, or a vector or plasmid that integrates into the chromosomal DNA of a host cell.

Específicamente, la construcción de expresión comprende el promotor pG1-x, conectado operablemente a una secuencia de nucleótidos que codifica una POI bajo el control transcripcional de dicho promotor, cuyo promotor no está asociado de forma nativa con la secuencia codificante de la POI. Específicamente, la construcción de expresión es un vector.Specifically, the expression construct comprises the pG1-x promoter, operably linked to a nucleotide sequence encoding a POI under the transcriptional control of said promoter, which promoter is not natively associated with the POI coding sequence. Specifically, the expression construct is a vector.

La invención proporciona adicionalmente una célula anfitriona recombinante que comprende la construcción de expresión como se describe en el presente documento, preferiblemente una célula eucariótica, tal como una célula de mamífero, insecto, levadura, hongo filamentoso o planta, preferiblemente una levadura o una célula fúngica filamentosa, más preferiblemente una célula de levadura del género Saccharomyces o Pichia.The invention further provides a recombinant host cell comprising the expression construct as described herein, preferably a eukaryotic cell, such as a cell. mammalian, insect, yeast, filamentous fungus or plant, preferably a yeast or filamentous fungal cell, more preferably a yeast cell of the genus Saccharomyces or Pichia.

Específicamente, la levadura se selecciona del grupo que consiste en Pichia, Candida, Torulopsis, Arxula, Hansenula, Yarrowia, Kluyveromyces, Saccharomyces, Komagataella, preferiblemente una levadura metilotrófica.Specifically, the yeast is selected from the group consisting of Pichia, Candida, Torulopsis, Arxula, Hansenula, Yarrowia, Kluyveromyces, Saccharomyces, Komagataella, preferably a methylotrophic yeast.

Una levadura específicamente preferida es Pichia pastoris, Komagataella pastoris, K. phaffii, o K. pseudopastoris, como, p. ej., cualquiera de las cepas de P. pastoris CBS 704, CBS 2612, CBS 7435, CBS 9173-9189, DSm Z 70877, X-33, GS115, KM71 y SMD1168.A specifically preferred yeast is Pichia pastoris, Komagataella pastoris, K. phaffii, or K. pseudopastoris, such as, e.g. g., any of the P. pastoris strains CBS 704, CBS 2612, CBS 7435, CBS 9173-9189, DSm Z 70877, X-33, GS115, KM71, and SMD1168.

Según un aspecto específico, la célula anfitriona recombinante comprende múltiples copias de la secuencia de ácido nucleico y/o múltiples copias de la construcción de expresión. Por ejemplo, la célula recombinante comprende 2, 3, 4 o más copias (número de copias del gen, GCN).According to a specific aspect, the recombinant host cell comprises multiple copies of the nucleic acid sequence and/or multiple copies of the expression construct. For example, the recombinant cell comprises 2, 3, 4 or more copies (gene copy number, GCN).

La invención proporciona adicionalmente un cultivo estable de la célula anfitriona recombinante como se describe en el presente documento.The invention further provides a stable culture of the recombinant host cell as described herein.

De acuerdo con una realización específica, se emplea una célula, que tiene una tasa de crecimiento específica más alta en presencia de un excedente de fuente de carbono con relación a condiciones de fuente de carbono limitada. According to a specific embodiment, a cell is used, which has a higher specific growth rate in the presence of a surplus carbon source relative to limited carbon source conditions.

La invención proporciona adicionalmente un método para producir una POI mediante el cultivo de una línea celular anfitriona recombinante como se describe en el presente documento, que comprende las etapas deThe invention further provides a method of producing a POI by culturing a recombinant host cell line as described herein, comprising the steps of

a) cultivar la línea celular en condiciones para expresar dicha POI, ya) cultivating the cell line under conditions to express said POI, and

b) recuperar la POI.b) retrieve the POI.

Específicamente, dicho método se lleva a cabo bajo el control transcripcional del promotor pG1-x regulable por fuente de carbono, en donde dicho promotor pG1-x tiene al menos uno de los rasgos de fuerza del promotor y regulables mejorados en comparación con el promotor pG1.Specifically, said method is carried out under the transcriptional control of the carbon source regulatable pG1-x promoter, wherein said pG1-x promoter has at least one of the promoter strength and regulatable traits improved compared to the pG1 promoter. .

Según una realización específica, la línea celular se cultiva en condiciones de cultivo discontinuo, por lote alimentado o continuo, y/o en medios que contienen sustrato de carbono limitado.According to a specific embodiment, the cell line is grown under batch, fed-batch, or continuous culture conditions, and/or in media containing limited carbon substrate.

Específicamente, el cultivo se realiza en un biorreactor comenzando con una fase discontinua como primera etapa, seguida de una fase por lote alimentado o una fase de cultivo continuo como segunda etapa.Specifically, the cultivation is performed in a bioreactor starting with a batch phase as the first stage, followed by a fed-batch phase or a continuous cultivation phase as the second stage.

Específicamente, las células anfitrionas se cultivan en un medio rico en fuente de carbono durante la fase de alta tasa de crecimiento (p. ej., al menos 50%, o al menos 60%, al menos 70%, al menos 80%, al menos 90%, al menos 95%, al menos 98%, al menos 99% o hasta la tasa máxima de crecimiento) y producen la POI durante una fase de baja tasa de crecimiento (p. ej., menos de 90%, preferiblemente menos de 80%, menos de 70%, menos de 60%, menos de 50% o menos de 40%, menos de 30%, menos de 20%, menos de 10%, menos de 5%, menos de 3%, menos de 2%, menos de 1%, menos de 0,5%, menos de 0,4%, menos de 0,3% o menos de 0,2% de la tasa de crecimiento máxima) p. ej. mientras se limita la fuente de carbono, preferiblemente alimentando un medio mínimo definido.Specifically, host cells are cultured in a medium rich in carbon source during the high growth rate phase (eg, at least 50%, or at least 60%, at least 70%, at least 80%, at least 90%, at least 95%, at least 98%, at least 99%, or up to maximum growth rate) and produce POI during a phase of low growth rate (eg, less than 90%, preferably less than 80%, less than 70%, less than 60%, less than 50% or less than 40%, less than 30%, less than 20%, less than 10%, less than 5%, less than 3% , less than 2%, less than 1%, less than 0.5%, less than 0.4%, less than 0.3% or less than 0.2% of the maximum growth rate) p. eg while limiting the carbon source, preferably by feeding a defined minimal medium.

Específicamente, la POI se expresa en condiciones que limitan el crecimiento, p. ej. cultivando la línea celular a una tasa de crecimiento menor que la tasa de crecimiento máxima, típicamente menos de 90%, preferiblemente menos de 80%, menos de 70%, menos de 60%, menos de 50%, menos de 40%, menos de 30%, menos de 20%, menos de 10%, menos de 5%, menos de 3%, menos de 2%, menos de 1%, menos de 0,5%, menos de 0,4%, menos de 0,3%, o menos de 0,2% de la tasa de crecimiento máxima de las células. Típicamente, la tasa de crecimiento máxima se determina individualmente para una célula anfitriona específica.Specifically, POI is expressed under conditions that limit growth, e.g. eg culturing the cell line at a growth rate less than the maximum growth rate, typically less than 90%, preferably less than 80%, less than 70%, less than 60%, less than 50%, less than 40%, less less than 30%, less than 20%, less than 10%, less than 5%, less than 3%, less than 2%, less than 1%, less than 0.5%, less than 0.4%, less than 0.3%, or less than 0.2% of the maximum growth rate of the cells. Typically, the maximum growth rate is individually determined for a specific host cell.

Específicamente, el método de cultivo comprendeSpecifically, the cultivation method comprises

a) una primera etapa que utiliza una fuente de carbono basal que reprime el promotor pG1-x, seguida de a) a first step using a basal carbon source that represses the pG1-x promoter, followed by

b) una segunda etapa que no utiliza o utiliza una cantidad limitada de una fuente de carbono complementaria que desreprime o induce el promotor pG1-x para inducir la producción de la POI.b) a second step that does not use or uses a limited amount of a complementary carbon source that derepresses or induces the pG1-x promoter to induce POI production.

Específicamente, la fase discontinua se realiza hasta que la fuente de carbono basal que se añade inicialmente al cultivo celular es consumida por la línea celular. El método de incremento de oxígeno disuelto (OD) se puede utilizar para determinar el consumo de la fuente de carbono basal durante la fase discontinua.Specifically, the batch phase is carried out until the basal carbon source that is initially added to the cell culture is consumed by the cell line. The dissolved oxygen (DO) increase method can be used to determine the consumption of the basal carbon source during the batch phase.

Según una realización específica, la fase discontinua se caracteriza por una disminución continua de la señal de presión parcial de oxígeno (pO2) y en donde el final de la fase discontinua se caracteriza por un aumento de pO2. Típicamente, mientras se consume la fuente de carbono basal durante la fase discontinua y sin añadir fuentes de carbono adicionales como es típico en las fases discontinuas, la señal de presión parcial de oxígeno (pO2) disminuirá continuamente hasta, por ejemplo, por debajo de 65%, tal como por ejemplo 30%. Tras el consumo de la fuente de carbono basal, la pO2 puede aumentar, p. ej., por encima del 30% tal como, por ejemplo, por encima de 65%, o más indicando el punto de tiempo apropiado para cambiar al sistema lote alimentado utilizando medio de alimentación para añadir una fuente de carbono adicional en condiciones limitadas de fuente de carbono.According to a specific embodiment, the discontinuous phase is characterized by a continuous decrease in the partial pressure of oxygen (pO2) signal and wherein the end of the discontinuous phase is characterized by an increase in pO2. Typically, while the basal carbon source is consumed during the batch phase and without adding additional carbon sources as is typical in batch phases, the partial pressure of oxygen (pO2) signal will continuously decrease to, say, below 65 %, such as for example 30%. Following consumption of the basal carbon source, the pO2 may increase, e.g. e.g., above 30% such as, for example, above 65%, or more indicating the appropriate time point to switch to the fed-batch system using feed medium to add an additional carbon source under carbon source limited conditions.

Específicamente, la pO2 se reduce a menos de 65% o menos de saturación durante la fase discontinua seguido de un aumento por encima de 65% o más de saturación al final del lote. Específicamente, la fase discontinua se realiza hasta un aumento de la señal de presión parcial de oxígeno (pO2) por encima de 65% de saturación, específicamente por encima de cualquiera de 70%, 75%, 80% u 85%.Specifically, the pO2 drops to less than 65% or less saturation during the batch phase followed by a rise above 65% or more saturation at the end of the batch. Specifically, the discontinuous phase is carried out until an increase in the partial pressure of oxygen (pO2) signal above 65% saturation, specifically above any of 70%, 75%, 80% or 85%.

Específicamente, la fase discontinua se realiza durante alrededor de 20 a 36 h.Specifically, the batch phase is carried out for about 20 to 36 hours.

El término "alrededor de" con respecto al tiempo de cultivo significará /- 5% o /- 10%.The term "about" with respect to the cultivation time will mean /- 5% or /- 10%.

Por ejemplo, el tiempo de ejecución del lote específico de alrededor de 20 a 36 h significa una duración de 18 a 39,6 h, específicamente de 19 a 37,8 h.For example, the specific batch execution time of about 20 to 36 hours means a duration of 18 to 39.6 hours, specifically 19 to 37.8 hours.

Según una realización específica, la fase discontinua se realiza utilizando de 40 a 50 g/L de glicerol, específicamente 45 g/L de glicerol como fuente de carbono basal en medios discontinuos, y el cultivo se realiza a 25°C durante alrededor de 27 a 30 h, o a 30°C durante alrededor de 23 a 36 h, o a cualquier temperatura entre 25°C y 30°C durante un tiempo de cultivo de 23 a 36 h. La disminución de la concentración de glicerol en el medio por lotes disminuiría la duración de la fase discontinua, mientras que el aumento del glicerol en el medio por lotes incluso prolongaría la fase discontinua. Como alternativa al glicerol, se puede utilizar glucosa, p. ej. en aproximadamente las mismas cantidades. According to a specific embodiment, the batch phase is performed using 40 to 50 g/L of glycerol, specifically 45 g/L of glycerol as the basal carbon source in batch media, and the cultivation is performed at 25°C for about 27 at 30 h, or at 30°C for about 23 to 36 h, or at any temperature between 25°C and 30°C for a culture time of 23 to 36 h. Decreasing the glycerol concentration in the batch medium would decrease the duration of the batch phase, while increasing the glycerol in the batch medium would even prolong the batch phase. As an alternative to glycerol, glucose can be used, e.g. eg in roughly the same amounts.

En un sistema típico de cultivo celular y expresión de POI, en donde una fase discontinua va seguida de una fase de lote alimentado, específicamente, el cultivo en la fase de lote alimentado se realiza durante cualquiera de, alrededor de 15 a 80 h, alrededor de 15 a 70 h, alrededor de 15 a 60 h, alrededor de 15 a 50 h, alrededor de 15 a 45 h, alrededor de 15 a 40 h, alrededor de 15 a 35 h, alrededor de 15 a 30 h, alrededor de 15 a 35 h, alrededor de 15 a 25 h, o alrededor de 15 a 20 h; preferiblemente alrededor de 20 a 40 h. Específicamente, el cultivo en la fase de lote alimentado se realiza durante cualquiera de alrededor de 80 h, alrededor de 70 h, alrededor de 60 h, alrededor de 55 h, alrededor de 50 h, alrededor de 45 h, alrededor de 40 h, alrededor de 35 h, alrededor de 33 h, alrededor de 30 h, alrededor de 25 h, alrededor de 20 h, o alrededor de 15 h.In a typical POI expression and cell culture system, where a batch phase is followed by a fed-batch phase, specifically, cultivation in the fed-batch phase is performed for anywhere from about 15 to 80 h, about from 15 to 70 hours, about 15 to 60 hours, about 15 to 50 hours, about 15 to 45 hours, about 15 to 40 hours, about 15 to 35 hours, about 15 to 30 hours, about 3 to 35 p.m., about 3 to 10 p.m., or about 3 to 8 p.m.; preferably about 20 to 40 hours. Specifically, cultivation in the fed-batch phase is performed for any of about 80 h, about 70 h, about 60 h, about 55 h, about 50 h, about 45 h, about 40 h, around 35h, around 33h, around 30h, around 25h, around 20h, or around 15h.

Cualquiera de tales cultivos de lote alimentado de menos de 120 h o menos de 100 h o hasta 80 h, que da como resultado una producción satisfactoria de POI obteniendo de ese modo un alto rendimiento, se denomina en el presente documento "fermentación rápida". Específicamente, la tasa de formación de producto específico de volumen (rP) es la cantidad de producto (mg) formado por Unidad de Volumen (L) y Unidad de tiempo (h) (mg(L h)-1). La tasa de formación de producto específico de volumen también se denomina rendimiento espacio-temporal (STY) o productividad volumétrica.Any such fed-batch culture of less than 120 hrs or less than 100 hrs or up to 80 hrs, which results in satisfactory production of POI thereby obtaining a high yield, is referred to herein as "rapid fermentation". Specifically, the volume specific product formation rate (rP) is the amount of product (mg) formed per Volume Unit (L) and Time Unit (h) (mg(L h)-1). The volume specific product formation rate is also called the space-time yield (STY) or volumetric productivity.

Específicamente, el cultivo por lote alimentado se realiza de manera que un rendimiento espacio-temporal de alrededor de 30 mg (L h)-1 (es decir, 30 mg (L h)-1 /- 5% o /- 10%). Específicamente un rendimiento espacio-temporal de alrededor de 30 mg (L h)-1 se logra en aproximadamente 30 horas de lote alimentado, específicamente se puede lograr al menos cualquiera de 27, 28, 29, 30, 31, 32 o 33 mg (L h)'1 en menos de cualquiera de 33 h, 32 h, 31 h, 30 h, 29 h, 28 h, 27 h, 26 h o 25 h de tiempo de lote alimentado.Specifically, fed-batch cultivation is performed such that a spatio-temporal yield of about 30 mg (L h)-1 (i.e. 30 mg (L h)-1 /- 5% or /- 10%) . Specifically a spatio-temporal yield of about 30 mg (L h)-1 is achieved in about 30 hours of fed batch, specifically at least any of 27, 28, 29, 30, 31, 32 or 33 mg can be achieved ( L h)'1 in less than any of 33 hrs, 32 hrs, 31 hrs, 30 hrs, 29 hrs, 28 hrs, 27 hrs, 26 hrs or 25 hrs of fed-batch time.

Específicamente, la fase discontinua se realiza como una primera etapa a) y la fase de lote alimentado se realiza como una segunda etapas b).Specifically, the batch phase is performed as a first step a) and the fed-batch phase is performed as a second step b).

Específicamente, la segunda etapa b) emplea un medio de alimentación en una fase de lote alimentado que proporciona la fuente de carbono complementaria en una cantidad limitante del crecimiento para mantener la tasa de crecimiento específica dentro del rango de 0,04 I r1 a 0,2 h-1, preferiblemente menos de 0,2, 0,15, 0,1 Ir1 o 0,15 h-1. Specifically, the second stage b) employs a feeding medium in a fed-batch phase that provides the complementary carbon source in a growth-limiting amount to maintain the specific growth rate within the range of 0.04 I r1 to 0, 2 h-1, preferably less than 0.2, 0.15, 0.1 Ir1 or 0.15 h-1.

Específicamente, el método de cultivo discontinuo y por lote alimentado emplea una célula anfitriona de levadura, p. ej. una levadura de cualquiera del género Saccharomyces o género Pichia o género Komagataella, o una levadura de un género distinto de Pichia, tal como de K. lactis, Z. rouxii, P. stipitis, H. polymorpha, o Y. lipolítica, preferiblemente Pichia pastoris o Komagataella pastoris. Específicamente, la levadura se utiliza en una fermentación rápida.Specifically, the fed-batch and fed-batch culture method employs a yeast host cell, e.g. eg a yeast from either the genus Saccharomyces or the genus Pichia or the genus Komagataella, or a yeast from a genus other than Pichia, such as K. lactis, Z. rouxii, P. stipitis, H. polymorpha, or Y. lipolytic, preferably Pichia pastoris or Komagataella pastoris. Specifically, yeast is used in rapid fermentation.

Específicamente, el método de cultivo discontinuo y por lote alimentado emplea el promotor pG1-x que es cualquiera de SEQ ID 37-44, preferiblemente cualquiera de SEQ ID 45-76. En particular, el promotor pG1-x se caracteriza por SEC ID 39, preferiblemente SEC ID 49.Specifically, the fed-batch and fed-batch culture method employs the pG1-x promoter which is any one of SEQ ID 37-44, preferably any one of SEQ ID 45-76. In particular, the pG1-x promoter is characterized by SEQ ID 39, preferably SEQ ID 49.

Específicamente, la POI se produce a una tasa de transcripción de al menos 15% en comparación con el promotor pGAP nativo de la célula.Specifically, POI is produced at a transcription rate of at least 15% compared to the cell's native pGAP promoter.

Según una realización específica, la fuente de carbono basal es diferente de la fuente de carbono complementaria, p. ej. cuantitativa y/o cualitativamente diferente. La diferencia cuantitativa puede proporcionar las diferentes condiciones para reprimir o desreprimir la actividad promotora. According to a specific embodiment, the basal carbon source is different from the complementary carbon source, e.g. eg quantitatively and/or qualitatively different. The quantitative difference may provide the different conditions for repressing or derepressing the promoter activity.

Según una realización específica adicional, las fuentes de carbono basal y complementaria comprenden el mismo tipo de moléculas o carbohidratos, preferiblemente a concentraciones diferentes. Según una realización específica adicional, la fuente de carbono es una mezcla de dos o más fuentes de carbono diferentes.According to a further specific embodiment, the basal and complementary carbon sources comprise the same type of molecules or carbohydrates, preferably at different concentrations. According to a further specific embodiment, the carbon source is a mixture of two or more different carbon sources.

Se puede utilizar cualquier tipo de carbono orgánico adecuado para el cultivo de células eucarióticas. Según una realización específica, la fuente de carbono es una hexosa, tal como glucosa, fructosa, galactosa o manosa, un disacárido, tal como sacarosa, un alcohol, tal como glicerol o etanol, o una mezcla de los mismos.Any type of organic carbon suitable for eukaryotic cell culture can be used. According to a specific embodiment, the carbon source is a hexose, such as glucose, fructose, galactose, or mannose, a disaccharide, such as sucrose, an alcohol, such as glycerol or ethanol, or a mixture thereof.

Según una realización específicamente preferida, la fuente de carbono basal se selecciona del grupo que consiste en glucosa, glicerol, etanol o mezclas de los mismos, y material nutriente complejo. Según una realización preferida, la fuente de carbono basal es glicerol.According to a specifically preferred embodiment, the basal carbon source is selected from the group consisting of glucose, glycerol, ethanol, or mixtures thereof, and complex nutrient material. According to a preferred embodiment, the basal carbon source is glycerol.

Según una realización específica adicional, la fuente de carbono complementaria es una hexosa tal como glucosa, fructosa, galactosa y manosa, un disacárido tal como sacarosa, un alcohol tal como glicerol o etanol, o una mezcla de los mismos. Según una realización preferida, la fuente de carbono complementaria es glucosa.According to a further specific embodiment, the complementary carbon source is a hexose such as glucose, fructose, galactose and mannose, a disaccharide such as sucrose, an alcohol such as glycerol or ethanol, or a mixture thereof. According to a preferred embodiment, the complementary carbon source is glucose.

Específicamente,Specifically,

a) la fuente de carbono basal se selecciona del grupo que consiste en glucosa, glicerol, etanol, una mezcla de los mismos y material nutriente complejo; ya) the basal carbon source is selected from the group consisting of glucose, glycerol, ethanol, a mixture thereof, and complex nutrient material; Y

b) la fuente de carbono complementaria es una hexosa, tal como glucosa, fructosa, galactosa o manosa, un disacárido, tal como sacarosa, un alcohol, tal como glicerol o etanol, o una mezcla de cualquiera de los anteriores. b) the complementary carbon source is a hexose, such as glucose, fructose, galactose, or mannose, a disaccharide, such as sucrose, an alcohol, such as glycerol or ethanol, or a mixture of any of the foregoing.

Dichas etapas de cultivo comprenden específicamente cultivar la línea celular en presencia de dichas fuentes de carbono, por tanto, en un medio de cultivo que comprende dichas fuentes de carbono, o en la etapa b) también en ausencia de una fuente de carbono complementaria.Said culturing steps specifically comprise culturing the cell line in the presence of said carbon sources, thus in a culture medium comprising said carbon sources, or in step b) also in the absence of a complementary carbon source.

Las condiciones desrepresoras (o inductoras) se pueden lograr adecuadamente por medios específicos. La segunda etapa b) emplea opcionalmente un medio de alimentación que no proporciona la fuente de carbono complementaria o la proporciona en una cantidad limitada.Derepressing (or inducing) conditions can be suitably achieved by specific means. The second stage b) optionally employs a feed medium that does not provide the complementary carbon source or provides it in a limited amount.

Específicamente, el medio de alimentación está químicamente definido y libre de metanol.Specifically, the feed medium is chemically defined and free of methanol.

El medio de alimentación se puede añadir al medio de cultivo en forma líquida o también en una forma alternativa, tal como un sólido, p. ej. en forma de un comprimido u otro medio de liberación sostenida, o un gas, p. ej. dióxido de carbono. Sin embargo, según una realización preferida, la cantidad limitada de una fuente de carbono complementaria añadida al medio de cultivo celular puede incluso ser cero. Preferiblemente, en condiciones de un sustrato de carbono limitado, la concentración de una fuente de carbono complementaria en el medio de cultivo es 0-1 g/L, preferiblemente menos de 0,6 g/L, más preferido menos de 0,3 g/L, más preferido menos de 0,1 g/L, preferiblemente 1-50 mg/L, más preferido 1 -10 mg/L, específicamente preferido 1 mg/L o incluso por debajo, tal como por debajo del límite de detección medido con un ensayo convencional adecuado, p. ej. determinada como concentración residual en el medio de cultivo tras el consumo por el cultivo de células en crecimiento.The feed medium can be added to the culture medium in liquid form or also in an alternative form, such as a solid, e.g. eg in the form of a tablet or other sustained release medium, or a gas, e.g. eg carbon dioxide. However, according to a preferred embodiment, the limited amount of a complementary carbon source added to the cell culture medium may even be zero. Preferably, under conditions of a limited carbon substrate, the concentration of a complementary carbon source in the culture medium is 0-1 g/L, preferably less than 0.6 g/L, more preferred less than 0.3 g /L, more preferred less than 0.1 g/L, preferably 1-50 mg/L, more preferred 1-10 mg/L, specifically preferred 1 mg/L or even below, such as below detection limit measured with a suitable conventional assay, e.g. eg determined as residual concentration in the culture medium after consumption by the growing cell culture.

En un método preferido, la cantidad limitada de la fuente complementaria proporciona una cantidad residual en el cultivo celular que está por debajo del límite de detección determinado en el caldo de fermentación al final de una fase de producción o en la salida de un procedimiento de fermentación, preferiblemente al cosechar el producto de fermentación.In a preferred method, the limited amount of the complementary source provides a residual amount in the cell culture that is below the detection limit determined in the fermentation broth at the end of a production phase or at the output of a fermentation process. , preferably when harvesting the fermentation product.

Específicamente, la segunda etapa b) emplea un medio de alimentación que proporciona la fuente de carbono complementaria en una cantidad limitante del crecimiento para mantener la tasa de crecimiento específica dentro del rango de 0,001 h-1 a 0,2 h-1, preferiblemente 0,005 h-1 a 0,15 h-1.Specifically, the second stage b) employs a feed medium that provides the complementary carbon source in a growth-limiting amount to maintain the specific growth rate within the range of 0.001 h-1 to 0.2 h-1, preferably 0.005 h-1 to 0.15 h-1.

Figurasfigures

Figura 1: Análisis de secuencia de pG1 para TFBS relacionado con la fuente de carbono utilizando MatInspector. pG1 (también conocido como Pg t h 1), se amplificó y clonó inicialmente desde la posición -965 a -1 (longitud de 965 pb, la secuencia se proporciona en Figura 6 ( SEQ ID 1, en particular se ha utilizado SEQ ID 9). Los números indican TFBS que se seleccionaron para su deleción (enumerados en la Tabla 2). Las familias de matrices asociadas son F$CSRE (elementos de respuesta a fuente de carbono, recuadros rayados), F$ADR (Regulador metabólico de levadura, recuadros punteados), F$MGCM (Motivos monoméricos de clase Gal4, recuadros rellenos) y F$YMIG (proteínas de la Caja GC de levadura, recuadros de color blanco). Otros TFBS pueden verse afectados por las deleciones (la información detallada de coincidencia de matriz se proporciona en Tabla 1). El recuadro sombreado de color negro indica la principal región reguladora de pG1 que se identificó mediante el escrutinio de variantes de pG1 acortadas. El asterisco indica la posición del motivo t At prominente (posición -390 a -374) que también se seleccionó para deleción y mutación. Los inicios 5' alternativos de las variantes acortadas del promotor pG1 están marcados con flechas y la longitud de la variante correspondiente. Figure 1: Sequence analysis of pG1 for carbon source-related TFBS using MatInspector. pG1 (also known as P gth 1 ), was initially amplified and cloned from position -965 to -1 (965 bp length, sequence is given in Figure 6 (SEQ ID 1, in particular SEQ ID 9 has been used) Numbers indicate TFBS that were selected for deletion (listed in Table 2) Associated matrix families are F$CSRE (Carbon Source Response Elements, hatched boxes), F$ADR (Yeast Metabolic Regulator, dotted boxes), F$MGCM (Gal4 class monomeric motifs, solid boxes), and F$YMIG (yeast GC Box proteins, white boxes).Other TFBS may be affected by deletions (detailed matching information matrix is provided in Table 1) .The black shaded box indicates the major regulatory region of pG1 that was identified by screening for shortened pG1 variants.The asterisk indicates the position of the prominent tAt motif (position -390 to - 374) which is also selected for deletion and mutation. Alternative 5' starts of shortened variants of the pG1 promoter are marked with arrows and the length of the corresponding variant.

Figura 2: Datos de escrutinio de las variantes del promotor pG1 acortadas La media geométrica de la fluorescencia de eGFP específica de la población (fluorescencia relacionada con el volumen celular) se muestra para los clones que expresan eGFP bajo el control de pG1 (clon núm. 8, GCN verificado de 1) o una variante de pG1 acortada (cada 2 clones cultivados por triplicado, seleccionados en pre-escrutinios) en condiciones de represión e inducción del crecimiento. Se utilizaron células de P. pastoris de tipo salvaje sin expresión como control negativo. Se tomaron muestras durante el precultivo represivo y después de 24 y 48 horas de inducción con cuentas de alimentación. Figure 2: Screening data for shortened pG1 promoter variants. Geometric mean population-specific eGFP fluorescence (fluorescence related to cell volume) is shown for clones expressing eGFP under pG1 control (clone no. 8, GCN verified from 1) or a shortened pG1 variant (each 2 clones grown in triplicate, selected in pre-screens) under growth repression and induction conditions. Wild-type P. pastoris cells without expression were used as a negative control. Samples were taken during the suppressive preculture and after 24 and 48 hours of induction with feeding beads.

Figura 3: Datos de escrutinio de las variantes de deleción de TFBS y mutación TAT La media geométrica de la fluorescencia de eGFP específica de la población (fluorescencia relacionada con el volumen celular) se muestra para los clones que expresan eGFP bajo el control de pG1 (clon núm. 8, GCN verificado de 1) o una variante de pG1 (se reunieron hasta 9 clones cultivados en 3 pocillos) en condiciones de represión e inducción del crecimiento. Se utilizaron células de P. pastoris de tipo salvaje como control negativo. Figure 3: Screening Data for TFBS Deletion Variants and TAT Mutation Geometric mean population-specific eGFP fluorescence (fluorescence related to cell volume) is shown for clones expressing eGFP under the control of pG1 ( clone #8, GCN verified from 1) or a pG1 variant (up to 9 clones grown in 3 wells pooled) under growth repression and induction conditions. Wild-type P. pastoris cells were used as a negative control.

Figura 4: Datos de escrutinio de las variantes de duplicación de pG1 La media geométrica de la fluorescencia de eGFP específica de la población (fluorescencia relacionada con el volumen celular) se muestra para los clones que expresan eGFP bajo el control de pG1 (clon núm. 8, GCN verificado de 1) o una variante de pG1 (se reunieron hasta 9 clones cultivados en 3 pocillos, seleccionados en pre-escrutinios) en condiciones de represión e inducción del crecimiento. Se utilizaron células de P. pastoris de tipo salvaje como control negativo. Figure 4: Screening data of pG1 duplication variants. Geometric mean population-specific eGFP fluorescence (fluorescence related to cell volume) is shown for clones expressing eGFP under pG1 control (clone no. 8, GCN verified from 1) or a pG1 variant (up to 9 clones grown in 3 wells, selected in pre-screens were pooled) under growth repression and induction conditions. Wild-type P. pastoris cells were used as a negative control.

Figura 5: Cultivo por lote alimentado de pG1 y variantes de pG1 que expresan eGFP La fluorescencia relativa de eGFP se midió a partir de muestras de biorreactor (diluidas a densidades de biomasa similares) utilizando un lector de placas y se muestra durante el tiempo de alimentación (final del lote establecido en 0) en el lote (A) y el cultivo por lote alimentado (B). Se comparó un clon que expresaba eGFP bajo control de pG1 (núm. 8) con clones que expresaban bajo control de una variante de deleción de pG1 (pG1-A2, SEQ ID 211), una mutación TAT (pG1-T16, SEQ ID 257, y una variante por duplicación (pG1-D1240) (SEQ ID 49). Figure 5: Fed-batch culture of pG1 and pG1 variants expressing eGFP . Relative fluorescence of eGFP was measured from bioreactor samples (diluted to similar biomass densities) using a plate reader and is displayed over the feeding time. (end of batch set to 0) in batch (A) and fed-batch culture (B). A clone expressing eGFP under control of pG1 (#8) was compared with clones expressing under control of a pG1 deletion variant (pG1-A2, SEQ ID 211), a TAT mutation (pG1-T16, SEQ ID 257 , and a duplicative variant (pG1-D1240) (SEQ ID 49).

Figura 6: Secuencias promotoras pG1 y pG1-xFigure 6: pG1 and pG1-x promoter sequences

Figura 6a: Secuencias de referenciaFigure 6a: Reference sequences

Figura 6b: Secuencias del promotor pG1-xFigure 6b: Sequences of the pG1-x promoter

Elementos de Secuencia Individual:Individual Sequence Elements:

Posición 8 (SEQ ID 2): ATAAATGGA (p. ej., posición -293 a -285 en SEQ ID 8):Position 8 (SEQ ID 2): ATAAATGGA (eg, position -293 to -285 in SEQ ID 8):

Posición 9 (SEQ ID 3): CATATTTTTCCGGTT (p. ej., posición -275 a-261 en SEQ ID 8)Position 9 (SEQ ID 3): CATATTTTTCCGGTT (eg, position -275 to -261 in SEQ ID 8)

Región central: (SEQ ID 4): ATAAATGGACGCCTGCTCCATATTTTTCCGGTT (p. ej., posición -293 a -261 en SEQ ID 8)Central region: (SEQ ID 4): ATAAATGGACGCCTGCTCCATATTTTTCCGGTT (eg, position -293 to -261 in SEQ ID 8)

Región reguladora principal: (SEQ ID 5): (p. ej., posición -328 a -211 en SEQ ID 8):Major Regulatory Region: (SEQ ID 5): (eg, position -328 to -211 in SEQ ID 8):

CCGGATAAGAGAATTTT GTTT GATTAT CCGTT CGGA TAAA TGGACGCCTGC CCGGATAAGAGAATTTT GTTT GATTAT CCGTT CGGA TAAA TGGACGCCTGC

TCCA TA 7"nT7~CCGG7TATTACCCCACCTGGAAGTGCCCAGAATTTTCCGGGGATT TCCA TA 7"nT7~CCGG7TATTACCCCACCTGGAAGTGCCCAGAATTTTCCGGGGATT

ACGGATAATACACGGATAATAC

secuencia de nucleótidos 3'-terminal (SEQ ID 6): TTC.CACC.C.T.T3'-terminal nucleotide sequence (SEQ ID 6): TTC.CACC.C.T.T

Indicaciones en secuencias:Directions in sequences:

• Región reguladora principal: negrita • Primary regulatory region: bold

• Región reguladora central: negrita, cursiva y subrayado , SEQ ID 2 y 3 doble subrayado • Central regulatory region: bold, italic and underlined , SEQ ID 2 and 3 double underlined

Motivo T: Cursiva y subrayado, puede estar opcionalmente extendido (en el extremo 5’-terminal del motivo T) por una secuencia TA precedente, o (en el extremo 3'-terminal del motivo T) por una secuencia AT subsiguiente T motif: Italicized and underlined, may be optionally extended (at the 5'-terminus of the T motif) by a preceding TA sequence, or (at the 3'-terminus of the T motif) by a subsequent AT sequence

• región 3'-terminal: subay.a.dñ .c.on Jíne.a..discontinua• 3'-terminal region: subay.a.dñ .c.with Jíne.a..discontinuous

• La región menos relevante para la actividad promotora en la secuencias de pG1 de referencia (Pg t h 1):• The least relevant region for promoter activity in the reference pG1 sequences (P gth 1 ):

subray_adj3_co_n_una_!Ln_ea _de_g.uiones _y_Ru_nlo_s: uno o más nucleótidos hasta todos los nucleótidos dentro de la región que va desde el extremo 5'-terminal hasta -328 (región subrayada en la Fig. 6a con una línea de guiones y puntos) puede estar sustituida o suprimida, o pueden insertar nucleótidos adicionales dentro de tal región, sin embargo, las realizaciones preferidas todavía comprenden al menos un motivo T que es (T)n (n = 13-20) con o sin nucleótidos A o TA precedentes; o con o sin nucleótidos A o AT subsiguientes. Tal región menos relevante que se puede suprimir parcial o totalmente es la región que va desde el extremo 5' terminal hasta la primera región o región reguladora principal 5' (negrita) en uno cualquiera de SEQ ID 37 a SEQ ID 202; preferiblemente, se pueden suprimir hasta 50, 100, 150, 200, 250, 300, 320 o 325 nucleótidos del extremo 5'-terminal de uno cualquiera de SEQ ID 37 a SEQ ID 202.underline_adj3_co_n_una_!Ln_ea _de_g.dashes _y_Ru_nlo_s: one or more nucleotides up to all nucleotides within the region from the 5'-terminus to -328 (region underlined in Fig. 6a with a line of dashes and dots) can be substituted or deleted, or may insert additional nucleotides within such a region, however, preferred embodiments still comprise at least one T motif that is (T)n (n = 13-20) with or without preceding nucleotides A or TA; or with or without subsequent A or AT nucleotides. Such a less relevant region that can be partially or totally deleted is the region from the 5' terminus to the first region or 5' major regulatory region (bold) in any one of SEQ ID 37 to SEQ ID 202; Preferably, up to 50, 100, 150, 200, 250, 300, 320 or 325 nucleotides from the 5'-terminus of any one of SEQ ID 37 to SEQ ID 202 may be deleted.

Deleción: de] (subrayado)Deletion: de] (underlined)

Motivos (T)n (n = 13-20): se pueden extender opcionalmente en su extremo 5' , p. ej. por "A" o "TA"; o en su extremo 3' , p. ej. por "A" o "AT"(T) n motifs (n = 13-20): may optionally be extended at their 5' end, e.g. eg by "A" or "TA"; or at its 3' end, e.g. eg for "A" or "AT"

o (T)13: SEC ID 12: TTTTTTTTTTTTT or (T) 13 : SEQ ID 12: TTTTTTTTTTTTT

o (T)14: SEC ID 13: TTTTTTTTTTTTTT or (T) 14 : SEQ ID 13: TTTTTTTTTTTTTT

o (T)15: SEC ID 14: TTTTTTTTTTTTTTT or (T) 15 : SEQ ID 14: TTTTTTTTTTTTTTT

o (T)16: SEC ID 15: TTTTTTTTTTTTTTTT or (T) 16 : SEQ ID 15: TTTTTTTTTTTTTTTT

o (T)17: SEC ID 16: TTTTTTTTTTTTTTTTT or (T) 17 : SEQ ID 16: TTTTTTTTTTTTTTTTT

o (T)18: SEC ID 17: TTTTTTTTTTTTTTTTTT or (T) 18 : SEQ ID 17: TTTTTTTTTTTTTTTTTT

o (T)19: SEQ ID 18: TTTTTTTTTTTTTTTTTTT or (T) 19 : SEQ ID 18: TTTTTTTTTTTTTTTTTTT

o (T)20: SEC ID 19: TTTTTTTTTTTTTTTTTTTT or (T) 20 : SEQ ID 19: TTTTTTTTTTTTTTTTTTTT

Motivos TA(T) n (n = 13-20), se pueden mutar opcionalmente para sustituir la "A" en la posición 2 por una "T" (A/T)TA(T) n motifs (n = 13-20), can optionally be mutated to replace the "A" at position 2 with a "T" (A/T)

o TA(T)13: SEC ID 20: TATTTTTTTTTTTTT or TA(T) 13 : SEQ ID 20: TATTTTTTTTTTTTTT

o TA(T)13 (sustituida por A/T), or TA(T) 13 (replaced by A/T),

SEQ ID 14 (véase (T)15): TTTTTTTTTTTTTTT SEQ ID 14 (see (T) 15 ): TTTTTTTTTTTTTTT

o TA(T)14: SEQ ID 21: TATTTTTTTTTTTTTT or TA(T) 14 : SEQ ID 21: TATTTTTTTTTTTTTT

o TA(T)14 (sustituida por A/T), o TA(T) 14 (replaced by A/T),

SEQ ID 15 (véase (T)16): TTTTTTTTTTTTTTTT SEQ ID 15 (see (T) 16 ): TTTTTTTTTTTTTTTT

o TA(T)15: SEC ID 22: TATTTTTTTTTTTTTTT or TA(T) 15 : SEQ ID 22: TATTTTTTTTTTTTTTTT

o TA(T)15 (sustituida por A/T), o TA(T) 15 (replaced by A/T),

SEQ ID 16 (véase (T)17): TTTTTTTTTTTTTTTTT SEQ ID 16 (see (T) 17 ): TTTTTTTTTTTTTTTTT

o TA(T)16: SEQ ID 23: TATTTTTTTTTTTTTTTT or TA(T) 16 : SEQ ID 23: TATTTTTTTTTTTTTTTT

o TA(T)16 (sustituida por A/T), o TA(T) 16 (replaced by A/T),

SEQ ID 17 (véase (T)18): TTTTTTTTTTTTTTTTTT SEQ ID 17 (see (T) 18 ): TTTTTTTTTTTTTTTTTT

o TA(T)17: SEC ID 24: TATTTTTTTTTTTTTTTTT or TA(T) 17 : SEQ ID 24: TATTTTTTTTTTTTTTTTTT

o TA(T)17 (sustituida por A/T), o TA(T) 17 (replaced by A/T),

SEQ ID 18 (véase (T)19): TTTTTTTTTTTTTTTTTTT SEQ ID 18 (see (T) 19 ): TTTTTTTTTTTTTTTTTTT

o TA(T)18: SEQ ID 25: TATTTTTTTTTTTTTTTTTT or TA(T) 18 : SEQ ID 25: TATTTTTTTTTTTTTTTTTT

o TA(T)18 (sustituida por A/T), o TA(T) 18 (replaced by A/T),

SEQ ID 19 (véase (T)2ü): TTTTTTTTTTTTTTTTTTTT SEQ ID 19 (see (T)2ü): TTTTTTTTTTTTTTTTTTTT

o TA(T)19: SEQ ID 26: TATTTTTTTTTTTTTTTTTTT or TA(T) 19 : SEQ ID 26: TATTTTTTTTTTTTTTTTTTTT

o TA(T)19 (A/T sustituido), or TA(T) 19 (substituted A/T),

SEQ ID 28 (es decir, (T)21): TTTTTTTTTTTTTTTTTTTTT SEQ ID 28 (ie, (T) 21 ): TTTTTTTTTTTTTTTTTTTTT

o TA(T)20: SEC ID 27: TATTTTTTTTTTTTTTTTTTTT or TA(T)20: SEQ ID 27: TATTTTTTTTTTTTTTTTTTTT

o TA(T)20 (sustituida por A/T),or TA(T)20 (replaced by A/T),

o SEQ ID 29 (es decir, (T)22): TTTTTTTTTTTTTTTTTTTTTT or SEQ ID 29 (i.e. (T)22): TTTTTTTTTTTTTTTTTTTTTT

Figura 7: Secuencia promotora de pGAP nativa de P. pastoris (GS115) (SEC ID 260) Figure 7: P. pastoris native pGAP promoter sequence (GS115) (SEQ ID 260)

Figure imgf000015_0001
Figure imgf000015_0001

Figura 7 continuación: Secuencias de factores de transcripción Figure 7 continued : Transcription factor sequences

Rgt1 (PAS_chr1-3_0233) (SEQ ID 261)Rgt1 (PAS_chr1-3_0233) (SEQ ID 261)

Cat8-2 (PAS_chr4_0540) (SEQ ID 262)Cat8-2 (PAS_chr4_0540) (SEQ ID 262)

Cat8-1 (PAS_chr2-1_0757) (SEQ ID 263)Cat8-1 (PAS_chr2-1_0757) (SEQ ID 263)

Figura 8 : Secuencias de la técnica anterior pG1 (SEQ ID 264), pG1a (SEQ ID 265), pG1b (SEQ ID 266), pG1c (SEQ ID 267), pG1d (SEQ ID 268), pG1e (SEQ ID 269) o pG1f (SEQ ID 270), como se describe en el documento WO2013050551 A1 Figure 8 : Prior art sequences pG1 (SEQ ID 264), pG1a (SEQ ID 265), pG1b (SEQ ID 266), pG1c (SEQ ID 267), pG1d (SEQ ID 268), pG1e (SEQ ID 269) or pG1f (SEQ ID 270), as described in WO2013050551 A1

Figura 9: Cultivo por lote alimentado de la realización pG1-3 seleccionada de SEQ ID 39 (pG1-D1240 (SEQ ID 49)) que expresa una proteína armazón alternativa como una proteína modelo utilizando (A) el protocolo convencional por lote alimentado, (B) protocolo optimizado por lote alimentado con rendimiento espacio-temporal ("fermentación rápida") adaptado de Maurer et al. (Microbial Cell Factories, 2006, 5:37) Figure 9: Fed-batch culture of selected embodiment pG1-3 of SEQ ID 39 (pG1-D1240 (SEQ ID 49)) expressing an alternative scaffold protein as a model protein using (A) the standard fed-batch protocol, ( B) Fed-batch optimized protocol with spatio-temporal yield ("rapid fermentation") adapted from Maurer et al. (Microbial Cell Factories, 2006, 5:37)

Descripción detallada de la invenciónDetailed description of the invention

Los términos específicos que se utilizan a lo largo de la memoria descriptiva tienen el siguiente significado.Specific terms used throughout the specification have the following meaning.

El término "fuente de carbono", también referido como "sustrato de carbono", como se emplea en el presente documento, significará un sustrato de carbono fermentable, típicamente una fuente de carbohidrato, adecuada como fuente de energía para microorganismos, tales como aquellos capaces de ser metabolizados por organismos anfitriones o líneas celulares de producción, en particular fuentes seleccionadas del grupo que consiste en monosacáridos, oligosacáridos, polisacáridos, alcoholes que incluyen glicerol, en forma purificada, en medios mínimos o proporcionados en materias primas, tales como un material nutriente complejo. La fuente de carbono se puede utilizar según la invención como una única fuente de carbono o como una mezcla de diferentes fuentes de carbono. The term "carbon source", also referred to as "carbon substrate", as used herein, shall mean a fermentable carbon substrate, typically a carbohydrate source, suitable as an energy source for microorganisms, such as those capable of to be metabolized by host organisms or production cell lines, in particular sources selected from the group consisting of monosaccharides, oligosaccharides, polysaccharides, alcohols including glycerol, in purified form, in minimal media or provided in raw materials, such as a nutrient material complex. The carbon source can be used according to the invention as a single carbon source or as a mixture of different carbon sources.

Una "fuente de carbono basal" tal como se emplea según la invención es típicamente una fuente de carbono adecuada para el crecimiento celular, tal como un nutriente para células eucarióticas. La fuente de carbono basal se puede proporcionar en un medio, tal como un medio basal o un medio complejo, pero también en un medio químicamente definido que contiene una fuente de carbono purificada. La fuente de carbono basal se proporciona típicamente en una cantidad para proporcionar el crecimiento celular, en particular durante la fase de crecimiento en un procedimiento de cultivo, por ejemplo para obtener densidades celulares de al menos 5 g/L de masa seca celular, preferiblemente al menos 10 g/L de masa seca celular, o al menos 15 g/L de masa seca celular, p. ej. exhibiendo viabilidades de más de 90% durante las etapas de subcultivo convencionales, preferiblemente más de 95%.A "basal carbon source" as used according to the invention is typically a carbon source suitable for cell growth, such as a nutrient for eukaryotic cells. The basal carbon source can be provided in a medium, such as basal medium or complex medium, but also in a chemically defined medium containing a purified carbon source. The basal carbon source is typically provided in an amount to support cell growth, particularly during the growth phase in a culture procedure, for example to obtain cell densities of at least 5 g/L cell dry mass, preferably at least 10 g/L cellular dry mass, or at least 15 g/L cellular dry mass, e.g. eg exhibiting viabilities of greater than 90% during conventional subculturing steps, preferably greater than 95%.

De acuerdo con la invención, la fuente de carbono basal se utiliza típicamente en una cantidad en exceso o sobrante, lo que se entiende como un exceso que proporciona energía para aumentar la biomasa, p. ej. durante el cultivo de una línea celular con una alta tasa de crecimiento específica, tal como durante la fase de crecimiento de una línea celular en un procedimiento de cultivo discontinuo o por lote alimentado. Esta cantidad sobrante es particularmente superior a la cantidad limitada de una fuente de carbono complementaria (como se emplea en condiciones de crecimiento limitado) para lograr una concentración residual en el caldo de fermentación que sea medible y típicamente al menos 10 veces mayor, preferiblemente al menos 50 veces o al menos 100 veces mayor que durante la alimentación de la cantidad limitada de la fuente de carbono complementaria.According to the invention, the basal carbon source is typically used in an excess or surplus amount, which is understood as an excess that provides energy to increase biomass, e.g. eg during the cultivation of a cell line with a high specific growth rate, such as during the growth phase of a cell line in a fed-batch or fed-batch culture procedure. This amount left over is particularly greater than the limited amount of a supplemental carbon source (as used under limited growth conditions) to achieve a residual concentration in the fermentation broth that is measurable and typically at least 10-fold higher, preferably at least 50 times or at least 100 times greater than during the feeding of the limited amount of the complementary carbon source.

Una "fuente de carbono complementaria" tal como se emplea de acuerdo con la invención es típicamente un sustrato complementario que facilita la producción de productos de fermentación por líneas celulares de producción, en particular en la fase de producción de un procedimiento de cultivo. La fase de producción sigue específicamente una fase de crecimiento, p. ej. en un procedimiento de cultivo discontinuo, por lote alimentado y continuo. La fuente de carbono complementaria específicamente puede estar contenida en la alimentación de un procedimiento por lote alimentado. La fuente de carbono complementaria se emplea típicamente en un cultivo celular en condiciones limitadas de sustrato de carbono, es decir, utilizando la fuente de carbono en una cantidad limitada.A "complementary carbon source" as used in accordance with the invention is typically a complementary substrate that facilitates the production of fermentation products by production cell lines, particularly in the production phase of a culture procedure. The production phase specifically follows a growth phase, e.g. eg in a continuous, fed-batch, batch culture procedure. The complementary carbon source specifically may be contained in the feed of a fed-batch process. The complementary carbon source is typically employed in cell culture under limited carbon substrate conditions, ie using the carbon source in a limited amount.

En el presente documento se entiende que una "cantidad limitada" de una fuente de carbono o una "fuente de carbono limitada" se refiere específicamente al tipo y cantidad de un sustrato de carbono que facilita la producción de productos de fermentación por líneas celulares de producción, en particular en un procedimiento de cultivo con tasas de crecimiento controladas inferiores a la tasa máxima de crecimiento. La fase de producción sigue específicamente una fase de crecimiento, p. ej. en un procedimiento de cultivo discontinuo, por lote alimentado y continuo. Los procedimientos de cultivo celular pueden emplear cultivo discontinuo, cultivo continuo y cultivo por lote alimentado. El cultivo discontinuo es un procedimiento de cultivo mediante el cual se añade una pequeña cantidad de una solución de cultivo de siembra a un medio y las células se cultivan sin añadir un medio adicional o descargar una solución de cultivo durante el cultivo. El cultivo continuo es un procedimiento de cultivo mediante el cual un medio se añade y descarga continuamente durante el cultivo. El cultivo continuo también incluye cultivo de perfusión. El cultivo por lote alimentado, que es un intermedio entre el cultivo discontinuo y el cultivo continuo y también conocido como cultivo semicontinuo, es un procedimiento de cultivo mediante el cual se añade un medio de manera continua o secuencial durante el cultivo pero, a diferencia del cultivo continuo, un solución de cultivo no se descarga continuamente.A "limited amount" of a carbon source or a "limited carbon source" is understood herein to refer specifically to the type and amount of a carbon substrate that facilitates the production of fermentation products by production cell lines. , in particular in a cultivation method with controlled growth rates lower than the maximum growth rate. The production phase specifically follows a growth phase, e.g. eg in a continuous, fed-batch, batch culture procedure. Cell culture methods may employ batch culture, continuous culture, and fed-batch culture. Batch culture is a culture method by which a small amount of a seed culture solution is added to a medium and cells are cultured without adding an additional medium or discharging a culture solution during culture. Continuous cultivation is a cultivation method by which a medium is continuously added and discharged during cultivation. Continuous culture also includes perfusion culture. Fed-batch culture, which is an intermediate between batch culture and continuous culture and also known as fed-batch culture, is a culture method whereby a medium is added continuously or sequentially during culture but, unlike fed-batch culture, continuous culture, a culture solution is not discharged continuously.

Se prefiere específicamente un procedimiento por lote aimentado que se basa en la alimentación de un sustrato de nutrientes que limita el crecimiento a un cultivo. La estrategia de lote alimentado, incluida la fermentación por lote alimentado única o por lote alimentado repetida, se utiliza típicamente en procedimientos bioindustriales para alcanzar una alta densidad celular en el biorreactor. La adición controlada del sustrato de carbono afecta directamente a la tasa de crecimiento del cultivo y ayuda a evitar el metabolismo por desbordamiento o la formación de subproductos metabólicos no deseados. En condiciones limitadas de fuente de carbono, la fuente de carbono puede estar contenida específicamente en la alimentación de un procedimiento por lote alimentado. Por tanto, el sustrato de carbono se proporciona en una cantidad limitada.A fed-batch process that relies on feeding a growth-limiting nutrient substrate to a culture is specifically preferred. The fed-batch strategy, including single fed-batch or repeated fed-batch fermentation, is typically used in bioindustrial processes to achieve high cell density in the bioreactor. The controlled addition of the carbon substrate directly affects the growth rate of the crop and helps prevent overflow metabolism or the formation of unwanted metabolic by-products. Under limited carbon source conditions, the carbon source may be contained specifically in the feed of a fed-batch process. Therefore, the carbon substrate is provided in a limited amount.

Asimismo, en el cultivo en quimiostato o continuo como se describe en el presente documento, la tasa de crecimiento se puede controlar estrictamente.Also, in chemostat or continuous culture as described herein, the growth rate can be strictly controlled.

En el presente documento se entiende particularmente que la cantidad limitada de una fuente de carbono es la cantidad de una fuente de carbono necesaria para mantener una línea celular de producción en condiciones de crecimiento limitado, p. ej. en una fase de producción o modo de producción. Tal cantidad limitada se puede emplear en un procedimiento por lote alimentado, donde la fuente de carbono está contenida en un medio de alimentación y se suministra al cultivo a tasas de alimentación bajas para un suministro de energía sostenido, p. ej. para producir una POI, manteniendo la biomasa a tasas de crecimiento específicas bajas. Típicamente, se añade un medio de alimentación a un caldo de fermentación durante la fase de producción de un cultivo celular.Limited amount of a carbon source is particularly understood herein to be the amount of a carbon source necessary to maintain a production cell line under limited growth conditions, e.g. eg in a production phase or mode of production. Such a limited amount can be employed in a fed-batch process, where the carbon source is contained in a feed medium and is fed to the crop at low feed rates for sustained energy supply, e.g. eg to produce a POI, keeping the biomass at low specific growth rates. Typically, a feed medium is added to a fermentation broth during the production phase of a cell culture.

La cantidad limitada de una fuente de carbono se puede determinar, por ejemplo, por la cantidad residual de la fuente de carbono en el caldo de cultivo celular, que está por debajo de un umbral predeterminado o incluso por debajo del límite de detección medido en un ensayo convencional (carbohidrato). La cantidad residual típicamente se determinaría en el caldo de fermentación al recolectar un producto de fermentación.The limited amount of a carbon source can be determined, for example, by the residual amount of the carbon source in the cell culture broth, which is below a predetermined threshold or even below the detection limit measured in a conventional assay (carbohydrate). The residual amount would typically be determined in the fermentation broth by collecting a fermentation product.

La cantidad limitada de una fuente de carbono también se puede determinar definiendo la tasa de alimentación promedio de la fuente de carbono al fermentador, p. ej. según lo determinado por la cantidad añadida durante todo el procedimiento de cultivo, p. ej. la fase por lote alimentado, por tiempo de cultivo, para determinar una cantidad media calculada por tiempo. Esta tasa de alimentación promedio se mantiene baja para garantizar el uso completo de la fuente de carbono complementaria por parte del cultivo celular, p. ej. entre 0,6 g L-1 h-1 (g de fuente de carbono por L de volumen de fermentación inicial y h de tiempo) y 25 g L-1 h-1, preferiblemente entre 1,6 g L-1 h-1 y 20 g L-1 h-1. The limited amount of a carbon source can also be determined by defining the average feed rate of the carbon source to the fermenter, e.g. eg as determined by the amount added throughout the culturing procedure, e.g. eg phase per fed batch, per culture time, to determine an average amount calculated per time. This average feeding rate is kept low to ensure full use of the complementary carbon source by the cell culture, e.g. eg between 0.6 g L-1 h-1 (g of carbon source per L of initial fermentation volume and h of time) and 25 g L-1 h-1, preferably between 1.6 g L-1 h-1 and 20 g L-1 h-1.

La cantidad limitada de una fuente de carbono también se puede determinar midiendo la tasa de crecimiento específica, cuya tasa de crecimiento específica se mantiene baja, p. ej. menor que la tasa de crecimiento específica máxima, durante la fase de producción, p. ej. dentro de un rango predeterminado, tal como en el rango de 0,001 h-1 a 0,20 h-1, o 0,005 h-1 a 0,20 h-1, preferiblemente entre 0,01 h-1 y 0,15 h-1.The limited amount of a carbon source can also be determined by measuring the specific growth rate, whose specific growth rate is kept low, e.g. eg less than the maximum specific growth rate, during the production phase, e.g. eg within a predetermined range, such as in the range of 0.001 h-1 to 0.20 h-1, or 0.005 h-1 to 0.20 h-1, preferably between 0.01 h-1 and 0.15 h -one.

Específicamente, se utiliza un medio de alimentación químicamente definido y libre de metanol.Specifically, a chemically defined, methanol-free feed medium is used.

El término "químicamente definido" con respecto al medio de cultivo celular, tal como un medio mínimo o medio de alimentación en un procedimiento de alimentación por lotes, significará un medio de cultivo adecuado para el cultivo celular in vitro de una línea celular de producción, en la que se conocen todos los componentes químicos y (poli)péptidos. Típicamente, un medio químicamente definido está completamente libre de componentes derivados de animales y representa un entorno de cultivo celular puro y uniforme.The term "chemically defined" with respect to cell culture medium, such as minimal medium or fed medium in a fed-batch process, shall mean a culture medium suitable for in vitro cell culture of a production cell line, in which all chemical components and (poly)peptides are known. Typically, a chemically defined medium is completely free of animal-derived components and represents a pure and uniform cell culture environment.

El término "línea celular", como se emplea en el presente documento, se refiere a un clon establecido de un tipo celular particular que ha adquirido la capacidad de proliferar durante un período de tiempo prolongado. El término "línea celular anfitriona" se refiere a una línea celular como la empleada para expresar un gen endógeno o recombinante o productos de una ruta metabólica para producir polipéptidos o metabolitos celulares mediados por tales polipéptidos. The term "cell line" as used herein refers to an established clone of a particular cell type that has acquired the ability to proliferate over an extended period of time. The term "host cell line" refers to a cell line as used to express an endogenous or recombinant gene or metabolic pathway products to produce polypeptides or cellular metabolites mediated by such polypeptides.

Una "línea de células anfitrionas de producción" o "línea celular de producción" se entiende comúnmente como una línea celular lista para su uso para el cultivo en un biorreactor para obtener el producto de un procedimiento de producción, tal como una POI. Los términos "anfitrión eucariótico" o "línea celular eucariótica" significará cualquier célula u organismo eucariótico, que pueda cultivarse para producir una POI o un metabolito de la célula anfitriona. Está bien entendido que el término no incluye a los seres humanos.A "production host cell line" or "production cell line" is commonly understood as a cell line ready for use for cultivation in a bioreactor to obtain the product of a production process, such as a POI. The terms "eukaryotic host" or "eukaryotic cell line" shall mean any eukaryotic cell or organism, which can be cultured to produce a POI or host cell metabolite. It is well understood that the term does not include human beings.

Los términos "cultivo celular" o "cultivo", también denominado "fermentación", con respecto a una línea de células anfitrionas, significa el mantenimiento de células en un entorno artificial, p. ej., in vitro, en condiciones favorables al crecimiento, diferenciación o viabilidad continuada, en estado activo o quiescente, de las células, específicamente en un biorreactor controlado según métodos conocidos en la industria.The terms "cell culture" or "culture", also called "fermentation", with respect to a host cell line, means the maintenance of cells in an artificial environment, e.g. eg, in vitro, under conditions favorable to the growth, differentiation, or continued viability, in an active or quiescent state, of cells, specifically in a controlled bioreactor according to methods known in the industry.

Cuando se cultiva un cultivo celular utilizando el medio de cultivo de la presente invención, el cultivo celular se pone en contacto con el medio en un recipiente de cultivo o con el sustrato en condiciones adecuadas para soportar el cultivo del cultivo celular. En determinadas realizaciones, se utiliza un medio de cultivo como se describe en el presente documento para cultivar células de acuerdo con mecanismos de cultivo celular convencionales que son bien conocidos en la técnica. En varios aspectos de la invención, se proporciona un medio de cultivo que se puede utilizar para el crecimiento de células eucarióticas, específicamente levaduras u hongos filamentosos.When a cell culture is grown using the culture medium of the present invention, the cell culture is contacted with the medium in a culture vessel or with the substrate under conditions suitable for supporting growth of the cell culture. In certain embodiments, a culture medium as described herein is used to grow cells in accordance with conventional cell culture techniques that are well known in the art. In various aspects of the invention, a culture medium is provided that can be used for the growth of eukaryotic cells, specifically yeast or filamentous fungi.

Los medios de cultivo celular proporcionan los nutrientes necesarios para mantener y hacer crecer las células en un entorno controlado, artificial e in vitro. Las características y composiciones de los medios de cultivo celular varían dependiendo de los requisitos celulares particulares. Los parámetros importantes incluyen la osmolalidad, el pH y las formulaciones de nutrientes. La alimentación de nutrientes se puede realizar de forma continua o discontinua de acuerdo con métodos conocidos en la técnica. Los medios de cultivo utilizados según la invención son particularmente útiles para producir proteínas recombinantes.Cell culture media provide the nutrients necessary to maintain and grow cells in a controlled, artificial, in vitro environment. Characteristics and compositions of cell culture media vary depending on the particular cellular requirements. Important parameters include osmolality, pH, and nutrient formulations. Nutrient feeding can be done continuously or batchwise according to methods known in the art. The culture media used according to the invention are particularly useful for producing recombinant proteins.

Mientras que un procedimiento discontinuo es un modo de cultivo en el que todos los nutrientes necesarios para el cultivo de las células están contenidos en el medio de cultivo inicial, sin un suministro adicional de nutrientes adicionales durante la fermentación, en un procedimiento por lote alimentado, después de una fase discontinua, tiene lugar una fase de alimentación en la que se suministran uno o más nutrientes al cultivo mediante la alimentación. El propósito de la alimentación con nutrientes es aumentar la cantidad de biomasa para aumentar también la cantidad de proteína recombinante. Aunque en la mayoría de los procedimientos de cultivo el modo de alimentación es crítico e importante, la presente invención que emplea el promotor de la invención no está restringida con respecto a un cierto modo de cultivo.Whereas a batch process is a culture mode in which all the nutrients necessary for cell growth are contained in the initial culture medium, without an additional supply of additional nutrients during fermentation, in a fed-batch process, after a discontinuous phase, a feeding phase takes place in which one or more nutrients are supplied to the culture by feeding. The purpose of nutrient feeding is to increase the amount of biomass to also increase the amount of recombinant protein. Although in most cultivation methods the feeding mode is critical and important, the present invention employing the promoter of the invention is not restricted with respect to a certain cultivation mode.

En determinadas realizaciones, el método de la invención es un procedimiento por lote alimentado. Específicamente, una célula anfitriona transformada con una construcción de ácido nucleico que codifica una POI recombinante deseada, se cultiva en un medio en fase de crecimiento y se pasa a un medio en fase de producción para producir una POI recombinante deseada.In certain embodiments, the method of the invention is a fed-batch process. Specifically, a host cell transformed with a nucleic acid construct encoding a desired recombinant POI is cultured in growth phase medium and passaged into production phase medium to produce a desired recombinant POI.

En otra realización, las células anfitrionas de la presente invención se cultivan en modo continuo, p. ej. en un quimiostato. Un procedimiento de fermentación continua se caracteriza por una velocidad definida, constante y continua de alimentación de medio de cultivo de nueva aportación al biorreactor, mediante el cual el caldo de cultivo se retira al mismo tiempo del biorreactor a la misma tasa de eliminación definida, constante y continua. Al mantener el medio de cultivo, la tasa de alimentación y la tasa de eliminación al mismo nivel constante, los parámetros de cultivo y las condiciones en el biorreactor permanecen constantes.In another embodiment, the host cells of the present invention are cultured continuously, e.g. eg in a chemostat. A continuous fermentation process is characterized by a defined, constant and continuous rate of feed of fresh culture medium to the bioreactor, whereby the culture broth is withdrawn at the same time from the bioreactor at the same defined, constant removal rate. and continues. By keeping the culture medium, feed rate, and removal rate at the same constant level, the culture parameters and conditions in the bioreactor remain constant.

Se entiende específicamente que un cultivo celular estable como se describe en el presente documento se refiere a un cultivo celular que mantiene las propiedades genéticas, específicamente manteniendo alto el nivel de producción de POI, p. ej. al menos a un nivel de pg, incluso después de aproximadamente 20 generaciones de cultivo, preferiblemente al menos 30 generaciones, más preferiblemente al menos 40 generaciones, lo más preferido de al menos 50 generaciones. Específicamente, se proporciona una línea celular anfitriona recombinante estable que se considera una gran ventaja cuando se utiliza para producción a escala industrial.A stable cell culture as described herein is specifically understood to refer to a cell culture that maintains genetic properties, specifically by maintaining a high level of POI production, e.g. eg at least at a pg level, even after about 20 generations of culture, preferably at least 30 generations, more preferably at least 40 generations, most preferably at least 50 generations. Specifically, a stable recombinant host cell line is provided which is considered to be of great advantage when used for industrial scale production.

El cultivo celular de la invención es particularmente ventajoso para métodos a escala de fabricación industrial, p. ej. con respecto al volumen y al sistema técnico, combinado con un modo de cultivo que se basa en la alimentación de nutrientes, en particular un procedimiento por lote alimentado o discontinuo, o un procedimiento continuo o semicontinuo (p. ej., quimiostato).The cell culture of the invention is particularly advantageous for industrial manufacturing scale methods, e.g. eg with regard to volume and technical system, combined with a culture mode that is based on nutrient feeding, in particular a fed-batch or fed-batch process, or a continuous or semi-continuous process (eg chemostat).

Los términos "expresión" o "sistema de expresión" o "casete de expresión" se refieren a moléculas de ácido nucleico que contienen una secuencia codificante deseada y secuencias de control en conexión operable, de modo que los anfitriones transformados o transfectados con estas secuencias son capaces de producir las proteínas codificadas o los metabolitos de las células anfitrionas. Para efectuar la transformación, el sistema de expresión se puede incluir en un vector; sin embargo, el ADN relevante también se puede integrar en el cromosoma del anfitrión. La expresión se puede referir a productos de expresión secretados o no secretados, incluidos polipéptidos o metabolitos.The terms "expression" or "expression system" or "expression cassette" refer to nucleic acid molecules containing a desired coding sequence and control sequences in operable connection, such that hosts transformed or transfected with these sequences are capable of producing the encoded proteins or metabolites of host cells. To effect transformation, the expression system can be included in a vector; however, the relevant DNA can also be integrated into the host chromosome. The term can refer to secreted or non-secreted expression products, including polypeptides or metabolites.

"Construcciones de expresión" o "vectores" o "plásmido" utilizados en el presente documento se definen como secuencias de ADN que se requieren para la transcripción de secuencias de nucleótidos recombinantes clonadas, es decir, de genes recombinantes y la traducción de su ARNm en un organismo anfitrión adecuado. Los vectores de expresión o plásmidos generalmente comprenden un origen para la replicación autónoma en las células anfitrionas, marcadores seleccionables (p. ej., un gen de síntesis de aminoácidos o un gen que confiere resistencia a antibióticos tales como zeocina, kanamicina, G418 o higromicina), varios sitios de escisión para enzimas de restricción, una secuencia promotora adecuada y un terminador de la transcripción, cuyos componentes están conectados operablemente entre sí. Los términos "plásmido" y "vector", como se emplean en el presente documento, incluyen secuencias de nucleótidos que se replican de forma autónoma, así como secuencias de nucleótidos que integran el genoma."Expression constructs" or "vectors" or "plasmids" used herein are defined as DNA sequences that are required for the transcription of cloned recombinant nucleotide sequences, i.e., of recombinant genes and the translation of their mRNA into a suitable host organism. The vectors of expression or plasmids generally comprise an origin for autonomous replication in host cells, selectable markers (eg, an amino acid synthesis gene or a gene that confers resistance to antibiotics such as zeocin, kanamycin, G418, or hygromycin), various restriction enzyme cleavage sites, a suitable promoter sequence and a transcription terminator, the components of which are operably linked to each other. The terms "plasmid" and "vector" as used herein include autonomously replicating nucleotide sequences as well as nucleotide sequences that make up the genome.

La construcción de expresión de la invención comprende específicamente un promotor de la invención, conectado operablemente a una secuencia de nucleótidos que codifica una POI bajo el control transcripcional de dicho promotor, cuyo promotor no está asociado de forma nativa con la secuencia codificante de la POI.The expression construct of the invention specifically comprises a promoter of the invention, operably linked to a nucleotide sequence encoding a POI under the transcriptional control of said promoter, which promoter is not natively associated with the POI coding sequence.

El término "heterólogo" como se emplea en el presente documento con respecto a una secuencia de nucleótidos o aminoácidos o proteína, se refiere a un compuesto que es foráneo, es decir "exógeno", por ejemplo, que no se encuentra en la naturaleza, con respecto a una célula anfitriona dada; o que se encuentra naturalmente en una célula anfitriona dada, por ejemplo, es "endógeno", sin embargo, en el contexto de una construcción heteróloga, p. ej., que emplea un ácido nucleico heterólogo. La secuencia de nucleótidos heteróloga que se encuentra endógenamente también se puede producir en una cantidad no natural, p. ej. mayor de la esperada o mayor de la que se encuentra naturalmente, en la célula. La secuencia de nucleótidos heteróloga, o un ácido nucleico que comprende la secuencia de nucleótidos heteróloga, posiblemente tenga una secuencia diferente de la secuencia de nucleótidos endógena pero codifique la misma proteína que se encuentra endógenamente. Específicamente, las secuencias de nucleótidos heterólogas son aquellas que no se encuentran en la misma relación con una célula anfitriona en la naturaleza. Se entiende que cualquier secuencia de nucleótidos recombinante o artificial es heteróloga. Un ejemplo de un polinucleótido heterólogo es una secuencia de nucleótidos no asociada de forma nativa con el promotor según la invención, p. ej. para obtener un promotor híbrido, o conectada operablemente a una secuencia codificante, como se describe en el presente documento. Como resultado, se puede obtener un polinucleótido híbrido o quimérico. Un ejemplo adicional de un compuesto heterólogo es un polinucleótido que codifica una POI conectado operablemente a un elemento de control de la transcripción, p. ej., un promotor de la invención, al que una secuencia codificante de POI endógena de origen natural no está normalmente conectada operablemente.The term "heterologous" as used herein with respect to a nucleotide or amino acid sequence or protein, refers to a compound that is foreign, i.e. "exogenous", eg, not found in nature, with respect to a given host cell; or naturally occurring in a given host cell, for example, is "endogenous", however, in the context of a heterologous construct, e.g. eg, employing a heterologous nucleic acid. The heterologous nucleotide sequence that is found endogenously can also occur in an unnatural amount, e.g. eg greater than expected, or greater than that found naturally, in the cell. The heterologous nucleotide sequence, or a nucleic acid comprising the heterologous nucleotide sequence, possibly has a different sequence from the endogenous nucleotide sequence but encodes the same protein that is found endogenously. Specifically, heterologous nucleotide sequences are those that are not found in the same relationship to a host cell in nature. Any recombinant or artificial nucleotide sequence is understood to be heterologous. An example of a heterologous polynucleotide is a nucleotide sequence not natively associated with the promoter according to the invention, e.g. eg to obtain a hybrid promoter, or operably linked to a coding sequence, as described herein. As a result, a hybrid or chimeric polynucleotide can be obtained. A further example of a heterologous compound is a polynucleotide encoding a POI operably linked to a transcriptional control element, e.g. eg, a promoter of the invention, to which a naturally occurring endogenous POI coding sequence is not normally operably linked.

El término "variante" como se emplea en el presente documento en el contexto de la presente invención se referirá a cualquier secuencia con una identidad de secuencia específica u homología con una secuencia parental comparable. Una variante es específicamente cualquier secuencia obtenida a partir de una secuencia parental, p. ej., por variación de tamaño, tal como elongación (terminal o no terminal, tal como "intersticial", es decir, con deleciones o inserciones dentro de la secuencia de nucleótidos) o fragmentación, mutación, hibridación (incluyendo combinación de secuencias).The term "variant" as used herein in the context of the present invention shall refer to any sequence with specific sequence identity or homology to a comparable parental sequence. A variant is specifically any sequence derived from a parent sequence, e.g. eg, by size variation, such as elongation (terminal or non-terminal, such as "interstitial", ie, with deletions or insertions within the nucleotide sequence) or fragmentation, mutation, hybridization (including combination of sequences).

El promotor pG1-x como se describe en el presente documento es específicamente una variante artificial del promotor pG1 nativo (tipo salvaje). Aunque existe un cierto grado de identidad de secuencia con la estructura nativa, se entiende bien que los materiales, métodos y usos de la invención, p. ej. que se refieren específicamente a secuencias de ácido nucleico aisladas, secuencias de aminoácidos, construcciones de expresión, células anfitrionas transformadas y proteínas recombinantes, son "hechas por el hombre" o sintéticas y, por lo tanto, no se consideran un resultado de la "ley de la naturaleza".The pG1-x promoter as described herein is specifically an artificial variant of the native (wild-type) pG1 promoter. Although there is a certain degree of sequence identity to the native structure, it is well understood that the materials, methods and uses of the invention, e.g. eg which refer specifically to isolated nucleic acid sequences, amino acid sequences, expression constructs, transformed host cells, and recombinant proteins, are "man-made" or synthetic and are therefore not considered a result of "law of the nature".

El promotor denominado en el presente documento "promotor pG1-x" es una variante del promotor pG1 y su secuencia de nucleótidos se puede producir mediante mutagénesis del promotor pG1 que se utiliza como secuencia "parental" para producir una variante. Un promotor pG1-x incluye un promotor que comprende dos, tres, cuatro o más copias de SEQ ID 2, SEQ ID 3, SEQ ID 4 o SEQ ID 5.The promoter referred to herein as "pG1-x promoter" is a variant of the pG1 promoter and its nucleotide sequence can be produced by mutagenesis of the pG1 promoter which is used as the "parent" sequence to produce a variant. A pG1-x promoter includes a promoter comprising two, three, four or more copies of SEQ ID 2, SEQ ID 3, SEQ ID 4 or SEQ ID 5.

Una serie de promotores pG1-x se ilustra, p. ej., por el promotor que comprende o consiste en cualquiera de las secuencias ilustradas en la Figura 6b, en particular cualquiera de las siguientes secuencias:A series of pG1-x promoters is illustrated, e.g. g., by the promoter comprising or consisting of any of the sequences illustrated in Figure 6b, in particular any of the following sequences:

a) SEQ ID 37-44, preferiblemente cualquiera de SEQ ID 45-76;a) SEQ ID 37-44, preferably any of SEQ ID 45-76;

b) SEQ ID 77-80, preferiblemente cualquiera de SEQ ID 81-112;b) SEQ ID 77-80, preferably any of SEQ ID 81-112;

c) SEQ ID 113-114, preferiblemente cualquiera de SEQ ID 115-130;c) SEQ ID 113-114, preferably any of SEQ ID 115-130;

d) SEQ ID 131-132, preferiblemente cualquiera de SEQ ID 133-148;d) SEQ ID 131-132, preferably any of SEQ ID 133-148;

e) SEQ ID 185-186, preferiblemente cualquiera de SEQ ID 187-202e) SEQ ID 185-186, preferably any of SEQ ID 187-202

Un promotor pG1-x también incluye fragmentos 3' de uno cualquiera de SEQ ID 37 a SEQ ID 202 en donde parte o todo el extremo 5' terminal hasta la primera región o región reguladora principal 5' se ha eliminado; preferiblemente, se eliminan hasta 50, 100, 150, 200, 250, 300, 320 o 325 nucleótidos del extremo 5' terminal de uno cualquiera de SEQ ID 37 a SEQ ID 202. A pG1-x promoter also includes 3' fragments of any one of SEQ ID 37 to SEQ ID 202 in which part or all of the 5' terminus to the first region or 5' major regulatory region has been deleted; Preferably, up to 50, 100, 150, 200, 250, 300, 320 or 325 nucleotides are removed from the 5' terminus of any one of SEQ ID 37 to SEQ ID 202.

El promotor pG1-x se caracteriza por tener un aumento de fuerza del promotor y/o razón de inducción en comparación con el promotor pG1, en dondeThe pG1-x promoter is characterized by having an increased promoter strength and/or induction ratio compared to the pG1 promoter, where

- la fuerza del promotor es al menos 1,1 veces mayor en el estado inducido en comparación con el promotor pG1, y/o- the strength of the promoter is at least 1.1-fold higher in the induced state compared to the pG1 promoter, and/or

- la razón de inducción es al menos 1,1 veces mayor en comparación con el promotor pG1.- the induction ratio is at least 1.1 times higher compared to the pG1 promoter.

Otras variantes de pG1-x son factibles, por ejemplo, utilizando el promotor pG1-x ilustrado en la Figura 6b, o variantes de tamaño, en particular variantes alargadas o fragmentos de las mismas, como secuencias "parentales" para producir variantes por mutagénesis de ciertas regiones, en particular tales, que se mantengan o incluso mejoren los elementos y funciones esenciales del promotor. Las variantes del promotor pG1-x pueden, por ejemplo, obtenerse a partir de cualquiera de las secuencias del promotor pG1-x ilustradas mediante mutagénesis para producir secuencias adecuadas para su uso como promotor en líneas celulares recombinantes. Tal promotor variante se puede obtener a partir de una biblioteca de secuencias mutantes seleccionando los miembros de la biblioteca con propiedades predeterminadas. Los promotores variantes pueden tener propiedades iguales o incluso mejoradas, p. ej. mejoradas en la fuerza del promotor, la inducción de la producción de p O i, con un efecto diferencial aumentado en condiciones de represión y desrepresión (en particular, la razón de inducción). El promotor variante también puede comprender una secuencia de nucleótidos de secuencias análogas, p. ej. de especies eucariotas distintas de Pichia pastoris o de un género distinto de Pichia, tal como de K. lactis, Z. rouxii, P. stipitis, H. polymorpha. Other variants of pG1-x are feasible, for example, using the pG1-x promoter illustrated in Figure 6b, or size variants, in particular elongated variants or fragments thereof, as "parent" sequences to produce variants by gene mutagenesis. certain regions, in particular such, that the essential elements and functions of the promoter are maintained or even improved. Variants of the pG1-x promoter can, for example, be obtained from any of the illustrated pG1-x promoter sequences by mutagenesis to produce sequences suitable for use as promoters in recombinant cell lines. Such a variant promoter can be obtained from a library of mutant sequences by selecting library members with predetermined properties. Variant promoters may have the same or even improved properties, e.g. eg enhanced in promoter strength, induction of p O i production, with increased differential effect under repressive and derepressive conditions (in particular, the rate of induction). The variant promoter may also comprise a nucleotide sequence of analogous sequences, e.g. eg from eukaryotic species other than Pichia pastoris or from a genus other than Pichia, such as K. lactis, Z. rouxii, P. stipitis, H. polymorpha.

El término "funcionalmente activo" como se utiliza en el presente documento con respecto a, p. ej., una variante del promotor, el promotor pG1-x o una variante de un promotor pG1-x como se describe en el presente documento o una variante del promotor pG1, significa una secuencia variante resultante de la modificación de una secuencia parental por mutagénesis, específicamente por inserción, deleción o sustitución de uno o más nucleótidos dentro de la secuencia o en uno o en ambos extremos distales de la secuencia, y cuya modificación no afecta a (en particular perjudica) la actividad de esta secuencia. Con respecto al promotor pG1 -x como se describe en el presente documento, la función y la actividad se caracterizan específicamente por la actividad y la fuerza del promotor, así como por la razón de inducción.The term "functionally active" as used herein with respect to, e.g. e.g., a promoter variant, the pG1-x promoter or a variant of a pG1-x promoter as described herein or a pG1 promoter variant, means a variant sequence resulting from modification of a parent sequence by mutagenesis , specifically by insertion, deletion or substitution of one or more nucleotides within the sequence or at one or both distal ends of the sequence, and whose modification does not affect (in particular impairs) the activity of this sequence. With respect to the pG1-x promoter as described herein, function and activity are specifically characterized by the activity and strength of the promoter, as well as the rate of induction.

Las variantes del promotor funcionalmente activas como se describen en el presente documento se caracterizan específicamente por exhibir sustancialmente la misma actividad del promotor que el promotor pG1 (+/- 10%, o /- 5%), o incluso superior.Functionally active promoter variants as described herein are specifically characterized as exhibiting substantially the same promoter activity as the pG1 promoter (+/- 10%, or /- 5%), or even higher.

Las variantes de promotor funcionalmente activas como se describen en el presente documento se caracterizan específicamente por exhibir sustancialmente las mismas propiedades regulables que el promotor pG1, p. ej., medidas por la razón de inducción (+/- 10%, o /- 5%), o una razón de inducción incluso mayor.Functionally active promoter variants as described herein are specifically characterized as exhibiting substantially the same regulatable properties as the pG1 promoter, e.g. measured by the induction ratio (+/- 10%, or /- 5%), or an even higher induction ratio.

El término "promotor", como se emplea en el presente documento, se refiere a una secuencia de ADN capaz de controlar la expresión de una secuencia codificante o ARN funcional. La actividad del promotor se puede evaluar por su eficacia transcripcional. Esto se puede determinarse directamente midiendo la cantidad de transcripción de ARNm del promotor, p. ej. mediante Transferencia Northern o indirectamente mediante la medición de la cantidad de producto génico expresado a partir del promotor.The term "promoter" as used herein refers to a DNA sequence capable of controlling the expression of a functional RNA or coding sequence. Promoter activity can be assessed by its transcriptional efficiency. This can be determined directly by measuring the amount of mRNA transcript from the promoter, e.g. eg by Northern Blot or indirectly by measuring the amount of gene product expressed from the promoter.

El promotor pG1-x como se describe en el presente documento inicia, regula o media de otro modo o controla específicamente la expresión de un ADN codificante. El ADN promotor y el ADN codificante pueden ser del mismo gen o de diferentes genes, y pueden ser del mismo organismo o de diferentes organismos.The pG1-x promoter as described herein specifically initiates, regulates or otherwise mediates or controls the expression of an encoding DNA. The promoter DNA and the coding DNA may be from the same gene or from different genes, and may be from the same organism or from different organisms.

Se entiende específicamente que el promotor pG1-x como se describe en el presente documento es un promotor regulable, en particular un promotor regulable por fuente de carbono con diferente fuerza de promotor en el estado reprimido e inducido.It is specifically understood that the pG1-x promoter as described herein is a regulatable promoter, in particular a carbon source regulatable promoter with different promoter strength in the repressed and induced state.

La fuerza del promotor de la invención se refiere específicamente a su fuerza de transcripción, representada por la eficiencia del inicio de la transcripción que se produce en ese promotor con alta o baja frecuencia. Cuanto mayor sea la fuerza de transcripción, más frecuentemente se producirá la transcripción en ese promotor. La fuerza del promotor es importante, porque determina la frecuencia con la que se transcribe una secuencia de ARNm determinada, lo que otorga una mayor prioridad a la transcripción de algunos genes sobre otros, lo que conduce a una mayor concentración del transcrito. Un gen que codifica una proteína que se requiere en grandes cantidades, por ejemplo, típicamente tiene un promotor relativamente fuerte. La ARN polimerasa solo puede realizar una tarea de transcripción a la vez y, por lo tanto, debe priorizar su trabajo para ser eficiente. Las diferencias en la fuerza del promotor se seleccionan para permitir esta priorización.The strength of the promoter of the invention refers specifically to its transcriptional strength, represented by the efficiency of transcription initiation that occurs at that promoter at high or low frequency. The higher the transcription strength, the more frequently transcription will occur at that promoter. Promoter strength is important, because it determines how often a given mRNA sequence is transcribed, giving higher priority to the transcription of some genes over others, leading to a higher concentration of the transcript. A gene that encodes a protein that is required in large quantities, for example, typically has a relatively strong promoter. RNA polymerase can only perform one transcription task at a time, and therefore must prioritize its work to be efficient. Differences in promoter strength are selected to allow for this prioritization.

Según la invención, el promotor regulable es relativamente fuerte en el estado completamente inducido, que se entiende típicamente como el estado de actividad aproximadamente máxima.According to the invention, the regulatable promoter is relatively strong in the fully induced state, which is typically understood as the state of approximately maximal activity.

La fuerza relativa se determina comúnmente con respecto a un promotor comparable, tal como el promotor pG1, o un promotor convencional, tal como el promotor pGAP respectivo de la célula que se utiliza como célula anfitriona. La frecuencia de transcripción se entiende comúnmente como la tasa de transcripción, p. ej. determinada por la cantidad de un transcrito en un ensayo adecuado, p. ej. RT-PCR o transferencia Northern. Por ejemplo, la fuerza de transcripción de un promotor según la invención se determina en la célula anfitriona que es P. pastoris y en comparación con el promotor pGAP nativo de P. pastoris. Relative strength is commonly determined relative to a comparable promoter, such as the pG1 promoter, or a conventional promoter, such as the respective pGAP promoter of the cell being used as the host cell. Transcription frequency is commonly understood as the rate of transcription, e.g. eg determined by the amount from a transcript in a suitable assay, e.g. eg RT-PCR or Northern blot. For example, the transcriptional strength of a promoter according to the invention is determined in the host cell which is P. pastoris and compared to the native P. pastoris pGAP promoter.

La fuerza de un promotor para expresar un gen de interés se entiende comúnmente como la fuerza de expresión o la capacidad de soportar un nivel/tasa de expresión altos. Por ejemplo, la fuerza de expresión y/o transcripción de un promotor de la invención se determina en la célula anfitriona que es P. pastoris y se compara con el promotor pGAP nativo de P. pastoris. The strength of a promoter to express a gene of interest is commonly understood as the strength of expression or the ability to support a high level/rate of expression. For example, the expression and/or transcription strength of a promoter of the invention is determined in the host cell which is P. pastoris and compared to the native P. pastoris pGAP promoter.

La fuerza de transcripción comparativa que emplea el promotor pGAP como referencia (patrón) se puede determinar por medios convencionales, por ejemplo midiendo la cantidad de transcritos, p. ej. empleando una micromatriz, o también en un cultivo celular, tal como midiendo la cantidad de productos de expresión génica respectivos en células recombinantes. Una prueba ilustrativa se representa en la sección de Ejemplos.Comparative transcriptional strength using the pGAP promoter as a reference (standard) can be determined by conventional means, for example by measuring the amount of transcripts, e.g. eg using a microarray, or also in cell culture, such as by measuring the amount of respective gene expression products in recombinant cells. An illustrative test is depicted in the Examples section.

En particular, la tasa de transcripción puede ser determinada por la fuerza de transcripción en una micromatriz, o con PCR cuantitativa en tiempo real (qRT-PCR) donde los datos de la micromatriz o qRT-PCR muestran la diferencia de nivel de expresión entre condiciones con alta tasa de crecimiento y condiciones con baja tasa de crecimiento, o condiciones que emplean diferentes composiciones de medios, y una alta intensidad de señal en comparación con el promotor pGAP nativo.In particular, the transcription rate can be determined by the strength of transcription on a microarray, or with quantitative real-time PCR (qRT-PCR) where the microarray or qRT-PCR data show the difference in expression level between conditions. with high growth rate and low growth rate conditions, or conditions employing different media compositions, and a high signal intensity compared to the native pGAP promoter.

La tasa de expresión se puede determinar, por ejemplo, por la cantidad de expresión de un gen indicador, como eGFP. The expression rate can be determined, for example, by the amount of expression of a reporter gene, such as eGFP.

El promotor pG1-x como se describe en el presente documento ejerce una fuerza de transcripción relativamente alta, reflejada por una tasa de transcripción o fuerza de transcripción de al menos 15% en comparación con el promotor pGAP nativo en la célula anfitriona, a veces llamado "promotor pGAP homólogo". Preferiblemente, la tasa o fuerza de transcripción es al menos 20%, en casos específicamente preferidos al menos 30%, al menos 40%, al menos 50%, al menos 60%, al menos 70%, al menos 80%, al menos 90% y al menos 100% o incluso más, tal como al menos 150% o al menos 200% en comparación con el promotor pGAP nativo, p. ej. determinada en la célula eucariótica seleccionada como célula anfitriona para producir la POI.The pG1-x promoter as described herein exerts a relatively high transcriptional strength, reflected by a transcription rate or transcriptional strength of at least 15% compared to the native pGAP promoter in the host cell, sometimes called "homologous pGAP promoter". Preferably, the rate or strength of transcription is at least 20%, in specifically preferred cases at least 30%, at least 40%, at least 50%, at least 60%, at least 70%, at least 80%, at least 90% and at least 100% or even more, such as at least 150% or at least 200% compared to the native pGAP promoter, e.g. eg determined in the eukaryotic cell selected as the host cell to produce the POI.

El promotor pGAP nativo típicamente inicia la expresión del gen gap que codifica gliceraldehído-3-fosfato deshidrogenasa (GAPDH), que es un promotor constitutivo presente en la mayoría de los organismos vivos. GAPDH (EC 1\2\1\12), una enzima clave de la glucólisis y la gluconeogénesis, juega un papel crucial en el metabolismo catabólico y anabólico de los carbohidratos.The native pGAP promoter typically initiates expression of the gap gene encoding glyceraldehyde-3-phosphate dehydrogenase (GAPDH), which is a constitutive promoter present in most living organisms. GAPDH (EC 1\2\1\12), a key enzyme of glycolysis and gluconeogenesis, plays a crucial role in the catabolic and anabolic metabolism of carbohydrates.

El promotor pGAP nativo es específicamente activo en una célula eucariótica recombinante de una manera similar a la de una célula eucariótica nativa de la misma especie o cepa, incluyendo la célula eucariótica no modificada (no recombinante) o recombinante. Se entiende comúnmente que tal promotor pGAP nativo es un promotor endógeno, por lo tanto, homólogo a la célula eucariótica, y sirve como promotor convencional o de referencia con fines de comparación.The native pGAP promoter is specifically active in a recombinant eukaryotic cell in a manner similar to that in a native eukaryotic cell of the same species or strain, including unmodified (nonrecombinant) or recombinant eukaryotic cell. Such a native pGAP promoter is commonly understood to be an endogenous promoter, thus homologous to the eukaryotic cell, and serves as a standard or reference promoter for comparison purposes.

Por ejemplo, un promotor pGAP nativo de P. pastoris es la secuencia promotora endógena no modificada en P. pastoris, como se utiliza para controlar la expresión de GAPDH en P. pastoris, p.ej. que tiene la secuencia mostrada en la Figura 13: secuencia del promotor pGAP nativo de P. pastoris (GS115) (SEC ID 260). Si P. pastoris se utiliza como anfitrión para producir una POI según la invención, la fuerza o tasa de transcripción del promotor según la invención se compara con tal promotor pGAP nativo de P. pastoris. For example, a native P. pastoris pGAP promoter is the unmodified endogenous promoter sequence in P. pastoris, as used to control GAPDH expression in P. pastoris, eg, having the sequence shown in Figure 13 : P. pastoris native pGAP promoter sequence (GS115) (SEQ ID 260). If P. pastoris is used as a host to produce a POI according to the invention, the strength or rate of transcription of the promoter according to the invention is compared to such native P. pastoris pGAP promoter.

Como otro ejemplo, un promotor pGAP nativo de S. cerevisiae es la secuencia promotora endógena no modificada en S. cerevisiae, que se emplea para controlar la expresión de GAPDH en S. cerevisiae. Si S. cerevisiae se utiliza como anfitrión para producir una POI según la invención, la fuerza o tasa de transcripción del promotor según la invención se compara con tal promotor pGAP nativo de S. cerevisiae. As another example, a native S. cerevisiae pGAP promoter is the unmodified endogenous promoter sequence in S. cerevisiae, which is used to control GAPDH expression in S. cerevisiae. If S. cerevisiae is used as a host to produce a POI according to the invention, the strength or rate of transcription of the promoter according to the invention is compared to such a native S. cerevisiae pGAP promoter.

Por tanto, la expresión relativa o la fuerza de transcripción de un promotor según la invención se compara habitualmente con el promotor pGAP nativo de una célula de la misma especie o cepa que se utiliza como anfitrión para producir una POI.Thus, the relative expression or transcriptional strength of a promoter according to the invention is usually compared to the native pGAP promoter of a cell of the same species or strain that is used as a host to produce a POI.

El término "regulable" con respecto a un promotor pG1 -x o un promotor pG1 como se utiliza en el presente documento se referirá a un promotor que está reprimido en una célula eucariótica en presencia de una cantidad en exceso de una fuente de carbono (nutriente o sustrato basal) en la fase de crecimiento de un cultivo discontinuo, y desreprimido para ejercer una fuerte actividad promotora en la fase de producción de una línea celular de producción, p. ej. tras la reducción de la cantidad de carbono, tal como tras la alimentación de una fuente de carbono que limita el crecimiento (nutriente o sustrato complementario) a un cultivo de acuerdo con la estrategia por lote alimentado. En este sentido, el término "regulable" se entiende como "regulable por límite de fuente de carbono" o "regulable por límite de glucosa", refiriéndose a la des-represión de un promotor por consumo, reducción, deficiencia o agotamiento de carbono, o por adición limitada de la fuente de carbono para que las células lo consuman fácilmente.The term "regulatable" with respect to a pG1-x promoter or a pG1 promoter as used herein shall refer to a promoter that is repressed in a eukaryotic cell in the presence of an excess amount of a carbon source (nutrient or basal substrate) in the growth phase of a batch culture, and derepressed to exert strong promoter activity in the production phase of a production cell line, e.g. eg upon reduction of the amount of carbon, such as upon feeding a growth-limiting carbon source (supplementary nutrient or substrate) to a crop according to the fed-batch strategy. In this sense, the term "regulatable" is understood as "carbon source limit-regulatable" or "glucose limit-regulatable", referring to the de-repression of a promoter by carbon consumption, reduction, deficiency or depletion, or by limited addition of the carbon source so that it is easily consumed by cells.

El promotor pG1-x funcionalmente activo como se describe en el presente documento es un promotor regulable relativamente fuerte que se silencia o reprime en condiciones de crecimiento celular (fase de crecimiento) y se activa o des-reprime en condiciones de producción (fase de producción) y, por lo tanto, es adecuado para inducir la producción de POI en una línea celular de producción limitando la fuente de carbono.The functionally active pG1-x promoter as described herein is a relatively strong regulatable promoter that is silenced or repressed under conditions of cell growth (growth phase) and activated or de-represses under production conditions (production phase) and is therefore suitable for inducing POI production in a production cell line by limiting the carbon source.

Específicamente, el promotor como se describe en el presente documento es regulable por fuente de carbono con una fuerza diferencial del promotor según se determina en una prueba que compara su fuerza en presencia de glucosa y limitación de glucosa, lo que demuestra que todavía está reprimido a concentraciones de glucosa relativamente altas, preferiblemente a concentraciones de al menos 10 g/L, preferiblemente al menos 20 g/L. Específicamente, el promotor de acuerdo con la invención se induce completamente a concentraciones limitadas de glucosa y concentraciones umbral de glucosa que inducen completamente el promotor, cuyo umbral es menos de 20 g/L, preferiblemente menos de 10 g/L, menos de 1 g/L, incluso menos de 0,1 g/L o menos de 50 mg/L, preferiblemente con una fuerza de transcripción completa de p. ej. al menos 50% de la del promotor pGAP homólogo nativo, a concentraciones de glucosa de menos de 40 mg/L.Specifically, the promoter as described herein is carbon source regulatable with differential promoter strength as determined in a test comparing its strength in the presence of glucose and glucose limitation, demonstrating that it is still repressed at relatively high glucose concentrations, preferably at concentrations of at least 10 g/L, preferably at least 20 g/L. Specifically, the promoter according to the invention is fully induced at limited concentrations of glucose and threshold concentrations of glucose that fully induce the promoter, which threshold is less than 20 g/L, preferably less than 10 g/L, less than 1 g /L, even less than 0.1 g/L or less than 50 mg/L, preferably with a complete transcriptional strength of p. eg at least 50% of that of the native homologous pGAP promoter, at glucose concentrations of less than 40 mg/L.

Preferiblemente, la razón de inducción se entiende como una fuerza promotora diferencial que se determina mediante el inicio de la producción de POI al cambiar a condiciones inductoras por debajo de un umbral de fuente de carbono predeterminado, y se compara con la fuerza en el estado reprimido. La fuerza de la transcripción se entiende comúnmente como la fuerza en el estado completamente inducido, es decir, que muestra las actividades aproximadamente máximas en condiciones de desrepresión. La fuerza diferencial del promotor es, p. ej. determinada de acuerdo con la eficiencia o el rendimiento de la producción de POI en una línea celular anfitriona recombinante en condiciones de desrepresión en comparación con las condiciones de represión, o también por la cantidad de un transcrito. El promotor regulable de acuerdo con la invención tiene una fuerza de promotor diferencial preferida, que es al menos 2 veces, más preferiblemente al menos 5 veces, incluso más preferida al menos 10 veces, más preferida al menos 20 veces, más preferiblemente al menos 30, 40, 50 o 100 veces en el estado des-reprimido en comparación con el estado reprimido, también entendido como multiplicidad de inducción.Preferably, the induction ratio is understood as a differential promoting force that is determined by the initiation of POI production upon switching to inducing conditions below a predetermined carbon source threshold, and compared to the force in the repressed state. . Transcriptional strength is commonly understood as the strength in the fully induced state, ie showing approximately maximal activities under derepressed conditions. The differential strength of the promoter is e.g. eg determined according to the efficiency or yield of POI production in a recombinant host cell line under derepression conditions compared to repression conditions, or also by the amount of a transcript. The regulatable promoter according to the invention has a preferred differential promoter strength, which is at least 2-fold, more preferably at least 5-fold, even more preferred at least 10-fold, more preferred at least 20-fold, most preferably at least 30-fold. , 40, 50 or 100 times in the de-repressed state compared to the repressed state, also understood as multiplicity of induction.

El término "identidad de secuencia" de una variante en comparación con una secuencia parental indica el grado de identidad (u homología) en el que dos o más secuencias de nucleótidos tienen pares de bases iguales o conservados en una posición correspondiente, hasta cierto grado, hasta un grado cercano al 100%. Una secuencia homóloga tiene típicamente al menos aproximadamente 50% de identidad de secuencia de nucleótidos, preferiblemente al menos aproximadamente 60% de identidad, más preferiblemente al menos aproximadamente 70% de identidad, más preferiblemente al menos aproximadamente 80% de identidad, más preferiblemente al menos aproximadamente 90% de identidad, más preferiblemente al menos aproximadamente 95% de identidad.The term "sequence identity" of a variant compared to a parental sequence indicates the degree of identity (or homology) in which two or more nucleotide sequences have the same or conserved base pairs in a corresponding position, to some degree, to a degree close to 100%. A homologous sequence typically has at least about 50% nucleotide sequence identity, preferably at least about 60% identity, more preferably at least about 70% identity, more preferably at least about 80% identity, more preferably at least about 90% identity, more preferably at least about 95% identity.

El "porcentaje (%) de identidad" con respecto a la secuencia de nucleótidos, p. ej., de un promotor o un gen, se define como el porcentaje de nucleótidos en una secuencia de ADN candidata que es idéntica a los nucleótidos en la secuencia de ADN, después de alinear la secuencia e introducir huecos, si fuera necesario, para lograr el porcentaje máximo de identidad de secuencia, y no considerar sustituciones conservativas como parte de la identidad de secuencia. El alineamiento con el propósito de determinar el porcentaje de identidad de la secuencia de nucleótidos se puede lograr de varias formas que están dentro del conocimiento práctico de la técnica, por ejemplo, utilizando soporta lógico informático disponible públicamente. Los expertos en la técnica pueden determinar los parámetros apropiados para medir el alineamiento, incluidos los algoritmos necesarios para lograr el alineamiento máximo en toda la longitud de las secuencias que se comparan. Para los fines de la presente invención, la identidad de secuencia entre dos secuencias de nucleótidos se determina utilizando el programa BLAST versión 2.2.29 (06-ene-2014) del NCBI con blastn establecido en los siguientes parámetros ilustrativos: Tamaño de Palabra: 11; Valor esperado: 10; Penalización por hueco: Existencia = 5, Extensión = 2; Filtro = activado por baja complejidad; Puntuaciones de emparejamiento/emparejamiento erróneo: 2, -3; Cordón “String” de filtro: L; m.The "percent (%) identity" with respect to the nucleotide sequence, e.g. g., from a promoter or a gene, is defined as the percentage of nucleotides in a candidate DNA sequence that are identical to the nucleotides in the DNA sequence, after aligning the sequence and introducing gaps, if necessary, to achieve the maximum percentage of sequence identity, and do not consider conservative substitutions as part of the sequence identity. Alignment for the purpose of determining percent nucleotide sequence identity can be accomplished in a number of ways that are within the skill of the art, for example, using publicly available computer software. Those skilled in the art can determine the appropriate parameters to measure alignment, including the algorithms necessary to achieve maximal alignment over the full length of the sequences being compared. For purposes of the present invention, sequence identity between two nucleotide sequences is determined using the NCBI BLAST program version 2.2.29 (06-Jan-2014) with blastn set to the following illustrative parameters: Word Size: 11 ; Expected value: 10; Gap Penalty: Existence = 5, Extension = 2; Filter = activated by low complexity; Match/Mismatch Scores: 2, -3; Filter “String” cord: L; m.

El término "mutagénesis" como se utiliza en el contexto de la presente invención se referirá a un método para proporcionar mutantes de una secuencia de nucleótidos, p. ej. mediante inserción, deleción y/o sustitución de uno o más nucleótidos, para obtener variantes de los mismos con al menos un cambio en la región codificante o no codificante. La mutagénesis puede ser por mutación aleatoria, semi-aleatoria o dirigida al sitio. Las variantes del promotor de pG1-x específicas se obtienen a partir de la secuencia del promotor pG1 mediante un método de mutagénesis utilizando la secuencia de nucleótidos de pG1 como secuencia parental. Tal método de mutagénesis abarca aquellos métodos de modificación mediante ingeniería genética del ácido nucleico o síntesis de novo de una secuencia de nucleótidos utilizando la información de la secuencia del promotor pG1 como molde. Los métodos de mutagénesis específicos aplican la modificación mediante ingeniería genética de promotores racional.The term "mutagenesis" as used in the context of the present invention shall refer to a method of providing mutants of a nucleotide sequence, e.g. eg by insertion, deletion and/or substitution of one or more nucleotides, to obtain variants thereof with at least one change in the coding or non-coding region. Mutagenesis can be by random, semi-random, or site-directed mutation. Specific pG1-x promoter variants are obtained from the pG1 promoter sequence by a mutagenesis method using the pG1 nucleotide sequence as the parent sequence. Such a method of mutagenesis encompasses those methods of nucleic acid engineering or de novo synthesis of a nucleotide sequence using the sequence information of the pG1 promoter as a template. Specific mutagenesis methods apply rational promoter engineering.

El promotor pG1-x se puede producir mediante mutagénesis del promotor pG1, y se pueden producir adicionalmente variantes del promotor pG1-x como se describe en el presente documento, incluidas variantes funcionalmente activas, empleando técnicas convencionales. El promotor puede, p. ej. modificarse para generar variantes del promotor con niveles de expresión y propiedades reguladoras alterados. Por ejemplo, se puede preparar una biblioteca de promotores mediante mutagénesis de secuencias de promotores seleccionadas, que se pueden utilizar como moléculas parentales, p. ej. para ajustar la expresión génica en células eucarióticas analizando variantes para su expresión bajo diferentes estrategias de fermentación y seleccionando variantes adecuadas. Se puede utilizar una biblioteca sintética de variantes, p. ej. para seleccionar un promotor que cumpla con los requisitos para producir una POI seleccionada. Tales variantes pueden tener una mayor eficiencia de expresión en células anfitrionas eucarióticas y una expresión diferencial en condiciones limitantes y ricas en fuentes de carbono. Típicamente, se producen grandes bibliotecas de genes aleatorizadas con una alta diversidad de genes, que se pueden seleccionar de acuerdo con un genotipo o fenotipo específicamente deseados.The pG1-x promoter can be produced by mutagenesis of the pG1 promoter, and variants of the pG1-x promoter can be further produced as described herein, including functionally active variants, using standard techniques. The promoter can e.g. eg modified to generate promoter variants with altered expression levels and regulatory properties. For example, a library of promoters can be prepared by mutagenesis of selected promoter sequences, which can be used as parent molecules, e.g. eg to tune gene expression in eukaryotic cells by screening variants for expression under different fermentation strategies and selecting suitable variants. A synthetic library of variants, e.g. eg to select a promoter who meets the requirements to produce a selected POI. Such variants may have higher expression efficiency in eukaryotic host cells and differential expression under limiting and carbon source-rich conditions. Typically, large randomized gene libraries with a high diversity of genes, which can be selected according to a specifically desired genotype or phenotype.

Algunos de los promotores pG1-x preferidos como se describen en el presente documento son variantes de tamaño del promotor pG1 y comprenden más de una copia de ciertos elementos o regiones del promotor, o comprenden uno o más fragmentos (iguales o diferentes) del promotor pG1.Some of the preferred pG1-x promoters as described herein are size variants of the pG1 promoter and comprise more than one copy of certain promoter elements or regions, or comprise one or more fragments (same or different) of the pG1 promoter. .

Los métodos de mutagénesis específicos proporcionan mutaciones puntuales de uno o más nucleótidos en una secuencia, en particular mutaciones puntuales en tándem, como para cambiar al menos 2, 3, 4, 5, 6, 7, 8, 9, 10 o incluso más nucleótidos continuos dentro de la secuencia de nucleótidos del promotor. Tal mutación es típicamente al menos una de una deleción, inserción y/o sustitución de uno o más nucleótidos. La secuencia promotora puede estar mutada en los extremos distales, en particular dentro de la región 5' que asciende hasta 50% de la secuencia de nucleótidos, que puede ser muy variable sin perder sustancialmente la actividad promotora. La secuencia promotora se puede mutar específicamente dentro de la región reguladora principal, sin embargo, se prefiere que la identidad de secuencia con la región reguladora principal parental de pG1 y en particular con la región reguladora central parental sea alta, tal como p. ej. al menos 80%. Dentro de la región reguladora principal, pero fuera de la región reguladora central, la variabilidad de la secuencia puede ser mayor para obtener una identidad de secuencia de menos de 80%. Specific mutagenesis methods provide point mutations of one or more nucleotides in a sequence, in particular tandem point mutations, such as to change at least 2, 3, 4, 5, 6, 7, 8, 9, 10 or even more nucleotides. continuous within the promoter nucleotide sequence. Such mutation is typically at least one of a deletion, insertion and/or substitution of one or more nucleotides. The promoter sequence may be mutated at the distal ends, particularly within the 5' region amounting to up to 50% of the nucleotide sequence, which may be highly variable without substantially losing promoter activity. The promoter sequence may be specifically mutated within the major regulatory region, however it is preferred that the sequence identity to the parent major regulatory region of pG1 and in particular the parent core regulatory region is high, such as e.g. eg at least 80%. Within the core regulatory region, but outside the core regulatory region, sequence variability can be greater to obtain less than 80% sequence identity.

La región reguladora central incorpora específicamente SEC ID 2 y SEC ID 3, que representan los sitios de unión del factor de transcripción (TFBS) y una región intersticial entre SEC ID 2 y SEC ID 3.The core regulatory region specifically incorporates SEQ ID 2 and SEQ ID 3, which represent transcription factor binding sites (TFBS), and an interstitial region between SEQ ID 2 and SEQ ID 3.

La secuencia de nucleótidos identificada como SEQ ID 2 comprende al menos parte del TFBS reconocido por Rgt1, Cat8-1 y Cat8-2.The nucleotide sequence identified as SEQ ID 2 comprises at least part of the TFBS recognized by Rgt1, Cat8-1 and Cat8-2.

La secuencia de nucleótidos identificada como SEQ ID 3 comprende al menos parte del TFBS reconocido por Rgt1, Cat8-1 y Cat8-2.The nucleotide sequence identified as SEQ ID 3 comprises at least part of the TFBS recognized by Rgt1, Cat8-1 and Cat8-2.

Específicamente, la secuencia de nucleótidos entre SEQ ID 2 y SEQ ID 3 (la secuencia intersticial) puede mutar a una secuencia no homóloga (p. ej., con una identidad de secuencia de menos de 50%) o incluso eliminarse.Specifically, the nucleotide sequence between SEQ ID 2 and SEQ ID 3 (the interstitial sequence) may be mutated to a non-homologous sequence (eg, with less than 50% sequence identity) or even deleted.

Cualquier mutación dentro de SEQ ID 2 y SEQ ID 3 es específicamente conservativa, es decir, tal como para mantener (o mejorar) el reconocimiento por el factor de transcripción respectivo. Tras modificar por ingeniería genética tales mutantes conservativos, la identidad de secuencia dentro de la secuencia de nucleótidos de SEQ ID 2 y/o SEQ ID 3 es al menos 90%, preferiblemente al menos 95%.Any mutation within SEQ ID 2 and SEQ ID 3 is specifically conservative, ie such as to maintain (or enhance) recognition by the respective transcription factor. Upon engineering such conservative mutants, the sequence identity within the nucleotide sequence of SEQ ID 2 and/or SEQ ID 3 is at least 90%, preferably at least 95%.

La región reguladora principal comprende o consiste en la secuencia de nucleótidos identificada por SEQ ID 5. Tal región comprende la región reguladora central y la región reguladora no central adicional, que comprende elementos esenciales del promotor pG1 y que puede mutar hasta cierto punto para producir el promotor pG1 -x como se describe en el presente documento.The major regulatory region comprises or consists of the nucleotide sequence identified by SEQ ID 5. Such a region comprises the core regulatory region and the additional non-core regulatory region, which comprises essential elements of the pG1 promoter and which can mutate to some extent to produce the pG1 promoter. pG1-x promoter as described herein.

Las regiones específicas de mutagénesis dirigida al sitio son, p. ej., la región reguladora no central del promotor pG1 o pG1-x (dentro o fuera de la región reguladora principal). Sin embargo, también se pueden preparar mutantes específicos mediante métodos de mutagénesis dirigidos a la región reguladora central del promotor, manteniendo un cierto grado de identidad de secuencia para mantener la función del promotor. Otras regiones específicas están fuera o dentro de la región reguladora principal. Específicamente, el promotor puede comprender una secuencia de nucleótidos híbrida, p. ej. que comprende la región reguladora central del promotor pG1 y una o más regiones o promotores alternativos (nativos o artificiales), por ejemplo, se puede utilizar el sitio de inicio de la traducción en la región 3' (específicamente el extremo 3' que comprende al menos 10 nucleótidos terminales, o al menos 15 nucleótidos terminales) de un promotor que no sea el promotor pG1 para sustituir el sitio de inicio de la traducción del promotor pG1.Specific regions of site-directed mutagenesis are, e.g. eg, the non-core regulatory region of the pG1 or pG1-x promoter (within or outside the core regulatory region). However, specific mutants can also be prepared by mutagenesis methods directed at the core regulatory region of the promoter, maintaining a certain degree of sequence identity to maintain promoter function. Other specific regions are outside or inside the main regulatory region. Specifically, the promoter may comprise a hybrid nucleotide sequence, e.g. eg comprising the core regulatory region of the pG1 promoter and one or more alternative regions or promoters (native or artificial), for example, the translation start site in the 3' region (specifically the 3' end comprising the least 10 terminal nucleotides, or at least 15 terminal nucleotides) from a promoter other than the pG1 promoter to replace the translation start site of the pG1 promoter.

Las mutaciones específicas se refieren a la duplicación de regiones seleccionadas (o motivos) del promotor pG1, p. ej., el motivo T o el motivo T extendido. Tales motivos seleccionados se pueden alargar mediante nucleótidos adicionales o acortar en uno o ambos extremos distales del motivo, o dentro del motivo. La secuencia de pG1 nativa comprende un motivo TAT que consiste en los nucleótidos "T" seguido de "A" seguido de T15 (SEQ ID 14). Tal motivo TAT 5-TATTTTTTTTTTTTTTT-3' (SEQ ID 22) ha resultado tener un efecto positivo sobre la fuerza del promotor, que incluso puede incrementarse duplicando el motivo TAT, o insertando al menos 2, 3 o 4 copias del motivo TAT, ya sea el mismo motivo TAT o utilizando un motivo T alternativo, el motivo T extendido (p. ej., un motivo TAT), que comprende al menos el motivo T13 (SEQ ID 12).Specific mutations refer to the duplication of selected regions (or motifs) of the pG1 promoter, e.g. eg, the T motif or the extended T motif. Such selected motifs may be lengthened by additional nucleotides or shortened at one or both distal ends of the motif, or within the motif. The native pG1 sequence comprises a TAT motif consisting of the nucleotides "T" followed by "A" followed by T15 (SEQ ID 14). Such a TAT motif 5-TATTTTTTTTTTTTTTTT-3' (SEQ ID 22) has been found to have a positive effect on the strength of the promoter, which can even be increased by duplicating the TAT motif, or by inserting at least 2, 3 or 4 copies of the TAT motif, since either the same TAT motif or using an alternative T motif, the extended T motif (eg, a TAT motif), comprising at least the T13 motif (SEQ ID 12).

La invención abarca adicionalmente una secuencia de nucleótidos que hibrida en condiciones rigurosas con el promotor pG1-x.The invention further encompasses a nucleotide sequence that hybridizes under stringent conditions to the pG1-x promoter.

Como se utiliza en la presente invención, se pretende que el término "hibridación" o "hibridando" signifique el procedimiento durante el cual dos secuencias de ácido nucleico se reasocian entre sí con enlaces de hidrógeno estables y específicos para formar una doble hebra en condiciones apropiadas. La hibridación entre dos secuencias complementarias o secuencias suficientemente complementarias depende de las condiciones operativas que se utilicen, y en particular de la rigurosidad. Se puede entenderse que la rigurosidad indica el grado de homología; cuanto mayor sea la rigurosidad, mayor será el porcentaje de homología entre las secuencias. La rigurosidad puede definirse en particular por la composición de bases de las dos secuencias nucleicas y/o por el grado de emparejamientos erróneos entre estas dos secuencias nucleicas. Variando las condiciones, p. ej. concentración de sal y temperatura, se puede permitir que una secuencia de ácido nucleico dada hibride solo con su complemento exacto (alta rigurosidad) o con cualquier secuencia algo relacionada (baja rigurosidad). El aumento de la temperatura o la disminución de la concentración de sal pueden tender a aumentar la selectividad de una reacción de hibridación.As used herein, the term "hybridization" or "hybridizing" is intended to mean the process during which two nucleic acid sequences anneal to each other with stable and specific hydrogen bonds to form a double strand under appropriate conditions. . Hybridization between two complementary sequences or sufficiently complementary sequences depends on the operating conditions used, and in particular on stringency. Stringency can be understood to indicate the degree of homology; how much the higher the stringency, the higher the percentage of homology between the sequences. The stringency can be defined in particular by the base composition of the two nucleotide sequences and/or by the degree of mismatches between these two nucleotide sequences. Varying the conditions, e.g. eg salt concentration and temperature, a given nucleic acid sequence may be allowed to hybridize only to its exact complement (high stringency) or to any somewhat related sequence (low stringency). Increasing the temperature or lowering the salt concentration may tend to increase the selectivity of a hybridization reaction.

Como se emplea en el presente documento, se entiende preferiblemente que la frase "hibridación en condiciones rigurosas de hibridación" se refiere a hibridación en condiciones de cierta rigurosidad. En una realización preferida, las "condiciones rigurosas de hibridación" son condiciones en las que la homología de las dos secuencias de ácido nucleico es al menos de 70%, preferiblemente al menos 80%, preferiblemente al menos 90%, es decir, en condiciones en las que la hibridación solo es posible si la doble hebra obtenida durante esta hibridación comprende preferiblemente al menos 70%, preferiblemente al menos 80%, preferiblemente al menos 90% de enlaces AT y enlaces CG.As used herein, the phrase "hybridization under stringent hybridization conditions" is preferably understood to refer to hybridization under conditions of some stringency. In a preferred embodiment, "stringent hybridization conditions" are conditions in which the homology of the two nucleic acid sequences is at least 70%, preferably at least 80%, preferably at least 90%, that is, under conditions wherein hybridization is only possible if the double strand obtained during this hybridization preferably comprises at least 70%, preferably at least 80%, preferably at least 90% AT bonds and CG bonds.

La rigurosidad puede depender de los parámetros de reacción, tales como la concentración y el tipo de especies iónicas presentes en la solución de hibridación, la naturaleza y concentración de los agentes desnaturalizantes y/o la temperatura de hibridación. Los expertos en la técnica pueden determinar las condiciones apropiadas, p. ej. como describen Sambrook et al. (Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, 1989).Stringency may depend on reaction parameters, such as the concentration and type of ionic species present in the hybridization solution, the nature and concentration of denaturing agents, and/or the hybridization temperature. Appropriate conditions can be determined by those skilled in the art, e.g. eg as described by Sambrook et al. (Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, 1989).

Los términos "aislado" o "aislamiento" como se emplean en el presente documento con respecto a un ácido nucleico, una POI u otro compuesto se referirán a dicho compuesto que ha sido suficientemente separado del entorno con el que estaría asociado naturalmente, para existir en forma "sustancialmente pura". "Aislado" no significa necesariamente la exclusión de mezclas artificiales o sintéticas con otros compuestos o materiales, o la presencia de impurezas que no interfieren en la actividad fundamental, y que pueden estar presentes, por ejemplo, debido a una purificación incompleta. En particular, también se pretende que las moléculas de ácido nucleico aisladas de la presente invención incluyan aquellas sintetizadas químicamente", y en particular aquellas que no se encuentran naturalmente en P. pastoris o cualquier otro organismo, denominado en el presente documento "artificial". Con referencia a los ácidos nucleicos de la invención, a veces se utiliza el término "ácido nucleico aislado" o "secuencia de ácido nucleico aislada". Este término, cuando se aplica al ADN, se refiere a una molécula de ADN que se separa de las secuencias de las que es inmediatamente contigua en el genoma natural del organismo en el que se originó. Por ejemplo, un "ácido nucleico aislado" puede comprender una molécula de ADN insertada en un vector, tal como un vector plasmídico o viral, o integrada en el ADN genómico de una célula procariótica o eucariótica u organismo anfitrión. Un "ácido nucleico aislado" (ya sea ADN o ARN) puede representar adicionalmente una molécula producida directamente por medios biológicos o sintéticos y separada de otros componentes presentes durante su producción.The terms "isolate" or "isolate" as used herein with respect to a nucleic acid, POI, or other compound shall refer to such compound that has been sufficiently separated from the environment with which it would be naturally associated, to exist in "substantially pure" form. "Isolated" does not necessarily mean the exclusion of artificial or synthetic mixtures with other compounds or materials, or the presence of impurities which do not interfere with the fundamental activity, and which may be present, for example, due to incomplete purification. In particular, the isolated nucleic acid molecules of the present invention are also intended to include those "chemically synthesized", and in particular those not naturally found in P. pastoris or any other organism, referred to herein as "artificial". With reference to the nucleic acids of the invention, the term "isolated nucleic acid" or "isolated nucleic acid sequence" is sometimes used. This term, when applied to DNA, refers to a DNA molecule that is separated from the sequences of which it is immediately contiguous in the natural genome of the organism in which it originated. For example, an "isolated nucleic acid" may comprise a DNA molecule inserted into a vector, such as a plasmid or viral vector, or integrated in the genomic DNA of a prokaryotic or eukaryotic cell or host organism An "isolated nucleic acid" (either DNA or RNA) may additionally represent a molecule produced directly by biological or synthetic means and separated from other components present during its production.

El término "conectado operablemente" como se emplea en el presente documento se refiere a la asociación de secuencias de nucleótidos en una única molécula de ácido nucleico, p. ej. un vector, de manera que la función de una o más secuencias de nucleótidos se vea afectada por al menos otra secuencia de nucleótidos presente en dicha molécula de ácido nucleico. Por ejemplo, un promotor está conectado operablemente con una secuencia codificante de un gen recombinante, cuando es capaz de efectuar la expresión de esa secuencia codificante. Como ejemplo adicional, un ácido nucleico que codifica un péptido señal está conectado operablemente a una secuencia de ácido nucleico que codifica una POl, cuando es capaz de expresar una proteína en la forma secretada, tal como una preforma de una proteína madura o la proteína madura. Específicamente, tales ácidos nucleicos conectados operablemente entre sí pueden conectarse inmediatamente, es decir, sin otros elementos o secuencias de ácido nucleico entre el ácido nucleico que codifica el péptido señal y la secuencia de ácido nucleico que codifica una POl. The term "operably linked" as used herein refers to the association of nucleotide sequences in a single nucleic acid molecule, e.g. eg a vector, such that the function of one or more nucleotide sequences is affected by at least one other nucleotide sequence present in said nucleic acid molecule. For example, a promoter is operably linked to a recombinant gene coding sequence when it is capable of effecting expression of that coding sequence. As a further example, a nucleic acid encoding a signal peptide is operably linked to a nucleic acid sequence encoding a POI, when it is capable of expressing a protein in the secreted form, such as a preform of a mature protein or the mature protein. . Specifically, such nucleic acids operably linked to each other can be linked immediately, ie, without other nucleic acid elements or sequences, between the nucleic acid encoding the signal peptide and the nucleic acid sequence encoding a POI.

Se entiende típicamente que una secuencia promotora está conectada operablemente a una secuencia codificante, si el promotor controla la transcripción de la secuencia codificante. Si una secuencia promotora no está asociada de forma nativa con la secuencia codificante, su transcripción no está controlada por el promotor en células nativas (de tipo salvaje) o las secuencias se recombinan con diferentes secuencias contiguas.A promoter sequence is typically understood to be operably linked to a coding sequence, if the promoter controls transcription of the coding sequence. If a promoter sequence is not natively associated with the coding sequence, its transcription is not controlled by the promoter in native (wild-type) cells or the sequences recombine with different contiguous sequences.

El término "proteína de interés (POl)", como se emplea en el presente documento, se refiere a un polipéptido o una proteína que se producen mediante tecnología recombinante en una célula anfitriona. Más específicamente, la proteína puede ser un polipéptido que no se encuentra naturalmente en la célula anfitriona, es decir, una proteína heteróloga, o puede ser nativa de la célula anfitriona, es decir, una proteína homóloga para la célula anfitriona, pero se produce, por ejemplo, por transformación con un vector autorreplicante que contiene la secuencia de ácido nucleico que codifica la POl, o tras la integración mediante técnicas recombinantes de una o más copias de la secuencia de ácido nucleico que codifica la POl en el genoma de la célula anfitriona, o mediante modificación recombinante de una o más secuencias reguladoras que controlan la expresión del gen que codifica la POl, p. ej. de la secuencia promotora. En algunos casos, el término POl como se emplea en el presente documento también se refiere a cualquier metabolito producto de la célula anfitriona mediado por la proteína expresada de manera recombinante.The term "protein of interest (POI)" as used herein refers to a polypeptide or protein that is produced by recombinant technology in a host cell. More specifically, the protein may be a polypeptide that is not naturally found in the host cell, i.e., a heterologous protein, or it may be native to the host cell, i.e., a protein homologous to the host cell, but is produced, for example, by transformation with a self-replicating vector containing the POI-encoding nucleic acid sequence, or following recombinant integration of one or more copies of the POI-encoding nucleic acid sequence into the host cell genome , or by recombinant modification of one or more regulatory sequences that control the expression of the gene encoding POl, e.g. eg of the promoter sequence. In some instances, the term POI as used herein also refers to any host cell product metabolite mediated by the recombinantly expressed protein.

La POl se puede recuperar específicamente del cultivo celular en forma purificada, p. ej. sustancialmente pura. POl can be specifically recovered from cell culture in purified form, e.g. eg substantially pure.

Los términos "sustancialmente pura" o "purificada" como se emplea en el presente documento se referirán a una preparación que comprende al menos 50% (p/p), preferiblemente al menos 60%, 70%, 80%, 90% o 95% de un compuesto, tal como una molécula de ácido nucleico o una POl. La pureza se mide mediante métodos apropiados para el compuesto (p. ej., métodos cromatográficos, electroforesis en gel de poliacrilamida, análisis por HPLC y similares).The terms "substantially pure" or "purified" as used herein shall refer to a preparation comprising at least 50% (w/w), preferably at least 60%, 70%, 80%, 90% or 95 % of a compound, such as a nucleic acid molecule or a POI. Purity is measured by appropriate methods for the compound (eg, chromatographic methods, polyacrylamide gel electrophoresis, HPLC analysis, and the like).

El término "recombinante", como se emplea en el presente documento, significará "preparado por ingeniería genética o como resultado de esta". Por tanto, un "microorganismo recombinante" comprende al menos un "ácido nucleico recombinante". Un microorganismo recombinante comprende específicamente un vector de expresión o un vector de clonación, o ha sido modificado genéticamente para contener una secuencia de ácido nucleico recombinante. Una "proteína recombinante" se produce expresando un ácido nucleico recombinante respectivo en un anfitrión. Un "promotor recombinante" es una secuencia de nucleótidos no codificante modificada por ingeniería genética adecuada para su uso como un promotor funcionalmente activo como se describe en el presente documento.The term "recombinant" as used herein shall mean "prepared by or as a result of genetic engineering." Thus, a "recombinant microorganism" comprises at least one "recombinant nucleic acid". A recombinant microorganism specifically comprises an expression vector or a cloning vector, or has been genetically modified to contain a recombinant nucleic acid sequence. A "recombinant protein" is produced by expressing a respective recombinant nucleic acid in a host. A "recombinant promoter" is a genetically engineered non-coding nucleotide sequence suitable for use as a functionally active promoter as described herein.

En general, los ácidos nucleicos u organismos recombinantes a los que se hace referencia en el presente documento se pueden producir mediante mecanismos de recombinación bien conocidos por un experto en la técnica. De acuerdo con la presente invención, se pueden emplear mecanismos convencionales de biología molecular, microbiología y ADN recombinante dentro de los conocimientos de la técnica. Tales mecanismos se explican completamente en la bibliografía. Véase, p. ej., Maniatis, Fritsch & Sambrook, "Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, (1982).In general, the recombinant nucleic acids or organisms referred to herein can be produced by recombination mechanisms well known to one of skill in the art. In accordance with the present invention, conventional techniques of molecular biology, microbiology, and recombinant DNA may be employed within the skill of the art. Such mechanisms are fully explained in the literature. See, p. Maniatis, Fritsch & Sambrook, "Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, (1982).

Según una realización preferida de la presente invención, se obtiene una construcción recombinante ligando el promotor y los genes relevantes en un vector o construcción de expresión. Estos genes pueden integrarse de forma estable en el genoma de la célula anfitriona transformando la célula anfitriona utilizando tales vectores o construcciones de expresión.According to a preferred embodiment of the present invention, a recombinant construct is obtained by ligating the promoter and relevant genes into an expression vector or construct. These genes can be stably integrated into the host cell genome by transforming the host cell using such vectors or expression constructs.

Los vectores de expresión pueden incluir, pero sin limitarse a, vectores de clonación, vectores de clonación modificados y plásmidos diseñados específicamente. El vector de expresión preferido como se utiliza en la invención puede ser cualquier vector de expresión adecuado para la expresión de un gen recombinante en una célula anfitriona y se selecciona dependiendo del organismo anfitrión. El vector de expresión recombinante puede ser cualquier vector que sea capaz de replicarse o integrarse en el genoma de los organismos anfitriones, también llamado vector anfitrión. Expression vectors may include, but are not limited to, cloning vectors, modified cloning vectors, and specifically designed plasmids. The preferred expression vector as used in the invention may be any expression vector suitable for expression of a recombinant gene in a host cell and is selected depending on the host organism. The recombinant expression vector can be any vector that is capable of replication or integration into the genome of the host organisms, also called host vector.

Los vectores de expresión apropiados típicamente comprenden secuencias reguladoras adicionales adecuadas para expresar ADN que codifica una POI en una célula anfitriona eucariótica. Los ejemplos de secuencias reguladoras incluyen operadores, potenciadores, sitios de unión a ribosomas y secuencias que controlan el inicio y la terminación de la transcripción y la traducción. Las secuencias reguladoras se pueden conectar operablemente a la secuencia de ADN que se va a expresar.Appropriate expression vectors typically comprise additional regulatory sequences suitable for expressing DNA encoding a POI in a eukaryotic host cell. Examples of regulatory sequences include operators, enhancers, ribosome binding sites, and sequences that control the initiation and termination of transcription and translation. The regulatory sequences can be operably linked to the DNA sequence to be expressed.

Para permitir la expresión de una secuencia de nucleótidos recombinante en una célula anfitriona, el vector de expresión puede proporcionar el promotor según la invención adyacente al extremo 5' de la secuencia codificante, p. ej. aguas arriba del gen de interés (GOI) o un gen del péptido señal que permite la secreción de la POI. Por tanto, la transcripción está regulada e iniciada por esta secuencia promotora.To allow expression of a recombinant nucleotide sequence in a host cell, the expression vector may provide the promoter according to the invention adjacent to the 5' end of the coding sequence, e.g. eg upstream of the gene of interest (GOI) or a signal peptide gene that allows secretion of the POI. Thus, transcription is regulated and initiated by this promoter sequence.

El término "péptido señal" como se emplea en el presente documento se referirá específicamente a un péptido señal nativo, un péptido señal heterólogo o un híbrido de un péptido señal nativo y heterólogo, y puede ser específicamente heterólogo u homólogo al organismo anfitrión que produce una POI. La función del péptido señal es permitir que la POI sea secretada para entrar en el retículo endoplásmico. Por lo general, es una cadena peptídica corta (de 3 a 60 aminoácidos de longitud) que dirige el transporte de una proteína fuera de la membrana plasmática, lo que facilita la separación y purificación de una proteína heteróloga. Algunos péptidos señal son escindidos de la proteína por la peptidasa señal después de que se transporten las proteínas.The term "signal peptide" as used herein shall refer specifically to a native signal peptide, a heterologous signal peptide, or a hybrid of a native and heterologous signal peptide, and may be specifically heterologous or homologous to the host organism that produces a protein. POI. The function of the signal peptide is to allow POI to be secreted to enter the endoplasmic reticulum. It is usually a short peptide chain (3 to 60 amino acids in length) that directs the transport of a protein out of the plasma membrane, facilitating separation and purification of a heterologous protein. Some signal peptides are cleaved from protein by signal peptidase after the proteins are transported.

Los péptidos señal ilustrativos son secuencias señal del prepro péptido del factor de apareamiento alfa de S. cerevisiae y los péptidos señal de gen de la fosfatasa ácida (PHO1) de P. pastoris y la proteína extracelular X (EPX1) (Heiss et al., 2015; documento WO2014067926A1).Illustrative signal peptides are signal sequences of the S. cerevisiae alpha-mating factor prepropeptide and the signal peptides of the P. pastoris acid phosphatase (PHO1) gene and extracellular protein X (EPX1) (Heiss et al., 2015; WO2014067926A1).

Los vectores de expresión que comprenden uno o más de los elementos reguladores (tales como el promotor pG1-x y opcionalmente una secuencia señal) pueden construirse para impulsar la expresión de una POI, y el rendimiento expresado se compara con construcciones con elementos reguladores convencionales, con el fin de probar la función de las secuencias relevantes. Las secuencias de nucleótidos identificadas se pueden amplificar mediante PCR utilizando cebadores de nucleótidos específicos, clonarse en un vector de expresión y transformarse en una línea celular eucariótica, p. ej. utilizando un vector de levadura y una cepa de P. pastoris, para la producción de alto nivel de varias POI diferentes. Para estimar el efecto del promotor pG1 -x como se describe en el presente documento sobre la cantidad de POI recombinante así producida, la línea celular eucariótica se puede cultivar en experimentos en matraces agitados y fermentaciones de lote alimentado o de quimiostato en comparación con cepas que comprenden un promotor pG1 convencional o el promotor pGAP, en la célula respectiva. En particular, la elección del promotor tiene un gran impacto sobre la producción de proteínas recombinantes.Expression vectors comprising one or more of the regulatory elements (such as the pG1-x promoter and optionally a signal sequence) can be constructed to drive expression of a POI, and the expressed yield is compared to constructs with conventional regulatory elements. in order to test the function of the relevant sequences. The identified nucleotide sequences can be amplified by PCR using specific nucleotide primers, cloned into an expression vector and transformed into a eukaryotic cell line, e.g. eg using a yeast vector and a P. pastoris strain, for high-level production of several different POIs. To estimate the effect of the pG1-x promoter as described herein on the amount of recombinant POI so produced, the eukaryotic cell line can be grown in shake flask experiments and fed-batch or chemostat fermentations compared to strains that they comprise a conventional pG1 promoter or the pGAP promoter, in the respective cell. In particular, the choice of promoter has a great impact on the production of recombinant proteins.

La POI se puede producir utilizando la línea celular anfitriona recombinante cultivando un transformante, así obtenido en un medio apropiado, aislando el producto expresado o metabolito del cultivo y, opcionalmente, purificándolo mediante un método adecuado. POI can be produced using the recombinant host cell line by culturing a transformant thus obtained in an appropriate medium, isolating the expressed product or metabolite from the culture, and optionally purifying it by a suitable method.

Los transformantes de acuerdo con la presente invención se pueden obtener introduciendo tal vector de ADN, p. ej. ADN plasmídico, en un anfitrión y seleccionando transformantes que expresan la POI o el metabolito de la célula anfitriona con altos rendimientos. Las células anfitrionas se tratan para permitirles incorporar ADN foráneo mediante métodos utilizados convencionalmente para la transformación de células eucarióticas, tales como el método de pulso eléctrico, el método de protoplastos, el método de acetato de litio y métodos modificados de los mismos. P. pastoris se transforma preferiblemente por electroporación. Los métodos preferidos de transformación para la captación del fragmento de ADN recombinante por el microorganismo incluyen transformación química, electroporación o transformación por formación de protoplastos. Los transformantes de acuerdo con la presente invención se pueden obtener introduciendo tal vector de ADN, p. ej. ADN plasmídico, en un anfitrión y seleccionando transformantes que expresan la proteína relevante o el metabolito de la célula anfitriona con altos rendimientos.Transformants according to the present invention can be obtained by introducing such vector DNA, e.g. eg Plasmid DNA, in a host and selecting transformants expressing the POI or host cell metabolite in high yields. Host cells are treated to enable them to incorporate foreign DNA by methods conventionally used for transformation of eukaryotic cells, such as the electric pulse method, the protoplast method, the lithium acetate method, and modified methods thereof. P. pastoris is preferably transformed by electroporation. Preferred transformation methods for uptake of the recombinant DNA fragment by the microorganism include chemical transformation, electroporation, or transformation by protoplast formation. Transformants according to the present invention can be obtained by introducing such vector DNA, e.g. eg Plasmid DNA, in a host and selecting transformants expressing the relevant protein or host cell metabolite in high yields.

Se prefieren varios enfoques diferentes para la producción de la POI según el método de la invención. Las sustancias pueden expresarse, procesarse y opcionalmente secretarse transformando una célula anfitriona eucariótica con un vector de expresión que alberga ADN recombinante que codifica una proteína relevante y al menos uno de los elementos reguladores como se describe anteriormente, preparando un cultivo de la célula transformada, haciendo crecer el cultivo, induciendo la transcripción y la producción de la POI, y recuperando el producto del procedimiento de fermentación.Several different approaches are preferred for the production of the POI according to the method of the invention. Substances can be expressed, processed and optionally secreted by transforming a eukaryotic host cell with an expression vector harboring recombinant DNA encoding a relevant protein and at least one of the regulatory elements as described above, preparing a culture of the transformed cell, making growing the culture, inducing POI transcription and production, and recovering the product from the fermentation process.

La célula anfitriona de acuerdo con la invención se prueba preferiblemente para determinar su capacidad de expresión o rendimiento mediante la siguiente prueba: ELISA, ensayo de actividad, HPLC u otras pruebas adecuadas.The host cell according to the invention is preferably tested for its ability to express or yield by the following test: ELISA, activity assay, HPLC or other suitable tests.

La invención permite específicamente el procedimiento de fermentación a escala piloto o industrial. La escala del procedimiento industrial preferiblemente emplearía un volumen de al menos 10 L, específicamente al menos 50 L, preferiblemente al menos 1 m3 , preferiblemente al menos 10 m3 , lo más preferiblemente al menos 100 m3.The invention specifically allows for the fermentation process on a pilot or industrial scale. The industrial process scale would preferably employ a volume of at least 10 L, specifically at least 50 L, preferably at least 1 m 3 , preferably at least 10 m 3 , most preferably at least 100 m 3 .

Se prefieren las condiciones de producción a escala industrial, que se refieren p. ej. a cultivo por lote alimentado en volúmenes de reactor de 100 L a 10 m3 o más, empleando tiempos de procedimiento típicos de varios días, o procedimientos continuos en volúmenes de fermentador de aproximadamente 50 - 1000 L o más, con tasas de dilución de aproximadamente 0,02 - 0,15 h-1.Industrial-scale production conditions are preferred, which refer to e.g. eg to fed-batch culture in reactor volumes of 100 L to 10 m 3 or more, employing typical process times of several days, or continuous processes in fermenter volumes of about 50 - 1000 L or more, with dilution rates of about 0.02-0.15 hr -1 .

Las técnicas de cultivo adecuadas pueden abarcar el cultivo en un biorreactor comenzando con una fase discontinua, seguida de una fase discontinua de alimentación exponencial corta a una tasa de crecimiento específica alta, seguida adicionalmente de una fase por lote alimentado a una tasa de crecimiento específica baja. Otra técnica de cultivo adecuada puede abarcar una fase discontinua seguida de una fase de cultivo continuo a una tasa de dilución baja. Suitable culturing techniques may encompass culturing in a bioreactor starting with a batch phase, followed by a short exponential fed-batch phase at a high specific growth rate, followed further by a fed-batch phase at a low specific growth rate. . Another suitable culture technique may comprise a batch phase followed by a continuous culture phase at a low dilution rate.

Una realización preferida incluye un cultivo discontinuo para proporcionar biomasa seguido de un cultivo por lote alimentado para una producción de POI de alto rendimiento.A preferred embodiment includes batch culture to provide biomass followed by fed-batch culture for high yield POI production.

Se prefiere cultivar la línea de células anfitrionas como se describe en el presente documento en un biorreactor en condiciones de crecimiento para obtener una densidad celular de al menos 1 g/L de peso seco celular, más preferiblemente al menos 10 g/L de peso seco celular, preferiblemente al menos 20 g/L de peso seco celular. Es ventajoso proporcionar tales rendimientos de producción de biomasa a escala piloto o industrial.It is preferred to cultivate the host cell line as described herein in a bioreactor under growth conditions to obtain a cell density of at least 1 g/L cell dry weight, more preferably at least 10 g/L dry weight. cell, preferably at least 20 g/L cell dry weight. It is advantageous to provide such yields of biomass production on a pilot or industrial scale.

Un medio de crecimiento que permite la acumulación de biomasa, específicamente un medio de crecimiento basal, típicamente comprende una fuente de carbono, una fuente de nitrógeno, una fuente de azufre y una fuente de fosfato. Típicamente, tal medio comprende además oligoelementos y vitaminas, y puede comprender adicionalmente aminoácidos, peptona o extracto de levadura.A growth medium that allows biomass accumulation, specifically a basal growth medium, typically comprises a carbon source, a nitrogen source, a sulfur source, and a phosphate source. Typically, such medium further comprises trace elements and vitamins, and may further comprise amino acids, peptone or yeast extract.

Las fuentes de nitrógeno preferidas incluyen NH4H2PO4 , o NH3 o (NH4)2SO4 ;Preferred nitrogen sources include NH 4 H 2 PO 4 , or NH 3 or (NH 4 ) 2 SO 4 ;

Las fuentes de azufre preferidas incluyen MgSO4 , o (NH4)2SO4 o K2SO4 ;Preferred sulfur sources include MgSO 4 , or (NH 4 ) 2 SO 4 or K 2 SO 4 ;

Las fuentes de fosfato preferidas incluyen NH4H2PO4 , o H3PO4 o NaH2PO4 , KH2PO4 , Na2HPO4 o K2HPO4; Preferred phosphate sources include NH 4 H 2 PO 4 , or H 3 PO 4 or NaH 2 PO 4 , KH 2 PO 4 , Na 2 HPO 4 or K 2 HPO 4 ;

Otros componentes de medios típicos incluyen KCI, CaCl2 y oligoelementos tales como: Fe, Co, Cu, Ni, Zn, Mo, Mn, I, B;Other typical media components include KCl, CaCl 2 and trace elements such as: Fe, Co, Cu, Ni, Zn, Mo, Mn, I, B;

Preferiblemente, el medio se complementa con vitamina B7 ;Preferably, the medium is supplemented with vitamin B 7 ;

Un medio de crecimiento típico para P. pastoris comprende glicerol, sorbitol o glucosa, NH4H2PO4 , MgSO4 , KCl, CaCh, biotina y oligoelementos.A typical growth medium for P. pastoris comprises glycerol, sorbitol or glucose, NH 4 H 2 PO 4 , MgSO 4 , KCl, CaCh, biotin and trace elements.

En la fase de producción, se utiliza específicamente un medio de producción con solo una cantidad limitada de una fuente de carbono complementaria.In the production phase, a production medium with only a limited amount of a complementary carbon source is specifically used.

Preferiblemente, la línea de células anfitrionas se cultiva en un medio mineral con una fuente de carbono adecuada, lo que simplifica aún más el procedimiento de aislamiento de manera significativa. Un ejemplo de un medio mineral preferido es uno que contiene una fuente de carbono utilizable (p. ej., glucosa, glicerol, sorbitol o metanol), sales que contienen los macroelementos (potasio, magnesio, calcio, amonio, cloruro, sulfato, fosfato) y oligoelementos (cobre, yoduro, manganeso, molibdato, cobalto, cinc y sales de hierro y ácido bórico) y opcionalmente vitaminas o aminoácidos, p. ej. para complementar las auxotrofías.Preferably, the host cell line is grown in a mineral medium with a suitable carbon source, which further simplifies the isolation procedure significantly. An example of a preferred mineral medium is one that contains a usable carbon source (eg, glucose, glycerol, sorbitol, or methanol), salts containing the macroelements (potassium, magnesium, calcium, ammonium, chloride, sulfate, phosphate ) and trace elements (copper, iodide, manganese, molybdate, cobalt, zinc and iron salts and boric acid) and optionally vitamins or amino acids, e.g. eg to complement the auxotrophies.

Específicamente, las células se cultivan en condiciones adecuadas para efectuar la expresión de la POI deseada, que puede purificarse a partir de las células o el medio de cultivo, dependiendo de la naturaleza del sistema de expresión y la proteína expresada, p. ej. si la proteína está fusionada a un péptido señal y si la proteína es soluble o está unida a la membrana. Como entenderá el experto en la técnica, las condiciones de cultivo variarán según los factores que incluyen el tipo de célula anfitriona y el vector de expresión particular empleado.Specifically, the cells are cultured under conditions suitable to effect expression of the desired POI, which may be purified from the cells or culture medium, depending on the nature of the expression system and the protein expressed, e.g. eg whether the protein is fused to a signal peptide and whether the protein is soluble or membrane bound. As will be understood by one of skill in the art, culture conditions will vary depending on factors including the type of host cell and the particular expression vector employed.

Un medio de producción típico comprende una fuente de carbono complementaria y adicionalmente NH4H2PO4 , MgSO4 , KCI, CaCl2 , biotina y oligoelementos.A typical production medium comprises a complementary carbon source and additionally NH 4 H 2 PO 4 , MgSO 4 , KCl, CaCl 2 , biotin and trace elements.

Por ejemplo, la alimentación de la fuente de carbono complementaria añadida a la fermentación puede comprender una fuente de carbono con hasta 50% en peso de azúcares utilizables. La baja tasa de alimentación del medio complementario limitará los efectos de la inhibición del producto o subproducto sobre el crecimiento celular, por lo que será posible un alto rendimiento de producto basado en la provisión de sustrato.For example, the complementary carbon source feed added to the fermentation may comprise a carbon source with up to 50% by weight of usable sugars. The low feed rate of supplemental medium will limit the effects of product or by-product inhibition on cell growth, thus a high yield of product based on substrate provision will be possible.

La fermentación se realiza preferiblemente a un pH que varía de 3 a 7,5.The fermentation is preferably carried out at a pH ranging from 3 to 7.5.

Los tiempos de fermentación típicos son aproximadamente de 24 a 120 horas con temperaturas en el intervalo de 20°C a 35°C, preferiblemente 22-30°C.Typical fermentation times are about 24 to 120 hours with temperatures in the range of 20°C to 35°C, preferably 22-30°C.

La POI se expresa preferiblemente empleando condiciones para producir rendimientos de al menos 1 mg/L, preferiblemente al menos 10 mg/L, preferiblemente al menos 100 mg/L, lo más preferido al menos 1 g/L.POI is preferably expressed using conditions to produce yields of at least 1 mg/L, preferably at least 10 mg/L, preferably at least 100 mg/L, most preferably at least 1 g/L.

Se entiende que los métodos divulgados en el presente documento pueden incluir adicionalmente el cultivo de dichas células anfitrionas recombinantes en condiciones que permitan la expresión de la POI, preferiblemente en la forma secretada o también como producto intracelular. A continuación, una POI producida de forma recombinante o un metabolito de la célula anfitriona se pueden aislar del medio de cultivo celular y adicionalmente purificar mediante mecanismos bien conocidos por un experto en la técnica.It is understood that the methods disclosed herein may further include culturing said recombinant host cells under conditions that allow expression of the POI, preferably in the secreted form or also as an intracellular product. A recombinantly produced POI or host cell metabolite can then be isolated from the cell culture medium and further purified by techniques well known to one of skill in the art.

La POI producida de acuerdo con la invención típicamente se puede aislar y purificar utilizando mecanismos del estado de la técnica, incluyendo el aumento de la concentración de la POI deseada y/o la disminución de la concentración de al menos una impureza.The POI produced in accordance with the invention can typically be isolated and purified using techniques of the state of the art, including increasing the concentration of the desired POI and/or decreasing the concentration of at least one impurity.

Si la POI es secretada por las células, se puede aislar y purificar del medio de cultivo utilizando mecanismos del estado de la técnica. La secreción de los productos de expresión recombinantes a partir de las células anfitrionas es generalmente ventajosa por razones que incluyen la facilitación del procedimiento de purificación, ya que los productos se recuperan del sobrenadante del cultivo en lugar de la mezcla compleja de proteínas que resulta cuando las células de levadura se rompen para liberar proteínas intracelulares.If POI is secreted by cells, it can be isolated and purified from culture medium using state-of-the-art techniques. Secretion of the recombinant expression products from the host cells is generally advantageous for reasons including facilitation of the purification process, since the products are recovered from the culture supernatant rather than the complex mixture of proteins that results when the cells are purified. yeast cells rupture to release intracellular proteins.

Las células transformantes cultivadas también se pueden romper sónicamente o mecánicamente, enzimáticamente o químicamente para obtener un extracto celular que contenga la POI deseada, a partir de la cual se aísla y purifica la POI.Cultured transformant cells can also be sonically or mechanically, enzymatically, or chemically disrupted to obtain a cell extract containing the desired POI, from which the POI is isolated and purified.

Como métodos de aislamiento y purificación para obtener un polipéptido recombinante o un producto proteico, se pueden utilizar métodos, tales como métodos que utilizan diferencia en la solubilidad, tales como la precipitación por adición de sal y la precipitación con disolventes, métodos que utilizan la diferencia en el peso molecular, tales como la ultrafiltración y la electroforesis en gel, métodos que utilizan la diferencia en carga eléctrica, tales como la cromatografía de intercambio iónico, métodos que utilizan la afinidad específica, tales como la cromatografía de afinidad, métodos que utilizan la diferencia en el carácter hidrófobo, tales como la cromatografía líquida de alta resolución en fase inversa, y métodos que utilizan la diferencia en el punto isoeléctrico, tales como el enfoque isoeléctrico.As isolation and purification methods to obtain a recombinant polypeptide or protein product, methods such as methods using difference in solubility such as salt addition precipitation and solvent precipitation, methods using difference in solubility can be used. on molecular weight, such as ultrafiltration and gel electrophoresis, methods using difference in electrical charge, such as ion exchange chromatography, methods using specific affinity, such as affinity chromatography, methods using difference in hydrophobicity, such as reverse phase high performance liquid chromatography, and methods using the difference in isoelectric point, such as isoelectric focusing.

El producto altamente purificado está esencialmente libre de proteínas contaminantes y preferiblemente tiene una pureza de al menos 90%, más preferiblemente al menos 95%, o incluso al menos 98%, hasta 100%. Los productos purificados se pueden obtener mediante purificación del sobrenadante del cultivo celular o también a partir de restos celulares.The highly purified product is essentially free of contaminating proteins and preferably has a purity of at least 90%, more preferably at least 95%, or even at least 98%, up to 100%. Purified products can be obtained by purification of cell culture supernatant or alternatively from cell debris.

Como métodos de aislamiento y purificación, se prefieren los siguientes métodos convencionales: rotura celular (si la POI se obtiene intracelularmente), separación de células (restos) y lavado mediante Microfiltración o Filtro de Flujo Tangencial (TFF) o centrifugación, purificación de POI mediante precipitación o tratamiento térmico, activación de p O i por digestión enzimática, purificación de POI por cromatografía, tal como intercambio iónico (IEX), cromatografía de interacción hidrófoba (HlC), Cromatografía de afinidad, Cromatografía de exclusión por tamaño (SEC) o HPLC, precipitación de POI de concentración y lavado por etapas de ultrafiltración.As isolation and purification methods, the following conventional methods are preferred: cell disruption (if POI is obtained intracellularly), cell separation (debris) and washing by Microfiltration or Tangential Flow Filter (TFF) or centrifugation, POI purification by precipitation or thermal treatment, activation of pOi by enzymatic digestion, purification of POI by chromatography, such as ion exchange (IEX), hydrophobic interaction chromatography (HlC), affinity chromatography, size exclusion chromatography (SEC) or HPLC , concentration POI precipitation and washing by ultrafiltration steps.

La POI aislada y purificada se puede identificar mediante métodos convencionales tales como transferencia Western, HPLC, ensayo de actividad o ELISA. Isolated and purified POI can be identified by conventional methods such as Western blotting, HPLC, activity assay or ELISA.

La POI puede ser cualquier polipéptido eucariótico, procariótico o sintético. Puede ser una proteína secretada o una proteína intracelular. La presente invención también proporciona la producción recombinante de homólogos funcionales, variantes funcionales equivalentes, derivados y fragmentos biológicamente activos de proteínas de origen natural. Los homólogos funcionales son preferiblemente idénticos a, o corresponden a, y tienen las características funcionales de una secuencia.The POI can be any eukaryotic, prokaryotic, or synthetic polypeptide. It can be a secreted protein or an intracellular protein. The present invention also provides for the recombinant production of functional homologues, functionally equivalent variants, derivatives and biologically active fragments of naturally occurring proteins. Functional homologues are preferably identical to, or correspond to, and have the functional characteristics of a sequence.

Una POI a la que se hace referencia en el presente documento puede ser un producto homólogo a la célula anfitriona eucariótica o heterólogo, preferiblemente para uso terapéutico, profiláctico, diagnóstico, analítico o industrial.A POI referred to herein may be a product homologous to the eukaryotic host cell or heterologous, preferably for therapeutic, prophylactic, diagnostic, analytical or industrial use.

Las POI son preferiblemente polipéptidos o proteínas recombinantes heterólogos, producidos en una célula eucariótica, preferiblemente una célula de levadura, preferiblemente como proteínas secretadas. Los ejemplos de proteínas preferiblemente producidas son inmunoglobulinas, fragmentos de inmunoglobulina, aprotinina, inhibidor de la ruta del factor tisular u otros inhibidores de proteasa, e insulina o precursores de insulina, análogos de insulina, hormonas de crecimiento, interleucinas, activador del plasminógeno tisular, factor de crecimiento transformante a o b, glucagón, péptido 1 similar a glucagón (GLP-1), péptido 2 similar a glucagón (GLP-2), GRPP, factor VII, factor VIII, factor XIII, factor de crecimiento 1 derivado de plaquetas, albúmina sérica, enzimas, tales como lipasas o proteasas, o un homólogo funcional, variante funcional equivalente, derivado y fragmento biológicamente activo con una función similar a la de la proteína nativa. La POI puede ser estructuralmente similar a la proteína nativa y se puede obtener a partir de la proteína nativa mediante la adición de uno o más aminoácidos a uno o ambos extremos C- y N-terminal o la cadena lateral de la proteína nativa, sustitución de uno o más aminoácidos en uno o varios sitios diferentes en la secuencia de aminoácidos nativa, deleción de uno o más aminoácidos en uno o ambos extremos de la proteína nativa o en uno o varios sitios en la secuencia de aminoácidos, o inserción de uno o más aminoácidos en uno o más sitios de la secuencia de aminoácidos nativa. Tales modificaciones son bien conocidas para varias de las proteínas mencionadas anteriormente.The POIs are preferably heterologous recombinant polypeptides or proteins, produced in a eukaryotic cell, preferably a yeast cell, preferably as secreted proteins. Examples of proteins preferably produced are immunoglobulins, immunoglobulin fragments, aprotinin, tissue factor pathway inhibitor or other protease inhibitors, and insulin or insulin precursors, insulin analogs, growth hormones, interleukins, tissue plasminogen activator, transforming growth factor a or b, glucagon, glucagon-like peptide 1 (GLP-1), glucagon-like peptide 2 (GLP-2), GRPP, factor VII, factor VIII, factor XIII, platelet-derived growth factor 1, albumin enzymes, such as lipases or proteases, or a functional homologue, functional equivalent variant, derivative and biologically active fragment with similar function to that of the native protein. The POI may be structurally similar to the native protein and may be obtained from the native protein by the addition of one or more amino acids to one or both of the C- and N-terminus or the side chain of the native protein, substitution of one or more amino acids at one or more different sites in the native amino acid sequence, deletion of one or more amino acids at one or both ends of the native protein or at one or more sites in the amino acid sequence, or insertion of one or more amino acids at one or more sites in the native amino acid sequence. Such modifications are well known for several of the proteins mentioned above.

Una POI también se puede seleccionar entre sustratos, enzimas, inhibidores o cofactores que proporcionan reacciones bioquímicas en la célula anfitriona, con el objetivo de obtener el producto de dicha reacción bioquímica o una cascada de varias reacciones, p. ej. para obtener un metabolito de la célula anfitriona. Los productos ilustrativos pueden ser vitaminas, tales como riboflavina, ácidos orgánicos y alcoholes, que se pueden obtener con mayores rendimientos tras la expresión de una proteína recombinante o una POI según la invención.A POI can also be selected from among substrates, enzymes, inhibitors or cofactors that provide biochemical reactions in the host cell, with the aim of obtaining the product of said biochemical reaction or a cascade of several reactions, e.g. eg to obtain a metabolite from the host cell. Illustrative products can be vitamins, such as riboflavin, organic acids and alcohols, which can be obtained in higher yields upon expression of a recombinant protein or POI according to the invention.

En general, la célula anfitriona, que expresa un producto recombinante, puede ser cualquier célula eucariótica adecuada para la expresión recombinante de una POI.In general, the host cell, which expresses a recombinant product, can be any eukaryotic cell suitable for recombinant expression of a POI.

los ejemplos de células de mamífero preferidas son células BHK, CHO (CHO-DG44, CHO-DUXB11, CHO-DUKX, CHO-K1, CHOK1SV, CHO-S), HeLa, HEK293, MDCK, NIH3T3, NS0, PER.C6, SP2/0 y VERO.examples of preferred mammalian cells are BHK, CHO (CHO-DG44, CHO-DUXB11, CHO-DUKX, CHO-K1, CHOK1SV, CHO-S), HeLa, HEK293, MDCK, NIH3T3, NS0, PER.C6, SP2/0 and VERO.

Los ejemplos de células de levadura preferidas utilizadas como células anfitrionas de acuerdo con la invención incluyen, pero no se limitan al género Saccharomyces (p. ej. Saccharomyces cerevisiae), el género Pichia (p. ej. P. pastoris o P. methanolica), el género Komagataella (K. pastoris, K. pseudopastoris o K. phaffii), Hansenula polymorpha, Yarrowia lipolytica, Schefferomyces stipitis o Kluyveromyces lactis. Examples of preferred yeast cells used as host cells in accordance with the invention include, but are not limited to the genus Saccharomyces (eg Saccharomyces cerevisiae), the genus Pichia (eg P. pastoris or P. methanolica) , the genus Komagataella ( K. pastoris, K. pseudopastoris, or K. phaffii), Hansenula polymorpha, Yarrowia lipolytica, Schefferomyces stipitis, or Kluyveromyces lactis.

La bibliografía más reciente divide y cambia de nombre Pichia pastoris a Komagataella pastoris, Komagataella phaffii y Komagataella pseudopastoris. En el presente documento se utiliza Pichia pastoris como sinónimo para todos, Komagataella pastoris, Komagataella phaffii y Komagataella pseudopastoris. The most recent bibliography divides and changes the name Pichia pastoris to Komagataella pastoris, Komagataella phaffii and Komagataella pseudopastoris. In this document, Pichia pastoris is used as a synonym for all Komagataella pastoris, Komagataella phaffii and Komagataella pseudopastoris.

Las células anfitrionas de levadura preferidas se obtienen a partir de levadura metilotrófica, tal como a partir de Pichia o Komagataella, p. ej. Pichia pastoris, o Komagataella pastoris, o K. phaffii, o K. pseudopastoris. Los ejemplos del anfitrión incluyen levaduras tales como P. pastoris. Los ejemplos de cepas de P. pastoris incluyen CBS 704 (=NRRL Y-1603 = DSMZ 70382), CBS 2612 (=NRRL Y-7556), CBS 7435 (=NRRL Y-11430), CBS 9173-9189 (cepas CBS: CBS-KNAW Fungal Biodiversity Center, Centraalbureau voor Schimmelcultures, Utrecht, Países Bajos) y DSMZ 70877 (Colección alemana de microorganismos y cultivos celulares), pero también cepas de Invitrogen, tales como X-33, GS115, KM71 y SMD1168. Los ejemplos de cepas de S. cerevisiae incluyen W303, CEN.PK y la serie BY (colección EUROSCARF). Todas las cepas descritas anteriormente se han utilizado con éxito para producir transformantes y expresar genes heterólogos.Preferred yeast host cells are obtained from methylotrophic yeast, such as from Pichia or Komagataella, e.g. eg Pichia pastoris, or Komagataella pastoris, or K. phaffii, or K. pseudopastoris. Examples of the host include yeasts such as P. pastoris. Examples of P. pastoris strains include CBS 704 (=NRRL Y-1603 = DSMZ 70382), CBS 2612 (=NRRL Y-7556), CBS 7435 (=NRRL Y-11430), CBS 9173-9189 (CBS strains: CBS-KNAW Fungal Biodiversity Center, Centraalbureau voor Schimmelcultures, Utrecht, The Netherlands) and DSMZ 70877 (German Collection of Microorganisms and Cell Cultures), but also Invitrogen strains such as X-33, GS115, KM71 and SMD1168. Examples of S. cerevisiae strains include W303, CEN.PK, and the BY series (EUROSCARF collection). All of the strains described above have been successfully used to produce transformants and express heterologous genes.

Una célula anfitriona de levadura preferida según la invención, tal como una célula anfitriona de P. pastoris o S. cerevisiae, contiene secuencias promotoras heterólogas o recombinantes, que se pueden obtener a partir de una cepa de P. pastoris o S. cerevisiae, diferente del anfitrión de producción. En otra realización específica, la célula anfitriona según la invención comprende una construcción de expresión recombinante según la invención que comprende el promotor procedente del mismo género, especie o cepa que la célula anfitriona.A preferred yeast host cell according to the invention, such as a P. pastoris or S. cerevisiae host cell, contains heterologous or recombinant promoter sequences, which may be obtained from a different P. pastoris or S. cerevisiae strain. of the production host. In another specific embodiment, the host cell according to the invention comprises a recombinant expression construct according to the invention comprising the promoter from the same genus, species or strain as the host cell.

Según la invención, se prefiere proporcionar una línea de células anfitrionas de P. pastoris que comprende una secuencia del promotor pG1-x como se describe en el presente documento conectada operablemente a la secuencia de nucleótidos que codifica la POI. According to the invention, it is preferred to provide a P. pastoris host cell line comprising a pG1-x promoter sequence as described herein operably linked to the nucleotide sequence encoding POI.

Si la POI es una proteína homologa para la célula anfitriona, es decir, una proteína que se encuentra naturalmente en la célula anfitriona, la expresión de la POI en la célula anfitriona se puede modular mediante el intercambio de su secuencia promotora nativa por una secuencia promotora de acuerdo con la invención.If the POI is a homologous protein for the host cell, that is, a protein naturally found in the host cell, the expression of the POI in the host cell can be modulated by exchanging its native promoter sequence for a promoter sequence. according to the invention.

Este propósito se puede lograr, p. ej. mediante la transformación de una célula anfitriona con una molécula de ADN recombinante que comprende secuencias homólogas del gen diana para permitir la recombinación específica de sitio, la secuencia promotora y un marcador selectivo adecuado para la célula anfitriona. La recombinación específica de sitio tendrá lugar para conectar operablemente la secuencia promotora con la secuencia de nucleótidos que codifica la POI. Esto da como resultado la expresión de la POI a partir de la secuencia promotora según la invención en lugar de a partir de la secuencia promotora nativa.This purpose can be achieved, e.g. eg by transforming a host cell with a recombinant DNA molecule comprising sequences homologous to the target gene to allow site-specific recombination, the promoter sequence, and a suitable selectable marker for the host cell. Site-specific recombination will take place to operably link the promoter sequence to the nucleotide sequence encoding the POI. This results in the expression of the POI from the promoter sequence according to the invention rather than from the native promoter sequence.

Se prefiere específicamente que el promotor pG1-x tenga una mayor actividad promotora con relación a la secuencia promotora nativa de la POI.It is specifically preferred that the pG1-x promoter has increased promoter activity relative to the native POI promoter sequence.

Según una realización específica, el método de producción de la POI emplea una secuencia de nucleótidos recombinante que codifica la POI, que se proporciona en un plásmido adecuado para la integración en el genoma de la célula anfitriona, en una sola copia o en múltiples copias por célula. La secuencia de nucleótidos recombinante que codifica la POI también se puede proporcionar en un plásmido de replicación autónoma en una sola copia o en múltiples copias por célula.According to a specific embodiment, the POI production method employs a recombinant nucleotide sequence encoding POI, which is provided on a plasmid suitable for integration into the host cell genome, in single copy or multiple copies by cell. The recombinant nucleotide sequence encoding the POI can also be provided on an autonomously replicating plasmid in a single or multiple copies per cell.

El método preferido como se describe en el presente documento emplea un plásmido, que es un vector de expresión eucariótico, preferiblemente un vector de expresión de levadura. Los vectores de expresión pueden incluir, pero sin limitarse a, vectores de clonación, vectores de clonación modificados y plásmidos diseñados específicamente. El vector de expresión preferido como se emplea en la invención puede ser cualquier vector de expresión adecuado para la expresión de un gen recombinante en una célula anfitriona y se selecciona dependiendo del organismo anfitrión. El vector de expresión recombinante puede ser cualquier vector que sea capaz de replicarse o integrarse en el genoma de los organismos anfitriones, también llamado vector anfitrión, tal como un vector de levadura, que porta una construcción de ADN de acuerdo con la invención. Un vector de expresión de levadura preferido es para la expresión en levadura seleccionada del grupo que consiste en levaduras metilotróficas representadas por los géneros Hansenula, Pichia, Candida y Torulopsis.The preferred method as described herein employs a plasmid, which is a eukaryotic expression vector, preferably a yeast expression vector. Expression vectors may include, but are not limited to, cloning vectors, modified cloning vectors, and specifically designed plasmids. The preferred expression vector as used in the invention may be any expression vector suitable for expression of a recombinant gene in a host cell and is selected depending on the host organism. The recombinant expression vector may be any vector that is capable of replicating or integrating into the genome of the host organisms, also called a host vector, such as a yeast vector, carrying a DNA construct according to the invention. A preferred yeast expression vector is for expression in yeast selected from the group consisting of methylotrophic yeasts represented by the genera Hansenula, Pichia, Candida and Torulopsis.

En la presente invención, se prefiere utilizar plásmidos obtenidos a partir de pPICZ, pGAPZ, pPIC9, pPICZalfa, pGAPZalfa, pPIC9K, pGAPHis o pPUZZLE como vector.In the present invention, it is preferred to use plasmids derived from pPICZ, pGAPZ, pPIC9, pPICZalpha, pGAPZalpha, pPIC9K, pGAPHis or pPUZZLE as a vector.

Según una realización preferida de la presente invención, se obtiene una construcción recombinante ligando los genes relevantes en un vector. Estos genes se pueden integrar de forma estable en el genoma de la célula anfitriona transformando la célula anfitriona utilizando tales vectores. Los polipéptidos codificados por los genes se pueden producir utilizando la línea celular anfitriona recombinante cultivando un transformante, así obtenido en un medio apropiado, aislando la POI expresada del cultivo y purificándolos mediante un método apropiado para el producto expresado, en particular para separar la POI de las proteínas contaminantes.According to a preferred embodiment of the present invention, a recombinant construct is obtained by ligating the relevant genes into a vector. These genes can be stably integrated into the host cell genome by transforming the host cell using such vectors. The polypeptides encoded by the genes can be produced using the recombinant host cell line by culturing a transformant, thus obtained, in an appropriate medium, isolating the expressed POI from the culture and purifying them by a method appropriate to the expressed product, in particular to separate the POI from contaminating proteins.

Los vectores de expresión pueden comprender uno o más marcadores seleccionables fenotípicos, p. ej. un gen que codifica una proteína que confiere resistencia a los antibióticos o que proporciona un requerimiento autótrofo. Los vectores de levadura contienen comúnmente un origen de replicación de un plásmido de levadura, una secuencia de replicación autónoma (ARS) o, alternativamente, una secuencia utilizada para la integración en el genoma del anfitrión, una región promotora, secuencias para poliadenilación, secuencias para la terminación de la transcripción y un marcador seleccionable.Expression vectors may comprise one or more phenotypic selectable markers, e.g. eg a gene encoding a protein that confers antibiotic resistance or provides an autotrophic requirement. Yeast vectors commonly contain an origin of replication from a yeast plasmid, an autonomously replicating sequence (ARS) or, alternatively, a sequence used for integration into the host genome, a promoter region, sequences for polyadenylation, sequences for transcription termination and a selectable marker.

Los procedimientos utilizados para ligar las secuencias de ADN y los elementos reguladores, p. ej. el promotor pG1-x y el gen o genes que codifican la POI, el promotor y el terminador, respectivamente, y para insertarlos en vectores adecuados que contienen la información necesaria para la integración o replicación del anfitrión, son bien conocidos por los expertos en la técnica, p. ej. descritos por J. Sambrook et al., (A Laboratory Manual, Cold Spring Harbor, 1989). Procedures used to ligate DNA sequences and regulatory elements, e.g. eg pG1-x promoter and gene(s) encoding POI, promoter and terminator, respectively, and for inserting them into suitable vectors containing information necessary for host integration or replication, are well known to those skilled in the art. technique, e.g. eg described by J. Sambrook et al., (A Laboratory Manual, Cold Spring Harbor, 1989).

Se entenderá que el vector, que utiliza los elementos reguladores de acuerdo con la invención y/o la POI como diana de integración, se puede construir preparando primero una construcción de ADN que contenga la secuencia de ADN completa que codifica los elementos reguladores y/o la POI y posteriormente insertando este fragmento en un vector de expresión adecuado, o insertando secuencialmente fragmentos de ADN que contienen información genética para los elementos individuales, seguido de ligación.It will be understood that the vector, which uses the regulatory elements according to the invention and/or the POI as integration target, can be constructed by first preparing a DNA construct containing the complete DNA sequence encoding the regulatory elements and/or POI and subsequently inserting this fragment into a suitable expression vector, or sequentially inserting DNA fragments containing genetic information for the individual elements, followed by ligation.

También se pueden utilizar vectores de clonación múltiple, que son vectores que tienen un sitio de clonación múltiple, de acuerdo con la invención, en donde se puede incorporar un gen heterólogo deseado en un sitio de clonación múltiple para proporcionar un vector de expresión. En los vectores de expresión, el promotor se coloca aguas arriba del gen de la POI y regula la expresión del gen. En el caso de los vectores de clonación múltiple, debido a que el gen de la POI se introduce en el sitio de clonación múltiple, el promotor se coloca aguas arriba del sitio de clonación múltiple.Multiple cloning vectors, which are vectors having a multiple cloning site, can also be used according to the invention, wherein a desired heterologous gene can be incorporated into a multiple cloning site to provide an expression vector. In expression vectors, the promoter is positioned upstream of the POI gene and regulates expression of the gene. In the case of multiple cloning vectors, because the POI gene is inserted into the multiple cloning site, the promoter is placed upstream of the multiple cloning site.

La construcción de ADN proporcionada para obtener una célula anfitriona recombinante de acuerdo con la invención se puede preparar sintéticamente mediante métodos convencionales establecidos, p. ej. el método de la fosforamidita. The DNA construct provided to obtain a recombinant host cell according to the invention can be synthetically prepared by established conventional methods, e.g. eg the phosphoramidite method.

La construcción de ADN también puede ser de origen genómico o de ADNc, por ejemplo, obtenida mediante la preparación de una biblioteca genómica o de ADNc y el escrutinio de secuencias de ADN que codifican todo o parte del polipéptido de la invención mediante hibridación utilizando sondas de oligonucleótidos sintéticos de acuerdo con técnicas convencionales (Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, 1989). Finalmente, la construcción de ADN puede ser de origen mixto sintético y genómico, mixto sintético y ADNc o mixto genómico y ADNc preparado por reasociación de fragmentos de origen sintético, genómico o de ADNc, según corresponda, correspondiendo los fragmentos a varias partes de la construcción de ADN completa, de acuerdo con las técnicas convencionales.The DNA construct may also be of cDNA or genomic origin, for example, obtained by preparing a cDNA or genomic library and screening DNA sequences encoding all or part of the polypeptide of the invention by hybridization using probes. synthetic oligonucleotides according to standard techniques (Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, 1989). Finally, the DNA construct may be of mixed synthetic and genomic origin, mixed synthetic and cDNA, or mixed genomic and cDNA prepared by annealing fragments of synthetic, genomic or cDNA origin, as appropriate, the fragments corresponding to various parts of the construct. of complete DNA, according to conventional techniques.

En otra realización preferida, el vector de expresión de levadura se puede integrar de manera estable en el genoma de la levadura, p. ej. mediante recombinación homóloga.In another preferred embodiment, the yeast expression vector can be stably integrated into the yeast genome, e.g. eg by homologous recombination.

Una célula anfitriona transformante de acuerdo con la invención obtenida transformando la célula con los elementos reguladores de acuerdo con la invención y/o los genes de POI se puede cultivar preferiblemente en primer lugar en condiciones para que crezca eficientemente hasta un gran número de células. Cuando se prepara la línea celular para la expresión de la POI, se eligen técnicas de cultivo para producir el producto de expresión.A transformant host cell according to the invention obtained by transforming the cell with the regulatory elements according to the invention and/or the POI genes may preferably first be cultured under conditions for it to grow efficiently to a large number of cells. When preparing the cell line for POI expression, culture techniques are chosen to produce the expression product.

La descripción anterior se entenderá más completamente con referencia a los siguientes ejemplos. Sin embargo, tales ejemplos son simplemente representativos de métodos para poner en práctica una o más realizaciones de la presente invención y no se deben interpretar como limitantes del alcance de la invención.The above description will be more fully understood with reference to the following examples. However, such examples are merely representative of methods of practicing one or more embodiments of the present invention and should not be construed as limiting the scope of the invention.

Ejemplosexamples

Ejemplo 1: El acortamiento 5' de pG1 revela la región reguladora principal de pG1Example 1: 5' Shortening of pG1 Reveals the Major Regulatory Region of pG1

El promotor pG1 nativo (tipo salvaje) se ha aislado de P. pastoris (Komagatella phaffii) cepa CBS2612 (cepas CBS: CBS-KNAW Fungal Biodiversity Center, Centraalbureau voor Schimmelcultures, Utrecht, Países Bajos). Según lo determinado por la secuenciación de Sanger y el análisis BLAST posterior, la secuencia del promotor pG1 de CBS2612 tenía más de 95% de identidad de secuencia con las regiones respectivas en las secuencias genómicas de las cepas GS115 (Invitrogen) (aguas arriba de PAS_chr1-3_0011) y CBS7435 (aguas arriba de P7435_Chr1-0007) o K. pastoris DSMZ 70382 (cepas DSMZ: Colección Alemana de Microrganismos y Cultivos Celulares) (aguas arriba de PIPA00372). Durante el análisis de la región genómica de pG1, se descubrió que su gen GTH1 tiene una anotación de inicio diferente en las cepas CBS7435 (P7435_Chr1-0007) y DSMZ 70382 (PIPA00372) que en GS115 (PAS_chr1-3_0011). A diferencia de GS115 y CBS2612, la secuencia codificante tiene una anotación de inicio 36 pb más aguas abajo en las secuencias genómicas de las otras dos cepas.The native (wild-type) pG1 promoter has been isolated from P. pastoris ( Komagatella phaffii) strain CBS2612 (CBS strains: CBS-KNAW Fungal Biodiversity Center, Centraalbureau voor Schimmelcultures, Utrecht, The Netherlands). As determined by Sanger sequencing and subsequent BLAST analysis, the pG1 promoter sequence of CBS2612 had greater than 95% sequence identity with the respective regions in the genomic sequences of strains GS115 (Invitrogen) (upstream of PAS_chr1 -3_0011) and CBS7435 (upstream of P7435_Chr1-0007) or K. pastoris DSMZ 70382 (DSMZ strains: German Collection of Microrganisms and Cell Cultures) (upstream of PIPA00372). During analysis of the genomic region of pG1, its GTH1 gene was found to have a different start annotation in strains CBS7435 (P7435_Chr1-0007) and DSMZ 70382 (PIPA00372) than in GS115 (PAS_chr1-3_0011). Unlike GS115 and CBS2612, the coding sequence has a start annotation 36 bp further downstream in the genomic sequences of the other two strains.

Para identificar la región reguladora relevante de pG1, se clonaron 8 variantes de pG1 acortadas a partir de CBS2612 empezando en las posiciones 5' alternativas -858, -663, -492, -371, -328, -283, -211 y -66 a la posición -1 (véase la Figura 1, numeración basada en el inicio del locus del gen GTH1 PAS_chr1-3_0011). Estas variantes de promotor acortado se escrutaron para determinar la expresión de eGFP en placas de pocillos profundos como se describe en el Ejemplo 8 para probar las propiedades de represión (glicerol) e inducción (cuentas de alimentación de glucosa) en comparación con la versión original de 965 pb de pG1 (Figura 2). No se encontraron diferencias en la señal de eGFP para todas las variantes de longitud en la condición de represión, lo que demuestra que la represión del promotor no estaba restringida en ninguna de las variantes acortadas. Después de 48 horas de inducción, la capacidad de expresión permaneció completamente funcional para las variantes del promotor hasta una longitud de 328 pb. La variante de 283 pb tenía sólo aproximadamente dos tercios de la fuerza en comparación con el promotor pG1 original. Las dos variantes de longitud más corta (211 y 66 pb) parecían ser casi no funcionales. Estos resultados indican que la región entre la posición -400 y -200 contiene importantes características reguladoras.To identify the relevant regulatory region of pG1, 8 shortened pG1 variants were cloned from CBS2612 starting at alternative 5' positions -858, -663, -492, -371, -328, -283, -211 and -66. to position -1 (see Figure 1 , numbering based on the start of the GTH1 gene locus PAS_chr1-3_0011). These shortened promoter variants were screened for eGFP expression in deep-well plates as described in Example 8 to test repression (glycerol) and induction (glucose feed beads) properties compared to the original version of . 965 bp of pG1 (Figure 2). No differences in eGFP signal were found for all length variants in the repression condition, demonstrating that promoter repression was not restricted in any of the shortened variants. After 48 hours of induction, expression capacity remained fully functional for promoter variants up to 328 bp in length. The 283 bp variant was only about two-thirds as strong as the original pG1 promoter. The two shorter length variants (211 and 66 bp) appeared to be almost non-functional. These results indicate that the region between position -400 and -200 contains important regulatory features.

Ejemplo 2: Una alta densidad de TFBS relacionados con la fuente de carbono pronosticada marca la principal región reguladora del promotor pG1Example 2: A High Density of TFBS Related to the Predicted Carbon Source Marks the Major Regulatory Region of the pG1 Promoter

Se buscó la secuencia del promotor pG1 (1000 pb aguas arriba del gen PAS_chr1-3_0011) para familias de matriz pertenecientes a los grupos de matriz de "hongos" y "elementos promotores centrales generales" utilizando el Matlnspector de Genomatix. Se encontraron 111 supuestos TFBS pertenecientes a 46 familias de matrices diferentes.The pG1 promoter sequence (1000 bp upstream of the PAS_chr1-3_0011 gene) was searched for matrix families belonging to the "fungi" and "general core promoter element" matrix groups using the Genomatix MatInspector. 111 putative TFBS belonging to 46 different matrix families were found.

(Tabla 1). Las familias de matrices más comunes en la secuencia analizada fueron motivos monoméricos de clase Gal4 (F$MGCM, 12 sitios de unión), reguladores transcripcionales que contenían homeodominio (F$HOMD, 6 sitios de unión), familia de cremalleras de leucina básica fúngica (F$BZIP, 5 sitios de unión) y proteínas de la Caja GC de levadura (F$YMIG, 5 sitios de unión). Se observó una densidad de sitios de unión de TFBS muy alta entre la posición -400 a -200 encontrándose allí aproximadamente dos tercios de los TFBS mencionados (familias de matrices más comunes) (18 de 28). Con respecto a los elementos promotores centrales generales, el Matlnspector no identificó motivos relacionados con levaduras u hongos, pero se puede encontrar una caja TATA comenzando en la posición -26. (Table 1). The most common template families in the analyzed sequence were Gal4-class monomeric motifs (F$MGCM, 12 binding sites), homeodomain-containing transcriptional regulators (F$HOMD, 6 binding sites), fungal basic leucine zipper family (F$BZIP, 5 binding sites) and yeast GC-Box proteins (F$YMIG, 5 binding sites). A very high density of TFBS binding sites was observed between position -400 to -200 with approximately two-thirds of the mentioned TFBS (most common matrix families) being found there (18 of 28). Regarding the general core promoter elements, the Matlnspector did not identify yeast or fungal related motifs, but a TATA box can be found starting at position -26.

Se identificó un motivo prominente, p. ej. en la posición -390 a -375, que se denominó TAT14 debido a su secuencia 5'-TATTTTTTTTTTTTTT-3' (SEC ID 21) o TAT15 debido a su secuencia 5'-TATTTTTTTTTTTTTTT-3' (SEC ID 22). Se sabe que tales tramos de poli (A:T) en las regiones promotoras afectan negativamente a la unión del nucleosomas y estimulan la unión de TF en sitios cercanos en la levadura. A prominent motif was identified, e.g. eg at position -390 to -375, which was named TAT14 due to its sequence 5'-TATTTTTTTTTTTTTT-3' (SEQ ID 21) or TAT15 due to its sequence 5'-TATTTTTTTTTTTTTT-3' (SEQ ID 22). Such poly(A:T) stretches in promoter regions are known to negatively affect nucleosome binding and stimulate TF binding at nearby sites in yeast.

Ejemplo 3: Se reveló que los factores de transcripción relacionados con la fuente de carbono Mxr1, Rgt1, Cat8-1, Cat8-2 y Mig1 son importantes para las propiedades reguladoras de pG1Example 3: The carbon source-related transcription factors Mxr1, Rgt1, Cat8-1, Cat8-2 and Mig1 were revealed to be important for the regulatory properties of pG1

Los sitios de unión del factor de transcripción con dependencia prevista de la fuente de glucosa o carbono se seleccionaron para un análisis adicional (véanse la Figura 1 y la Tabla 2). Las variantes de pG1 con deleciones de las respectivas regiones se generaron utilizando PCR de extensión por solapamiento.Transcription factor binding sites with predicted dependence on glucose or carbon source were selected for further analysis (see Figure 1 and Table 2). pG1 variants with deletions of the respective regions were generated using overlap extension PCR.

La Tabla 3 enumera todos los TFBS seleccionados e indica todos los TFBS que están (parcialmente) afectados por la deleción (lista detallada en la Tabla 2). Para algunas deleciones (p. ej., A9 y A10), algunos nucleótidos del TFBS respectivo se dejaron intactos para mantener funcional el TFBS vecino cercano y examinar por separado su efecto. Table 3 lists all selected TFBS and indicates all TFBS that are (partially) affected by the deletion (detailed list in Table 2). For some deletions (eg, A9 and A10), some nucleotides of the respective TFBS were left intact to keep the close neighbor TFBS functional and separately examine its effect.

Todas las variantes de deleción de TFBS y mutación de TAT se escrutaron para determinar la expresión de eGFP como se describe en el Ejemplo 8 en condiciones de represión (glicerol) e inducción (cuenta de alimentación de glucosa) (Figura 3). Es importante considerar que los TF/TFBS individuales generalmente no son suficientes para cumplir con la regulación de un promotor. Las deleciones de TFBS también implican que la secuencia promotora puede verse afectada por la secuencia adjunta recién formada, por distancias alteradas entre TFBS o por cambios de propiedades de orden superior (organización de la cromatina). El mismo TFBS en diferentes posiciones del promotor puede tener diferentes funciones, también debido a otros TFBS adyacentes. En TFBS muy próximos, los t F pueden actuar de forma sinérgica o restringir la unión de otros TF debido al impedimento estérico.All TFBS deletion and TAT mutation variants were screened for eGFP expression as described in Example 8 under repression (glycerol) and induction (glucose feed count) conditions (FIG. 3). It is important to consider that individual TF/TFBS are generally not sufficient to comply with the regulation of a promoter. TFBS deletions also imply that the promoter sequence may be affected by newly formed adjunct sequence, by altered distances between TFBS, or by higher order property changes (chromatin organization). The same TFBS at different promoter positions may have different functions, also due to other adjacent TFBS. In closely spaced TFBS, tFs may act synergistically or restrict the binding of other TFs due to steric hindrance.

Se eliminaron cuatro familias diferentes de TF relacionadas con la fuente de carbono en las variantes del promotor pG1 (véanse la Tabla 2 y la Tabla 3): Regulador metabólico de levadura (F$ADR; matrices: F$ADR1.01), motivos monoméricos de clase Gal4 (F$MGCM; matrices: F$RGT1.01, F$RGT1.02), elementos sensibles a la fuente de carbono (F$CSRE, matrices: F$CSRE.01, F$SIP4.01) y Proteínas de la Caja GC de Levadura (F$YMIG; matrices: F$MIG1.01 y F$MIG1.02). Los factores de transcripción correspondientes en S. cerevisiae son Adr1, Rgt1, Sip4/Cat8 y Mig1, respectivamente.Four different carbon source-related TF families were deleted in the pG1 promoter variants (see Table 2 and Table 3): Yeast metabolic regulator (F$ADR; arrays: F$ADR1.01), monomeric motifs Gal4 class (F$MGCM; matrices: F$RGT1.01, F$RGT1.02), carbon source sensitive elements (F$CSRE, matrices: F$CSRE.01, F$SIP4.01) and Yeast GC Box Proteins (F$YMIG; matrices: F$MIG1.01 and F$MIG1.02). The corresponding transcription factors in S. cerevisiae are Adr1, Rgt1, Sip4/Cat8 and Mig1, respectively.

Los promotores dependientes de la fuente de carbono están controlados por la represión de la glucosa y/o la inducción por carbohidratos u otras fuentes de carbono que no son azúcares. La represión de glucosa se lleva a cabo principalmente por el complejo de proteína quinasa Snf1, el represor transcripcional Mig 1 y la proteína fosfatasa 1. Los factores aguas abajo regulan, p. ej. genes respiratorios (Hap4), genes de gluconeogénesis (Cat8, Sip4) y transportadores de glucosa (Rgt1) en S. cerevisiae. Carbon source-dependent promoters are controlled by glucose repression and/or induction by carbohydrates or other non-sugar carbon sources. Glucose repression is mainly carried out by the protein kinase complex Snf1, the transcriptional repressor Mig 1 and protein phosphatase 1. Downstream factors regulate e.g. eg respiratory genes (Hap4), gluconeogenesis genes (Cat8, Sip4) and glucose transporters (Rgt1) in S. cerevisiae.

P. pastoris tiene dos homólogos de Mig1, llamados Mig 1 -1 y Mig 1 -2, el segundo de los cuales posiblemente actúa como represor del catabolito de carbono. Cuando hay glucosa disponible, Mig1 actúa como represor, mientras que Rgt1 actúa como activador transcripcional. Para cumplir la función represora, Mig 1 se desfosforila y se importa al núcleo donde recluta los correpresores Ssn6 y Tup1. P. pastoris has two homologues of Mig1, named Mig 1-1 and Mig 1-2, the second of which possibly acts as a carbon catabolite repressor. When glucose is available, Mig1 acts as a repressor, while Rgt1 acts as a transcriptional activator. To fulfill the repressor function, Mig 1 is dephosphorylated and imported into the nucleus where it recruits the co-repressors Ssn6 and Tup1.

Al limitar la glucosa, Rgt1 se desfosforila y actúa como represor transcripcional. La función de Rgt1 está controlada por su estado de fosforilación (Rgt1 tiene cuatro sitios de fosforilación), y la inducción de promotores regulados no requiere la disociación de Rgt1 en S. cerevisiae, como se observa típicamente para los represores transcripcionales. By limiting glucose, Rgt1 is dephosphorylated and acts as a transcriptional repressor. Rgt1 function is controlled by its phosphorylation state (Rgt1 has four phosphorylation sites), and induction of regulated promoters does not require Rgt1 dissociation in S. cerevisiae, as is typically observed for transcriptional repressors.

El factor de transcripción con dedos de cinc sensible a la fuente de carbono Adr1 es necesario para la activación transcripcional del gen de la alcohol deshidrogenasa reprimible por glucosa (ADH2) en S. cerevisae. El homólogo de Adr1 en P. pastoris es Mxr1 (PAS_chr4_0487), el regulador clave del metabolismo del metanol, y se informó que es un factor de transcripción de acción positiva que es esencial para una fuerte inducción de Pa o x sobre metanol. El motivo central de TFBS 5' CYCC 3' referido para Mxr1 coincide con ambos sitios F$ADR1.01 encontrados en la secuencia del promotor pG1.The carbon source-sensitive zinc finger transcription factor Adr1 is required for transcriptional activation of the glucose-repressible alcohol dehydrogenase ( ADH2) gene in S. cerevisae. The homologue of Adr1 in P. pastoris is Mxr1 (PAS_chr4_0487), the key regulator of methanol metabolism, and was reported to be a positive-acting transcription factor that is essential for strong induction of P aox on methanol. The TFBS 5' CYCC 3' core motif referred to for Mxr1 coincides with both F$ADR1.01 sites found in the pG1 promoter sequence.

El elemento de respuesta a la fuente de carbono (CSRE) está unido por los activadores transcripcionales Sip4 y Cat8 y funciona induciendo la expresión de genes de gluconeogénesis en S. cerevisiae. Se pueden encontrar dos homólogos de P. pastoris de ScCat8: Cat8-1 (PAS_chr2-1_0757) y Cat8-2 (PAS_chr4_0540), siendo ambos los mejores éxitos de blastp para ScSip4. Cat8-2 es débilmente similar a ScCat8, y potencialmente juega un papel importante en las condiciones de desrepresión.The carbon source response element (CSRE) is bound by the transcriptional activators Sip4 and Cat8 and functions by inducing the expression of gluconeogenesis genes in S. cerevisiae. Two P. pastoris homologues of Sc Cat8 can be found: Cat8-1 (PAS_chr2-1_0757) and Cat8-2 (PAS_chr4_0540), both being the best blastp hits for ScSip4. Cat8-2 is weakly similar to ScCat8, and potentially plays an important role in derepressive conditions.

Ejemplo 4: Las variantes de deleción del promotor pG1 revelan el TFBS responsable de su represión e inducciónExample 4: pG1 promoter deletion variants reveal the TFBS responsible for its repression and induction

De las 5 variantes de deleción que residen aguas arriba (5') de la región reguladora principal de pG1 identificadas anteriormente (véase recuadro sombreado en la Figura 1 y la Tabla 2), las variantes pG1-A1, -A2 y -A4 parecen tener un efecto beneficioso sobre la fuerza del promotor mientras que las variantes de deleción pG1-A3 y A5 no tuvieron efecto sobre la expresión de GFP en comparación con el promotor pG1 original (SEQ ID 9). Este resultado sugiere que el acortamiento 5' del promotor podría ser beneficioso para la modificación genética de pG1. Las deleciones de TFBS dentro de la región reguladora principal de pG1 (pG1-A6 a -A12, véanse la Figura 1 y la Tabla 2) tuvieron diferentes impactos en la expresión de eGFP, pero ninguno mostró un aumento de la inducción sin perder las propiedades de represión. Por lo tanto, se supone que la región reguladora principal de pG1 debe mantenerse en variantes del promotor pG1 modificadas genéticamente para mantener su estricta regulación. Por consiguiente, sin esta región, se observó una inducción mucho menor en la limitación de la glucosa en el Ejemplo 1 (pG1-328 y pG1-283, Figura 2 ).Of the 5 deletion variants residing upstream (5') of the pG1 major regulatory region identified above (see shaded box in Figure 1 and Table 2), variants pG1-A1, -A2, and -A4 appear to have a beneficial effect on promoter strength while pG1-A3 and A5 deletion variants had no effect on GFP expression compared to the original pG1 promoter (SEQ ID 9). This result suggests that 5' shortening of the promoter could be beneficial for genetic modification of pG1. TFBS deletions within the major regulatory region of pG1 (pG1-A6 to -A12, see Figure 1 and Table 2 ) had different impacts on eGFP expression, but none showed increased induction without losing properties. of repression. Therefore, it is assumed that the major regulatory region of pG1 must be maintained in genetically modified pG1 promoter variants to maintain its tight regulation. Therefore, without In this region, a much smaller induction in glucose limitation was observed in Example 1 (pG1-328 and pG1-283, Figure 2 ).

Los sitios de unión de Mig1 se eliminaron en pG1-A3, -A4, -A10 y -A11 (F$MIG1.02 en A3, F$MIG1.01 en A4, A10 y A11), donde pG1-A10 y pG1-A11 también incluyen las deleciones F$ADR1.01 y F$RGT1.02, respectivamente. Se encontró una represión ligeramente más estricta para A3, mientras que A4 tuvo una represión sin cambios, pero niveles mejorados de eGFP después de la inducción.Mig1 binding sites were deleted in pG1-A3, -A4, -A10 and -A11 (FMIG1.02 in A3, FMIG1.01 in A4, A10 and A11), where pG1-A10 and pG1- A11 also includes the F$ADR1.01 and F$RGT1.02 deletions, respectively. A slightly tighter repression was found for A3, while A4 had unchanged repression, but improved levels of eGFP after induction.

La liberación de la represión observada para A10 y la inducción del promotor más débil de A10 y A11 también podrían conectarse a los sitios de unión de F$RGT1 en esta región (F$RGT1.01 y F$RGT1.02 suprimidos en A9 y A11). Además, Mig 1 podría desempeñar un papel bifuncional en la regulación de pG1: dos genes MIG1 se encuentran en P. pastoris (MIG1-1, MIG1-2) y se demostró que estaban regulados a la inversa según la disponibilidad de glucosa. The release of repression observed for A10 and the induction of the weaker promoter of A10 and A11 could also be linked to F$RGT1 binding sites in this region (F$RGT1.01 and F$RGT1.02 deleted in A9 and A11). Furthermore, Mig 1 might play a bifunctional role in pG1 regulation: two MIG1 genes are found in P. pastoris ( MIG1-1, MIG1-2) and were shown to be reverse regulated depending on glucose availability.

La deleción de F$ADR1.01 aumentó los niveles de eGFP en la variante pG1-A1, aunque se esperaría que la deleción del sitio de unión de Mxr1 (regulador positivo del metabolismo del metanol en Pp, homólogo de ScADR1) debilitara bastante el promotor. La deleción combinada de F$ADR1.01 con F$MIG1.01 en pG1-A10 liberó la represión del promotor sobre el glicerol y debilitó su inducción, que es una respuesta concluyente para la deleción de TFBS de Mig1. Deletion of F$ADR1.01 increased eGFP levels in the pG1-A1 variant, although deletion of the Mxr1 (positive regulator of methanol metabolism in Pp, homologue of ScADR1) binding site would be expected to significantly weaken the promoter. . Combined deletion of F$ADR1.01 with F$MIG1.01 in pG1-A10 released promoter repression on glycerol and weakened its induction, which is a conclusive response to TFBS deletion of Mig1.

En la región reguladora principal, el sitio de unión F$RGT1.02 se eliminó en las variantes pG1-A6 (dos sitios), -A7, -A8, -A11 y -A12, y F$RGT1.o1 se eliminó en A9. La variante que alberga la deleción del sitio F$RGTl.02 emparejado (A6, sitios de unión en hebras opuestas con un desplazamiento de 7 pb) mostró una ligera liberación de la represión y una reducción de la inducción. Las variantes A7 y A8 contienen sitios F$RGT1.02 muy cercanos, donde el primero se encuentra en la hebra negativa y el segundo en la hebra positiva; también A8 contiene la deleción de un sitio F$SIP4.01. El primero (A7) mostró una ligera liberación de la represión y un aumento de inducción, mientras que el segundo (A8) tuvo una inducción mucho más débil (pero tuvo una represión del promotor sin cambios). Esto indica un papel importante para el activador transcripcional Cat8-1 y/o Cat8-2 (homólogos más fuertes para ScSip4) para la inducción de pG1. La variante A9 se creó para suprimir los TFBS de F$RGT1.01 y F$CSRE.01 (sitios de unión en hebras opuestas) localizados muy próximos y la drástica pérdida de represión indica un papel importante de estos TFBS para controlar estrechamente pG1, muy probablemente a través de la unión de Rgt1, Cat8-1 y/o Cat8-2. La deleción de F$RGT1.02 en la variante pG1-Al2 no tuvo efecto sobre el rendimiento de expresión de eGFP. Curiosamente, la transcripción de CAT8-2 está fuertemente regulada al alza en la limitación de glucosa en comparación con el excedente de glucosa, mientras que RGT1 y CAT8-2 no fueron regulados transcripcionalmente en las condiciones probadas.In the major regulatory region, the F$RGT1.02 binding site was deleted in variants pG1-A6 (two sites), -A7, -A8, -A11 and -A12, and F$RGT1.o1 was deleted in A9 . The variant harboring the paired F$RGT1.02 site deletion (A6, binding sites on opposite strands 7 bp shift) showed slight release of repression and reduced induction. Variants A7 and A8 contain closely spaced F$RGT1.02 sites, with the former on the negative strand and the latter on the positive strand; also A8 contains the deletion of an F$SIP4.01 site. The first (A7) showed a slight release of repression and increased induction, while the second (A8) had a much weaker induction (but had unchanged promoter repression). This indicates an important role for the transcriptional activator Cat8-1 and/or Cat8-2 (stronger homologs for ScSip4) for the induction of pG1. The A9 variant was created to suppress closely located F$RGT1.01 and F$CSRE.01 TFBSs (binding sites on opposite strands), and the dramatic loss of repression indicates an important role for these TFBSs in tightly controlling pG1, most likely through the binding of Rgt1, Cat8-1 and/or Cat8-2. The F$RGT1.02 deletion in the pG1-Al2 variant had no effect on eGFP expression yield. Interestingly, CAT8-2 transcription is strongly upregulated in glucose limitation compared to glucose surplus, whereas RGT1 and CAT8-2 were not transcriptionally regulated under the conditions tested.

Ejemplo 5: La fuerza del promotor pG1 depende del tramo poli (A:T) TAT14Example 5: The Strength of the pG1 Promoter Depends on the Poly(A:T) TAT14 Stretch

El motivo TAT está situado aproximadamente 80 pb aguas arriba (5', p. ej., posición -390 a -374) de la región reguladora principal de pG1. La secuenciación repetida de la región 5' de GTH1 en CBS2612, CBS7435 o GS115 de P. pastoris dio como resultado la detección de 15 /- 1 T en el motivo TAT. Para dilucidar su impacto en el rendimiento del promotor, se seleccionó el motivo TAT14 para la deleción (pG1-ATAT14) y mutación (en T16, T18 y T20; pG1-T16, pG1-T18, pG1-T20). Se diseñaron inicialmente cebadores (véanse cebadores núm. 37-42 en la Tabla 4) para obtener T18, T20 y T22, pero se obtuvieron y utilizaron variantes con diferentes longitudes (T16, T20 y T18, respectivamente). La deleción del motivo TAT14 dio como resultado señales de GFP más bajas, mientras que su prolongación aumentó la fuerza de expresión de pG1. Esto indica que el uso de un motivo TAT14 prolongado sería beneficioso para la modificación genética de pG1.The TAT motif is located approximately 80 bp upstream (5', eg, position -390 to -374) of the major regulatory region of pG1. Repeat sequencing of the 5' region of GTH1 in P. pastoris CBS2612, CBS7435 or GS115 resulted in the detection of 15 /- 1 T in the TAT motif. To elucidate its impact on promoter yield, the TAT14 motif was selected for deletion (pG1-ATAT14) and mutation (at T16, T18 and T20; pG1-T16, pG1-T18, pG1-T20). Primers (see primers #37-42 in Table 4) were initially designed to obtain T18, T20 and T22, but variants with different lengths (T16, T20 and T18, respectively) were obtained and used. Deletion of the TAT14 motif resulted in lower GFP signals, while its prolongation increased the expression strength of pG1. This indicates that the use of a long TAT14 motif would be beneficial for the genetic modification of pG1.

Ejemplo 6: Las duplicaciones de secuencias parciales de la región reguladora principal de pG1 mejoran significativamente su fuerza de expresiónExample 6: Partial Sequence Duplications of the Major Regulatory Region of pG1 Significantly Enhance Its Strength of Expression

Se generaron dos variantes de duplicación (pG1-D1240 (SEQ ID 49) y pG1-D1427 (SEQ ID 85), los números indican las longitudes de las respectivas variantes del promotor) del promotor pG1 mediante amplificación por PCR de dos fragmentos de secuencia (-472 a -188 y -472 a -1) e inserción utilizando los sitios de restricción Psi y BgIII (posiciones 509-514 y 525-530). Las secciones de duplicación comienzan aguas arriba de TFBS suprimido en pG1-A5 y terminan después de la región reguladora principal de pG1 para la primera variante (pG1-D1240), mientras que la segunda duplicación (pG1-D1427) llega hasta el extremo 3' del promotor pG1. Estas variantes se escrutaron para determinar la expresión de eGFP de la misma manera que se describe para las variantes de deleción de TFBS y mutación de TAT14 (véase el Ejemplo 8). Ambas variantes de duplicación mostraron una represión más estricta en exceso de glicerol y una inducción más fuerte al limitar la glucosa. (Figura 4). Two duplication variants (pG1-D1240 (SEQ ID 49) and pG1-D1427 (SEQ ID 85), numbers indicate the lengths of the respective promoter variants) of the pG1 promoter were generated by PCR amplification of two sequence fragments ( -472 to -188 and -472 to -1) and insertion using the Psi and BglII restriction sites (positions 509-514 and 525-530). The duplication sections start upstream of the deleted TFBS in pG1-A5 and end after the major regulatory region of pG1 for the first variant (pG1-D1240), while the second duplication (pG1-D1427) goes all the way to the 3' end. from the pG1 promoter. These variants were screened for eGFP expression in the same manner as described for the TFBS deletion and TAT14 mutation variants (see Example 8). Both duplication variants showed stricter repression at excess glycerol and stronger induction at limiting glucose. (Figure 4).

La estabilidad postransformacional del clon variante de duplicación pG1-D1240 núm. 3 se probó realizando tres cultivos discontinuos consecutivos sin presión de selección, que es igual a aproximadamente 20 generaciones. La expresión de eGFP fue estable durante todo el tiempo de cultivo (datos no mostrados). En comparación, un procedimiento en biorreactor con P. pastoris típico comienza con DO600 = 1 (-0,2-0,4 g/L de YDM) en la fase discontinua y termina con ~ 100 g/L de YDM después de la fase por lote alimentado y por lo tanto tarda 10 generaciones aproximadamente. The post-transformational stability of the pG1-D1240 duplication variant clone no. 3 was tested by performing three consecutive batch cultures without selection pressure, which is equal to approximately 20 generations. eGFP expression was stable throughout the culture time (data not shown). By comparison, a typical P. pastoris bioreactor process starts with OD600 = 1 (-0.2-0.4 g/L YDM) in the batch phase and ends with ~100 g/L YDM after the batch phase. per batch fed and therefore takes approximately 10 generations.

Ejemplo 7: Verificación del rendimiento de la variante del promotor pG1 en cultivo de biorreactor por lote alimentadoExample 7: Verification of pG1 Promoter Variant Yield in Fed-Batch Bioreactor Culture

Con el fin de verificar el rendimiento de las variantes del promotor generadas en condiciones de bioprocedimiento, se seleccionaron algunas variantes para el cultivo por lote alimentado en función de su comportamiento de expresión de eGFP alterado: pG1-A2 (SEQ ID 211) fue la variante más mejorada aguas arriba de la región reguladora principal , y pG1-T16 (SEQ ID 257) y pG1-D1240 (SEQ ID 49) mostraron niveles de expresión de eGFP más altos en la limitación de glucosa sin perder la represión del promotor en condiciones con glicerol. Se realizó un cultivo en biorreactor, que se inició con una fase discontinua de glicerol seguida de un lote alimentado optimizado para rendimiento espaciotemporal (Prielhofer et al., 2013), para un clon de cada uno y se comparó con la cepa de control pG1 núm. 8 para la expresión de eGFP (véanse la Figura 5 y la Tabla 5).In order to verify the performance of the promoter variants generated under bioprocess conditions, some variants were selected for fed-batch culture based on their altered eGFP expression behavior: pG1-A2 (SEQ ID 211) was the variant enhanced upstream of the major regulatory region, and pG1-T16 (SEQ ID 257) and pG1-D1240 (SEQ ID 49) showed higher eGFP expression levels in glucose-limiting without losing promoter repression under conditions with glycerol. Bioreactor culture, initiated with a glycerol batch phase followed by a fed-batch optimized for spatiotemporal yield (Prielhofer et al., 2013), was performed for one clone of each and compared to the control pG1 strain # . 8 for eGFP expression (see Figure 5 and Table 5 ).

Las fermentaciones por lote alimentado se realizaron en reactores DASGIP con un volumen de trabajo final de 0,7 L. The fed-batch fermentations were performed in DASGIP reactors with a final working volume of 0.7 L.

Se utilizaron los siguientes medios:The following means were used:

Solución de partida de sales traza PTMi contenida por litroStarting solution of trace salts PTMi contained per liter

6,0 g de CuSO*5H2O, 0,08 g de Nal, 3,36 g de MnSO4-H2O, 0,2 g de Na2MoO4^2H2O, 0,02 g de H3BO3 , 0,82 g de CoCl2 , 20,0 g de ZnCl2 , 65,0 g de FeSO*7H2O, 0,2 g de biotina y 5,0 mL de H2SO4 (95%-98%).6.0 g CuSO*5H 2 O, 0.08 g Nal, 3.36 g MnSO 4- H 2 O, 0.2 g Na 2 MoO 4 ^2H 2 O, 0.02 g H 3 BO 3 , 0.82 g CoCl 2 , 20.0 g ZnCl 2 , 65.0 g FeSO*7H 2 O, 0.2 g biotin, and 5.0 mL H 2 SO 4 (95% -98%).

Medio de lote de glicerol contenido por litroBatch media glycerol content per liter

2 g de Ácido cítrico monohidrato (C6HsOyH 2O), 39,2 g de glicerol, 12,6 g de NH4H2PO4 , 0,5 g de MgSO4^7H2O, 0,9 g de KCI, 0,022 g de CaC ^2H 2O, 0,4 mg de biotina y 4,6 mL de solución de partida de sales traza de PTM1. Se añadió HCl para ajustar el pH a 5.2 g Citric Acid Monohydrate (C 6 H s O and H 2 O), 39.2 g Glycerol, 12.6 g NH 4 H 2 PO 4 , 0.5 g MgSO 4 ^7H 2 O, 0.9 g of KCl, 0.022 g of CaC^2H 2 O, 0.4 mg of biotin and 4.6 mL of starting solution of trace salts of PTM1. HCl was added to adjust the pH to 5.

Medio de carga alimentado con glucosa contenido por litroGlucose fed loading medium content per liter

464 g de glucosa monohidrato, 5,2 g de MgSO4 ^7 H2O, 8,4 g de KCI, 0,28 g de CaCh^ 2 H2O, 0,34 mg de biotina y 10,1 mL de solución madre de sales traza PTM1.464 g of glucose monohydrate, 5.2 g of MgSO 4 ^7 H 2 O, 8.4 g of KCl, 0.28 g of CaCh^ 2 H 2 O, 0.34 mg of biotin and 10.1 mL of trace salts stock solution PTM1.

El oxígeno disuelto se controló a OD = 20% con la velocidad del agitador (400 - 1200 rpm). La tasa de aireación fue de 24 L h' 1 de aire, la temperatura se controló a 25°C y el punto de ajuste de pH de 5 se controló con la adición de NH4OH (25%).Dissolved oxygen was controlled at DO=20% with stirrer speed (400-1200 rpm). The aeration rate was 24 L h ' 1 of air, the temperature was controlled at 25°C and the pH set point of 5 was controlled with the addition of NH 4 OH (25%).

Para iniciar la fermentación, se filtraron en condiciones estériles 400 mL de medio discontinuo en el fermentador y se inocularon a partir de un precultivo selectivo del respectivo clon de P. pastoris con una densidad óptica inicial (DO600) de 1. La fase discontinua de aproximadamente 25 h (alcanzando una concentración de biomasa seca de aproximadamente 20 g/L) estuvo seguida por un lote alimentado limitado en glucosa comenzando con una alimentación exponencial durante 7 h y una tasa de alimentación constante de 15 g/L durante 13 h, lo que lleva a una concentración final de biomasa seca de aproximadamente 100 g/L. Se tomaron muestras durante la fase discontinua y por lote alimentado, y se analizaron para determinar la expresión de eGFP utilizando un lector de placas (Infinite 200, Tecan, CH). Por lo tanto, las muestras se diluyeron a una densidad óptica (DO600) de 5. Los resultados se muestran en la Figura 5 como fluorescencia relativa por biorreactor (FL/r).To start the fermentation, 400 mL of batch medium were sterile filtered into the fermenter and inoculated from a selective preculture of the respective P. pastoris clone with an initial optical density (OD600) of 1. The batch phase of approximately 25 h (reaching a dry biomass concentration of approximately 20 g/L) was followed by a glucose-limited fed-batch beginning with exponential feeding for 7 h and a constant feed rate of 15 g/L for 13 h, leading to at a final concentration of dry biomass of approximately 100 g/L. Samples were taken during batch and fed-batch phase and analyzed for eGFP expression using a plate reader (Infinite 200, Tecan, CH). Therefore, the samples were diluted to an optical density (OD600) of 5. The results are shown in Figure 5 as relative fluorescence per bioreactor (FL/r).

El número de copias del gen de estos tres clones se analizó mediante PCR en tiempo real y dio como resultado un GCN para todos ellos (datos no mostrados). Todas las variantes de pG1 mostraron una buena represión en la fase discontinua y una fuerte expresión en el estado inducido (Tabla 5). La fuerte mejora de la variante de duplicación pG1-D1240 se pudo verificar en condiciones de biorreactor, el clon pG1-D1240 núm. 3 mostró un aumento de 50% en la fluorescencia de GFP en el extremo del lote alimentado en comparación con pG1. Aunque la señal ya había aumentado al final del lote, la razón de inducción fue incluso un poco más alta que para el pG1 original. Además de en el escrutinio, el clon pG1-A2 num. 3 tenía un ligero aumento de señal al final del lote, y aproximadamente 10% de debilitamiento de la señal al final del lote alimentado. El clon pG1-T16 núm. 3 de la variante de mutación TAT14 mostró la señal más fuerte al final del lote, y se quedó atrás de la variante de duplicación en el final del lote alimentado, alcanzando una mejora de aproximadamente 20% sobre pG1 núm. 8 de control, similar al resultado del escrutinio. El diferente comportamiento de inducción de los clones en la fase discontinua se explica por la desrepresión debida a la disminución de la concentración de glicerol a lo largo de la fase discontinua (véase la Figura 5A). En general, los cultivos por lote alimentado podrían confirmar en gran medida los resultados obtenidos en el escrutinio a pequeña escala.The gene copy number of these three clones was analyzed by real-time PCR and resulted in a GCN for all of them (data not shown). All pG1 variants showed good repression in the batch phase and strong expression in the induced state (Table 5). The strong enhancement of the pG1-D1240 duplication variant could be verified under bioreactor conditions, pG1-D1240 clone no. 3 showed a 50% increase in GFP fluorescence at the end of the fed batch compared to pG1. Although the signal had already increased at the end of the batch, the induction rate was even slightly higher than for the original pG1. In addition to screening, clone pG1-A2 num. 3 had a slight increase in signal at the end of the batch, and approximately 10% weakening of the signal at the end of the fed batch. pG1-T16 clone no. 3 of the TAT14 mutation variant showed the strongest signal at the end of the batch, and lagged behind the duplication variant at the end of the fed batch, achieving an improvement of approximately 20% over pG1 no. 8 control, similar to the result of the scrutiny. The different induction behavior of the clones in the batch phase is explained by the derepression due to the decrease in glycerol concentration throughout the batch phase (see Figure 5A). In general, fed-batch cultures could largely confirm the results obtained in small-scale screening.

Logros y ConclusionesAchievements and Conclusions

Los promotores de genes con regulación dependiente de la fuente de carbono son favorables para la aplicación de bioprocedimientos ya que la fase de producción se puede separarse de la de crecimiento. La mejora potencial de la producción de proteínas basada en el promotor se puede lograr encontrando las condiciones óptimas de crecimiento (p. ej., tasa de crecimiento, estrategia de alimentación) o manipulando directamente la secuencia del promotor (p. ej., mutaciones, deleciones). Gene promoters with carbon source-dependent regulation are favorable for the application of bioprocesses since the production phase can be separated from the growth phase. Potential enhancement of promoter-based protein production can be achieved by finding optimal growth conditions (eg, growth rate, feeding strategy) or by directly manipulating the promoter sequence (eg, mutations, deletions).

Se construyeron varias variantes del promotor pG1 con longitud acortada, deleciones de TFBS, mutaciones del motivo TAT y duplicaciones de fragmentos. De ese modo, se identificó la región reguladora principal de pG1, incluido su importante TFBS. El análisis de las deleciones de TFBS indica que los factores de transcripción Rgt1 y Cat8-1 y/o Cat8-2 juegan un papel esencial para la represión e inducción de pG1: se suprimieron dos motivos que consistían en F$RGT1 y F$CSRE que se unen en la misma posición en las hebras opuestas. La deleción de la primera parte (pG1-A8, posición -293 a -285; RGT1: (+) -310 a -299, CSRE: (-) -299 a-285) provocó un debilitamiento de la inducción del promotor, mientras que la deleción de la segunda parte (pG1-A9, posición -275 a -261; RGT1: (-) -275 a -259, CSRE: (+) -276 a -260) condujo a una disminución de la represión del promotor. De ese modo, se identificaron motivos reguladores que son esenciales y característicos para la regulación de pG1.Several variants of the pG1 promoter with shortened length, TFBS deletions, TAT motif mutations and fragment duplications were constructed. Thus, the major regulatory region of pG1, including its important TFBS, was identified. Analysis of TFBS deletions indicates that transcription factors Rgt1 and Cat8-1 and/or Cat8-2 play an essential role for pG1 repression and induction: two motifs consisting of F$RGT1 and F$CSRE were deleted. that join in the same position on opposite strands. Deletion of the first part (pG1-A8, position -293 to -285; RGT1: (+) -310 to -299, CSRE: (-) -299 to -285) caused a weakening of promoter induction, while that deletion of the second part (pG1-A9, position -275 to -261; RGT1: (-) -275 to -259, CSRE: (+) -276 to -260) led to decreased promoter repression . Thus, regulatory motifs that are essential and characteristic for the regulation of pG1 were identified.

El papel de los reguladores transcripcionales Mig1 (F$MIG1) y Mxr1 (F$ADR1) podría ser más importante en otras condiciones tales como el exceso de glucosa o la inducción por metanol. Otros factores de transcripción que se unen en esa región o cerca de ella también podrían contribuir a la regulación de pG1.The role of transcriptional regulators Mig1 (F$MIG1) and Mxr1 (F$ADR1) could be more important in other conditions such as glucose excess or methanol induction. Other transcription factors that bind to or near that region could also contribute to pG1 regulation.

Se sabe que los tramos poli (A:T) desempeñan un papel en las secuencias promotoras, y se podría demostrar que el motivo TAT en pG1, que se encuentra aguas arriba (p. ej., posición -390 a -375) de la región reguladora principal, es esencial por su fuerza. El alargamiento de este motivo a T16, T18 y T20 tuvo un efecto positivo sobre el comportamiento del promotor.Poly(A:T) stretches are known to play a role in promoter sequences, and it could be shown that the TAT motif in pG1, which is located upstream (eg, position -390 to -375) of the main regulatory region, is essential for its strength. Elongation of this motif at T16, T18 and T20 had a positive effect on promoter behavior.

Las variantes de deleción de pG1 revelaron que el acortamiento en 5' también podría ser beneficioso para la modificación genética del promotor. Los TFBS para Mxr1, Mig1, Rgt1 y Cat8 suprimidos aguas arriba de la principal región reguladora de pG1 mejoraron la expresión de eGFP, aunque este efecto no se observó para las variantes del promotor acortadas en 5'.The pG1 deletion variants revealed that 5' shortening could also be beneficial for promoter genetic modification. TFBSs for Mxr1, Mig1, Rgt1, and Cat8 deleted upstream of the major regulatory region of pG1 enhanced eGFP expression, although this effect was not seen for 5'-shortened promoter variants.

Dos variantes con duplicaciones de secuencia parciales alcanzaron capacidades de expresión muy mejoradas en comparación con el pG1 de tipo salvaje.Two variants with partial sequence duplications achieved greatly improved expression capabilities compared to wild-type pG1.

Se podrían asignar características distintivas del buen comportamiento de expresión de pG1, que es una base sólida para la modificación genética racional del promotor: acortamiento en 5', uso del motivo TAT y mutación/elongación opcionales y duplicación de fragmentos. El comportamiento de la variante pG1 en el escrutinio a pequeña escala se pudo verificar con éxito en los cultivos por lote alimentado.Distinctive features of good pG1 expression behavior, which is a strong basis for rational genetic modification of the promoter, could be assigned: 5' shortening, use of TAT motif and optional mutation/elongation and duplication of fragments. The performance of the pG1 variant in small-scale screening could be successfully verified in fed-batch cultures.

Abreviaturas:Abbreviations:

CSRE: elemento de respuesta a fuente de carbono, F$: matriz TF específica de hongos, GCN: número de copia del gen, GOI: gen de interés, Pp: Pichia pastoris, Sc: Saccharomyces cerevisiae, TF: factor o factores de transcripción, TFBS: sitio o sitios de unión del factor de transcripción, YDM: masa seca de levaduraCSRE: carbon source response element, F$: fungus-specific TF array, GCN: gene copy number, GOI: gene of interest, Pp: Pichia pastoris, Sc: Saccharomyces cerevisiae, TF: transcription factor(s) , TFBS: transcription factor binding site(s), YDM: yeast dry matter

Ejemplo 8: Determinación de la represión, inducción, nivel de expresión de pG1-x (nivel de expresión en comparación con pG1), razón de inducciónExample 8: Determination of Repression, Induction, Expression Level of pG1-x (Expression Level Compared to pG1), Induction Ratio

La fuerza del promotor en comparación con el promotor pG1 y la razón de inducción se pueden determinar mediante el siguiente ensayo convencional: se escrutan cepas de P. pastoris en placas de 24 pocillos profundos a 25°C con agitación a 280 rpm con 2 mL de cultivo por pocillo. Se utilizan cuentas de alimentación de glucosa (6 mm, Kuhner, CH) para generar condiciones de crecimiento que limitan la glucosa. Las células se analizan para determinar la expresión de eGFP durante la represión (YP glicerol al 1%, fase exponencial) y la inducción (YP 1 cuenta de alimentación, durante 20-28 horas) utilizando citometría de flujo. La fluorescencia de eGFP específica se calcula a partir de la intensidad de la fluorescencia y la dispersión directa para al menos 3000 puntos de datos de los datos de citometría de flujo. La dispersión directa es una medida relativa del volumen celular. La fluorescencia de eGFP específica equivale a la intensidad de fluorescencia (FI) dividida por la dispersión directa (FSC) a 1,5, es decir, FI/FSC15 (Hohenblum, H., N. Borth y D. Mattanovich, (2003) Assessing viability and cell-associated product of recombinant protein producing Pichia pastoris with flow cytometry. J Biotechnol 102: 281-290). A partir de estos datos, se utiliza la media geométrica de la fluorescencia específica de la población, y se normaliza restando la señal de fondo de las células de tipo salvaje de P. pastoris no productoras. La fluorescencia de eGFP específica de la condición de glicerol se denomina "Represión", y la fluorescencia de eGFP específica de la condición de glucosa limitada (cuentas de alimentación de glucosa) se denomina "Inducción". Por lo tanto, solo los valores de Represión e Inducción del mismo escrutinio y medición de citometría de flujo se pueden comparar y utilizar para los cálculos. Para determinar la fuerza relativa del promotor pG1-x, los niveles de expresión de eGFP en el estado inducido de los promotores pG1-x se compararon con el promotor pG1 original dividiendo el valor de Inducción de una cepa que comprende el promotor pG1-x por el valor de Inducción de una cepa que comprende el promotor pG1 original. La razón de Inducción se calcula dividiendo el valor de Inducción por el valor de Represión de la misma cepa/promotor. La Represión, la Inducción, la fuerza relativa del promotor pG1-x y la razón de Inducción se muestran en la Tabla 6 para diversas variantes del promotor.The strength of the promoter compared to the pG1 promoter and the rate of induction can be determined by the following standard assay: P. pastoris strains are screened in 24 deep-well plates at 25°C with shaking at 280 rpm with 2 mL of culture per well. Glucose feed beads (6mm, Kuhner, CH) are used to generate glucose-limiting growth conditions. Cells are analyzed for eGFP expression during repression (YP 1% glycerol, exponential phase) and induction (YP 1 feed bead, over 20-28 hours) using flow cytometry. Specific eGFP fluorescence is calculated from fluorescence intensity and forward scatter for at least 3000 data points of flow cytometry data. Forward scatter is a relative measure of cell volume. Specific eGFP fluorescence equals fluorescence intensity (FI) divided by forward scatter (FSC) at 1.5, i.e. FI/FSC15 (Hohenblum, H., N. Borth, and D. Mattanovich, (2003) Assessing viability and cell-associated product of recombinant protein producing Pichia pastoris with flow cytometry. J Biotechnol 102: 281-290). From these data, the geometric mean of the population-specific fluorescence is used, and normalized by subtracting the background signal from non-producing P. pastoris wild-type cells. The eGFP fluorescence specific to the glycerol condition is termed "Repression", and the eGFP fluorescence specific to the glucose-limited condition (glucose feed beads) is termed "Induction". Therefore, only Repression and Induction values from the same screening and flow cytometry measurement can be compared and used for calculations. To determine the relative strength of the pG1-x promoter, eGFP expression levels in the induced state of the pG1-x promoters were compared to the original pG1 promoter by dividing the Induction value of a strain comprising the pG1-x promoter by the Induction value of a strain comprising the original pG1 promoter. The Induction ratio is calculated by dividing the Induction value by the Repression value of the same strain/promoter. Repression, Induction, relative pG1-x promoter strength and Induction ratio are shown in Table 6 for various promoter variants.

Otros ejemplos han demostrado que mediante el uso de un promotor pG1 -x que comprende o consiste en la secuencia de nucleótidos de SEQ ID 49 se produjo una proteína modelo (POI) en P. pastoris con rendimientos mucho más altos (una multiplicidad de aumento de más de 3,5 veces), experimentos por lote alimentado) en comparación con el promotor pG1 no modificado (SEQ ID 7 de referencia). Other examples have shown that by using a pG1-x promoter comprising or consisting of the nucleotide sequence of SEQ ID 49 a model protein (POI) was produced in P. pastoris in much higher yields (an increased multiplicity of more than 3.5-fold), fed-batch experiments) compared to the unmodified pG1 promoter (SEQ ID 7 reference).

Ejemplo 9: Comparación de "fermentación rápida" y fermentación convencionalExample 9: Comparison of "rapid fermentation" and conventional fermentation

Resumen: Se podrían obtener tiempos de fermentación significativamente reducidos para la expresión de una proteína armazón alternativa como proteína modelo bajo el control de una realización de pG1-3 del promotor de SEQ ID 39 (pG1-D1240 (SEQ ID 49)) empleando un protocolo de lote alimentado con rendimiento espacio-temporal optimizado en lugar de utilizar un régimen por lote alimentado convencional.Abstract: Significantly reduced fermentation times for expression of an alternative scaffold protein could be obtained as a model protein under the control of a pG1-3 embodiment of the promoter of SEQ ID 39 (pG1-D1240 (SEQ ID 49)) using a protocol fed-batch with optimized spatio-temporal yield instead of using a conventional fed-batch regimen.

Se seleccionó un clon que expresaba una proteína modelo bajo el control de pG1-D1240 (SEQ ID 49) para los cultivos por lote alimentado. Los cultivos por lote alimentado se realizaron en reactores DASGIP (Eppendorf, Alemania) con un volumen de trabajo final de 0,5 L. Se prepararon medios y solución de oligoelementos como se describió previamente en el Ejemplo 7, excepto por la concentración de glicerol en el medio discontinuo de glicerol que fue de 45 g/L. Durante el cultivo, el nivel de oxígeno disuelto se controló a OD = 30% con la velocidad del agitador (400 -1200 rpm). La tasa de aireación fue de 1 vvm de aire, la temperatura se controló a 25°C y el punto de ajuste de pH de 5,0 se controló con la adición de NH4OH (25%). Para iniciar el cultivo del biorreactor, se inocularon 250 mL de medio discontinuo a partir de un precultivo del respectivo clon de P. pastoris con una densidad óptica inicial (DO600) de 1,0. La fase discontinua con glicerol duró aproximadamente 30 horas y alcanzó una concentración de biomasa seca de 25 a 29 g/L. La fase por lote alimentado de glicerol estuvo seguida por un lote alimentado limitado en glucosa. Se compararon dos modos de cultivo por lotes alimentados diferentes: (A) un protocolo por lote alimentado convencional que utiliza una velocidad de alimentación constante, (B) un protocolo por lote alimentado con rendimiento espaciotemporal optimizado ("Fermentación rápida"), donde la tasa de alimentación de glucosa se optimizó para maximizar la productividad volumétrica de la fermentación.A clone expressing a model protein under the control of pG1-D1240 (SEQ ID 49) was selected for fed-batch cultures. Fed-batch cultures were performed in DASGIP reactors (Eppendorf, Germany) with a final working volume of 0.5 L. Media and trace element solution were prepared as previously described in Example 7, except for the concentration of glycerol in the discontinuous glycerol medium was 45 g/L. During cultivation, the dissolved oxygen level was controlled at OD = 30% with the speed of the shaker (400-1200 rpm). The aeration rate was 1 vvm of air, the temperature was controlled at 25°C and the pH set point of 5.0 was controlled with the addition of NH4OH (25%). To start the bioreactor culture, 250 mL of batch medium were inoculated from a preculture of the respective clone of P. pastoris with an initial optical density (OD600) of 1.0. The discontinuous phase with glycerol lasted approximately 30 hours and reached a dry biomass concentration of 25 to 29 g/L. The glycerol fed-batch phase was followed by a glucose-limited fed-batch. Two different fed-batch culture modes were compared: (A) a conventional fed-batch protocol using a constant feed rate, (B) a fed-batch protocol with optimized spatiotemporal yield ("Rapid Fermentation"), where the rate Glucose feed was optimized to maximize the volumetric productivity of the fermentation.

Para el cultivo convencional, se selección una tasa de alimentación de glucosa constante de 1,25 mL I r 1. El cultivo por lote alimentado se mantuvo durante 100 h (126 h de tiempo de cultivo total), lo que dio como resultado una concentración final de biomasa seca de aproximadamente 90 g L-1. Para la "Fermentación rápida", se adoptó un algoritmo de optimización basado en modelos (Maurer et al., Microbial Cell Factories, 2006, 5:37), donde la velocidad de alimentación de glucosa volumétrica optimizada F(t) se aproximó mediante una función linealmente creciente: F(t) [mL h-1] = 0,3234 mL Ir2 * t 3,3921 mL h-1. La fase por lote alimentado se mantuvo durante t = 33 h (60 h de tiempo total de cultivo), lo que dio como resultado una concentración final de biomasa seca de aproximadamente 140 g L-1. For conventional culture, a constant glucose feed rate of 1.25 mL I r 1 was selected. The fed-batch culture was maintained for 100 h (126 h total culture time), resulting in a concentration final dry biomass of approximately 90 g L-1. For "Rapid Fermentation", a model-based optimization algorithm was adopted (Maurer et al., Microbial Cell Factories, 2006, 5:37), where the optimized volumetric glucose feed rate F(t) was approximated by a linearly increasing function: F(t) [mL h-1] = 0.3234 mL Ir2 * t 3.3921 mL h-1. The fed-batch phase was maintained for t = 33 h (60 h total culture time), resulting in a final dry biomass concentration of approximately 140 g L-1.

Se tomaron muestras al final del lote y durante la fase por lote alimentado. Los títulos de producto se analizaron a partir de sobrenadantes clarificados utilizando un kit de reactivos HT de expresión de proteína de bajo peso molecular y el sistema Caliper LabChip GXI (Perkin Elmer, EE. UU.). Como patrón de referencia para la cuantificación absoluta se utilizó un patrón purificado de proteína armazón alternativa.Samples were taken at the end of the batch and during the fed-batch phase. Product titers were analyzed from clarified supernatants using a Low Molecular Weight Protein Expression HT Reagent Kit and the Caliper LabChip GXI System (Perkin Elmer, USA). A purified alternative scaffold protein standard was used as a reference standard for absolute quantification.

La Figura 9 muestra la generación de producto y biomasa durante el tiempo total de cultivo para el cultivo convencional. (A) y la "Fermentación rápida" (B). En comparación, se pudieron alcanzar títulos de producto final de 6,4 g L-1 y 4,3 g L-1 después de 60 h y 126 h para la "Fermentación rápida" y la fermentación convencional, respectivamente. En otras palabras, se pudo encontrar un título 1,4 veces más alto (títulos de caldo 1,2 veces superiores resp.) en un tiempo de fermentación significativamente más corto (-66 h) cuando se complementa la alimentación de glucosa durante la expresión bajo el promotor pG1-D1240 (SEQ ID 49) como se describe para la "Fermentación rápida" en lugar de utilizar el régimen de alimentación convencional descrito. Figure 9 shows the generation of product and biomass during the total cultivation time for conventional cultivation. (A) and the "rapid fermentation" (B). In comparison, final product titers of 6.4 g L-1 and 4.3 g L-1 could be achieved after 60 h and 126 h for "Rapid Fermentation" and conventional fermentation, respectively. In other words, a 1.4-fold higher titer (1.2-fold higher broth titers resp.) could be found in a significantly shorter fermentation time (-66 h) when glucose feed is supplemented during expression. under the pG1-D1240 promoter (SEQ ID 49) as described for "Rapid Fermentation" instead of using the conventional feeding regimen described.

a asto ace

Figure imgf000035_0001
Figure imgf000035_0001

Figure imgf000036_0001
Figure imgf000036_0001

Figure imgf000037_0001
Figure imgf000037_0001

Figure imgf000038_0001
Figure imgf000038_0001

Figure imgf000039_0001
Figure imgf000039_0001

Figure imgf000040_0001
Figure imgf000040_0001

Figure imgf000041_0001
Figure imgf000041_0001

Figure imgf000042_0001
Figure imgf000042_0001

Figure imgf000043_0001
Figure imgf000043_0001

Figure imgf000044_0001
Figure imgf000044_0001

Figure imgf000045_0001
Figure imgf000045_0001

Figure imgf000046_0001
Figure imgf000046_0001

Figure imgf000047_0001
Figure imgf000047_0001

Figure imgf000048_0001
Figure imgf000048_0001

Figure imgf000049_0001
Figure imgf000049_0001

Figure imgf000050_0001
Figure imgf000050_0001

Figure imgf000051_0001
Figure imgf000051_0001

Figure imgf000052_0001
Figure imgf000052_0001

Figure imgf000053_0001
Figure imgf000053_0001

Tabla 2: TFBS afectado de la secuencia promotora de pG1 en los mutantes de deleción pG1-A1 a A12. El análisis de secuencia se realizó utilizando MatInspector de Genomatix. Los TFBS relacionados con la glucosa y el carbono que se seleccionaron para la deleción se muestran en negrita y el ID correspondiente (1-12) y las posiciones suprimidas se indican en las columnas 1 y 2.Table 2: Affected TFBS of pG1 promoter sequence in deletion mutants pG1-A1 to A12. Sequence analysis was performed using MatInspector from Genomatix. Glucose- and carbon-related TFBSs that were selected for deletion are shown in bold and the corresponding ID (1-12) and deleted positions are indicated in columns 1 and 2.

Figure imgf000054_0001
Figure imgf000054_0001

Figure imgf000055_0001
Figure imgf000055_0001

Figure imgf000056_0001
Figure imgf000056_0001

Figure imgf000057_0001
Figure imgf000057_0001

Tabla 3: Posiciones y deleciones de TFBS de las variantes de deleción de TFBS de pG1 Se enumeran los TFBS elegidos como diana y afectados en las variantes de deleción de TFBS de pG1 (pG1-A1 a A12). Los TFBS específicos relacionados con la fuente de carbono se muestran en negrita. La información detallada para todos los TFBS y para los TFBS suprimidos se proporciona en la Tabla 1 y la Tabla 2, respectivamente. Table 3: TFBS positions and deletions of TFBS deletion variants of pG1 TFBS targeted and affected in TFBS deletion variants of pG1 (pG1-A1 to A12) are listed. Specific TFBS related to the carbon source are shown in bold. Detailed information for all TFBS and for suppressed TFBS is provided in Table 1 and Table 2, respectively.

Figure imgf000058_0001
Figure imgf000058_0001

Tabla 4: Secuencias de cebadoresTable 4: Primer sequences

Figure imgf000058_0002
Figure imgf000058_0002

Figure imgf000059_0001
Figure imgf000059_0001

Figure imgf000060_0001
Figure imgf000060_0001

Figure imgf000061_0001
Figure imgf000061_0001

Tabla 5: Cultivo por lote alimentado de pG1 (denominado en el presente documento pG1 núm. 8) y variantes de pG1-x (denominadas también en el presente documento variantes de pG1) que expresan eGFP Se muestra la fluorescencia relativa de eGFP para el final del lote y para el final del lote alimentado. Los puntos de tiempo se establecieron en 0 al final del lote. Se comparó un clon que expresaba eGFP bajo control de pG1 (núm. 8) con clones que expresaban bajo control de una deleción de pG1 (pG1-A2), una mutación de TAT14 (pG1-T16) y una variante por duplicación (pG1-D1240). Las concentraciones de biomasa (YDM) en el lote y el lote alimentado fueron las esperadas.Table 5: Fed-batch culture of pG1 (herein referred to as pG1 #8) and pG1-x variants (herein also referred to as pG1 variants) expressing eGFP Relative fluorescence of eGFP is shown for the end of the batch and for the end of the fed batch. Time points were set to 0 at the end of the batch. A clone expressing eGFP under the control of pG1 (#8) was compared with clones expressing under the control of a pG1 deletion (pG1-A2), a TAT14 mutation (pG1-T16), and a duplicative variant (pG1- D1240). Biomass concentrations (YDM) in the batch and the fed batch were as expected.

Figure imgf000061_0002
Figure imgf000061_0002

Tabla 6: La fuerza del promotor en comparación con pG1 y la razón de inducción del prom otor de las variantes de pG1, a partir de un escrutinio comparativo de pocillos profundos. La fuerza de expresión de las variantes de pG1-x (inducidas) está relacionada con el nivel de expresión de eGFP obtenido con el promotor pG1 original. La razón de inducción se calcula a partir del nivel de GFP en el estado inducido y reprimido.Table 6: Promoter strength compared to pG1 and promoter induction ratio of pG1 variants, from deep well comparative screening. The expression strength of the (induced) pG1-x variants is related to the level of eGFP expression obtained with the original pG1 promoter. The induction ratio is calculated from the GFP level in the induced and repressed state.

Figure imgf000061_0003
Figure imgf000061_0003

Figure imgf000062_0001
Figure imgf000062_0001

Claims (20)

REIVINDICACIONES 1. Un promotor pG1-x aislado y/o artificial, que es una variante funcional del promotor pG1 regulable por fuente de carbono de Pichia pastoris identificado por SEQ ID 1, cuyo promotor pG1-x consiste en, o comprende, al menos una parte de SEQ ID 1, cuya parte de SEQ ID 1 tiene una longitud de al menos 293 pb, cuyo promotor pG1-x comprende las siguientes regiones promotoras1. An isolated and/or artificial pG1-x promoter, which is a functional variant of the Pichia pastoris carbon source-regulatable pG1 promoter identified by SEQ ID 1, which pG1-x promoter consists of, or comprises, at least a part of SEQ ID 1, which part of SEQ ID 1 is at least 293 bp long, whose pG1-x promoter comprises the following promoter regions a) al menos dos copias de una región promotora reguladora central, cuya región promotora reguladora central comprende las secuencias de nucleótidos de SEQ ID 2 y SEQ ID 3, en donde SEQ ID 2 y/o SEQ ID 3 comprenden uno o más sitios de unión al factor de transcripción (TFBs ); ya) at least two copies of a central regulatory promoter region, whose central regulatory promoter region comprises the nucleotide sequences of SEQ ID 2 and SEQ ID 3, where SEQ ID 2 and/or SEQ ID 3 comprise one or more binding sites to the transcription factor (TFBs); Y b) una región promotora reguladora no central, que es cualquier región dentro de la secuencia promotora de pG1-x distinta de la región reguladora central;b) a non-core regulatory promoter region, which is any region within the pG1-x promoter sequence other than the core regulatory region; en donde el promotor pG1-x tiene una identidad de secuencia con la región correspondiente de SEQ ID 1, que es al menos 80% con SEQ ID 2 y SEQ ID 3, y al menos 50% en cualquier región distinta de SEQ ID 2 o SEQ ID 3; y adicionalmente en donde el promotor pG1-x está caracterizado por un aumento de la fuerza del promotor y/o la razón de inducción en comparación con el promotor pG1, en dondewherein the pG1-x promoter has sequence identity to the corresponding region of SEQ ID 1, which is at least 80% to SEQ ID 2 and SEQ ID 3, and at least 50% to any region other than SEQ ID 2 or SEQ ID 3; and further wherein the pG1-x promoter is characterized by increased promoter strength and/or induction ratio compared to the pG1 promoter, wherein - la fuerza del promotor aumenta al menos 1,1 veces en el estado inducido en comparación con el promotor pG1, y/o- promoter strength is increased by at least 1.1-fold in the induced state compared to the pG1 promoter, and/or - la razón de inducción aumenta al menos 1,1 veces en comparación con el promotor pG1.- the induction ratio is increased by at least 1.1-fold compared to the pG1 promoter. 2. El promotor pG1-x de la reivindicación 1, en donde la región reguladora central comprende la secuencia de nucleótidos de SEQ ID 4, o una variante funcional de SEQ ID 4 con al menos 80% de identidad de secuencia, que comprende uno o más TFBS.2. The pG1-x promoter of claim 1, wherein the core regulatory region comprises the nucleotide sequence of SEQ ID 4, or a functional variant of SEQ ID 4 with at least 80% sequence identity, comprising one or plus TFBS. 3. El promotor pG1-x de la reivindicación 1 o 2, en donde la región reguladora central está incorporada a una región reguladora principal representada por SEQ ID 5, o una variante funcional de SEQ ID 5 con al menos 80% de identidad de secuencia, que comprende uno o más TFBS.3. The pG1-x promoter of claim 1 or 2, wherein the core regulatory region is incorporated into a major regulatory region represented by SEQ ID 5, or a functional variant of SEQ ID 5 with at least 80% sequence identity , comprising one or more TFBS. 4. El promotor pG1-x de cualquiera de las reivindicaciones 1 a 3, que comprende uno o más TFBS para cualquiera de los factores de transcripción seleccionados del grupo que consiste en Rgt1, Cat8-1 y Cat8-2.4. The pG1-x promoter of any one of claims 1 to 3, comprising one or more TFBS for any of the transcription factors selected from the group consisting of Rgt1, Cat8-1 and Cat8-2. 5. El promotor pG1-x de cualquiera de las reivindicaciones 1 a 4, en donde dicha región promotora reguladora central comprende una deleción de uno o más nucleótidos entre las secuencias de nucleótidos de SEQ ID 2 y SEQ ID 3 en comparación con la región correspondiente de SEQ ID 1.5. The pG1-x promoter of any of claims 1 to 4, wherein said core regulatory promoter region comprises a deletion of one or more nucleotides between the nucleotide sequences of SEQ ID 2 and SEQ ID 3 compared to the corresponding region of SEQ ID 1. 6. El promotor pG1 -x de cualquiera de las reivindicaciones 1 a 5, que comprende al menos uno o al menos dos motivos T identificados por cualquiera de SEQ ID 12-29.6. The pG1-x promoter of any of claims 1 to 5, comprising at least one or at least two T motifs identified by any of SEQ ID 12-29. 7. Un promotor pG1-x aislado y/o artificial, que comprende o consiste en la secuencia de nucleótidos seleccionada del grupo que consiste en cualquiera de7. An isolated and/or artificial pG1-x promoter, comprising or consisting of the nucleotide sequence selected from the group consisting of any of a) SEQ ID 37-44, preferiblemente cualquiera de SEQ ID 45-76;a) SEQ ID 37-44, preferably any of SEQ ID 45-76; b) SEQ ID 77-80, preferiblemente cualquiera de SEQ ID 81-112;b) SEQ ID 77-80, preferably any of SEQ ID 81-112; c) SEQ ID 113-114, preferiblemente cualquiera de SEQ ID 115-130;c) SEQ ID 113-114, preferably any of SEQ ID 115-130; d) SEQ ID 131-132, preferiblemente cualquiera de SEQ ID 133-148; od) SEQ ID 131-132, preferably any of SEQ ID 133-148; either e) SEQ ID 185-186, preferiblemente cualquiera de SEQ ID 187-202;e) SEQ ID 185-186, preferably any of SEQ ID 187-202; o una secuencia de nucleótidos que tiene al menos 80% de identidad de secuencia con cualquiera de las anteriores, en donde el promotor pG1-x está caracterizado por un aumento de la fuerza del promotor y/o la razón de inducción en comparación con el promotor pG1 de Pichia pastoris identificado por SEQ ID 1, en dondeor a nucleotide sequence having at least 80% sequence identity to any of the foregoing, wherein the pG1-x promoter is characterized by increased promoter strength and/or rate of induction compared to promoter Pichia pastoris pG1 identified by SEQ ID 1, wherein - la fuerza del promotor aumenta al menos 1,1 veces en el estado inducido en comparación con el promotor pG1, y/o- promoter strength is increased by at least 1.1-fold in the induced state compared to the pG1 promoter, and/or - la razón de inducción aumenta al menos 1,1 veces en comparación con el promotor pG1.- the induction ratio is increased by at least 1.1-fold compared to the pG1 promoter. 8. El promotor pG1-x de la reivindicación 7, que comprende o consiste en la secuencia de nucleótidos seleccionada del grupo que consiste en cualquiera de SEQ ID 37-44, preferiblemente cualquiera de SEQ ID 45-76.8. The pG1-x promoter of claim 7, comprising or consisting of the nucleotide sequence selected from the group consisting of any of SEQ ID 37-44, preferably any of SEQ ID 45-76. 9. El promotor pG1-x de cualquiera de las reivindicaciones 1 a 8, que está conectado operablemente a una secuencia de nucleótidos que codifica una proteína de interés (POI), cuyo ácido nucleico no está asociado de forma nativa con la secuencia de nucleótidos que codifica la POI. 9. The pG1-x promoter of any of claims 1 to 8, which is operably linked to a nucleotide sequence encoding a protein of interest (POI), which nucleic acid is not natively associated with the nucleotide sequence encoding encodes the POI. 10. El ácido nucleico de la reivindicación 9, que comprende adicionalmente una secuencia de nucleótidos que codifica un péptido señal que permite la secreción de la POI, preferiblemente en donde la secuencia de nucleótidos que codifica el péptido señal está situada adyacente al extremo 5' de la secuencia de nucleótidos que codifica la POI.10. The nucleic acid of claim 9, further comprising a nucleotide sequence encoding a signal peptide that enables secretion of the POI, preferably wherein the nucleotide sequence encoding the signal peptide is located adjacent to the 5' end of the nucleotide sequence encoding the POI. 11. Una construcción de expresión que comprende el ácido nucleico de la reivindicación 9 o 10, preferiblemente un vector o plásmido de replicación autónoma, o un vector o plásmido que se integra en el ADN cromosómico de una célula anfitriona.An expression construct comprising the nucleic acid of claim 9 or 10, preferably an autonomously replicating vector or plasmid, or a vector or plasmid that integrates into the chromosomal DNA of a host cell. 12. Una célula anfitriona recombinante que comprende la construcción de expresión de la reivindicación 11, preferiblemente una célula eucariótica, más preferiblemente una célula de levadura o fúngica filamentosa, más preferiblemente una célula de levadura del género Saccharomyces o Pichia.12. A recombinant host cell comprising the expression construct of claim 11, preferably a eukaryotic cell, more preferably a yeast or filamentous fungal cell, most preferably a yeast cell of the genus Saccharomyces or Pichia. 13. Un método para producir una POI mediante el cultivo de una línea celular anfitriona recombinante de la reivindicación 12, que comprende las etapas de13. A method of producing a POI by culturing a recombinant host cell line of claim 12, comprising the steps of a) cultivar la línea celular en condiciones para expresar dicha POI, ya) cultivating the cell line under conditions to express said POI, and b) recuperar la POI.b) retrieve the POI. 14. El método de la reivindicación 13, en donde el cultivo comprende14. The method of claim 13, wherein the culture comprises a) una primera etapa que utilizan una fuente de carbono basal que reprime el promotor pG1-x, preferiblemente en donde la fuente de carbono basal se selecciona del grupo que consiste en glucosa, glicerol, etanol, una mezcla de los mismos y material nutriente complejo, seguida dea) a first step using a basal carbon source that represses the pG1-x promoter, preferably wherein the basal carbon source is selected from the group consisting of glucose, glycerol, ethanol, a mixture thereof and complex nutrient material , followed by b) una segunda etapa que no utiliza o utiliza una cantidad limitada de una fuente de carbono complementaria que desreprime el promotor pG1-x para inducir la producción de la POI, preferiblemente en donde la fuente de carbono complementaria es una hexosa tal como glucosa, fructosa, galactosa o manosa, un disacárido, tal como sacarosa, un alcohol, tal como glicerol o etanol, o una mezcla de cualquiera de los anteriores.b) a second step that does not use or uses a limited amount of a complementary carbon source that derepresses the pG1-x promoter to induce production of the POI, preferably wherein the complementary carbon source is a hexose such as glucose, fructose , galactose or mannose, a disaccharide, such as sucrose, an alcohol, such as glycerol or ethanol, or a mixture of any of the foregoing. 15. El método de la reivindicación 14, en donde la segunda etapa b) emplea un medio de alimentación que proporciona la fuente de carbono complementaria en una cantidad limitante del crecimiento para mantener la tasa de crecimiento específica dentro del rango de 0,001 h-1 a 0,2 Ir1, preferiblemente 0,005 h-1 a 0,15 h-1.15. The method of claim 14, wherein the second step b) employs a feeding medium that provides the complementary carbon source in a growth-limiting amount to maintain the specific growth rate within the range of 0.001 h-1 a 0.2 Ir1, preferably 0.005 h-1 to 0.15 h-1. 16. El método de las reivindicaciones 14 o 15, en donde el cultivo se realiza en un biorreactor comenzando con una fase discontinua como primera etapa, seguida de una fase por lote alimentado o una fase de cultivo continuo como segunda etapa, en donde la fase discontinua se realiza durante alrededor de las 20 a las 36h; y el cultivo en la fase por lote alimentado se realiza durante cualquiera de alrededor de 15 a 80 h, alrededor de 15 a 70 h, alrededor de 15 a 60 h, alrededor de 15 a 50 h, alrededor de 15 a 45 h, alrededor de 15 a 40 h, alrededor de 15 a 35 h, alrededor de 15 a 30h, alrededor de 15 a 25h, o alrededor de 15 a 20h; preferiblemente alrededor de 20 a 40 h.16. The method of claims 14 or 15, wherein the cultivation is carried out in a bioreactor starting with a batch phase as the first stage, followed by a fed-batch phase or a continuous cultivation phase as the second stage, wherein the phase discontinuous is done during around 20 to 36h; and the cultivation in the fed-batch phase is carried out during any of about 15 to 80 hrs, about 15 to 70 hrs, about 15 to 60 hrs, about 15 to 50 hrs, about 15 to 45 hrs, about from 3 to 40 p.m., about 3 to 35 p.m., about 3 to 30 p.m., about 3 to 10 p.m., or about 3 to 8 p.m.; preferably about 20 to 40 hours. 17. El método de cualquiera de las reivindicaciones 13 a 16, en donde la célula anfitriona recombinante es levadura de cualquiera del género Saccharomyces o género Pichia o género Komagataella, preferiblemente Pichia pastoris o Komagataella pastoris. 17. The method of any of claims 13 to 16, wherein the recombinant host cell is yeast from either the Saccharomyces genus or Pichia genus or Komagataella genus, preferably Pichia pastoris or Komagataella pastoris. 18. El método de cualquiera de las reivindicaciones 13 a 17, en donde el promotor pG1 -x es cualquiera de SEQ ID 37­ 44, preferiblemente cualquiera de SEQ ID 45-76, preferiblemente en donde el promotor pG1-x comprende SEQ ID 39, más preferiblemente SEQ ID 49.18. The method of any of claims 13 to 17, wherein the pG1-x promoter is any of SEQ ID 37 44, preferably any of SEQ ID 45-76, preferably wherein the pG1-x promoter comprises SEQ ID 39, more preferably SEQ ID 49. 19. El método de cualquiera de las reivindicaciones 13 a 18, en donde la POI se produce a una tasa de transcripción de al menos 15% en comparación con el promotor pGAP nativo de la célula.19. The method of any of claims 13 to 18, wherein the POI is produced at a transcription rate of at least 15% compared to the cell's native pGAP promoter. 20. El método de cualquiera de las reivindicaciones 13 a 19, en donde la POI es una proteína heteróloga, preferiblemente seleccionada entre proteínas terapéuticas, incluyendo anticuerpos o fragmentos de los mismos, enzimas y péptidos, antibióticos proteicos, proteínas de fusión de toxinas, productos conjugados de carbohidrato -proteína, proteínas estructurales, proteínas reguladoras, vacunas y proteínas o partículas de tipo vacunas, enzimas de procedimiento, factores de crecimiento, hormonas y citocinas, o un metabolito de una POI. 20. The method of any of claims 13 to 19, wherein the POI is a heterologous protein, preferably selected from therapeutic proteins, including antibodies or fragments thereof, enzymes and peptides, protein antibiotics, toxin fusion proteins, products carbohydrate-protein conjugates, structural proteins, regulatory proteins, vaccines and vaccine-like proteins or particles, procedural enzymes, growth factors, hormones and cytokines, or a metabolite of a POI.
ES16751266T 2015-08-05 2016-08-05 Promoter variants Active ES2902044T3 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP2015068024 2015-08-05
EP16163932 2016-04-05
PCT/EP2016/068784 WO2017021541A1 (en) 2015-08-05 2016-08-05 Promoter variants

Publications (1)

Publication Number Publication Date
ES2902044T3 true ES2902044T3 (en) 2022-03-24

Family

ID=56684642

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16751266T Active ES2902044T3 (en) 2015-08-05 2016-08-05 Promoter variants

Country Status (14)

Country Link
US (2) US10752907B2 (en)
EP (1) EP3332005B1 (en)
JP (1) JP6833812B2 (en)
KR (1) KR102253479B1 (en)
CN (1) CN108350447B (en)
AU (1) AU2016303026B2 (en)
BR (1) BR112018002395A2 (en)
CA (1) CA2992170C (en)
DK (1) DK3332005T3 (en)
ES (1) ES2902044T3 (en)
HK (1) HK1251256A1 (en)
IL (1) IL257000B (en)
TW (1) TW201718859A (en)
WO (1) WO2017021541A1 (en)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL2764016T3 (en) 2011-10-07 2019-08-30 Lonza Ltd Regulatable promoter
WO2019154686A1 (en) 2018-02-12 2019-08-15 Lonza Ltd Host cell for producing a protein of interest
EP3536784A1 (en) 2018-03-05 2019-09-11 ACIB GmbH Host cell engineered for improved metabolite production
US11866714B2 (en) * 2018-06-07 2024-01-09 Basf Se Promoter for yeast
JP2022502018A (en) * 2018-09-24 2022-01-11 オルタ ドグ テクニク ユニヴェルシテシ Modified AOX1 promoter variant
EP3824083A4 (en) * 2018-09-24 2022-01-05 Orta Dogu Teknik Universitesi Design of alcohol dehydrogenase 2 (adh2) promoter variants by promoter engineering
JP7061234B2 (en) 2019-01-11 2022-04-27 ロンザ リミテッド Carbon source regulatory protein production in recombinant host cells
EP3690052B1 (en) * 2019-01-29 2023-04-19 Clariant Produkte (Deutschland) GmbH Chimeric promoter for use in metabolic engineering
EP3947695B1 (en) 2019-04-01 2023-09-06 Universität für Bodenkultur Wien Mut- methylotrophic yeast
WO2020200414A1 (en) 2019-04-01 2020-10-08 Lonza Ltd Protein production in mut-methylotrophic yeast
WO2020200415A1 (en) 2019-04-01 2020-10-08 Lonza Ltd Mut- methylotrophic yeast
EP4127185A1 (en) 2020-04-01 2023-02-08 Lonza Ltd. Helper factors for expressing proteins in yeast
IL301312A (en) 2020-09-30 2023-05-01 Lonza Ag Host cells overexpressing translational factors
JP2024506650A (en) 2021-02-12 2024-02-14 ベーリンガー インゲルハイム エルツェーファウ ゲゼルシャフト ミット ベシュレンクテル ハフツング ウント コンパニー コマンディトゲゼルシャフト Signal peptide for increased protein secretion
CN114657190B (en) * 2022-04-06 2023-08-29 暨南大学 Application of Msn p as negative regulatory factor in improving protein expression in host cells
CN114908092B (en) * 2022-05-12 2023-07-18 华南理工大学 Long-acting high-strength hybrid promoter, recombinant strain thereof and application
EP4353825A1 (en) * 2022-10-10 2024-04-17 bisy GmbH Modified promoter sequences

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AT501955B1 (en) 2005-02-23 2007-08-15 Univ Graz Tech MUTED AOX1 PROMOTERS
US8105811B2 (en) 2008-06-13 2012-01-31 Wisconsin Alumni Research Foundation Sugar transport sequences, yeast strains having improved sugar uptake, and methods of use
PL2764016T3 (en) 2011-10-07 2019-08-30 Lonza Ltd Regulatable promoter
WO2014067926A1 (en) * 2012-10-29 2014-05-08 Lonza Ltd Expression sequences

Also Published As

Publication number Publication date
AU2016303026A1 (en) 2018-02-15
CN108350447B (en) 2021-08-31
US10752907B2 (en) 2020-08-25
CA2992170A1 (en) 2017-02-09
DK3332005T3 (en) 2022-01-03
CN108350447A (en) 2018-07-31
TW201718859A (en) 2017-06-01
EP3332005B1 (en) 2021-09-22
CA2992170C (en) 2022-08-16
EP3332005A1 (en) 2018-06-13
WO2017021541A1 (en) 2017-02-09
JP2018522565A (en) 2018-08-16
US20180223293A1 (en) 2018-08-09
US20200347391A1 (en) 2020-11-05
KR20180037237A (en) 2018-04-11
BR112018002395A2 (en) 2018-09-18
AU2016303026B2 (en) 2020-10-22
IL257000A (en) 2018-03-29
IL257000B (en) 2022-06-01
JP6833812B2 (en) 2021-02-24
HK1251256A1 (en) 2019-01-25
KR102253479B1 (en) 2021-05-21

Similar Documents

Publication Publication Date Title
ES2902044T3 (en) Promoter variants
US11168117B2 (en) Constitutive promoter
US11976284B2 (en) Promoter variants for protein production
ES2921137T3 (en) Carbon source-regulated protein production in a recombinant host cell
US10428123B2 (en) Constitiutive promoter
WO2024133538A1 (en) Host cells with pat1 knockout for increased specific protein productivity
KR20230075436A (en) Host cells overexpressing translation factors
ES2730173T3 (en) Adjustable Promoter
CN114026239A (en) MUT-methanol nutritional yeast