ES2881279T3 - Sistema de expresión basado en promotor de LLP de levadura constitutivo - Google Patents
Sistema de expresión basado en promotor de LLP de levadura constitutivo Download PDFInfo
- Publication number
- ES2881279T3 ES2881279T3 ES16707460T ES16707460T ES2881279T3 ES 2881279 T3 ES2881279 T3 ES 2881279T3 ES 16707460 T ES16707460 T ES 16707460T ES 16707460 T ES16707460 T ES 16707460T ES 2881279 T3 ES2881279 T3 ES 2881279T3
- Authority
- ES
- Spain
- Prior art keywords
- ssn6
- protein
- gene
- modified
- promoter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
- C07K14/39—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
- C07K14/39—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
- C07K14/395—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts from Saccharomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Mycology (AREA)
- Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
Una célula eucariota modificada, en donde esta célula eucariota modificada es una célula de Pichia pastoris, que se modifica en comparación con su célula de tipo salvaje al menos por que comprende - un gen similar a ssn6 modificado y/o - un nivel de expresión modificado de proteína similar a SSN6, o por que - se elimina un gen similar a ssn6, respectivamente, en el sentido de que - la célula de Pichia pastoris modificada no es capaz de proporcionar una proteína similar a SSN6 que ejerza su función de tipo salvaje y/o actividad de tipo salvaje, - la cantidad de proteína similar a SSN6 que todavía está presente en la célula de Pichia pastoris modificada difiere de la cantidad de proteína similar a SSN6 que está presente en su forma salvaje, y/o - esencialmente ninguna proteína similar a SSN6 está presente en la célula de Pichia pastoris modificada, en donde se aplican las siguientes definiciones: - el gen similar a ssn6 se define como que comprende la SEQ ID NO: 1, - la secuencia de nucleótidos del gen similar a ssn6 se modifica mediante la introducción de una mutación puntual, una deleción parcial o completa o un reemplazo por una secuencia de nucleótidos diferente, y - la célula de Pichia pastoris modificada, en comparación con su tipo salvaje sin modificar, se define como que exhibe una actividad proteica similar a SSN6 reducida o nula y/o función en la regulación de un promotor de LLP, comprendiendo este promotor de LLP la SEQ ID NO: 133.
Description
DESCRIPCIÓN
Sistema de expresión basado en promotor de LLP de levadura constitutivo
Campo de la invención
La presente invención pertenece al campo de la biotecnología, producción de proteínas recombinantes, biología molecular, microbiología y genética microbiana. Específicamente, la presente invención se refiere a una célula de Pichia pastoris modificada, o un sistema de expresión, respectivamente, que comprende un gen modificado, una secuencia de polinucleótidos que comprende dicho gen modificado, un vector de expresión que comprende dicha secuencia de polinucleótidos, una célula huésped que comprende dicho vector de expresión, así como al uso de dichos componentes. Además, la presente invención se refiere a métodos que utilizan dichos componentes.
Descripción de la técnica de antecedentes
Los sistemas de expresión para la expresión de genes de interés (GOI) y también para la producción de proteínas de interés son ampliamente conocidos y de gran importancia en el campo de la biología molecular, microbiología y genética microbiana.
Hasta ahora, se conocen varios sistemas de expresión que permiten la expresión de determinados genes y proteínas deseados, tales como los sistemas basados en células y los sistemas exentos de células. Los sistemas basados en células comprenden sistemas bacterianos y sistemas eucarióticos, y los sistemas exentos de células se basan, por ejemplo, en el uso de ARN polimerasa purificada, ribosomas, ARNt y ribonucleótidos o se basan en el uso de sistemas que contienen sistemas de síntesis de proteínas exentos de células, tales como, por ejemplo, lisados de reticulocitos de conejo. La elección del sistema de expresión utilizado respectivamente depende de diversos factores, tales como el tipo de proteína (fuente eucariótica o procariótica de la proteína) que se ha de expresar, o si son necesarias modificaciones post-traduccionales con el fin de asegurar un funcionamiento y/o una estructura adecuados.
Por ejemplo, en general, si se han de expresar proteínas eucariotas, típicamente se selecciona un sistema de expresión eucariótico. Por lo tanto, la razón es que la mayoría de las proteínas eucariotas se modifican, por ejemplo, por fosforilación, acilación, metilación, ubiquitinación o glicosilación. Se sabe que las bacterias no son organismos huésped ideales para proteínas modificadas de este tipo, ya que las bacterias son procariotas que no están equipadas con la maquinaria enzimática completa para realizar las modificaciones post-traduccionales o el plegamiento molecular que se requieren para que muchas proteínas funcionen correctamente. Por lo tanto, si se han de expresar proteínas eucariotas, se utilizan típicamente sistemas de expresión que utilizan células eucariotas. Sistemas de expresión de este tipo se basan, por ejemplo, en células de levadura, hongos o insectos. Los sistemas de expresión en levaduras utilizan promotores inducibles o no inducibles para la expresión. Promotores inducibles para levaduras metilotróficas tales como Pichia pastoris (P. Pastoris) requieren a menudo el uso de metanol como sustancia inductora. Adicionalmente, en la técnica anterior, se han realizado estudios con respecto a la regulación de la expresión génica, en particular en Saccharomyces cerevisiae:
Fleming et al. (EMBO Journal, Vol. 20, N° 18, 2001, páginas 5219-5231) describe cepas ssn6 que no tienen proteína SSN6, y la represión del gen de floculación FLO1 por el correpresor Tup1-Ssn6.
Fleming et al. (BBA - Gene Regulatory Mechanisms, Vol. 1839, N° 11, 2014, páginas 1242-1255) describe que el gen de floculación de levadura FLO1 está reprimido por el complejo Cyc8-Tup1.
Teunissen et al. (Yeast, Vol. 11, N° 5, 1995, páginas 435-446) analiza la regulación transcripcional del gen de floculación FLO1 en Saccharomyces cerevisiae y encontró que el gen FLO1 está regulado transcripcionalmente. Adicionalmente, se encontró que el gen FLO1 es activado o desreprimido por mutaciones en la cascada reguladora de TUP1/SSN6.
Tzamaris et al. (Genes and Development, Vol. 9, N° 7, 1995, páginas 821-831) realizó un análisis funcional de Cyc8 y demostró que se requieren distintas combinaciones de motivos TPR (un motivo en tándem que está presente en la proteína Cyc8) para la interacción directa con Tup1 y represión de genes específicos.
T rumbly (Gene, Vol. 73, N° 1, 1988, páginas 97-111) clonó y caracterizó el gen CYC8 que media en la represión de glucosa en levaduras.
Shen et al. (FEMS Yeast Research, Vol. 6, N° 6, 2006, páginas 914-923) describen que la floculación inducida por GTS1 es de naturaleza dependiente de la floculina y es provocada por la expresión de la floculina principal Flo1p.
El documento EP 2 184 294 tiene como objetivo proporcionar ácidos nucleicos y construcciones para aumentar el catabolismo de la galactosa y métodos para ello. A este respecto, el documento EP 2184294 describe que se sabe que la proteína TUP1 funciona como un co-represor transcripcional general en levaduras, y que TUP 1 de Saccharomyces cerevisiae forma un complemento con CYS8 (SSN6), que reprime la transcripción de genes regulada por glucosa, oxígeno y daño del ADN.
A pesar de los sistemas de expresión conocidos, todavía existe la necesidad de un sistema de expresión mejorado, en particular para un sistema de expresión eucariota. Se desean, por ejemplo, mejoras con respecto a la manipulación del sistema de expresión, costos, aspectos de seguridad (p. ej., evitar el uso de inductores altamente inflamables tales como metanol), la complejidad del sistema, el tiempo necesario para expresar las proteínas o el rendimiento de las proteínas expresadas.
Sumario de la invención
La presente invención proporciona los siguientes aspectos, materias objeto y realizaciones preferidas, que respectivamente, tomados solos o en combinación, contribuyen a resolver el objeto de la presente invención:
(1) Una célula eucariota modificada, en donde esta célula eucariota modificada es una célula de Pichia pastoris, que se modifica en comparación con su célula de tipo salvaje al menos porque comprende
o un gen tipo ssn6 modificado y/o
o un nivel de expresión modificado de proteína similar a SSN6, o
porque
o se elimina un gen similar al ssn6,
respectivamente, en el sentido de que
o la célula de Pichia pastoris modificada no es capaz de proporcionar una proteína similar a SSN6 que ejerza su función de tipo salvaje y/o actividad de tipo salvaje,
o la cantidad de proteína similar a SSN6 que todavía está presente en la célula de Pichia pastoris modificada difiere de la cantidad de proteína similar a SSN6 que está presente en su forma salvaje, y/o o esencialmente ninguna proteína similar a SSN6 está presente en la célula de Pichia pastoris modificada, en donde se aplican las siguientes definiciones:
o el gen similar a ssn6 se define como que comprende la SEQ ID NO: 1,
o la secuencia de nucleótidos del gen similar a ssn6 se modifica mediante la introducción de una mutación puntual, una deleción parcial o completa o un reemplazo por una secuencia de nucleótidos diferente, y o la célula de Pichia pastoris modificada, en comparación con su tipo salvaje sin modificar, se define como que exhibe una actividad proteica similar a SSN6 reducida o nula y/o función en la regulación de un promotor de LLP, comprendiendo este promotor de LLP la SEQ ID NO: 133.
En una realización preferida, dicha célula de Pichia pastoris modificada exhibe una actividad y/o función de proteína similar a SSN6 diferente con respecto a la actividad y/o función de las proteínas en la regulación de la expresión de genes que están bajo el control del promotor de la proteína similar a lectina (LLP).
(2) La célula de Pichia pastoris modificada de acuerdo con el punto (1), en donde dicha célula de Pichia pastoris modificada exhibe una actividad de proteína similar a SSN6 reducida y/o una función reducida, o ninguna actividad de proteína similar a SSN6 y/o función en absoluto, en la regulación de la expresión de genes que están bajo el control del promotor de LLP.
(3) La célula de Pichia pastoris modificada de acuerdo con el punto (1) o (2), en donde el gen similar a ssn6 se modifica en una secuencia reguladora, tales como promotor(es), potenciador(es), terminador(es), silenciador(es), secuencia(s) IRES, sitio(s) de unión al ribosoma y secuencia(s) que estabilizan o desestabilizan el ARNm mediante estructura(s) secundaria(s) y/o en una secuencia codificante.
(4) La célula de Pichia pastoris modificada de acuerdo con cualquiera de los puntos (1) a (3), en donde el nivel de expresión modificado de la proteína similar a SSN6 se obtiene modificando la secuencia codificante del gen similar a ssn6.
(5) La célula de Pichia pastoris modificada de acuerdo con cualquiera de los puntos (1) a (4), en donde la actividad, función, preferiblemente función reguladora de genes, y/o cantidad total de proteína similar a SSN6 de la célula de Pichia pastoris modificada es a lo sumo del 20%, preferiblemente a lo sumo del 15%, más preferiblemente a lo sumo del 10%, incluso más preferiblemente a lo sumo del 5% de la actividad, función y/o cantidad total de proteína similar a SSN6 de su forma de tipo salvaje, y lo más preferiblemente no hay actividad y/o función alguna de la proteína similar a SSN6 de la célula de Pichia pastoris modificada en absoluto.
(6) La célula de Pichia pastoris modificada de acuerdo con cualquiera de los puntos (1) a (5), en donde el gen similar a ssn6 y/o el nivel de expresión de la proteína similar a SSN6 está modificado por
• introducción de una o más mutaciones puntuales, p. ej., sustitución, inserción o deleción de uno o más nucleótidos en la secuencia de polinucleótidos del gen similar a ssn6,
• deleción parcial o completa de la secuencia de polinucleótidos del gen similar a ssn6, y/o
• reemplazo parcial o completo de la secuencia de polinucleótidos del gen similar a ssn6 por una secuencia de nucleótidos diferente, p. ej., heteróloga,
en donde la secuencia de polinucleótidos del gen similar a ssn6 comprende secuencias de polinucleótidos codificantes y reguladores, y en donde dichas secuencias de polinucleótidos reguladores del gen similar a ssn6 comprenden promotores, potenciadores, terminadores, silenciadores, secuencias IRES, sitios de unión a ribosomas o secuencias que estabilizan o desestabilizan el ARNm por estructuras secundarias.
(7) La célula de Pichia pastoris modificada de acuerdo con cualquiera de los puntos precedentes, en donde dicha célula es una célula de Pichia pastoris de acuerdo con la clasificación actual.
(8) La célula de Pichia pastoris modificada de acuerdo con el punto (7), en donde la célula puede ser cualquier célula de Pichia pastoris, preferiblemente una célula de una cepa seleccionada del grupo que consiste en NRRL Y-11430, CBS704, GS115 y KM71.
(9) La célula de Pichia pastoris modificada de acuerdo con cualquiera de los puntos precedentes, en donde dicha célula de Pichia pastoris comprende una secuencia de polinucleótidos que representa una modificación de la SEQ ID NO: 1, preferiblemente la célula de Pichia pastoris modificada comprende la SEQ ID NO: 7.
La SEQ ID NO: 1 representa la región codificante del gen similar a ssn6.
La SEQ ID NO: 7 representa la secuencia de nucleótidos de tipo ssn6 modificada.
(10) La célula de Pichia pastoris modificada de acuerdo con cualquiera de los puntos precedentes, en donde dicha célula de tipo salvaje contiene una proteína similar a SSN6, proteína que comprende una o ambas de las secuencias de aminoácidos consenso representadas en SEQ ID NO: 63 y 64.
En otras palabras, la célula de Pichia pastoris, antes de su modificación que da como resultado dicha célula de Pichia pastoris modificada, contenía una proteína similar a SSN6, proteína que comprendía una o ambas de las secuencias de aminoácidos representadas en SEQ ID NO: 63 y 64.
(11) Una secuencia de polinucleótidos que comprende, preferiblemente que consiste en un gen similar a ssn6 modificado,
en donde se aplican las siguientes definiciones:
• dicho gen similar a ssn6 se define como que comprende la SEQ ID NO: 1,
• la secuencia de nucleótidos del gen similar ssn6 se modifica mediante la introducción de una mutación puntual o una deleción parcial,
en donde, si dicha secuencia de polinucleótidos
(a) se introduce en un sistema de expresión adecuado y se intenta expresar, esencialmente no se expresa proteína similar a SSN6 alguna, o
(b) se expresa en un sistema de expresión adecuado, se expresa una proteína similar a SSN6 que no ejerce su función de tipo salvaje y/o su actividad de tipo salvaje, preferiblemente con respecto a su actividad y/o función en la regulación de la expresión génica, más preferiblemente en la regulación de la expresión de genes que están bajo el control del promotor de LLP, y/o
(c) se expresa en un sistema de expresión adecuado, se expresa una cantidad de proteína similar a SSN6 que difiere de la cantidad de proteína similar a SSN6 de tipo salvaje;
o
o la secuencia de polinucleótidos comprende la SEQ ID NO: 7.
Con el fin de evaluar cualquiera de (a) a (c), se intenta expresar la secuencia de polinucleótidos de tipo salvaje correspondiente en condiciones equiparables o iguales, bajo las cuales se intenta expresar el gen similar a ssn6 modificado.
(12) La secuencia de polinucleótidos de acuerdo con el punto (11), en donde, si dicha secuencia de polinucleótidos se introduce en un sistema de expresión adecuado y se intenta expresar, o se expresa en un sistema de expresión adecuado, se reduce la cantidad de proteína similar a SSN6, o esencialmente no hay, preferiblemente ninguna, proteína similar a SSN6 presente en absoluto, en comparación con la cantidad de proteína similar a SSN6 que se expresa cuando la secuencia de polinucleótidos de tipo salvaje correspondiente se expresa en condiciones equiparables o iguales.
(13) La secuencia de polinucleótidos de acuerdo con el punto (11) o (12), en donde una secuencia reguladora del gen similar a ssn6 se selecciona del grupo que comprende promotores, potenciadores, terminadores, silenciadores, secuencias IRES, sitios de unión a ribosomas y secuencias que estabilizan o desestabilizan el ARNm mediante estructuras secundarias, preferiblemente dicha secuencia reguladora se selecciona del grupo que consiste en promotores, potenciadores y terminadores.
(14) La secuencia de polinucleótidos de acuerdo con cualquiera de los puntos (11) a (13), en donde el gen similar a ssn6 ha sido modificado tal como se define en el punto (6).
(15) La secuencia de polinucleótidos de acuerdo con cualquiera de los puntos (11) a (14), en donde la secuencia de polinucleótidos comprende, preferiblemente consiste en modificaciones de la SEQ ID NO: 1, preferiblemente la secuencia de polinucleótidos comprende, más preferiblemente consiste en la SEQ ID NO: 7.
Los siguientes puntos (16) a (20) también se describen en esta memoria, sin embargo, estos puntos (16) a (20) no forman parte de la presente invención:
(16) Una secuencia de ácido nucleico que comprende la secuencia de polinucleótidos de acuerdo con cualquiera de los puntos (11) a (15).
(17) Un vector que comprende la secuencia de polinucleótido/secuencia de ácido nucleico de acuerdo con cualquiera de los puntos (11) a (16).
(18) Una célula huésped que comprende el vector de acuerdo con el punto (17) o un polinucleótido de acuerdo con cualquiera de los puntos (11) a (13).
(19) La célula huésped de acuerdo con el punto (18), en donde dicha célula huésped es una bacteria, preferiblemente Escherichia coli.
(20) Un polipéptido codificado por la secuencia de polinucleótidos de acuerdo con cualquiera de los puntos (11) a (15).
(21) Un vector de expresión que comprende un promotor, en donde dicho promotor se caracteriza porque se reprime en presencia de una proteína similar a SSN6 si dicho vector de expresión se introduce en un sistema de expresión adecuado, p. ej., en una célula de Pichia pastoris tal como se define en el punto. (7) u (8), en donde la proteína similar a SSN6 se define como que comprende la secuencia de aminoácidos representada en la SEQ ID NO: 8, y
en donde dicho promotor es un promotor de LLP que comprende, preferiblemente consiste en SEQ ID NO: 133 o versiones modificadas de la misma, caracterizándose dichas versiones modificadas porque todavía exhiben la función del promotor, en donde LLP, que se define por la secuencia de nucleótidos representada en SEQ ID NO: 16, no es codificada por la secuencia de polinucleótidos de este vector de expresión.
(22) El vector de expresión de acuerdo con el punto (21), que, además, comprende uno o más genes de interés. (23) El vector de expresión de acuerdo con el punto (22), en donde el gen o los genes de interés están bajo el control del promotor definido en el punto (21).
(24) El vector de expresión de acuerdo con cualquiera de los puntos (21) a (23), en donde dicho vector de expresión comprende, además, uno o más genes de interés; preferiblemente, dicho gen o genes de interés se seleccionan del grupo que consiste en genes que codifican enzimas, anticuerpos o fragmentos de los mismos, hormonas, proteínas estructurales y antígenos proteicos que están presentes en vacunas.
(25) El vector de expresión de acuerdo con cualquiera de los puntos (21) a (24), en donde el gen de interés se selecciona del grupo que consiste en genes que codifican enzimas, anticuerpos o fragmentos de los mismos, hormonas, proteínas estructurales (tales como albúmina) y antígenos proteicos que son adecuados para vacunas. La siguiente realización del punto (26) se describe en esta memoria, sin embargo, no forma parte de la presente invención:
(26) El vector de expresión de acuerdo con cualquiera de los puntos (21) a (24), en donde, si el promotor es un promotor de LLP tal como se define en el punto (21), la proteína LLP es codificada por la secuencia de polinucleótidos de este vector de expresión y, preferiblemente, el gen de interés se selecciona del grupo que consiste en genes que codifican enzimas, anticuerpos o fragmentos de los mismos, hormonas, proteínas estructurales (tales como albúmina) y antígenos proteicos que son adecuados para vacunas.
(27) El vector de expresión de acuerdo con cualquiera de los puntos (21) a (25), en el que dicho vector de expresión comprende, además, características seleccionadas de cualquiera de las siguientes:
(i) un marcador de selección;
(ii) un marcador de purificación;
(iii) una secuencia señal, preferiblemente una secuencia señal secretora de factor alfa, más preferiblemente la secuencia señal MFalfa pre-pro, incluso más preferiblemente una secuencia señal que comprende o consiste, preferiblemente que consiste en la SEQ ID NO: 14 o la SEQ ID NO: 21;
(iv) un origen de replicación; y/o
(v) una secuencia de nucleótidos para la integración fijada como objetivo y/o aleatoria en el genoma de una célula huésped.
En una realización preferida, la secuencia señal (iii) del vector de expresión de acuerdo con el punto (27) comprende o consiste, preferiblemente consiste en la SEQ ID NO: 14.
(28) El vector de expresión de acuerdo con cualquiera de los puntos (21) a (25) y (27), en donde dicho vector contiene más de un promotor tal como se define en el punto (21), y/o en donde dicho vector contiene más de un promotor de LLP de acuerdo con el punto (24), preferiblemente 2, 3, 4, 5 o 6 promotores de LLP de acuerdo con el punto (24) y preferiblemente diferentes promotores de LLP, p. ej., promotores de LLP de diferente longitud, de acuerdo con el punto (24) que dan como resultado diferentes tasas de expresión de los genes de interés bajo el control de dicho promotor de LLP.
(29) El vector de expresión de acuerdo con cualquiera de los puntos (21) a (25) y (27), en donde dicho vector contiene, además de uno o más promotores de LLP, además uno o más de otros promotores diferentes de un promotor de LLP, otros promotores que dan como resultado tasas de expresión diferentes a las tasas de expresión de los promotores de LLP.
Las siguientes realizaciones de los elementos (30) y (31) se describen en esta memoria, sin embargo, no forman parte de la presente invención:
(30) Uso de un vector de expresión de acuerdo con el punto (28) o (29) para la expresión de una proteína multimérica, consistiendo dicha proteína multimérica en dos o más cadenas de proteínas individuales, cuyas cadenas de proteínas individuales están conectadas entre sí por una o más puentes disulfuro y/o cadenas de proteínas individuales que forman una proteína multimérica mediante otras formas de interacciones cadena de proteína-cadena de proteína.
(31) Uso de acuerdo con el punto (30), en donde dicha proteína multimérica se expresa transformando una célula con dos o más vectores individuales, en donde cada uno de los vectores contiene uno o más promotores tal
como se define en el punto (21) y/o en el punto (24), o en donde al menos un vector contiene un promotor de LLP y al menos un vector contiene otro promotor diferente de un promotor de LLP.
Las siguientes realizaciones de los puntos (32) y (33) se adjuntan en esta memoria, sin embargo, no forman parte de la invención:
(32) Una célula huésped, que comprende el vector de acuerdo con el punto (17) o cualquiera de los puntos (21) a (29).
(33) La célula huésped de acuerdo con el punto (32), en donde dicha célula huésped es una bacteria, preferiblemente Escherichia coli, o la célula de Pichia pastoris de acuerdo con cualquiera de los puntos (1) a (9). (34) La célula de Pichia pastoris de acuerdo con cualquiera de los puntos (1) a (10), que comprende el vector de expresión de acuerdo con cualquiera de los puntos (21) a (25) y (27) a (29).
La siguiente realización del punto (35) se adjunta en esta memoria, sin embargo, no forma parte de la invención:
(35) Un sistema de expresión, que comprende
a) la célula de Pichia pastoris modificada tal como se define en cualquiera de los puntos (1) a (10 );
b) el vector de expresión tal como se define en cualquiera de los puntos (21) a (29), en donde dicho vector de expresión también puede estar presente en forma linearizada y/o al menos partes del vector están integradas en el genoma de la célula de Pichia pastoris modificada.
(36) La célula de Pichia pastoris modificada de acuerdo con cualquiera de los puntos (1) a (10), que comprende, además, un promotor tal como se define en el punto (21).
(37) La célula de Pichia pastoris modificada de acuerdo con el punto (36), que comprende, además, (a) un gen o genes de interés que están bajo el control del promotor como se define en el punto (21).
(38) La célula de Pichia pastoris modificada de acuerdo con el punto (37), en donde el gen o los genes de interés son los definidos en el punto (25).
(39) La célula de Pichia pastoris modificada de acuerdo con el punto (37) o (38), en donde el gen LLP no se expresa además del gen o los genes de interés, o en donde el gen LLP se expresa además del gen o los genes de interés.
(40) La célula de Pichia pastoris modificada de acuerdo con el punto (39),
• en donde el promotor de LLP o el promotor similar a LLP controla (a) un gen o genes de interés que es o son diferentes de LLP y, además, otra copia de dicho promotor controla el gen LLP (p. ej., Opción 2 en la Fig. 3D); o • en donde el promotor de LLP o el promotor similar a LLP solo controla (a) un gen o genes de interés que es o son diferentes de LLP y no está presente gen LLP alguno (p. ej., Opción 1 en la Fig. 3C ).
(41) Uso de
1. (A) la célula de Pichia pastoris,
2. (B) la secuencia de polinucleótidos, y/o
3. (C) el vector de expresión
de acuerdo con cualquiera de los puntos (1) a (40)
en un método para expresar, preferiblemente sobre-expresar, el gen o los genes de interés.
Las siguientes realizaciones de los puntos (42) a (50) se adjuntan en esta memoria, sin embargo, no forman parte de la invención:
(42) Método para determinar la pureza de una composición que comprende el producto de expresión de un gen de interés, que comprende las siguientes etapas:
(a) expresar un gen o genes de interés utilizando una célula de Pichia pastoris modificada de acuerdo con cualquiera de los puntos (1) a (10) y utilizando un vector de expresión de acuerdo con el punto (25), en donde
(a1) la célula de Pichia pastoris modificada comprende un gen que codifica la proteína LLP bajo el control de un promotor de LLP o un promotor similar a LLP, y en el que
(a2) el vector de expresión comprende uno o más genes de interés bajo el control de un promotor de LLP o un promotor similar a LLP, en el que dicho gen o genes de interés no codifican LLP,
obteniendo con ello una composición que comprende el producto de expresión del gen o genes de interés, es decir, la proteína o proteínas de interés y la proteína LLP;
(b) determinar la cantidad del producto de expresión del gen o genes de interés, es decir, la cantidad de proteína o proteínas de interés, y la cantidad de proteína LLP que está presente en la composición obtenida en la etapa (a), en donde la cantidad de proteína LLP en comparación con la cantidad de producto de expresión del gen o genes de interés, es decir, de la proteína o proteínas de interés, es indicativa de la pureza de la composición obtenida en la etapa (a); y, opcionalmente,
(c) someter la composición de la etapa (a) a una o más etapas de purificación aguas abajo, seguido de la etapa (b) para determinar la cantidad de la proteína o las proteínas de interés, y la cantidad de proteína LLP que está presente en la composición obtenida después de haber llevado a cabo dicha etapa de purificación aguas abajo, es decir, vigilando el agotamiento de la proteína de la célula huésped (pureza del gen de la proteína de interés en el curso de su purificación).
(43) Un método para expresar uno o más genes de interés en una célula de Pichia pastoris, que comprende un gen similar a ssn6 o un gen relacionado con ssn6, en el que la traducción del transcrito de ARNm del gen similar a ssn6 o el gen relacionado con ssn6 se evita hibridando una secuencia complementaria o una secuencia parcial de la misma con el transcrito de ARNm.
(44) El método del punto (43), en el que la secuencia parcial de la secuencia complementaria es un ARNip, ARN antisentido, una ribozima o ARN o ADN triplex.
(45) Un método para expresar uno o más genes de interés en una célula de Pichia pastoris que comprende un casete de expresión relacionado con SSN6 o un casete de expresión similar a SSN6, en donde la proteína relacionada con SSN6 o la proteína similar a SSN6 en dicha célula de Pichia pastoris está modificada o inhibida en su función y/o actividad.
(46) El método de acuerdo con el punto (45), en el que la proteína relacionada con SSN6 o la proteína similar a SSN6 de dicha célula de Pichia pastoris se modifica o inhibe en su función y/o actividad en la regulación del promotor de LLP, preferiblemente la proteína relacionada con SSN6 o proteína similar a SSN6 exhibe actividad y/o función de proteína relacionada con SSN6 o proteína similar a SSN6 reducida, o ninguna actividad y/o función en absoluto de proteína similar a SSN6 o de proteína relacionada con SSN6.
(47) Una célula de Pichia pastoris, que comprende
• un gen similar a ssn6 modificado o un gen relacionado con ssn6 modificado, en donde dicho gen ha insertado una secuencia de nucleótidos extraña, con el fin de que
(i) la célula de Pichia pastoris no es capaz de proporcionar una proteína similar a SSN6 o una proteína relacionada con s SN6 que ejerza su función de tipo salvaje y/o actividad de tipo salvaje, preferiblemente con respecto a su actividad y/o función en la regulación del promotor de LLP o promotor similar a LLP,
(ii) la cantidad de proteína similar a SSN6 o de proteína relacionada con SSN6 que está presente en la célula de Pichia pastoris difiere de la cantidad de proteína similar a SSN6 o de proteína relacionada con SSN6 que está presente en su forma de tipo salvaje, preferiblemente la cantidad de la proteína similar a SSN6 o de la proteína relacionada con s SN6 está reducida, y/o
(Iii) ninguna proteína similar a SSN6 está presente en la célula de Pichia pastoris o proteína relacionada con SSN6,
y
• un gen de interés que reemplaza una parte o la totalidad de la región codificante del gen que codifica la proteína LLP, y que está bajo el control del promotor de LLP, en el sentido de que esencialmente no hay proteína LLP presente en la célula de Pichia pastoris,
preferiblemente en donde dicha célula de Pichia pastoris exhibe una actividad y/o función de proteína similar a SSN6 o proteína relacionada con SSN6 reducida, o ninguna actividad y/o función de proteína similar a SSN6 o proteína relacionada con SSN6.
(48) Una célula de Pichia pastoris, que comprende
• un gen similar a ssn6 modificado, en donde dicho gen ha insertado una secuencia de nucleótidos extraña, con el fin de que
(i) la célula de Pichia pastoris no sea capaz de proporcionar una proteína similar a SSN6 que ejerza su función de tipo salvaje y/o actividad de tipo salvaje, preferiblemente con respecto a su actividad y/o función en la regulación del promotor de LLP,
(ii) la cantidad de proteína similar a SSN6 que está presente en la célula de Pichia pastoris difiere de la cantidad de proteína similar a SSN6 que está presente en su forma de tipo salvaje, preferiblemente la cantidad de la proteína similar a SSN6 está reducida, y/o
(iii) ninguna proteína similar a SSN6 está presente en la célula de Pichia pastoris,
• un gen de interés bajo el control del promotor de LLP, y
• un gen llp,
preferiblemente en donde dicha célula de Pichia pastoris exhibe una actividad y/o función de proteína similar a SSN6 reducida, o ninguna actividad y/o función de proteína similar a SSN6 en absoluto.
(49) Secuencia de nucleótidos que comprende en su extremo 5' una secuencia de nucleótidos que codifica la secuencia de péptidos de la secuencia de señal LLP y que se representa en la SEQ ID NO: 3, y que, además, comprende una secuencia de nucleótidos que codifica una proteína diferente. a la secuencia de proteína LLP nativa.
(50) Uso de una secuencia de nucleótidos de acuerdo con el punto (45) para la fabricación de una proteína que no es LLP en una célula de levadura, cuya célula de levadura segrega dicha proteína que no es LLP en el medio de cultivo celular, debido a la actividad promotora de la secreción de dicha secuencia de péptidos de la secuencia señal de LLP que se representa en SEQ ID NO: 3.
(51) Uso de un promotor de LLP que comprende SEQ ID NO: 133 en un vector para la expresión de un gen de interés en una célula de Pichia pastoris modificada tal como se define en cualquiera de los puntos (1) a (10). (52) Uso de un vector de expresión de acuerdo con cualquiera de los puntos (21) a (25) y (27) a (29) para la expresión de un gen de interés en una célula de Pichia pastoris modificada tal como se define en cualquiera de los puntos (1 ) a (10).
(53) Célula huésped que comprende un vector de expresión de acuerdo con cualquiera de los puntos (21) a (26) y (28) a (29).
(54) Método para preparar una proteína recombinante mediante el uso de un vector de expresión como se define en cualquiera de los puntos (21) a (26) y (28) a (29) y/o una célula de Pichia pastoris modificada tal como se define en cualquiera de los puntos (1) a (10).
Las siguientes realizaciones de los puntos (55) y (56) se describen en esta memoria, sin embargo, no forman parte de la invención:
(55) Vector que comprende la secuencia de promotor de LLP como se define en el punto (51).
(56) Ácido nucleico que comprende una o más de las secuencias de promotor de LLP de acuerdo con el punto (51). En una realización preferida, el ácido nucleico de acuerdo con el punto (54) se utiliza como un promotor. Definiciones de expresiones y términos utilizados dentro del significado de la presente invención
Dentro del significado de la presente invención, la proteína similar a SSN6 es una proteína que comprende, preferiblemente consiste en la secuencia de aminoácidos tal como se representa en la SEQ ID NO: 8.
La expresión "gen similar a ssn6" designa un gen que codifica la proteína similar a SSN6.
La región codificante del gen similar a ssn6 de P. pastoris se representa en la SEQ ID NO: 1.
Genes o proteínas que se asemejan al gen similar a ssn6 o la proteína similar a SSN6 con respecto a la función, actividad y secuencia, o solo con respecto a la función y actividad, se designan en esta memoria como "genes relacionados con ssn6" o "proteínas relacionadas con ssn6".
En el sentido de la presente invención, el término "gen" designa una determinada secuencia de ácido nucleico que codifica un polipéptido o una cadena de ARN que tiene una función en el organismo. La secuencia de ácido nucleico comprende regiones reguladoras (en esta memoria designadas también secuencias de polinucleótidos reguladores o secuencias reguladoras), regiones transcritas (tales como regiones que codifican proteínas, pero también regiones que se transcriben, pero no codifican proteínas, tales como intrones) y/u otras regiones de secuencia funcional.
En general, las regiones reguladoras son principalmente regiones que flanquean la región 3' y 5' de la región codificante del gen, pero determinadas regiones reguladoras, tales como elementos trans-reguladores, podrían estar ubicadas bastante distantes dentro del mismo cromosoma o incluso podrían estar ubicados en un cromosoma diferente. En particular, dentro del significado de la presente invención, las regiones reguladoras del gen similar a ssn6 comprenden la región flanqueante que se ubica hasta 200 nucleótidos aguas arriba y aguas abajo de los extremos 3' y 5' de la región codificante similar a ssn6.
Ejemplos de secuencias de polinucleótidos reguladores son promotores, potenciadores, terminadores, silenciadores, secuencias IRES, sitios de unión a ribosomas y secuencias que estabilizan o desestabilizan el ARNm mediante estructuras secundarias. Dentro del significado de la presente invención, la expresión "secuencia de polinucleótidos reguladora" designa secuencias de polinucleótidos que modifican la expresión de genes, por ejemplo, el gen similar a ssn6 y/o del gen ssn6 y/o un gen de interés y/o el gen Llp.
"Antígenos proteicos que son adecuados para vacunas" son antígenos que son capaces de provocar una respuesta inmune adecuada y deseada tras la vacunación. Por ejemplo, antígenos de este tipo son neuraminidasa (NA) o hemaglutinina (HA) del virus de la influenza. Una persona experta en la técnica conoce antígenos adicionales que son adecuados para fines de vacunación. Una persona experta en la técnica conoce métodos para testar la idoneidad de proteínas para provocar una respuesta inmune adecuada.
Una secuencia de "polinucleótido" o "ácido nucleico" incluye ADN (ácido desoxirribonucleico) o ARN (ácido ribonucleico), en forma de cadena sencilla o de doble cadena o de otro modo.
En general, la expresión "gen similar a ssn6" designa un gen que codifica la proteína similar a SSN6. El gen similar a ssn6 pertenece a una familia de proteínas conservadas evolutivamente (véase la Fig. 9A), y se sabe que determinadas levaduras, moscas, gusanos y mamíferos contienen proteínas que se asemejan a proteínas similares a SSN6 en secuencia y función/actividad. Estas proteínas se designan en esta memoria como «proteínas relacionadas con SSN6», y los genes que codifican estas proteínas se designan en esta memoria como "genes relacionados con ssn6". Ejemplos de levaduras que contienen proteínas que pertenecen a la familia de proteínas relacionada con ssn6 son P. Pastoris), Saccharomyces cerevisiae (S. cerevisiae) y Candida albicans (C. albicans).
La expresión "proteína relacionada con ssn6", por ejemplo, designa las proteínas respectivas, cuyos números de acceso a GenBank del NCBI (National Center for Biotechnology Information, e E.UU.) se indican en el sitio de la izquierda de la Fig. 9A. La Fig. 9A muestra solamente una parte interna de estas secuencias alineadas a la correspondiente parte de la secuencia similar a ssn6 de P. Pastoris (número de acceso a GenBank del NCBI (CCA36593.1). En detalle, estas proteínas incluyen XP_004181958.1 (SEQ ID NO: 24), KDQ17717.1 (SEQ ID NO: 25), CCK71477.1 (SEQ ID NO: 26), EDK38165.2 (SEQ ID NO: 27), XP_003688172.1 (SEQ ID NO: 28), XP_003667908.1 (SEQ ID NO: 29), EGA59684.1 (SEQ ID NO: 30), EDN64727.1 (SEQ ID NO: 31), AAA34545.1 (SEQ ID NO: 32), NP_009670.3 (SEQ ID NO: 33), XP_001731010.1 (SEQ ID NO: 34), CCU98386.1 (SEQ ID NO: 35), XP_646078.1 (SEQ ID NO: 36), XP_003288629.1 (SEQ ID NO: 37), CCF50299.1 (SEQ ID NO: 38), XP_761648.1 (SEQ ID NO: 39), XP_007880878.1 (SEQ ID NO: 40), EPB82504.1 (SEQ ID NO: 41), CDK26448.1 (SEQ ID NO: 42), ESW97404.1 (SEQ ID NO: 43), CCH42354.1 (SEQ ID NO: 44), CDR41214.1 (SEQ ID NO: 45), XP_002489776.1 (SEQ ID NO: 46), XP_002770760.1 (SEQ ID NO: 47), EDK37317.2 (SEQ ID NO: 48), XP_001485744.1 (SEQ ID NO: 49), XP_002619527.1 (SEQ ID NO: 50), XP_004200097.1 (SEQ ID NO: 51), XP_004199242.1 (SEQ ID NO: 52), XP_002419644.1 (SEQ ID NO: 53), BAF31137.1 (SEQ ID NO: 54), XP_719833.1 (SEQ ID NO: 55), EMG49052.1 (SEQ ID NO: 56), XP_002551300.1 (SEQ ID NO: 57), XP_001526425.1 (SEQ ID NO: 58), CCE42279.1 (SEQ ID NO: 59), XP_003868368.1 (SEQ ID NO: 60), XP_001387682.2 (SEQ ID NO: 61), XP_007376632.1 (SEQ ID NO: 62) como se encuentra en la base de datos del NCBI en http://www.ncbi.nlm.nih.gov/nucleotide/.
Dentro del significado de la presente invención, la expresión "proteína similar a SSN6" designa la proteína que comprende (preferiblemente que consiste en la secuencia de aminoácidos tal como se representa en la secuencia representada en la Fig. 2A (SEQ ID NO: 8).
Además, dentro del significado de la presente invención, la expresión "proteína similar a SSN6" designa una proteína que comprende secuencias de aminoácidos consenso representadas en la Fig. 9 B o 9 C, a saber:
Fig. 9 B: Secuencia consenso 1 (SEQ ID NO: 63)
W(CGL)(SLTA)(IMV)G(VINSTK)LY(YFLA)(QNSRKE)(INLM)(GNSKR)Q(NFYL)(HRETPAK)D
(AST)(LI)(DGTNASE)(AV)(YF)
y/o
Fig. 9 C: Secuencia consenso 2 (SEQ ID NO: 64) W(YFLED)(NDG)L(GLAS)(TSIQC)(LIV)YE(TSARKQ)(CS)(NHSDEH)(DNK-RGF)(Q-H)(ILTHVAS)(TSNQERIAMG)D(ASV)(LIASC)(DHNE)(SA)(YC)(EAKRQMTLNDS)(RQK)
Ambas secuencias consenso están escritas en código de una sola letra y grupos de aminoácidos entre paréntesis. Grupos de aminoácidos entre paréntesis significa que cualquiera de los aminoácidos entre paréntesis puede estar presente en esa posición dentro de la secuencia consenso. Por ejemplo, la secuencia consenso en la Fig.9 B comienza con W en la posición 1, y en la posición 2 puede estar presente C o G o L, en la posición 3 puede estar presente S o L o T o A, etc. La correspondiente posición de aminoácido dentro del contexto de la proteína similar a SSN6 de P. pastoris se da a continuación en las secuencias consenso de la Fig. 9 B y 9 C, p. ej., el residuo triptófano (W) en la posición 1 de la secuencia consenso en la Fig. 9 B corresponde al aminoácido en la posición 352 de la secuencia de la proteína similar a SSN6 de P. pastoris
En caso de que se escriba un «-» (guión), por ejemplo, en la posición 407 de la secuencia consenso en la Fig. 9 C, (Q-H), esto significa que en esta posición puede haber una Q, ningún aminoácido o un H.
La expresión "gen relacionado con ssn6" o "proteína relacionada con SSN6" designa un gen o una proteína que se asemeja al gen similar a ssn6 o proteína similar a SSN6 con respecto a la función, actividad y secuencia, o solo con respecto a la función y actividad.
La región codificante del gen similar a ssn6 de P. Pastoris se representa en la Fig. 1A (SEQ ID NO: 1). La secuencia de aminoácidos de la proteína similar a SSN6 de P. Pastoris se representa en la Fig. 1 J (SEQ ID NO: 13).
La expresión "gen llp" designa un gen que codifica la proteína LLP. La SEQ ID NO: 16 representa la secuencia de nucleótidos de la región codificante del gen llp de P. Pastoris, incluyendo la secuencia señal.
"Parecido con respecto a la función" o "parecido con respecto a la actividad" define que el producto génico relacionado con ssn6, es decir, la proteína relacionada con SSN6 que es codificada por el «gen relacionado con ssn6», exhibe esencialmente la misma función y actividad que la proteína SSN6 de P. Pastoris (representada en SEQ ID NO: 13) con respecto al promotor LLP ("proteína similar a lectina con similitud a Flo1p"), cuando dicha función y actividad se comparan en un sistema adecuado cuando se aplican condiciones equiparables, preferiblemente correspondientes. La función y actividad que es de interés en la presente invención y, por lo tanto, debe compararse o evaluarse, respectivamente, es la capacidad de la proteína similar a SSN6 y la proteína relacionada con SSN6, respectivamente, para regular, preferiblemente reprimir (reducir) e incluso más preferiblemente prevenir, la expresión de genes que están bajo el control del promotor de LLP. Por ejemplo, en una situación de tipo salvaje, típicamente el gen que está bajo el control del promotor de Llp es un gen que codifica la proteína LLP. En este caso, con el fin de determinar si la proteína relacionada con SSN6 exhibe esencialmente la misma función y/o actividad que la proteína similar a SSN6, por ejemplo, se compara la cantidad de proteína LLP que está presente, es decir, la cantidad de proteína LLP en un sistema de expresión en el que está presente un gen relacionado con ssn6 (y, por lo tanto, una proteína relacionada con SSN6), en comparación con un sistema de expresión en el que está presente un gen similar a SSN6 (y, por lo tanto, una proteína similar a SSN6). Si se demuestra que el gen candidato relacionado con ssn6 y el gen similar a ssn6 (y sus productos génicos, proteína relacionada (candidata) con SSN6 y proteína similar a SSN6, respectivamente (a la que también se alude en esta memoria como "proteína relacionada con SSN6/similar a SSN6" o "proteína similar a SSN6") exhiben esencialmente la misma función/actividad con respecto al promotor de LLP (y con respecto al gen que está bajo el control de dicho promotor, tal como el gen llp), p. ej., con respecto a la cantidad determinada de proteína LLP, entonces el gen candidato relacionado con ssn6 es un gen relacionado con ssn6.
Un promotor se define como una región reguladora de ADN capaz de unirse a una ARN polimerasa en una célula y que inicia la transcripción de un gen particular al que se enlaza operativamente. Típicamente, los promotores se encuentran cerca de los sitios de inicio de la transcripción del gen o los genes respectivos que están bajo el control de dicho promotor, en la misma cadena. Fig 1 B (SEQ ID NO: 2) y Fig. 1 I (SEQ ID NO: 12) muestran secuencias de nucleótidos del promotor
de LLP de P. Pastoris (Fig. 1 B = primeros 605 nucleótidos 5' del codón de inicio ATG, Fig. 1 I = primeros 1000 nucleótidos 5' del codón de inicio ATG).
Siempre que se haga referencia en esta memoria a un promotor de LLP, esta expresión también comprende un "promotor similar a LLP". Dentro del significado de la presente invención, un promotor similar a LLP es un promotor que exhibe esencialmente la misma función/actividad que el promotor de LLP, es decir, todavía es capaz de ejercer esencialmente la función/actividad de tipo salvaje del promotor de LLP.
Con el fin de determinar si un gen candidato relacionado con ssn6 y la proteína relacionada con SSN6, respectivamente, exhiben esencialmente la misma función y actividad que el gen similar a ssn6 y la proteína similar a SSN6, respectivamente, con respecto al promotor de LLP, se puede utilizar cualquier método adecuado que sea conocido por una persona experta en la técnica. Ejemplos de métodos de este tipo son medir la cantidad de proteína LLP en el sobrenadante de un cultivo celular, por ejemplo, mediante ensayo inmunoabsorbente ligado a enzimas (ELISA), o mediante transferencia Western, o medir el nivel de ARNm de LLP mediante transferencia Northern o mediante reacción en cadena de la polimerasa cuantitativa. (qPCR) o qPCR con transcriptasa inversa, o midiendo la actividad del promotor de LLP o del promotor similar a LLP ("promotor de LLP/similar a LLP"), por ejemplo, utilizando ensayos de genes informadores de luciferasa o utilizando proteína fluorescente verde (GFP) de promotor de LLP, etc. Todos estos métodos son bien conocidos por una persona experta en la técnica y representan un trabajo de rutina. Un libro de texto que comprende protocolos para métodos rutinarios es, por ejemplo, Sambrook et al., "Molecular Cloning: A Laboratory Manual", 4a Edición, Cold Spring Harbor Laboratory Press, (2012), al que se hace referencia en esta memoria como Sambrook et al. Se considera que un gen candidato relacionado con ssn6 exhibe esencialmente la misma función/actividad que el gen similar a ssn6, si su efecto (y el efecto de su producto génico, respectivamente) sobre la expresión de la proteína LLP es esencialmente el mismo.
Dentro del significado de la presente invención, la expresión "esencialmente el mismo" define una desviación de hasta el 20%, preferiblemente de hasta el 10%, más preferiblemente de hasta el 7% e incluso más preferiblemente de hasta el 3% de un valor dado.
Por consiguiente, la expresión "esencialmente no" define que hay una cantidad/actividad de la materia respectiva (tal como la proteína) presente (o restante) que corresponde a lo sumo al 20%, preferiblemente a lo sumo al 10%, más preferiblemente a lo sumo al 7%, e incluso más preferiblemente a lo sumo al 3% de la cantidad/actividad de tipo salvaje respectiva. "Esencialmente no" también incluye la ausencia de la materia/cantidad/actividad respectiva, preferiblemente significando por debajo del límite de detección de los métodos descritos en esta solicitud para esa materia/cantidad/actividad.
Dentro del significado de la presente invención, el término "reducida", p. ej., actividad "reducida", función "reducida" o cantidad "reducida" designa que la actividad total, función, preferiblemente función reguladora de genes, o cantidad de una materia (p. ej., proteína similar a SSN6 de la célula de Pichia pastoris modificada; o promotor de LLP) es a lo sumo del 20%, preferiblemente a lo sumo del 15%, más preferiblemente a lo sumo del 10%, incluso más preferiblemente a lo sumo del 5% de la actividad, función y/o cantidad total de la forma de tipo salvaje de esta materia (p. ej., proteína similar a SSN6; o promotor de LLP).
Es posible que las secuencias de nucleótidos y las proteínas que codifican, respectivamente, que exhiben esencialmente la misma función y actividad que el gen similar a ssn6 y la proteína similar a SSN6, respectivamente, exhiban un grado de identidad de secuencia comparativamente bajo, tal como 50%, 40% o 30% o incluso menor, tal como 25%, 20%, 19%, 18%, 17%, 16%, 15%, 12%, 10% o 5%. Por lo tanto, genes relacionados con ssn6/proteínas relacionadas con SSN6 son genes/proteínas que - en primer lugar - exhiben esencialmente la misma función/actividad que el gen similar a ssn6/proteína similar a SSN6 con respecto a la proteína LLP (en situación de tipo salvaje). Por lo tanto, la expresión "gen relacionado con ssn6" designa genes que se asemejan al gen similar a ssn6 como se define en esta memoria con respecto a la función/actividad, es decir, la capacidad de la proteína relacionada con SSN6 que es codificada por el gen relacionado con ssn6 para regular la expresión de genes que están bajo el control del promotor de LLP y la secuencia del promotor de LLP, respectivamente.
También es posible que una proteína relacionada con SSN6 comprenda las secuencias de aminoácidos consenso representadas en la Fig. 9 B y/o en la Fig. 9 C.
Además, es posible (sin embargo, no forma parte de la presente invención) que el "gen relacionado con ssn6" se parezca al gen similar a ssn6 tal como se define en esta memoria no solo con respecto a la función/actividad, es decir, la capacidad de la proteína relacionada con ssn6 codificada por el gen relacionado con ssn6 para regular la expresión de genes que están bajo el control del promotor de LLP o del promotor de LLP modificado, y la secuencia del promotor de lLp , respectivamente, pero adicionalmente se origina a partir de un microorganismo que se selecciona del grupo que consiste en Komagataella pastoris CBS 7435 (Sinónimo/otros nombres: Pichia pastoris, Pichia pastoris CBS 7435), Komagataella pastoris GS115 (Sinónimo/otros nombres: Pichia pastoris, Pichia pastoris GS115), Scheffersomyces stipitis CBS 6054 (Sinónimo/otros nombres: Pichia stipitis, Pichia stipitis CBS 6054), Millerozyma farinosa CBS 7064 (otro nombre: Pichia farinosa CBS 7064), Candida parapsilosis, Candida orthopsilosis Co 90-125, Debaryomyces hansenii CBS767,
Spathaspora passalidarum NRRL Y-27907, Candida albicans, Candida albicans, Candida albicans SC5314, Candida maltosa Xu316, Candida tropicalis MYA-3404 (otro nombre: Candida tropicalis T1), Lodderomyces elongisporus NRRL YB-4239 (otro nombre Saccharomyces elongisporus), Clavispora lusitaniae ATCC 4272 (anamorfo de genebank: Candida lusitaniae ATCC 42720), Meyerozyma guilliermondii ATCC 6260 (anamorfo de genebank: Pichia guilliermondii ATCC 6260), Wickerhamomyces ciferrii, Ogataea parapolymorpha DL-1 (sinónimo y otros nombres:: Hansenula polymorpha, Hansenula polymorpha DL-1, Ogataea angusta DL-1, Ogataea parapolymorpha ATCC 26012, Ogataea parapolymorpha DL-1, Pichia angusta DL-1), Cyberlindnera fabianii (sinónimo y otros nombres: Hansenula fabianii, Pichia fabianii, ...) Kuraishia capsulata CBS 1993, Dictyostelium discoideum AX4 (pertenece a amoebae social), Tetrapisispora phaffii CBS 4417 (sinónimo: Fabospora phaffii, Dictyostelium purpureum (pertenece a amoebae social), Pseudozyma flocculosa PF-1, Malassezia globosa CBS 7966, Botryobasidium botryosum FD-172 SS1 (basidiomicetos), Naumovozyma dairenensis CBS 421 (sinónimo: Saccharomyces dairenensis), Tetrapisispora blattae CBS 6284, Mucor circinelloides f. circinelloides 1006PhL (linaje fúngico divergente temprano), Malassezia sympodialis ATCC 42132, Kazachstania naganishii CBS 8797 (Saccharomyces naganishii), Saccharomyces cerevisiae YJM789, Saccharomyces cerevisiae FostersB, Saccharomyces cerevisiae, Saccharomyces cerevisiae S288c, Ustilago hordei (hongo tizón del maíz, basidiomiceto), Meyerozyma guilliermondii ATCC 6260 (sinónimo/otros nombres: Candida guilliermondii, Pichia guilliermondii ATCC 6260), y Ustilago maydis 521 (hongo tizón del maíz, basidiomiceto).
En una realización preferida, el "gen similar a ssn6 modificado", y las proteínas respectivas que estos genes codifican, no corresponden/no se derivan de las secuencias de nucleótidos o aminoácidos ssn6 o Tup1 de Saccharomyces cerevisiae, especialmente no corresponden a las siguientes secuencias:
La SEQ ID NO: 135 (secuencia de nucleótidos que codifica SSN6)
La SEQ ID NO: 136 (secuencia de nucleótidos que codifica Tup1)
La SEQ ID NO: 137 (secuencia de aminoácidos de SSN6)
La SEQ ID NO: 138 (secuencia de aminoácidos de Tup1).
En una realización preferida adicional, la célula de Pichia pastoris modificada comprende genes similares a ssn6 modificados, pero ningún otro gen o genes modificados que regule(n) la expresión de un gen que está bajo el control de un promotor que está reprimido en presencia de proteína similar a SSN6.
"Identidad de secuencia" o "% de identidad" se refiere al porcentaje de coincidencias de residuos entre al menos dos secuencias de polipéptidos o polinucleótidos alineadas utilizando un algoritmo estandarizado. Un algoritmo de este tipo puede insertar, de forma estandarizada y reproducible, huecos en las secuencias que se comparan con el fin de optimizar el alineamiento entre dos secuencias y, por lo tanto, lograr una comparación más significativa de las dos secuencias. Para los propósitos de la presente invención, la identidad de secuencia entre dos secuencias de aminoácidos o nucleótidos se determina utilizando el programa NCBI BLAST versión 2.2.29 (06-enero-2014) (Altschul et al., Nucleic Acids Res. (1997) 25: 3389-3402). La identidad de secuencia de dos secuencias de aminoácidos se puede determinar con blastp establecido en los siguientes parámetros: Matriz: BLOSUM62, Tamaño de Palabra: 3; Valor esperado: 10; Costo del hueco: Existencia = 11, Extensión = 1; Filtro = baja complejidad activado; Cadena de Filtro: L; Ajustes de composición: ajuste de matriz de puntuación de composición condicional. Para los propósitos de la presente invención, la identidad de secuencia entre dos secuencias de nucleótidos se determina utilizando el programa NCBI BLAST versión 2.2.29 (06-ene-2014) con blastn establecido en los siguientes parámetros ejemplares: Tamaño de Palabra: 11; Valor esperado: 10; Costos del hueco: Existencia = 5, Extensión = 2; Filtro = baja complejidad activado; Puntuaciones de Coincidencia/Discordancia: 2-3; Cadena de Filtro: L; m.
Alternativamente, las secuencias de ácidos nucleicos se pueden caracterizar por su grado de complementariedad. Tal como se utiliza en esta memoria, el término "complementario" se refiere a la capacidad de las secuencias de nucleótidos de purina y pirimidina de asociarse mediante enlaces hidrógeno para formar moléculas de ácido nucleico de doble cadena. Guanina y citosina, adenina y timina y adenina y uracilo son complementarias y pueden asociarse mediante enlaces hidrógeno, lo que da como resultado la formación de moléculas de ácido nucleico de doble cadena cuando dos moléculas de ácido nucleico tienen secuencias "complementarias". A las secuencias de ADN complementarias se las alude como un «complemento". De acuerdo con la invención, "condiciones altamente rigurosas" significa hibridación a 65 °C en 5X SSPE y formamida al 50%, y lavado a 65 °C en 0.5X SSPE. Las condiciones para la hibridación de alta rigurosidad se describen en Sambrook et al., "Molecular Cloning: A Laboratory Manual", 3a edición, Cold Spring Harbor Laboratory Press, (2001), incorporado en esta memoria como referencia. En algunos aspectos ilustrativos, la hibridación puede producirse a lo largo de la longitud completa del ácido nucleico aislado, o a lo largo de parte de su longitud, o a un fragmento del mismo.
La siguiente lista indica ejemplos de organismos que comprenden genes relacionados con ssn6: Komagataella pastoris CBS 7435 (Sinónimo/otros nombres: Pichia pastoris, Pichia pastoris CBS 7435), Komagataella pastoris GS115 (Sinónimo/otros nombres: Pichia pastoris, Pichia pastoris GS115), Scheffersomyces stipitis CBS 6054 (Sinónimo/otros nombres: Pichia stipitis, Pichia stipitis CBS 6054), Millerozyma farinosa CBS 7064 (otro nombre: Pichia farinosa CBS
7064), Candida parapsilosis, Candida orthopsilosis Co 90-125, Debaryomyces hansenii CBS767, Spathaspora passalidarum NRRl Y-27907, Candida albicans, Candida albicans, Candida albicans SC5314, Candida maltosa Xu316, Candida tropicalis MYA-3404 (otro nombre: Candida tropicalis T1), Lodderomyces elongisporus NRRL YB-4239 (otro nombre: Saccharomyces elongisporus), Clavispora lusitaniae ATCC 4272 (anamorfo de genebank: Candida lusitaniae ATCC 42720), Meyerozyma guilliermondii ATCC 6260 (anamorfo de genebank: Pichia guilliermondii ATCC 6260), Wickerhamomyces ciferrii, Ogataea parapolymorpha DL-1 (sinónimo y otros nombres: Hansenula polymorpha, Hansenula polymorpha d L-1, Ogataea angusta DL-1, Ogataea parapolymorpha ATCC 26012, Ogataea parapolymorpha DL-1, Pichia angusta DL-1), Cyberlindnera fabianii (sinónimo y otros nombres: Hansenula fabianii, Pichia fabianii, ...), Kuraishia capsulata CBS 1993, Dictyostelium discoideum AX4 (pertenece a amoebae social), Tetrapisispora phaffii CBS 4417 (sinónimo: Fabospora phaffii, Dictyostelium purpureum (pertenece a amoebae social), Pseudozyma flocculosa PF-1, Malassezia globosa CBS 7966, Botryobasidium botryosum FD-172 SS1 (basidiomiceto), Naumovozyma dairenensis CBS 421 (sinónimo: Saccharomyces dairenensis), Tetrapisispora blattae CBS 6284, Mucor circinelloides f. circinelloides 1006PhL (linaje fúngico divergente temprano), Malassezia sympodialis ATCC 42132, Kazachstania naganishii CBS 8797 (Saccharomyces naganishii), Saccharomyces cerevisiae YJM789, Saccharomyces cerevisiae FostersB, Saccharomyces cerevisiae, Saccharomyces cerevisiae S288c, Ustilago hordei (hongo tizón del maíz, basidiomiceto), Meyerozyma guilliermondii ATCC 6260 (sinónimo/otros nombres: Candida guilliermondii, Pichia guilliermondii ATCC 6260), y Ustilago maydis 521 (hongo tizón del maíz, basidiomiceto).
Dentro del significado de la presente invención, la expresión "tipo salvaje" indica que una determinada materia está presente en su estado natural y, por tanto, ejerce su función y/o actividad natural. Una "determinada materia" puede ser, por ejemplo, un organismo, tal como un microorganismo, una célula o, preferiblemente, una determinada proteína, tal como la proteína SSN6 o la proteína similar a SSN6. El estado de tipo salvaje, o forma de tipo salvaje, respectivamente, de una determinada materia se puede distinguir de las formas mutantes de dicha materia, ya que, por ejemplo, las formas mutantes estructurales pueden resultar de modificaciones que se llevan a cabo artificialmente, tal como modificaciones o manipulaciones in vitro, in vivo o ex vivo. Modificaciones que pueden llevarse a cabo artificialmente se describen en otra parte de esta memoria. Un organismo que comprende modificaciones se "modifica" en comparación con su forma de tipo salvaje con respecto a la estructura modificada.
Dentro del significado de la presente invención, el término "función" define el papel fisiológico de una determinada materia, tal como la proteína similar a SSN6, y el término "actividad" define en qué medida dicha determinada materia ejerce su función. Un ejemplo del papel fisiológico de una determinada materia es el papel regulador, preferiblemente represor, de la proteína similar a SSN6 sobre la actividad del promotor de LLP y, por lo tanto, sobre la expresión de genes que están bajo el control de dicho promotor. Dentro del significado de la presente invención, la expresión "función de tipo salvaje" designa la función de una determinada estructura o
materia (tal como un organismo, una proteína o un gen) ejerce en su estado natural. Por consiguiente, la expresión "actividad de tipo salvaje" designa la actividad que ejerce una determinada estructura en su estado natural.
Dentro del significado de la presente invención, un organismo puede modificarse solo con respecto a una única característica estructural y/o funcional específica, o con respecto a múltiples características estructurales y/o funcionales. Características estructurales y/o funcionales específicas que se modifican son características que modulan (es decir, influyen, ya sea positiva o negativamente, preferiblemente negativamente) en la expresión del gen ssn6 o gen similar a ssn6.
Un ejemplo de una característica específica que puede modificarse es, por ejemplo, la secuencia de nucleótidos del gen similar a ssn6, comprendiendo este gen una secuencia codificante y una secuencia reguladora que influye en la expresión de dichos genes tal como se describe en otra parte de esta memoria.
Secuencias reguladoras son secuencias que controlan la expresión de determinados genes. Dentro del significado de la presente invención, dichas secuencias reguladoras son, por ejemplo, secuencias que controlan la expresión del gen similar a ssn6, o el gen LLP, tales como promotores, potenciadores, terminadores, silenciadores, secuencias IRES, sitios de unión a ribosomas. y secuencias que estabilizan o desestabilizan el ARNm mediante estructuras secundarias.
Dentro del significado de la presente invención, la expresión "secuencia de nucleótidos heteróloga" es un polinucleótido que no se produce de forma natural en la célula, p. ej., porque la secuencia de nucleótidos del polinucleótido no se produce de forma natural en células eucariotas, tales como células eucariotas como se definen en otra parte en esta memoria.
Dentro del significado de la presente invención, los nombres "Komagataella pastoris" y "Pichia pastoris" son sinónimos.
Los nombres "NRRL Y-11430, CBS7435" se utilizan como sinónimos en la presente invención. El genoma de CBS7435 comprende los cromosomas 1 a 4 y una mitocondria . Las respectivas secuencias de nucleótidos tienen los siguientes Números de Acceso de GenBank: Cromosoma 1: FR839628.1; Cromosoma 2: FR839629.1; Cromosoma 3: FR839630.1; Cromosoma 4: FR839631.1; Mitocondria: FR839632.1 (Publicación High-quality genome sequence of Pichia pastoris CBS7435, Kuberl A, Schneider J, Thallinger GG, Anderl I, Wibberg D, Hajek T, Jaenicke S, Brinkrolf K, Goesmann A,
Szczepanowski R, Puhler A, Schwab H, Glieder A, Pichler H, J Biotechnol, volumen 154 número 4, páginas 312-320 año 2011).
Un "vector" es un replicón, tal como plásmido, fago, cromosoma artificial bacteriano (BAC) o cósmido, en el que se puede insertar otro segmento de ADN (p. ej., un gen extraño) para provocar la replicación de dicho segmento de a Dn insertado dando como resultado la expresión de dicha secuencia insertada. Los vectores pueden comprender un promotor y uno o más elementos de control (p. ej., elementos potenciadores) que son homólogos o heterólogos a dicho segmento de ADN insertado, pero que son reconocidos y utilizados por la célula huésped. Un "replicón" es cualquier elemento genético (p. ej., plásmido, cromosoma, virus) que funciona como una unidad de replicación del ADN dentro de una célula. Un replicón puede ser una unidad autónoma. Esto significa que es capaz de replicarse bajo su propio control. Dentro del significado de la presente invención, el vector comprende un promotor, en donde dicho promotor se caracteriza porque es reprimido en presencia de proteína similar a SSN6 si dicho vector se introduce en una célula huésped adecuada. En una realización preferida de la presente invención, el vector comprende un promotor para la secuencia codificante de la proteína LLP y/o para la secuencia codificante de una proteína de interés, en donde dicho promotor se caracteriza porque se reprime en presencia de proteína similar a SSN6 si dicho vector se introduce en una célula huésped adecuada.
Un tipo común de vector es un "plásmido", que generalmente es una molécula autónoma de ADN de doble cadena, habitualmente de origen bacteriano, que puede aceptar fácilmente ADN adicional (extraño) y que puede introducirse fácilmente en una célula huésped adecuada. En general, los vectores permiten la introducción de secuencias de nucleótidos en una célula huésped, con el fin de transformar al huésped y, opcionalmente, fomentar la expresión y/o replicación de la secuencia introducida.
Un vector contiene a menudo ADN codificante y secuencias reguladoras, tales como ADN del promotor y tiene uno o más sitios de restricción adecuados para insertar a Dn adicional, p. ej., extraño tal como heterólogo. El ADN del promotor y el ADN codificante pueden ser del mismo gen o de diferentes genes, y pueden ser del mismo organismo o de diferentes organismos. Vectores, tales como vectores de clonación recombinantes, incluirán a menudo uno o más sistemas de replicación para la clonación o expresión, uno o más marcadores para la selección en el huésped, p. ej., resistencia a antibióticos, y uno o más casetes de expresión. Se pueden producir vectores, o construcciones de vectores, respectivamente, utilizando biología molecular convencional y técnicas de ADN recombinante dentro de la experiencia de la técnica. Técnicas de este tipo se explican completamente en la bibliografía. Véase, p. ej., Sambrook, Fritsch & Maniatis, Molecular Cloning: A Laboratory Manual, 4a Edition (2012) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, Nueva York (en esta memoria "Sambrook et al., 2012"); DNA Cloning: A Practical Approach, Volúmenes I y II (D.N. Glover ed. 1985); F.M. Ausubel et al. (eds.), Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (1994).
Generalmente, los elementos estructurales específicos de un vector dependen del uso pretendido de dicho vector. Por ejemplo, con el fin de propagar un vector en una célula huésped, el mismo puede contener uno o más sitios de "orígenes de replicación" (a menudo también denominados "ori"), que es una secuencia de ácido nucleico específica en la que se inicia la replicación. Por consiguiente, la expresión "origen de replicación" u "ori" se refiere a una secuencia de ácido nucleico que inicia la replicación de ácido nucleico.
"Ori T" se refiere a un "origen de transferencia" que permite la transferencia del vector de una célula bacteriana a otra.
Dependiendo de en qué organismo/célula se pretenda utilizar el vector (de expresión), un experto en la técnica sabe qué marcadores tienen que estar presentes en el vector. Si, por ejemplo, el vector está destinado a ser utilizado en levadura, entre otros, están presentes marcadores de levadura comúnmente utilizados, tales como beta-galactosidasa, zeocina, geneticina, URA3, HIS3, LEU2, TRP1 y LYS2. Si el vector está destinado a ser utilizado en bacterias tales como E. coli, puede estar presente, entre otros, un ori (véase arriba) y/o marcadores seleccionables tales como genes que confieren resistencia a antibióticos.
Marcadores seleccionables adecuados dependen del sistema respectivo que se utilice y son conocidos por un experto en la técnica. Microorganismos transformados, es decir, los que contienen moléculas recombinantes tales como un vector (vector de expresión) o plásmido, pueden seleccionarse con una diversidad de métodos o marcadores de selección positiva y/o negativa. Por ejemplo, un marcador de selección positiva puede ser un gen que permite el crecimiento en ausencia de un nutriente esencial, tal como un aminoácido. Una diversidad de pares de selección positiva/negativa adecuados están disponibles y son conocidos en la técnica. Por ejemplo, se podrían utilizar diversos análogos de aminoácidos conocidos en la técnica como una selección negativa, mientras que el crecimiento en medios mínimos (con relación al análogo de aminoácidos) podría utilizarse como una selección positiva. Marcadores visualmente detectables también son adecuados para su uso en la presente invención, y pueden seleccionarse y/o rastrearse positiva y negativamente utilizando tecnologías tales como clasificación de células activadas por fluorescencia (FACS) o de microfluidos. Ejemplos de marcadores detectables incluyen diversas enzimas, grupos protésicos, marcadores fluorescentes, marcadores luminiscentes, marcadores bioluminiscentes y similares. Ejemplos de proteínas fluorescentes adecuadas incluyen, pero no se limitan a proteína amarilla fluorescente (YFP), proteína verde fluorescente (GFP), proteína ciano fluorescente (CFP), umbeliferona, fluoresceína, isotiocianato de fluoresceína, rodamina, diclorotriazinilamina fluoresceína, cloruro de dansilo, ficoeritrina y similares. Ejemplos de marcadores bioluminiscentes adecuados incluyen, pero no se limitan a luciferasa (p. ej., bacteriana, de luciérnaga, de escarabajo clic y similares), luciferina, aequorina y
similares. Ejemplos de sistemas enzimáticos adecuados que tienen señales visualmente detectables incluyen, pero no se limitan a, galactosidasas, glucorinidasas, fosfatasas, peroxidasas, colinesterasas y similares. En otros aspectos, el marcador de selección positiva es un gen que confiere resistencia a un compuesto, que sería letal para la célula en ausencia del gen. Por ejemplo, una célula que expresa un gen de resistencia a los antibióticos sobreviviría en presencia de un antibiótico, mientras que una célula que carece del gen no lo haría. Por ejemplo, la presencia de un gen de resistencia a la tetraciclina podría seleccionarse positivamente en presencia de tetraciclina, y seleccionarse negativamente en presencia de ácido fusárico. Genes de resistencia a antibióticos adecuados incluyen, pero no se limitan a genes tales como gen de resistencia a ampicilina, gen de resistencia a neomicina, gen de resistencia a blasticidina, gen de resistencia a higromicina, gen de resistencia a puromicina, gen de resistencia a cloranfenicol, gen de resistencia a apramicina, gen de resistencia a geneticina, gen de resistencia a zeocina y similares. En determinados aspectos, el marcador de selección negativa es un gen que es letal para la célula diana en presencia de un sustrato particular. Por ejemplo, el gen thyA es letal en presencia de trimetoprim. Por consiguiente, las células que crecen en presencia de trimetoprima no expresan el gen thyA .
Con el fin de purificar las proteínas recombinantes, los respectivos vectores (de expresión) utilizados a menudo comprenden secuencias de purificación (marcadores de purificación).adecuadas Por ejemplo, un vector puede comprender un epítopo c-myc C-terminal y una secuencia de polihistidina para la detección y purificación de la proteína o las proteínas recombinantes.
Como se describe en otra parte en esta memoria, un vector se puede utilizar para introducir una secuencia de ácido nucleico en una célula huésped, o en el genoma de la célula huésped, tal como el genoma de una levadura, tal como P. pastoris, o de una bacteria, tal como E. coli. La introducción de ácido nucleico (heterólogo) en el ácido nucleico de una célula huésped se denomina "recombinación". Un proceso de recombinación de este tipo puede fijarse como objetivo, es decir, tener lugar en un sitio deseado definido del genoma (secuencia de ácido nucleico) en el que se ha de introducir. En este caso, la recombinación se designa como "recombinación homóloga" (o "recombinación fijada como objetivo"/"integración fijada como objetivo"). Además, el proceso de recombinación puede ser aleatorio ("recombinación aleatoria"/"integración aleatoria"). En este caso, la recombinación no es homóloga.
La expresión "recombinación homóloga" se refiere a un tipo de recombinación genética, un proceso de reordenamiento físico que ocurre entre dos cadenas diferentes de moléculas de ADN. La recombinación homóloga implica el alineamiento de secuencias idénticas o similares, un cruce entre las cadenas de ADN homólogas alineadas de las dos moléculas y la rotura y reparación del ADN para producir un intercambio de material entre las cadenas. La recombinación homóloga se distingue de otros tipos de recombinación. Por ejemplo, la "recombinación específica del sitio", tal como se ejemplifica mediante elementos invertibles, resolvasas y algunos eventos de integración de fagos son ejemplos de recombinación no homóloga. Aunque en muchos casos se requieren secuencias idénticas o similares en los dos sitios de recombinación, las secuencias son cortas, lo que las distingue de los tramos más largos (cientos de pares de bases) utilizados en la recombinación homóloga. (J Rubnitz y S Subramani. 1984, Mol Cell Biol. 4: 2253-2258).
Si el vector se alinea en una región no homóloga del ácido nucleico diana, la recombinación es aleatoria.
Dentro del significado de la presente invención, en relación con la recombinación homóloga, dos secuencias de ADN son "sustancialmente homólogas" si son capaces de mediar en una recombinación homóloga. Este puede ser el caso, por ejemplo, cuando al menos aproximadamente el 80%, preferiblemente al menos aproximadamente el 90% o el 95%, más preferiblemente al menos aproximadamente el 97% o el 98% de los nucleótidos coinciden a lo largo de una longitud definida de las secuencias de ADN, según se determina por los algoritmos de comparación de la secuencia conocidos por una persona experta en la técnica y descritos en otra parte de esta solicitud. También es posible que dos secuencias de ADN muestren una coincidencia del 100% de los nucleótidos a lo largo de una longitud definida. En este caso, las dos secuencias de ADN son homólogas entre sí. Dentro del significado de la presente invención, una secuencia de ADN en el vector, p. ej., el vector de expresión, es sustancialmente homóloga, u homóloga, a un sitio de integración diana deseado en la célula huésped.
Dentro del significado de la presente invención, pueden ocurrir ambos eventos de integración/recombinación, es decir, la recombinación homóloga y la recombinación aleatoria. Por ejemplo, si se desea reemplazar un determinado gen (o secuencia codificante) por el gen de interés, entonces se llevará a cabo una recombinación homóloga. Dentro del significado de la presente invención, se puede desear reemplazar un gen que está bajo el control de un promotor que es reprimible por una proteína similar a SSN6, tal como una secuencia de ácido nucleico que codifica la proteína LLP ("Opción 1" en la Fig. 3 C). Dentro del significado de la presente invención, sin embargo también posible que se puede desear no reemplazar un gen que está bajo el control de un promotor que es reprimible por la proteína similar a SSN6, tal como una proteína LLP que codifica una secuencia de ácido nucleico, pero para expresar dicho gen (tal como el gen que codifica LLP) y para expresar adicionalmente el gen de interés ("Opción 2" en la Fig. 3 D). En tal caso, se lleva a cabo una recombinación aleatoria (heteróloga).
Dentro del significado de la presente invención, la expresión "gen de interés" (GOI) se refiere a un gen que está destinado a expresarse en una célula huésped. En la presente invención, los genes de interés son genes seleccionados, por ejemplo,
del grupo que codifica enzimas, anticuerpos o fragmentos de los mismos, hormonas, proteínas estructurales (p. ej., albúmina) y antígenos proteicos presentes en vacunas.
Dentro del significado de la presente invención, la expresión "casete de expresión" se refiere a una parte del ADN del vector que se utiliza, por ejemplo, para la clonación y/o transformación. Un casete de expresión comprende uno o más genes y secuencias que controlan su expresión. Un casete de expresión puede insertarse en una secuencia de nucleótidos tal como un genoma, por ejemplo, mediante recombinación homóloga o mediante recombinación heteróloga.
Dentro del significado de la presente invención, la expresión "célula huésped" designa cualquier célula que, en condiciones adecuadas, es capaz de propagar o expresar un vector tal como un vector de expresión. Por ejemplo, en la presente invención, un vector de expresión puede comprender un promotor, en donde dicho promotor se caracteriza porque se reprime en presencia de una proteína similar a SSN6.
La célula huésped que comprende un vector puede ser cualquier célula huésped adecuada, tal como una célula bacteriana, preferiblemente una célula de E. coli. También es posible que el vector, tal como el vector de expresión, esté presente en una célula eucariota. En este caso, la célula huésped se denomina célula eucariota. Si, como se describe en otra parte de esta memoria, dicha célula eucariota se modifica con respecto al gen similar a ssn6 o la proteína similar a SSN6, la célula eucariota se designa como "célula eucariota modificada". En la presente invención, las células eucariotas modificadas son una célula de Pichia pastoris.
Si el vector de expresión está destinado a estar presente en una célula eucariota, que puede estar modificada o no, se prefiere que el vector de expresión comprenda características seleccionadas de una cualquiera de las siguientes: un marcador de selección; un marcador de purificación; una secuencia señal, preferiblemente la secuencia señal que secreta el factor alfa de levadura, el péptido señal KILM1 de levadura, el péptido señal PH01 de levadura o el péptido señal SUC2 de levadura, más preferiblemente una secuencia señal que secreta el factor alfa, incluso más preferiblemente la pre-pro secuencia señal MFalfa; un origen de replicación; y/o una secuencia de nucleótidos para la integración fijada como objetivo (opción 1, de la Fig. 3 C) y/o aleatoria (opción 2, Fig. 3 D) en el genoma de una célula huésped.
Dentro del significado de la presente invención, las células eucariotas que se utilizan se modifican en comparación con su célula de tipo salvaje. Esto significa que la célula eucariota modificada comprende (al menos) un gen similar a ssn6 modificado; y/o un nivel de expresión modificado, preferiblemente reducido, de proteína similar a SSN6, o que un gen similar a ssn6 se elimine, dando como resultado la ausencia completa de dicha proteína similar a SSN6. En la presente invención, la célula eucariota modificada es una célula de Pichia pastoris. El efecto de las modificaciones respectivas es que la célula de Pichia pastoris modificada no es capaz de proporcionar una proteína similar a SSN6 que ejerza su función de tipo salvaje y/o actividad de tipo salvaje, preferiblemente con respecto a la regulación del promotor LLP; y/o la cantidad de proteína similar a SSN6 que está presente en la célula de Pichia pastoris modificada difiere de células (preferiblemente en que se reduce) de la cantidad de proteína similar a SSN6 que está presente en su forma de tipo salvaje; y/o esencialmente no hay presente proteína similar a SSN6 alguna en la célula modificada. Esto, a su vez, tiene el efecto de que dicha célula de Pichia pastoris modificada, en comparación con su célula de tipo salvaje, exhibe una actividad y/o función de proteína similar a SSN6 diferente (preferiblemente reducida), preferiblemente con respecto a su actividad y/o función en la regulación del promotor de LLP.
Como se describe en otra parte de esta memoria, si la célula de Pichia pastoris modificada no es capaz de proporcionar una proteína similar a SSN6 adecuada y suficientemente funcional (p. ej., en términos de función, actividad y/o cantidad), como resultado, las secuencias reguladoras que son controladas por dicha proteína, tales como promotores, tal como el promotor de LLP, ya no se ve afectada en su función (p. ej., no se reprime). Esto, a su vez, da como resultado una sobre expresión de la proteína que está bajo el control de dicha secuencia de polinucleótidos reguladora.
En otras palabras, una proteína similar a SSN6 adecuada y suficientemente funcional reprime el promotor de LLP, lo que significa que el promotor de LLP exhibe una función reducida, en comparación con la función del promotor de LLP que no es reprimida por dichas proteínas. En cuanto al término "reducido", se hace referencia a la descripción en otra parte de esta memoria.
Dentro del significado de la presente invención, el término "sobre-expresión" define que la expresión de una proteína (codificada, por ejemplo, por el gen de interés) en una célula, tal como una célula de Pichia pastoris (modificada), se encuentra en niveles superiores a los normales en una célula de tipo salvaje. Por ejemplo, en la presente invención, la célula de Pichia pastoris modificada puede utilizarse para sobre-expresar un gen de interés.
Dentro del significado de la presente invención, el término "modificación" designa cualquier enmienda adecuada que sea conocida por una persona experta en la técnica que pueda aplicarse a una secuencia de nucleótidos o gen, respectivamente, que dé como resultado uno o más de los siguientes efectos (si la secuencia de nucleótidos modificada se expresa en un sistema de expresión adecuado): la proteína similar a SSN6 no ejerce su función de tipo salvaje y/o actividad de tipo salvaje; la cantidad de proteína similar a SSN6 que está presente es menor en comparación con las células no modificadas; y/o no está presente proteína similar a SSN6 alguna. En una realización de la presente invención, la secuencia de nucleótidos del gen similar a ssn66 se modifica mediante la introducción de una mutación puntual, p. ej.,
sustitución, inserción o deleción de uno o más nucleótidos; por supresión parcial o total; y/o por sustitución por una secuencia de nucleótidos diferente, p. ej., heteróloga.
También es posible que el nivel de expresión de la proteína similar a SSN6 afectada se modifique, por ejemplo, mediante la introducción de una mutación puntual, p. ej., sustitución, inserción o deleción de uno o más nucleótidos en secuencias de polinucleótidos reguladores del nucleótido similar a ssn6 afectado. secuencia o gen similar a ssn6, respectivamente; por deleción parcial o completa de secuencias de polinucleótidos reguladores de la secuencia de nucleótidos similar a ssn6 o gen similar a ssn6 afectados, respectivamente; y/o mediante el reemplazo de las secuencias de polinucleótidos reguladores de la secuencia de nucleótidos similar a ssn6 afectada o del gen similar a ssn6, respectivamente, por secuencias de nucleótidos diferentes, p. ej., heterólogas. Las secuencias de polinucleótidos reguladores se seleccionan del grupo definido en otra parte de esta memoria.
Con el fin de evaluar si se ha llevado a cabo una modificación en el significado de la presente invención en una secuencia de nucleótidos, se pueden llevar a cabo alineamientos de secuencia adecuados: Por ejemplo, la secuencia de la secuencia de polinucleótidos potencialmente modificada se puede alinear con la respectiva contraparte de tipo salvaje. El alineamiento resultante indica si se ha llevado a cabo una modificación y, de ser así, qué tipo de modificación.
Dentro del significado de la presente invención, la expresión «secuencia codificante» designa una secuencia de nucleótidos (p. ej., secuencia de nucleótidos heteróloga u homóloga o polinucleótido heterólogo u homólogo, respectivamente), tal como una secuencia de nucleótidos que está comprendida en un gen de interés, que codifica un producto de expresión, como un ARN o polipéptido, que, cuando se expresa, da como resultado la producción del producto (p. ej., polipéptido (p. ej., un polipéptido heterólogo), tal como enzimas, anticuerpos o fragmentos de los mismos, hormonas o antígenos proteicos presentes en las vacunas).
Aquí, la expresión "un promotor que está reprimido" define que el promotor no es capaz de ejercer su función natural completa y su actividad natural completa. Un ejemplo de un promotor de este tipo que se reprime en presencia de proteína similar a SSN6 es el promotor de LLP: Aún no se sabe qué mecanismo subyace a dicha represión, sin embargo se especula que la represión podría estar basada en la alteración de la estructura cromatina local, o en la interacción con la maquinaria de transcripción general (Smith et al., TIBS 25, julio de 2000, 325-330).
Dentro del significado de la presente invención, como resultado de la represión del promotor, se influye en la expresión de un gen que está bajo el control de dicho promotor de manera que no se expresa la proteína codificada respectiva; y que la cantidad de dicha proteína expresada difiere de la cantidad natural de dicha proteína.
Dentro del significado de la presente invención, una secuencia codificante (p. ej., de un polinucleótido heterólogo) está "bajo el control de" (o similar) una secuencia de control transcripcional o traduccional (secuencia de polinucleótidos reguladora) cuando la secuencia de polinucleótidos reguladora dirige ARN, preferiblemente ARNm, que luego puede cortarse y empalmarse (si contiene intrones) y, opcionalmente, traducirse en una proteína codificada por la secuencia codificante. En una realización de la presente invención, un gen (tal como un gen de interés) está bajo el control del promotor de LLP. Esto significa que mientras el promotor funcione como en una situación de tipo salvaje (por ejemplo, es reprimido por una proteína similar a SSN6), un gen que está bajo el control de dicho promotor no se expresa o se expresa en niveles bajos cuando las células se cultivan en condiciones estándares. Tan pronto como el promotor de LLP es desreprimido debido a la presencia de una proteína similar a SSN6 modificada o diferentes condiciones de cultivo, un gen que está bajo el control de este promotor se expresa en niveles altos a muy altos (en comparación con una situación en la que el promotor no está reprimido). En base a la relación subyacente a la presente invención, es probable que una proteína similar a SSN6 pueda bloquearse no solo por una mutación del gen similar a ssn6, sino también por inhibidores del gen o proteína similar a ssn6, lo que también podría resultar en una actividad incrementada del promotor de LLP.
El término "funcional" define que la materia respectiva exhibe su función natural.
El término "seleccionar" se refiere a la identificación y el aislamiento de una célula receptora que contiene el vector de interés. Microorganismos transformados, es decir, los que contienen moléculas recombinantes tales como un vector o plásmido, pueden seleccionarse con una diversidad de métodos o marcadores de selección positiva y/o negativa. Detalles de acuerdo con métodos de selección de este tipo y marcadores se describen en otra parte de esta solicitud. Marcadores de selección negativos incluyen, pero no se limitan a genes tales como thyA, sacB, gnd, gapC, zwJ, talA, taiB, ppc, gdhA, pgi, Jbp, pykA, cit, acs, edd, icdA, groEL, secA y similares.
En general, la expresión "sistema de expresión" designa un sistema que está diseñado específicamente para la producción de un producto génico de elección, al que también se alude en esta memoria como proteína de interés (POI). El sistema de expresión comprende un gen similar a ssn6 modificado, o un gen similar a ssn6 y una secuencia polinucleotídica reguladora modificada que está implicada en la regulación de la expresión de dichos genes, por lo que dicho sistema de expresión no es capaz de expresar una proteína similar a SSN6, esa proteína similar a SSN6 se expresa que no ejerce su función de tipo salvaje y/o actividad de tipo salvaje, y/o que se expresa una cantidad de proteína similar a SSN6 que difiere, preferiblemente es menor, en comparación con la cantidad de proteína similar a SSN6 que se expresa mediante
dicho sistema de expresión cuando la secuencia de polinucleótidos de tipo salvaje correspondiente se expresa mediante un sistema de expresión de este tipo en las mismas condiciones.
El sistema de expresión es un sistema de expresión eucariota, es decir, un sistema de expresión que comprende una célula eucariota. En particular, dicha célula eucariota se modifica como se describe en otra parte de esta memoria.
Descripción detallada de la invención
La presente invención se describe ahora con más detalle mediante realizaciones y ejemplos preferidos, que sin embargo se presentan solo con fines ilustrativos y no deben entenderse como limitantes del alcance de la presente invención de modo alguno.
Aunque los sistemas de expresión para expresar proteínas son ampliamente conocidos en la técnica anterior, estos sistemas de expresión exhiben a menudo desventajas, por ejemplo con respecto al rendimiento del producto de expresión, o con respecto al propio sistema de expresión.
La presente invención se basa en el hallazgo general sorprendente de que un sistema de expresión eucariota constitutivo mejorado puede ser generado modificando un gen similar a ssn6 («gen similar a ssn6») que está presente en una célula de Pichia pastoris, y/o modificando el nivel de expresión de proteína similar a SSN6; o eliminando el gen similar a ssn6, respectivamente, en el sentido de que la célula de Pichia pastoris modificada resultante no es capaz de proporcionar una proteína similar a SSN6 que ejerza su función de tipo salvaje y/o actividad de tipo salvaje, en particular con respecto a secuencias reguladoras tales como un promotor que está regulado por dichas proteínas (tal como el promotor de LLP); la cantidad de proteína similar a SSN6 que está presente en la célula de Pichia pastoris modificada difiere (preferiblemente es menor) de la cantidad de proteína similar a SSN6 que está presente en su forma de tipo salvaje, en el sentido de que dichas proteínas no son capaces de ejercer su función y/o actividad de tipo salvaje, en particular con respecto a secuencias reguladoras tales como un promotor que está regulado por dichas proteínas; y/o ninguna proteína similar a SSN6 ("proteína similar a SSN6") está presente en la célula modificada, de nuevo en el sentido de que dichas proteínas no son capaces de ejercer su función y/o actividad de tipo salvaje, en particular con respecto a secuencias reguladoras tales como un promotor que es regulado por dichas proteínas. Por lo tanto, al evitar que la proteína similar a SSN6 ejerza su función natural (tipo salvaje), cuya función comprende las interacciones represivas directas y/o indirectas con secuencias reguladoras tales como los promotores (p. ej., el promotor de LLP), la expresión de un gen que está bajo el control de dichas secuencias reguladoras (p. ej., promotor de LLP) en un sistema de expresión adecuado no es, al menos en cierto grado, reprimido más. En otras palabras, el gen respectivo que está bajo el control de dicho promotor está sobre expresado en comparación con su expresión de tipo salvaje.
En esta memoria también se describe un sistema de expresión eucariota, el cual, sin embargo, no forma parte de la presente invención, que se mejora, por ejemplo, con respecto al rendimiento del producto de expresión en comparación con el rendimiento que se obtiene al aplicar los sistemas de expresión de la técnica anterior. Además, el sistema de expresión está mejorado con respecto a los aspectos de seguridad: contrariamente a determinados sistemas de expresión eucariotas de la técnica anterior, el presente sistema de expresión eucariota no se basa en los promotores AOX (alcohol oxidasa) comúnmente utilizados, que están estrechamente regulados por metanol. La presencia de metanol inflamable y tóxico representa un riesgo de seguridad importante y también impone un riesgo en los productos de expresión sensibles al alcohol o en las células huésped. Especialmente en la fermentación a gran escala de proteínas recombinantes, el uso de metanol es un grave riesgo para la seguridad y el medio ambiente. Sistemas de expresión eucariotas alternativos que utilizan promotores que no están regulados por metanol se basan, por ejemplo, en el promotor constitutivo de GAP (gliceraldehído-3-fosfato deshidrogenasa). Sin embargo, el rendimiento resultante, por ejemplo, cuando se aplica un sistema de expresión basado en GAP, deja mucho que desear.
Dentro del significado de la presente invención, se ha encontrado, sorprendentemente, que la modificación de un gen similar a ssn6 y/o la modificación del nivel de expresión de una proteína similar a SSN6 que está presente en una célula de Pichia pastoris con el efecto de que la célula de Pichia pastoris modificada resultante no es capaz de ejercer la función de tipo salvaje de la proteína similar a SSN6 con respecto a una secuencia reguladora que es regulada por dicha proteína similar a SSN6, tal como un promotor (p. ej., el promotor de LLP), da como resultado una expresión potenciada del gen que está bajo el control de dicha secuencia reguladora.
Por lo tanto, la presente invención proporciona una célula de Pichia pastoris modificada, que está modificada en comparación con su célula de tipo salvaje, al menos porque comprende
• un gen similar a ssn6 modificado y/o
• un nivel de expresión modificado de proteína similar a SSN6, o
porque
• se elimina un gen similar a ssn6,
respectivamente, en el sentido de que
• la célula de Pichia pastoris modificada no es capaz de proporcionar una proteína similar a SSN6 que ejerza su función de tipo salvaje y/o actividad de tipo salvaje,
• la cantidad de proteína similar a SSN6 que todavía está presente en la célula de Pichia pastoris modificada difiere de la cantidad de proteína similar a SSN6 que está presente en su forma salvaje, y/o
• esencialmente ninguna proteína similar a SSN6 está presente en la célula de Pichia pastoris modificada,
en donde se aplican las siguientes definiciones:
• dicho gen similar a ssn6 se define como que comprende la SEQ ID NO: 1,
• la secuencia de nucleótidos del gen similar a ssn6 se modifica mediante la introducción de una mutación puntual, una deleción parcial o completa o un reemplazo por una secuencia de nucleótidos diferente, y
• la célula de Pichia pastoris modificada, en comparación con su tipo salvaje sin modificar, se define como que exhibe una actividad proteica similar a SSN6 reducida o nula y/o función en la regulación de un promotor de l Lp , comprendiendo este promotor de LLP la SEQ ID NO: 133.
De acuerdo con la relación subyacente a la presente invención, la célula de Pichia pastoris modificada resultante, cuando se compara con su célula de tipo salvaje, exhibe una actividad y/o función de proteína similar a SSN6 diferente, preferiblemente con respecto a su actividad y/o función en la regulación de la expresión de un gen.
Siempre que se utilice la expresión "función de tipo salvaje" en relación con la proteína similar a SSN6, o los genes respectivos que codifican dicha proteína, se refiere a la función con respecto a una secuencia reguladora que es regulado por la proteína similar a SSN6, tal como un promotor (preferiblemente el promotor de LLP).
Como es sabido por un experto en la materia, la expresión de un gen está regulada, entre otros, por una interacción compleja de diversos factores que contribuyen a la regulación de la expresión de (a) determinado(s) gen(es), tales como promotores, potenciadores, terminadores, silenciadores, factores de transcripción, secuencias IRES, sitios de unión a ribosomas y secuencias que estabilizan o desestabilizan el ARNm mediante estructuras secundarias o potenciadores.
Por lo tanto, en una realización preferida, la célula de Pichia pastoris modificada resultante exhibe una actividad y/o función de proteína similar a SSN6 diferente con respecto a cualquier promotor que esté regulado por dichas proteínas, preferiblemente el promotor de LLP. Por lo tanto, es una realización preferida de la presente invención que la célula de Pichia pastoris modificada, cuando se compara con su célula de tipo salvaje, exhibe una actividad y/o función de proteína similar a SSN6 diferente con respecto a la regulación de la expresión de genes que están bajo el control del promotor de LLP. La actividad y/o función de dicha proteína (similar a SSN6) da como resultado que los genes que están bajo el control de dicho promotor (promotor de LLP) estén sobre-expresados.
La actividad y/o función diferente de la proteína similar a SSN6 puede ser cualquier actividad y/o función diferente que dé como resultado una sobre-expresión del gen respectivo que está bajo el control de la secuencia reguladora afectada. Por ejemplo, una proteína similar a SSN6 podría verse alterada en su actividad y/o función mediante modificaciones de "ganancia de función" o "pérdida de función". Si varias copias de diferentes versiones modificadas o proteína similar a SSN6 de tipo salvaje están presentes dentro de una célula al mismo tiempo, determinadas proteínas similares a SSN6 podrían ser dominantes con respecto a su actividad y/o función. Los mutantes de "pérdida de función" comprenden una mutación que da como resultado una función proteica reducida o anulada. Los mutantes de "ganancia de función" comprenden una mutación que da como resultado una actividad anormal en una proteína. Preferiblemente, es una actividad y/o función reducida de la proteína similar a SSN6. También puede ser que no haya proteína similar a SSN6 alguna presente en la célula de Pichia pastoris modificada, o que no haya una proteína similar a SSN6 dentro del límite de detección de métodos comúnmente conocidos, tales como, por ejemplo, RT-PCR, qPCR u otras técnicas relacionadas con PCR, transferencia Western, ELISA u otros ensayos de detección inmunológica, ensayos de genes informadores, métodos de detección espectrométrica de masas, ensayos de chips que detectan proteínas o ácidos nucleicos, etc.
Con el fin de llegar a una célula de Pichia pastoris modificada que exhiba una función y/o actividad proteica similar a SSN6 diferente, preferiblemente reducida, más preferiblemente esencialmente nula, se puede modificar el gen similar a ssn6. Esta modificación puede haber tenido lugar, por ejemplo, en una secuencia codificante que codifica la proteína respectiva y/o en una secuencia reguladora respectiva. Una secuencia reguladora que puede modificarse es, por ejemplo, un promotor, potenciador, terminador, silenciador, secuencia IRES, sitio de unión al ribosoma y secuencia que estabiliza o desestabiliza el ARNm mediante estructuras secundarias o potenciador.
De acuerdo con la presente invención, las modificaciones anteriores en las regiones reguladoras y/o codificantes de los genes que codifican la proteína similar a SSN6 tienen un efecto sobre el nivel de expresión de la proteína similar a SSN6, porque la célula de Pichia pastoris modificada no es capaz de expresar dichas proteínas, o porque la cantidad de dichas proteínas sea diferente, preferiblemente esté reducida, en comparación con su forma de tipo salvaje. Las modificaciones anteriores también pueden tener un efecto sobre la función y/o actividad de la proteína similar a SSN6 en el sentido de que dichas proteínas no ejercen su función y/o actividad de tipo salvaje.
También es posible llegar a una célula de Pichia pastoris modificada que exhiba una proteína similar a SSN6 alterada como se definió arriba al alterar la transcripción o traducción del gen que codifica la proteína similar a SSN6. La transcripción y la traducción pueden alterarse mediante cualquier método adecuado que sea conocido por una persona experta en la técnica, por ejemplo, la traducción puede alterarse hibridando una secuencia complementaria o una secuencia parcial de la misma con el transcrito de ARNm. La secuencia parcial de la secuencia complementaria se selecciona, por ejemplo, de ARNip, ARN antisentido, ribozima y ARN o ADN triplex, etc.
Independientemente de si las regiones reguladoras y/o codificantes del gen similar a ssn6 están modificadas, o si la transcripción y/o traducción del gen que codifica la proteína similar a SSN6 está alterada, como resultado, la célula de Pichia pastoris modificada no es capaz de proporcionar una proteína similar a SSN6 que ejerza su función de tipo salvaje y/o actividad de tipo salvaje, la cantidad de proteína similar a SSN6 que está presente en la célula de Pichia pastoris modificada difiere de la cantidad de proteína similar a SSN6 que está presente en su forma de tipo salvaje, y/o no hay presente proteína similar a SSN6 en la célula modificada, como se describe en otra parte de esta memoria.
El gen similar a ssn6 y/o el nivel de expresión de la proteína similar a SSN6 pueden modificarse mediante cualquier método adecuado conocido por una persona experta en la técnica. Por ejemplo, el gen similar a ssn6 y/o el nivel de expresión de la proteína similar a SSN6 se modifica por
• introducción de una o más mutaciones puntuales, p. ej., sustitución, inserción o deleción de uno o más nucleótidos en la secuencia de polinucleótidos del gen similar a ssn6,
• deleción parcial o completa de la secuencia de polinucleótidos del gen similar a ssn6, y/o
• reemplazo parcial o completo de la secuencia de polinucleótidos del gen similar a ssn6 por una secuencia de nucleótidos diferente, p. ej., heteróloga,
En una realización preferida, la actividad, función, preferiblemente función reguladora de genes y/o cantidad total de proteína similar a SSN6 de la célula de Pichia pastoris modificada es a lo sumo del 20%, preferiblemente a lo sumo del 15%, más preferiblemente a lo sumo del 10%, incluso más preferiblemente a lo sumo del 5% de la actividad, función y/o cantidad de proteína similar a SSN6 de su forma de tipo salvaje, y lo más preferiblemente no hay actividad y/o función de la proteína similar a SSN6 de la célula de Pichia pastoris modificada en absoluto.
En el sentido de la presente invención, la expresión "actividad, función y/o cantidad total de proteína similar a SSN6 de la célula de Pichia pastoris modificada" define la actividad, función y/o cantidad total de proteína similar a SSN6 de una muestra de células eucariotas modificadas. Por ejemplo, con el fin de evaluar si la actividad, función y/o cantidad de proteína similar a SSN6 de las células de Pichia pastoris modificadas difiere de la característica correspondiente de las células de tipo salvaje, la cantidad total de proteína similar a SSN6 está presente en una muestra de un determinado número de células de tipo salvaje se compara con la cantidad total de proteína similar a SSN6 que está presente en una muestra de esencialmente el mismo número de células de Pichia pastoris modificadas.
Dentro del significado de la presente invención, la célula de Pichia pastoris modificada puede ser cualquier célula adecuada, es decir, cualquier célula de Pichia pastoris adecuada que comprenda, en su forma de tipo salvaje, una secuencia de polinucleótidos que codifica una proteína similar a SSN6. En una realización preferida, dicha célula adecuada comprende adicionalmente una secuencia de nucleótidos que representa el promotor de LLP. Con el fin de determinar si una célula de Pichia pastoris comprende las secuencias arriba definidas, se puede utilizar cualquier método adecuado que sea conocido por un experto en la técnica, por ejemplo, técnicas tales como transferencia Northern, PCR en tiempo real, PCR cuantitativa con transcriptasa inversa (RT-qPCR) o experimentos de hibridación de micromatrices. Pueden utilizarse experimentos de hibridación de micromatrices para cuantificar la expresión de cientos a miles de genes al mismo tiempo. Pueden encontrarse protocolos adecuados, por ejemplo, en Sambrook et al.
En una realización preferida adicional, la célula de Pichia pastoris modificada es una célula de una cepa seleccionada del grupo que consiste en NRRL Y-11430, CBS704, GS115 y KM71.
Tal como se describe en esta memoria, la célula de Pichia pastoris modificada de acuerdo con la presente invención puede comprender un gen similar a ssn6 modificado. Por lo tanto, en una realización adicional, la célula de Pichia pastoris modificada comprende una secuencia de polinucleótidos que representa una modificación de SEQ ID NO: 1.
Como se explica en otra parte de esta memoria, se ha encontrado que una modificación del gen similar a ssn6 de acuerdo con la presente invención, es decir, una modificación que dé como resultado una expresión modificada de la proteína similar a SSN6, da como resultado una sobre-expresión de genes que están bajo el control de un promotor que está regulado por una proteína similar a SSN6, tal como el promotor de LLP. Por lo tanto, la presente invención también se refiere a una secuencia de polinucleótidos que comprende
• un gen similar a ssn6 modificado que comprende una secuencia codificante y una secuencia reguladora, en donde, si dicha secuencia polinucleotídica se expresa en un sistema de expresión adecuado,
• esencialmente no se expresa proteína similar a SSN6 alguna, o
• se expresa proteína similar a SSN6 que no ejerce su función de tipo salvaje y/o actividad de tipo salvaje, preferiblemente con respecto a su actividad y/o función en la regulación de la expresión génica, más preferiblemente en la regulación de la expresión de genes que están bajo el control del promotor de LLP, y/o
• se expresa una cantidad de proteína similar a SSN6 que difiere de la cantidad de proteína similar a SSN6 que se expresa cuando la correspondiente secuencia de polinucleótidos de tipo salvaje se expresa en condiciones comparables o iguales.
En una realización preferida, la cantidad de proteína similar a SSN6 que se expresa difiere de la cantidad de proteína similar a SSN6 que se expresa cuando la correspondiente secuencia de polinucleótidos de tipo salvaje se expresa en condiciones comparables o iguales en que se reduce.
En una realización adicional, el polinucleótido anterior consiste en dicho gen similar a ssn6 modificado.
En una realización preferida, la cantidad de proteína similar a SSN6 se reduce, o no hay ninguna proteína similar a SSN6 presente en absoluto, en comparación con la cantidad de proteína similar a SSN6 que se expresa cuando la secuencia de polinucleótidos de tipo salvaje correspondiente se expresa en condiciones comparables o en las mismas condiciones.
Las modificaciones se pueden llevar a cabo en la secuencia reguladora (región reguladora) y/o en la secuencia codificante (región codificante) del gen similar a ssn6. La secuencia reguladora puede ser cualquier secuencia reguladora, preferiblemente la secuencia reguladora se selecciona del grupo que comprende o consiste en promotores, potenciadores, terminadores, silenciadores, secuencias IRES, sitios de unión a ribosomas y secuencias que estabilizan o desestabilizan el ARNm por estructuras secundarias, más preferiblemente dicha secuencia reguladora se selecciona del grupo que consiste en promotores, potenciadores y terminadores.
El gen similar a ssn6 ha sido modificado como se describe en otra parte de esta memoria. En una realización preferida, el polinucleótido comprende, preferiblemente consiste en, modificaciones de SEQ ID NO: 1. Un ejemplo de un gen similar a ssn6 modificado se representa en la Fig. 1 G (SEQ ID NO: 7). Por lo tanto, en una realización preferida adicional, el polinucleótido de acuerdo con la presente invención comprende, preferiblemente consiste en SEQ ID NO: 7.
Como es conocido por una persona experta en la materia, es posible propagar y/o expresar una determinada secuencia de nucleótidos insertando esta secuencia en un vector, que luego, a su vez, se introduce en una célula huésped tal como una bacteria, siendo esta bacteria preferiblemente Escherichia coli (E. coli) o una célula eucariota, por ejemplo tal como se describe en otra parte de esta memoria. Por lo tanto, se describe en esta memoria, pero no forma parte de la presente invención, también un vector que comprende la secuencia de polinucleótidos que comprende el gen relacionado con ssn6/similar a ssn6 modificado, así como a una célula huésped que comprende dicho vector o partes de dicho vector.
Dependiendo del uso previsto respectivo, dicho vector contiene elementos estructurales específicos. Si, por ejemplo, se pretende propagar la secuencia de nucleótidos, entonces el vector correspondiente debe contener un ori.
En esta memoria se describe, pero no forma parte de la presente invención, un polipéptido codificado por la secuencia de polinucleótidos de acuerdo con la presente invención. Si la secuencia de polinucleótidos de acuerdo con la presente invención, que comprende un gen similar a ssn6 modificado tal como se describe arriba, se expresa en un sistema de expresión adecuado, la expresión de un producto génico, p. ej., de un polipéptido o proteína, depende de las modificaciones que se hayan llevado a cabo. Por ejemplo, si la modificación da como resultado un desplazamiento del marco de lectura completo, con toda probabilidad no se puede expresar producto génico alguno. Sin embargo, también puede ser que la modificación solo dé como resultado una secuencia de nucleótidos truncada ("acortada"), lo que a su vez da como resultado la expresión de un producto génico truncado que también puede contener una secuencia de aminoácidos heteróloga corta en su extremo C que es codificado por la secuencia de nucleótidos heteróloga insertada (véase la Fig.2 B, SEQ ID NO: 9, con 7 aminoácidos C-terminales heterólogos (EWYLQLR, subrayados en la Fig.2 B; SEQ ID NO: 139), en comparación con la secuencia no mutada en la Fig. 2 A, SEQ ID NO: 8).
En la presente invención se ha encontrado, sorprendentemente, que inhibiendo parcial o completamente la función y/o actividad de tipo salvaje de la proteína similar a SSN6, o haciendo que la proteína similar a SSN6 no está esencialmente
presente, respectivamente en una célula que en su forma de tipo salvaje comprende un gen que codifica dicha proteína, estando un gen bajo el control de un promotor que está reprimido en presencia de una proteína similar a SSN6 que puede sobre-expresarse en un sistema de expresión adecuado.
Por lo tanto, la presente invención se refiere, además, a un vector de expresión que comprende un promotor, en donde dicho promotor se caracteriza porque se reprime en presencia de una proteína similar a SSN6 si dicho vector de expresión se introduce en un sistema de expresión adecuado, p. ej., en una célula eucariota tal como se define en otra parte en esta memoria, en donde la proteína similar a SSN6 se define como que comprende la secuencia de aminoácidos representada en la SEQ ID NO: 8, y en donde dicho promotor es un promotor de LLP que comprende, preferiblemente consiste en SEQ ID NO: 133 o versiones modificadas de la misma, caracterizándose dichas versiones modificadas porque todavía exhiben la función del promotor, en donde LLP, que se define por la secuencia de nucleótidos representada en SEQ ID NO: 16, no es codificada por la secuencia de polinucleótidos de este vector de expresión.
Al utilizar este vector de expresión, un gen bajo el control de un promotor que está reprimido en presencia de una proteína similar a SSN6 puede sobre-expresarse en un sistema de expresión adecuado. Con el fin de determinar si un promotor es reprimible por una proteína similar a SSN6, se puede utilizar cualquier método adecuado que sea conocido por una persona experta en la técnica. Por ejemplo, se pueden diseñar vectores de expresión que comprendan el promotor que se ha de testar y un gen indicador (también denominado gen informador) tal como luciferasa que está bajo el control del promotor que se ha de testar. Si, en presencia de proteína similar a SSN6, la expresión del producto génico se reduce, a continuación el promotor candidato es reprimida en presencia de similar a s SN6. La determinación de la actividad promotora candidata reducida, por ejemplo, puede medirse cuantificando el producto génico indicador o su actividad, por ejemplo luciferasa, mediante métodos conocidos en la técnica. Existe un cierto número de ensayos conocidos en la técnica, que se pueden utilizar para determinar la actividad del promotor o medir la interacción de proteínas con las secuencias del promotor y que de ese modo son adecuados para testar si la actividad de un determinado promotor está influenciada por una proteína similar a SSN6. Ejemplos de ensayos de este tipo son ensayos de genes informadores, ensayos de desplazamiento de movilidad electroforética (EMSA, ensayos de desplazamiento de gel), ensayo de descenso de a Dn de doble cadena, ensayos de inmunoprecipitación de cromatina y ensayos de huella de DNasa, etc.
En una realización preferida de la presente invención, el vector de expresión comprende uno o más genes de interés que están bajo el control de dicho promotor, es decir, el promotor que es reprimido en presencia de proteína similar a SSN6. Aplicando protocolos adecuados que son conocidos por una persona experta, tal como un protocolo como se describe arriba, una persona experta en la técnica es capaz de evaluar si un promotor es reprimido en presencia de proteína similar a SSN6, o no. En una realización preferida de la presente invención, el promotor que está comprendido en el vector de expresión y que controla el gen o genes de interés es un promotor de LLP o una versión modificada del mismo. Preferiblemente, el promotor de LLP comprende, preferiblemente consiste en la secuencia de polinucleótidos representada en SEQ ID NO: 2 o 12. La expresión "versión modificada" del promotor de LLP define que dicho promotor de LLP modificado todavía exhibe la función de un promotor de LLP en términos de regular la expresión del gen que está bajo su control.
Además, es posible que el promotor sea un promotor de LLP y que LLP sea codificado o no sea codificado por la secuencia de polinucleótidos del vector de expresión. En cualquier caso, y también en caso de que el promotor no sea el promotor de LLP, sino un promotor diferente que se reprime en presencia de una proteína similar a SSN6, el gen de interés se selecciona preferiblemente del grupo que consiste en genes que codifican enzimas, anticuerpos o fragmentos de los mismos, hormonas, proteínas estructurales y antígenos proteicos que están presentes en las vacunas. En el vector de expresión de la presente invención, LLP no es codificada por la secuencia de polinucleótidos de este vector de expresión. Preferiblemente, el vector de expresión comprende, además, características seleccionadas de uno cualquiera de lo siguiente:
(i) un marcador de selección;
(ii) un marcador de purificación;
(iii) una secuencia señal, preferiblemente una secuencia señal secretora de factor alfa, más preferiblemente la secuencia señal MFalfa pre-pro, incluso más preferiblemente una secuencia señal que comprende o consiste, preferiblemente que consiste en la SEQ ID NO: 14 o la SEQ ID NO: 21;
(iv) un origen de replicación; y/o
(v) una secuencia de nucleótidos para la integración fijada como objetivo y/o aleatoria en el genoma de una célula huésped.
El vector de expresión puede estar comprendido en una célula huésped tal como se describe en esta memoria, preferiblemente en una bacteria tal como E. coli, por ejemplo, con fines de propagación.
El vector de expresión también se puede introducir en la célula de Pichia pastoris modificada de acuerdo con la presente invención, dando como resultado la introducción del casete de expresión del vector de expresión en el genoma de la célula de Pichia pastoris modificada. La introducción del vector de expresión en la célula huésped se puede llevar a cabo de acuerdo con cualquier método adecuado que sea conocido por una persona experta, por ejemplo, mediante electroporación. Además, también se puede considerar la expresión transitoria, es decir, el vector de expresión no está integrado en el genoma.
La presente invención también se refiere a una célula de Pichia pastoris modificada que comprende el vector de expresión tal como se define en esta memoria.
La introducción del casete de expresión del vector de expresión en la célula de Pichia pastoris modificada también se designa «recombinación» y puede ser una recombinación fijada como objetivo, es decir, homóloga, o una recombinación aleatoria. Si tiene lugar una recombinación aleatoria, el casete de expresión se integra de tal manera en el genoma de la célula eucariota modificada que la secuencia de nucleótidos que codifica la proteína LLP presente en la célula de Pichia pastoris modificada no se ve afectada. En otras palabras, la célula de Pichia pastoris modificada expresa no solo el gen de interés, sino también la proteína LLP. En este caso, la cantidad de proteína LLP que está presente en la célula modificada, el sobrenadante de la célula modificada o en subfracciones de la misma se puede utilizar como indicador de la pureza del producto de expresión del gen de interés, es decir, la proteína de interés, por ejemplo durante la purificación de la proteína de interés. A esta situación, en la que la proteína l Lp se expresa además del gen o los genes de interés, se la alude como "Opción 2" (Fig. 3 D). Por lo tanto, en esta memoria se describe, pero no forma parte de la presente invención, una célula de Pichia pastoris, que comprende
• un gen similar a ssn6 modificado, en donde dicho gen ha insertado una secuencia de nucleótidos extraña, con el fin de que
(i) la célula de Pichia pastoris no sea capaz de proporcionar una proteína similar a SSN6 que ejerza su función de tipo salvaje y/o actividad de tipo salvaje, preferiblemente con respecto a su actividad y/o función en la regulación del promotor de LLP,
(ii) la cantidad de proteína similar a SSN6 que está presente en la célula de Pichia pastoris difiere de la cantidad de proteína similar a SSN6 que está presente en su forma de tipo salvaje, preferiblemente la cantidad de la proteína similar a SSN6 está reducida, y/o
(iii) ninguna proteína similar a SSN6 está presente en la célula de Pichia pastoris,
• un gen de interés bajo el control del promotor de LLP, y
• un gen llp,
preferiblemente en donde dicha célula de Pichia pastoris exhibe una actividad y/o función de proteína similar a SSN6 reducida, o ninguna actividad y/o función de proteína similar a SSN6 en absoluto.
Si tiene lugar una recombinación fijada como objetivo, es decir, homóloga, y si, además, el promotor del casete de expresión es un promotor de LLP o una modificación del mismo, entonces el casete de expresión se inserta de tal manera que reemplaza (parcial o completamente) la secuencia de nucleótidos del gen que codifica la proteína LLP. En este caso, no hay expresión de LLP. Esta situación, en la que solo se expresan el o los genes de interés, pero no la proteína LLP, se denomina "Opción 1".
Por lo tanto, en esta memoria se describe, pero no forma parte de la presente invención, una célula de Pichia pastoris, que comprende
• un gen similar a ssn6 modificado, en donde dicho gen ha insertado una secuencia de nucleótidos extraña, con el fin de que
(i) la célula de Pichia pastoris no sea capaz de proporcionar una proteína similar a SSN6 que ejerza su función de tipo salvaje y/o actividad de tipo salvaje, preferiblemente con respecto a su actividad y/o función en la regulación del promotor de LLP,
(ii) la cantidad de proteína similar a SSN6 que está presente en la célula de Pichia pastoris difiere de la cantidad de proteína similar a SSN6 que está presente en su forma de tipo salvaje, preferiblemente la cantidad de la proteína similar a SSN6 está reducida, y/o
(iii) ninguna proteína similar a SSN6 está presente en la célula de Pichia pastoris,
y
• un gen de interés que reemplaza una parte o la totalidad de la región codificante del gen que codifica la proteína LLP, en el sentido de que esencialmente no hay proteína LLP presente en la célula de Pichia pastoris y que está bajo el control del promotor de LLP,
preferiblemente en donde dicha célula de Pichia pastoris exhibe una actividad y/o función de proteína similar a SSN6 reducida, o ninguna actividad y/o función de proteína similar a SSN6 en absoluto.
También se describe en esta memoria, pero no forma parte de la presente invención, un sistema de expresión, que comprende
a) la célula de Pichia pastoris modificada tal como se define en esta memoria;
b) el vector de expresión como se define en esta memoria, en donde dicho vector de expresión puede
también estar presente en forma linearizada y/o al menos partes del vector se integrarán en el genoma de la célula de Pichia pastoris modificada.
En una realización preferida adicional de la presente invención, la célula de Pichia pastoris modificada comprende adicionalmente un promotor, en donde dicho promotor se reprime en presencia de proteína similar a SSN6 si dicho vector de expresión se introduce en un sistema de expresión adecuado, en donde la proteína similar a SSN6 se define como que comprende la secuencia de aminoácidos representada en SEQ ID NO: 8, y
en donde dicho promotor es un promotor de LLP que comprende, preferiblemente consiste en SEQ ID NO: 133 o versiones modificadas de la misma, caracterizándose dichas versiones modificadas porque todavía exhiben la función del promotor, en donde LLP, que se define por la secuencia de nucleótidos representada en SEQ ID NO: 16, no es codificada por la secuencia de polinucleótidos de este vector de expresión. En una realización adicional, la célula de Pichia pastoris modificada comprende adicionalmente (a) gen(es) de interés que está(n) bajo el control de dicho promotor, preferiblemente seleccionados del grupo que consiste en genes que codifican enzimas, anticuerpos o fragmentos de los mismos, hormonas, proteínas estructurales y antígenos proteicos que están presentes en las vacunas.
Como ya se explicó anteriormente, es posible que en dicho sistema de expresión el gen LLP no se exprese además del gen o los genes de interés (opción 1), y también es posible que el gen LLP se exprese además del gen o los genes de interés (opción 2). En el primer caso (opción 1), el promotor de LLP solo controla la expresión de (a) gen(es) de interés, y en el último caso (opción 2), el promotor de LLP controla la expresión de (a) gen(es) de interés (que son diferentes de los genes que codifican LLP) y LLP.
La presente invención se refiere, además, al uso de (A) la célula de Pichia pastoris modificada, (B) la secuencia de polinucleótidos y/o (C) el vector de expresión, respectivamente de acuerdo con la presente invención, en un método de expresión de gen(es) de interés.
Tal como se describe arriba, la cantidad de proteína LLP que está presente en una composición que comprende la proteína de interés es un indicador de la pureza de dicha composición con respecto a dicha proteína de interés. Por lo tanto, también se describe en esta memoria, pero no forma parte de la presente invención, un método para determinar la pureza de una composición que comprende el producto de expresión de un gen de interés, que comprende las siguientes etapas:
(a) expresar gen(es) de interés utilizando la célula de Pichia pastoris modificada y el vector de expresión, respectivamente de acuerdo con la presente invención, en donde
(a1) la célula de Pichia pastoris modificada comprende un gen que codifica la proteína LLP bajo el control de un promotor de LLP, y en el que
(a2) el vector de expresión comprende uno o más genes de interés bajo el control de un promotor de LLP o un promotor de LLP modificado, en donde dicho gen de interés no codifica LLP,
obteniendo con ello una composición que comprende el producto de expresión del gen o genes de interés, es decir, la proteína o proteínas de interés y la proteína LLP;
(b) determinar la cantidad del producto de expresión del gen o genes de interés, es decir, la cantidad de proteína o proteínas de interés, y la cantidad de proteína LLP que está presente en la composición obtenida en la etapa (a), en donde la cantidad de proteína LLP en comparación con la cantidad de producto de expresión del gen o genes de interés, es decir, de la proteína o proteínas de interés, es indicativa de la pureza de la composición obtenida en la etapa (a); y, opcionalmente,
(c) someter la composición de la etapa (a) a una o más etapas de purificación aguas abajo, seguido de la etapa (b), es decir, determinar la cantidad del gen o los genes de interés, es decir, la o las proteínas de interés, y la cantidad de proteína LLP que está presente en la composición obtenida después de haber llevado a cabo dicha etapa de purificación aguas abajo.
Con el fin de obtener una composición que comprenda LLP, además del gen o los genes de interés, la integración del casete de expresión del vector de expresión representa una integración aleatoria en el genoma de la célula de Pichia pastoris modificada.
La composición que comprende la o las proteínas de interés y la proteína LLP puede ser cualquier composición que surja en el curso del procedimiento de producir la o las proteínas de interés. Por consiguiente, una composición de este tipo puede ser, por ejemplo, un sobrenadante del cultivo celular utilizado para expresar la o las proteínas de interés.
Además se describe en esta memoria, pero no forma parte de la presente invención, un método para expresar uno o más genes de interés en una célula de Pichia pastoris, que comprende un gen similar a ssn6, en el que la traducción del transcrito de ARNm del gen similar a ssn6 se evita que hibride una secuencia complementaria o una secuencia parcial de la misma con el transcrito de ARNm. En una realización preferida, la secuencia parcial de la secuencia complementaria es un ARNip, ARN antisentido, una ribozima o ARN o ADN triplex.
Además se describe en esta memoria, pero no forma parte de la presente invención, un método para expresar uno o más genes de interés en una célula de Pichia pastoris, que comprende un casete de expresión similar a s SN6, en el que la proteína similar a SSN6 en dicha célula de Pichia pastoris se modifica o inhibe en su función y/o actividad. Preferiblemente, la proteína similar a SSN6 de dicha célula de Pichia pastoris se modifica o inhibe en su función y/o actividad en la regulación del promotor de LLP, más preferiblemente la proteína similar a SSN6 exhibe actividad y/o función de proteína similar a SSN6 reducida, o ninguna actividad y/o función de la proteína similar a SSN6.
Descripción de las figuras
Fig. 1: Secuencias de Polinucleótidos
La Figura 1 muestra diversas secuencias de polinucleótidos.
La Fig. 1 A muestra la secuencia de nucleótidos de la región codificante del gen similar a ssn6 de P. Pastoris (SEQ ID. NO: 1).
La Fig. 1 B muestra la secuencia de nucleótidos del promotor de LLP de P. pastoris, 605 pb 3' del codón de inicio ATG de LLP (SEQ ID NO: 2).
La Fig. 1 C muestra la secuencia de nucleótidos de la secuencia señal de la proteína LLP de P. Pastoris (SEQ ID NO: 3).
La Fig. 1 D muestra la secuencia de nucleótidos de la secuencia terminador del gen de P. Pastoris (SEQ ID NO: 4).
La Fig. 1 E muestra la secuencia de nucleótidos del promotor similar a SSN6 de P. pastoris, 1000 pb 3' del codón de inicio ATG similar a SSN6 (SEQ ID NO: 5).
La Fig. 1 F muestra la secuencia de nucleótidos de la secuencia terminador del gen similar a ssn6 de P. Pastoris (SEQ ID NO: 6).
La Fig. 1 G muestra la secuencia de nucleótidos del ADN modificado similar a SSN6 de P. Pastoris (desde el codón de inicio ATG al codón de parada TAA) como se presenta en P. Pastoris cepa SSS1. Esto da como resultado una región codificante similar a ssn6 con una inserción interna de una secuencia de nucleótidos heteróloga, que altera la secuencia codificante de la secuencia codificante similar a ssn6 (SEQ ID NO: 7). La Fig. 1 H muestra la secuencia de nucleótidos de la secuencia de inicio Kozak (SEQ ID NO: 11).
La Fig. 1 I muestra la secuencia de nucleótidos del promotor de LLP, 1000 pb 3' del codón de inicio ATG de LLP (SEQ ID NO: 12).
La Fig. 1 J muestra la secuencia de aminoácidos de la proteína similar a SSN6 (SEQ ID NO: 13)
La Fig. 1 K muestra la secuencia señal pre-pro de MFalfa: la Fig. 1 K (A) muestra dicha secuencia señal sin repetición EAEA (SEQ ID NO: 14) y la Fig. 1 K (B) muestra dicha secuencia señal con repetición EAEA (SEQ ID NO: 21).
La Fig. 1 L muestra la secuencia de ADN de codón optimizado que codifica un fragmento de anticuerpo de cadena sencilla DLX521 (SEQ ID NO: 15).
La Fig. 1 M muestra la región codificante de la secuencia de ADN del gen llp que incluye la secuencia señal (SEQ ID NO: 16).
La Fig. 1 N muestra la secuencia de nucleótidos optimizada por codones de la hormona del crecimiento humana (hGH) tal como se utiliza en los ejemplos de esta solicitud (SEQ ID NO: 17)
La Fig. 1 O muestra la secuencia de nucleótidos de la albúmina de suero humano (HSA) tal como se utiliza en los ejemplos de esta solicitud (SEQ ID NO: 18).
La Fig. 1 P muestra la secuencia de nucleótidos de la penicilina V amidasa (PVA) tal como se utiliza en los ejemplos de esta solicitud (SEQ ID NO: 19).
La Fig. 1 Q muestra la secuencia de nucleótidos del vector pGAPk utilizado para generar la línea celular de levadura SSS1 (plásmido sin un GOI y con un marcador de resistencia a geneticina) (SEQ ID NO: 20) La Fig. 1 R muestra la secuencia de un vector pLLP que contiene un marcador de resistencia a geneticina (pLLPk) correspondiente a SEQ ID NO: 22.
La Fig. 1 S muestra la SEQ ID NO: 23, que es parte de la secuencia de nucleótidos del cromosoma 1 de la secuencia genómica de la cepa de levadura YJK_PVA_021 después de la integración aleatoria de un casete de expresión de PVA y de zeocina en la región codificante de similar a ssn6 (secuencia de complemento inverso de similar a ssn6) en la posición 807.480 del cromosoma 1 de la cepa de referencia Pichia pastoris CBS 7435. La secuencia similar a ssn6 está subrayada, el codón de inicio se muestra en negrita y doble subrayado (ATG ^ complemento inverso ^ CAT). Se muestra la secuencia codificante similar a ssn6 interrumpida que incluye 10 nucleótidos que flanquean 5' y 3' a la secuencia codificante similar a ssn6. La secuencia mostrada es parte del genoma secuenciado por Illumina de la cepa YJK_PVA_021 (SEQ ID NOs: 67-115) y la secuencia de SEQ ID NO: 23 es parte de la secuencia genómica SEQ ID NO: 103 obtenida por Illumina Inc. Secuencias de oligo2395 (secuencia de complemento inverso de oligo2395) y oligo2398 están marcados en gris.
La Fig. 1 T muestra la secuencia señal de LLP fusionada al extremo 3' de la secuencia codificante de HSA que reemplaza a la secuencia señal HSA nativa, dando como resultado la secuencia de acuerdo con SEQ ID NO: 121.
La Fig. 1 U muestra la SEQ ID NO: 129, que es la secuencia delta29 del promotor de LLP acortada correspondiente a una longitud de 576 bases del promotor de LLP acortado.
La Fig. 1 V muestra la SEQ ID NO: 130, que es la secuencia delta93 del promotor de LLP acortada correspondiente a una longitud de 512 bases del promotor de LLP acortado.
La Fig. 1 W muestra la SEQ ID NO: 131, que es la secuencia delta133 del promotor de LLP acortada correspondiente a una longitud de 472 bases del promotor de LLP acortado.
La Fig. 1 X muestra la SEQ ID NO: 132, que es la secuencia delta201 del promotor de LLP acortada correspondiente a una longitud de 404 bases del promotor de LLP acortado.
La Fig. 1 Y muestra la SEQ ID NO: 133, que es la secuencia delta233 del promotor de LLP acortada correspondiente a una longitud de 372 bases del promotor de LLP acortado.
La Fig. 1 Z muestra la SEQ ID NO: 134, que es la secuencia delta300 del promotor de LLP acortada correspondiente a una longitud de 305 bases del promotor de LLP acortado.
Fig. 2: Secuencias de aminoácidos
La Figura 2 muestra diversas secuencias de aminoácidos.
La Fig. 2 A muestra la secuencia de aminoácidos de la proteína similar a SSN6 de P. Pastoris.(SEQ ID NO: 8). La Fig. 2 B muestra la secuencia de aminoácidos de la proteína similar a SSN6 modificada de P. Pastoris YJK_PVA_021 (SEQ ID NO: 9). Los 7 aminoácidos subrayados representan aminoácidos heterólogos no similares a SSN6 que se originan a partir del vector utilizado para inactivar la proteína similar a SSN6.
La Fig. 2 C muestra la secuencia de nucleótidos de la proteína LLP incluyendo la secuencia señal de LLP (SEQ ID NO: 10).
La Fig. 2 D muestra la secuencia de aminoácidos de la secuencia señal de LLP de P. Pastoris.(SEQ ID NO: 140).
Fig. 3: Mecanismo de Pichia pastoris super-secretora (SSS1)
wt = tipo salvaje, similar a ssn6 = gen similar a ssn6, LLP = secuencia codificante de LLP, PI = promotor de LLP, LLP-prot. = proteína LLP, Pg = promotor GAP, AR = resistencia a antibióticos, GOI = secuencia codificante del gen de interés, GOI- prot. = proteína de gen de interés
Figura 3 A
La cepa wt (cepa de tipo salvaje, NRRL Y-11430) contiene un gen similar a ssn6 intacto que, de acuerdo con la interpretación de los autores de la invención, suprime el promotor (PI) de la proteína de tipo lectina (LLP). El gen similar a ssn6 está en la cadena inversa del cromosoma 1 (la secuencia codificante es de 806379 - 808244) y el gen LLP está en la cadena delantera del cromosoma 1 (la secuencia codificante es de 2492530 a 2493945).
Figura 3 B
Se obtuvo una construcción de expresión con una secuencia Pg/AR integrada aleatoriamente en la secuencia codificante del gen similar a ssn6 de la cepa NRRL Y-11430. La cepa resultante contiene un gen similar a ssn6 alterado (similar a ssn6 inact ). De acuerdo con la interpretación de los autores de la invención, la interrupción del similar a ssn6 que resulta en similar a ssn6 inact . elimina el efecto supresor de similar a ssn6 sobre el promotor de PI, activando con ello el promotor de PI que finalmente da como resultado una alta expresión de la proteína LLP o de otros GOIs (gen de interés) bajo el control de un promotor de LLP.
Figura 3 C
Se puede introducir un gen de interés (GOI) en la cepa de levadura de la Fig. B mediante recombinación homóloga, reemplazando con ello la región codificante del gen LLP por la secuencia codificante del GOI (Fig. 3C, = Opción 1), y dando como resultado la expresión del GOI (GOI-proteína), mientras que no se produce proteína LLP.
Figura 3 D
Alternativamente, se puede introducir un gen de interés (GOI) fusionado al promotor de LLP (PI, GOI) en la cepa de levadura de la Fig. B mediante recombinación aleatoria dejando intacta la l Lp e insertando el GOI bajo el control del promotor de LLP (PI ) en una posición aleatoria del genoma de la levadura. Esto da como resultado la expresión concomitante de GOI (GOI- prot. ) y de LLP (LLP- prot. ).
Figura 4: Análisis SDS-PAGE
Una secuencia de ADN optimizada con codones (realizada por DNA2.0 Inc., Menelo Park, EE.UU.) que codifica la proteína modelo DLX521 (un scFv = Fragmento variable de cadena sencilla de un anticuerpo) se insertó en un plásmido con el promotor de GAP (pGAP = pJ905 de DNA2.0 Inc.) entre los sitios de restricción EcoRI y NotI, y un plásmido con el promotor de LLP (pLLP ) entre los sitios de restricción EcoRV y NotI . El plásmido pGAP se linearizó con Swal y se transformó en NRRL Y-11430 y el plásmido pLLP se linearizó con AvrII y se transformó en SSS1. Para el plásmido pGAP, los transformantes se rastrearon por PCR y se seleccionaron aleatoriamente 8 clones con una señal de PCR positiva y se utilizaron para la preparación de material de glicerol. Para el plásmido pLLP, los transformantes se rastrearon por PCR y se seleccionaron aleatoriamente 9 clones con una señal de p Cr positiva y se utilizaron para la preparación de material de glicerol. Los materiales de glicerol de las 8 cepas pGAP y 9 cepas pLLP se sometieron a estudios de expresión a escala de placa de microtitulación (25°C, 350 rpm, 70 h). La DO (densidad óptica) a 600 nm era comparable en la recolección (la DO se determinó en la recolección para verificar la variabilidad de la biomasa). Posteriormente, se cargaron en el gel 15 pL de las muestras (sobrenadante mezclado con tampón de muestra NuPAGE® LDS incl. 2-mercaptoetanol de acuerdo con las instrucciones de los fabricantes (Invitrogen/Life Technologies)).
El sistema de SDS-gel de poliacrilamida (SDS-PAGE) utilizado era el gel Bs-Tris 4-12% de grandiente Novex NuPAGE® (Invitrogen/Life Technologies) utilizando el sistema de tampón MES (Invitrogen/Life Technologieis). El marcador de peso molecular de la proteína (M) utilizado era de AppliChem GmbH, Darmstadt, Alemania. El Marcador de Proteína VI usado, preteñido (AppliChem), muestra los pesos moleculares aproximados indicados en kilo Dalton (kDa) de las proteínas marcadoras si se separan en un gel de poliarcrilamida SDS al 10% (SDS-PAGE) utilizando tampón Bis-Tris 10% MES de acuerdo con el fabricante AppliChem. El volumen de carga era de 15 pl de sobrenadante del cultivo de levadura/pista. Todas las cepas de pGAP y pLLP se testaron previamente mediante p Cr para scFv . Sólo las cepas scFv -positivas se testaron posteriormente para la expresión de proteína scFv. La tabla que figura a continuación del gel SDS PAGE enumera las bandas de proteína en las posiciones de peso molecular de LLP y scFV, la intensidad de la banda de proteína
(++ banda fuerte, banda clara, o banda débil, - sin banda), así como la Opción de acuerdo con la Fig.1 a la que pertenece este clon de levadura Opción 1: solo se expresa GOI, no LLP; Opción 2: se expresan GOI LLP
La banda de proteína de alto peso molecular en el gel en la posición de aproximadamente el marcador de peso molecular 125 kDa representa un dímero de la proteína LLP. La identidad de la proteína LLP se demostró mediante los siguientes experimentos y evidencias. Primero se cortó la banda LLP del gel y se determinó la secuencia de aminoácidos C-terminal mediante secuenciación de péptidos utilizando métodos estándares conocidos en la técnica. Además, la banda de gel de LLP se analizó mediante espectrometría de masas utilizando métodos estándares conocidos en la técnica. Ambos métodos demostraron que esta banda de proteína en el gel es de hecho proteína LLP. Además, la LLP se ensayó con una enzima que elimina las estructuras glico de las proteínas, a saber, PNGasa F. El tratamiento de LLP con PNGasa F redujo el peso molecular del dímero de LLP de aproximadamente 125 kDa a aproximadamente 110 kDa . Además, se sabe por la bibliografía (IUBMB Live, 2009, 61:252-60), que las lectinas pueden formar multímeros muy estables, tales como dímeros. Por lo tanto, los autores de la invención concluyen que la banda de proteína LLP de alto peso molecular en sus geles de SDS-PAGE es un dímero de proteína LLP estable.
Fig. 5 A: Análisis SDS PAGE
Una secuencia de ADN optimizada con codones (SEQ ID NO: 17) que codifica la proteína modelo hGH se insertó en un plásmido con el promotor de GAP (pGAP ) y un plásmido con el promotor de LLP ( pLLP). El plásmido pGAP se transformó en NRRL Y-11430 y el plásmido pLLP en SSS1. Para pGAP, se seleccionaron aleatoriamente 16 transformantes y se sometieron a estudios de expresión a escala de placa de microtitulación (25°C, 350 rpm, 70 h). Para pLLP, se seleccionaron aleatoriamente 28 transformantes y se sometieron a estudios de expresión a escala de placa de microtitulación (25°C, 350 rpm, 70 h). La DO a 600 nm era comparable en la recolección (la DO se determinó en la recolección para verificar la variabilidad de la biomasa). Posteriormente, se cargaron en el gel 15 pL de las muestras (sobrenadante mezclado con tampón de muestra NuPAGE® LDS incl. 2-mercaptoetanol .
Este resultado indica que el sistema pLLP es superior al sistema pGAP.
Fig.5 B: Borrón de transferencia Western de hGH
15, 20 o 30 pl de muestras de sobrenadante de cultivos en placa de pocillos profundos de células de Pichia pastoris transformadas tal como se describe en la Fig.5 A se cargaron directamente en geles SDS-PAGE ( Novex NuPage 4-12% Bis-Tris Gels de Invitrogen con MES-tampón de desarrollo). A continuación, las proteínas se transfirieron a una membrana de PVDF. Después de la transferencia y el bloqueo, la membrana se incubó con una solución que contenía anticuerpo anti- hGH (Zymed Cat.N° 18-0090, dilución: 1:1000) durante 2 h. Después de lavar la membrana, se añadió un anticuerpo secundario acoplado con fosfatasa alcalina (conjugado de fosfatasa alcalina anti-IgG de conejo, Sigma Cat. N° A3687,
dilución: 1:16.000) durante 1 h. Después de lavar la membrana, se añadió NBT/BCIP (cloruro de tetrazolio azul nitro/sal de toluidina - r m -4- l r - -in lilf f r r h H.
Fig. 6: Análisis SDS PAGE
La pista 6 contiene una muestra de células SSS1 no transfectadas con una construcción pLLP (control negativo). Análisis SDS-PAGE. Una secuencia de ADN optimizada con codones que codifica la proteína modelo HSA en un plásmido con el promotor de GAP (pGAP) y un plásmido con el promotor de LLP ( pLLP ). El plásmido pGAP se transformó en NRRL Y-11430 y el plásmido PLLP en SSS1. Se aplicó PCR de colonias para rastrear transformantes que luego se sometieron a estudios de expresión a escala de placa de microtitulación (25°C, 350 rpm, 70 h). La DO a 600 nm era comparable en la recolección (la DO se determinó en la recolección para verificar la variabilidad de la biomasa). Posteriormente, se cargaron en el gel 15 pL de las muestras (sobrenadante mezclado con tampón de muestra NuPAGE® LDS incl. 2-mercaptoetanol .
Este resultado indica que el sistema pLLP es superior al sistema pGAP.
Fig.7 Comparación del sistema de expresión pGAP con el sistema de expresión pLLP
Este resultado indica que el sistema pLLP es superior al sistema pGAP.
7A:
Cepas de Pichia pastoris transformadas con HSA ya sea bajo el control del promotor de GAP (pGAP = promotor de gliceraldehído-3-fosfato deshidrogenasa de P. pastoris) o bajo el control del promotor de LLP (pLLP = promotor de proteína similar a lectina de P. pastoris) se cultivaron en un fermentador de 5 litros durante 144 h a 25 °C, pH 6,0 y 30% de oxígeno, utilizando glicerol en fase de crecimiento discontinuo y utilizando alimentación constante de glucosa en la etapa principal de crecimiento. El sobrenadante del cultivo se analizó para HSA empleando un kit de Albúmina de Suero Humano ELISA (Ensayo Inmunoabsorbente Ligado a Enzimas) de Cygnus Technologies (Cat. N° F055) de acuerdo con las instrucciones del fabricante. Mezclas de cepas transformadas de levadura (pGAP) y mezclas de cepas de levadura transformadas (pLLP) se ensayaron con el fin de dar cuenta de las diferencias de expresión en cepas individuales, p. ej., para determinar la tasa de expresión promedio de pGAP y de pLLP.
7B:
Ensayo de enzimas PVA. Una secuencia de ADN optimizada con codones que codifica PVA (Pleurotus ostreatus -Penicillna V Amidasa) en un plásmido con el promotor de GAP (pGAP) y un plásmido con el promotor de LLP ( pLLP). El plásmido pGAP se transformó en NRRL Y-11430 y el plásmido pLLP en células de levadura SSS1. Para cada uno de los plásmidos, se seleccionaron aleatoriamente 16 transformantes y se sometieron a estudios de expresión a escala de placa de microtitulación (25°C, 350 rpm, 70 h). El título de PVA (g/kg de ácido fenoxi acético) y la DO a 600 nm se determinaron en la recolección y se utilizaron para la normalización (g/kg de fenoxi normalizado). El diagrama muestra el valor medio ± SEM (error típico de la media) de la actividad de PVA medida por conversión de fenoximetilpenicilina mediada por PVA en ácido fenoxi acético g/kg. El valor individual más alto de cada uno de los grupos está marcado con un asterisco (*). Para fines de expresión, habitualmente se elegirían aquellas cepas que expresan la cantidad más alta de actividad PVA (marcadas con * en el diagrama). En este caso la mejor cepa que expresa PVA bajo el control de la pLLP expresó aproximadamente 2,9 veces más PVA-actividad en comparación con la mejor cepa pGAP (pGAP: n = 13, el valor máx. era de 0,17 g/kg, pLLP : n = 15, el valor máx. era 0,49 g/kg). El vector pGAP de DNA2.0 Inc. y el vector pGAP de Sandoz son casi idénticos. Todos los elementos del vector,tales como promotores, terminadores, marcadores de resistencia, pUC ori, etc. son iguales en ambos vectores. Solo diferencias menores con respecto a los sitios de enzimas de restricción
utilizados y secuencias de nucleótidos cortas que conectan algunos de estos elementos dentro de los vectores y son ligeramente diferentes entre ambos vectores.
Fig. 8: Expresión del gen de interés (GOI) en cultivos de levadura en fermentador
8A
Se insertó una secuencia de ADN optimizado con codones que codifica la enzima PVA (penicilina V amidasa) en un plásmido bajo el control del promotor de GAP (pGAP). El plásmido pGAP se transformó en células de levadura NRRL Y-11430 (Pichia pastoris), y las células fueron cultivadas en un fermentador bajo condiciones estándares utilizando medios estándares y condiciones de cultivo como se conocen en la técnica. El vector pGAP se integró aleatoriamente en el gen SSN6, activando con ello el promotor de LLP. El sobrenadante del cultivo de fermentación se trató posteriormente con la enzima PNGasa F (péptido N-glicosidasa F; escinde la alta manosa ligada a asparagina, así como los oligosacáridos complejos híbridos de las glicoproteínas; New England Biolabs, Número de Catálogo P0704S). Muestras del sobrenadante del cultivo celular sin tratar (pista 1) y del sobrenadante del cultivo celular tratado con PNGasa F (pista 2) se separaron en SDS-PAGE. La pista 1 muestra el dímero de LLP glicosilado en forma de una banda muy intensa a aproximadamente 125 kDa, mientras que la banda de PVA es algo difusa a alrededor de 72 kDa, probablemente debido a que moléculas individuales de PVA están glicosiladas en un grado diferente. La pista 3 muestra a aproximadamente 36 kDa la banda de proteína de la PNGasa F añadida, a aproximadamente 110 kDa la banda muy fuerte del dímero LLP desglicosilado ( ^ LLP des-glic.) y a aproximadamente 52 kDa una banda distinta, ahora muy clara. que representa PVA desglicosilado ( ^ PVA des-glic .).
8B
Una secuencia de ADN optimizada con codones que codifica un fragmento de anticuerpo de cadena sencilla (scFv), en este caso el scFv denominado DLX521 se insertó en un plásmido bajo el control del promotor de LLP (pLLP). El plásmido pLLP que contenía una resistencia a geneticina se transformó aleatoriamente en YJK_PVA_021 (las células de levadura ya transformadas con PVA de la Fig. 8 A), y las células se cultivaron en un fermentador en condiciones estándares utilizando medios estándares y condiciones de cultivo como se conocen en la técnica. El sobrenadante de la fermentación se diluyó 20 veces y se cargaron 15 pl en SDS-PAGE en presencia de 2-mercaptoetanol. Una banda de proteína muy intensa en la posición de peso molecular del scFv es visible en el gel en la pista 1. Además, se observa una banda menor en la posición del dímero de LLP a aproximadamente 125 kDa y se ve una banda de proteína intensa de PVA. a aproximadamente 72 kDa . No se añadió PNGasa, por lo que todas las proteínas están glicosiladas. Se realizó una dilución de 20 veces del sobrenadante del cultivo celular con el fin de representar la muy alta tasa de expresión del scFv con respecto a la LLP. Esta cepa de levadura es un ejemplo de la "Opción 2" como se muestra en la Fig. 3 D, excepto que se expresan 2 GOI (PVA y DLX521). PVA está bajo el control del promotor de GAP y se integra aleatoriamente por casualidad en el gen similar a ssn6.
Este es un ejemplo que demuestra que, además del promotor de LLP, también se pueden utilizar otros promotores, tales como el promotor GAP, junto con el sistema de expresión de la invención.
8C
Este esquema muestra la construcción de expresión utilizada en la Fig. 8 A. Se insertó en un plásmido (pGAP) una secuencia de ADN optimizada con codones que codifica la enzima PVA bajo el control del promotor GAP. Este plásmido pGAP se transformó en células de levadura NRRL Y-11430 (Pichia pastoris), y las células fueron cultivadas en un fermentador bajo condiciones estándares utilizando medios estándares y de cultivo. Se utilizaron mediciones de DO600 para ajustar las densidades celulares. El vector pGAP se integró aleatoriamente en el gen ssn6, activando con ello el promotor de LLP y dando como resultado una expresión de la proteína LLP.
Esta construcción de expresión es una prueba de principio, que demuestra nuevamente que la interrupción del gen ssn6 da como resultado una expresión mejorada del gen que está bajo el control del promotor de LLP, en este caso en una expresión mejorada de la proteína LLP, además de la expresión de la proteína PVA.
Fig. 9:
A:
Alineamiento parcial de 39 diferentes secuencias de proteínas que muestran homología de secuencia con proteína similar a SSN6 de P. pastoris (CCA36593.1) (SEQ ID NO: 8)
B:
Secuencia consenso 1 similar a SSN6 de P. pastoris (SEQ ID NO: 63)
C:
Secuencia de consenso 2 similar a SSN6 de P. pastoris (SEQ ID NO: 64)
Fig. 10: Vector de expresión de pLLP
Esta figura muestra el vector de expresión pLLP sin GOI insertado (Fig. 10 A ), y su secuencia de longitud completa (Fig.
10 B) (SEQ ID NO: 65).
Vector de expresión (sin GOI insertado): El gen de interés (GOI) se puede insertar en este vector utilizando los sitios de escisión de endonucleasas de restricción Notl y/o EcoRV, lo que da como resultado que el GOI esté bajo el control del promotor LLP y el terminador ADH. Con el fin de insertar el vector de expresión en el genoma de la levadura, el vector se puede linearizar escindiendo con la endonucleasa de restricción AvrII, cuyo sitio de restricción se encuentra entre el promotor de LLP y la secuencia del terminador de LLP. El vector linearizado resultante contiene en su extremo 5' el promotor de LLP y en su extremo 3' el terminador de LLP. Si se inserta en el genoma de la levadura mediante recombinación homóloga a través del promotor de LLP y las secuencias terminadoras de LLP, esta recombinación homóloga elimina la secuencia nativa que codifica LLP del genoma de la levadura. Al mismo tiempo, el GOI bajo el control del promotor de LLP y el terminador ADH, así como un casete de expresión de zeocina y todas las demás partes del vector pLLP se insertan en el genoma de la levadura.
Fig. 11: Vector de expresión pGAP con DLX521 como GOI
Esta figura muestra el vector de expresión pGAP con DLX521 como GOI (Fig. 11 A), y su secuencia de longitud completa (Fig. 11 B) (SEQ ID NO: 66).
La linearización del vector se ha llevado a cabo con Swal .
Fig. 12: Expresión de HSA utilizando la secuencia señal de LLP
Esta figura muestra la expresión de albúmina de suero humano (HSA) utilizando la secuencia señal de secreción de LLP. La secuencia señal de LLP se fusionó N-terminalmente a la secuencia codificante de HSA (Ilps -HSA), transformada en células de levadura. Se cultivaron 10 clones seleccionados al azar en placas de pocillos profundos y se comprobó la expresión de HSA en el sobrenadante (Fig. 12 A). También se expresó un clon en un fermentador de 1 litro durante 48, 72 y 96 horas (Fig. 12 B). La expresión se mostró mediante SDS-PAGE seguida de tinción con azul de Coomassie. Fig. 13 A - D: Análisis de la funcionalidad de los fragmentos del promotor de LLP (Análisis de truncamiento)
El promotor de LLP se acortó sucesivamente mediante la clonación de fragmentos del promotor de LLP generados por PCR en la cepa de levadura YJK_PVA_021. Se seleccionaron 11 clones seleccionados al azar para cada longitud de promotor de LLP y se cultivaron en placas de pocillos profundos y el sobrenadante se analizó mediante SDS-PAGE seguido de tinción con azul de Coomassie. Las longitudes de los fragmentos del promotor LLP ensayados fueron las siguientes: Fig. A: 576 pb, Fig. B: 512 pb, Fig. C: 472 pb, y Fig. D: 372 pb. Cada una de las figuras muestra dos líneas representativas, designando "Opción 1" que solo se expresa scFv, y designando "Opción 2" que se expresan scFv y LLP. Fig. 14: Secuencias S.cerevisae ssn6 y TUP1 (región codificante completa)
Esta figura muestra la respectiva región codificante completa de lo siguiente:
A. Ácido nucleico Ssn6, de S. cerevisiae (SEQ ID NO: 135);
B: Proteína SSN6, de S. cerevisiae (SEQ ID NO: 137);
C: Ácido nucleico Tup -1 de S. cerevisiae (SEQ ID NO: 136);
D: Proteína Tup -1 de S. cerevisiae (SEQ ID NO: 138).
Métodos
1. Evaluación de la cantidad de un gen candidato relacionado con ssn6
El nivel de expresión de un gen candidato relacionado con ssn6 se puede medir, por ejemplo, midiendo el nivel de ARNm de dicho gen relacionado con ssn6 mediante transferencia Northern o mediante reacción en cadena de la polimerasa cuantitativa (qPCR) o transcriptasa inversa qPCR, o midiendo la actividad del promotor de dicho gen relacionado con ssn6, por ejemplo, utilizando ensayos del gen informador de luciferasa o utilizando construcciones de proteína fluorescente verde (GFP) de promotor relacionado con ssn6, etc. Todos estos métodos son bien conocidos por una persona experta
en la técnica y representan el trabajo rutinario. Un libro de texto que comprende protocolos para métodos rutinarios es, por ejemplo, Sambrook et al., "Molecular Cloning: A Laboratory Manual", 4a edición, Cold Spring Harbor Laboratory Press, (2012), al que se alude en esta memoria como Sambrook et al.
2. Evaluar si un gen candidato relacionado con ssn6 se parece al gen similar a ssn6 como se define en esta memoria con respecto a la función, actividad y secuencia.
2.1 Medir la cantidad de proteína LLP expresada en cultivo celular:
La cantidad de una proteína (o su nivel de expresión) se puede determinar de acuerdo con cualquier método adecuado que sea conocido por una persona experta en la técnica, por ejemplo midiendo la cantidad de proteína LLP en el sobrenadante de un cultivo celular por ELISA, por transferencia Western o SDS PAGE (electroforesis en gel de poliacrilamida con dodecilsulfato de sodio) de la proteína LLP.
En la presente invención, la cantidad de proteína LLP en el sobrenadante se ha medido llevando a cabo un análisis SDS PAGE cualitativo (Novex NuPage 4-12% Bis-Tris Gels con tampón de desarrollo MES, de Invitrogen).
Alternativamente, el nivel de proteína LLP se puede determinar indirectamente midiendo ARNm de LLP utilizando los mismos métodos descritos arribe en el párrafo 1 "Evaluación de la cantidad de un gen candidato relacionado con ssn6".
2.2 Medición de la cantidad de un gen de interés (GOI) expresado bajo el control del promotor de LLP en cultivo celular Los mismos métodos para medir la cantidad de proteína LLP, como se describe arriba en 2.1, también se pueden utilizar para medir la proteína GOI expresada bajo el control de un promotor de LLP de acuerdo con la invención.
2.3 Medición de la actividad y función de una proteína
Con el fin de medir la función y actividad de proteína similar a SSN6, se puede utilizar cualquier protocolo adecuado que sea conocido por una persona experta. Especialmente cualquier método adecuado para medir el funcionamiento del promotor de l Lp puede utilizarse para medir la función y actividad de la proteína similar a SSN6, tal como los métodos mencionados arriba en 2.1 y 2.2.
Una vez que se ha identificado una proteína similar a SSN6, su actividad supresora del promotor de LLP puede inhibirse inactivando el gen similar a ssn6 correspondiente mediante métodos descritos en otra parte de esta solicitud. Una vez que se ha realizado este bloqueo, se puede medir el funcionamiento (es decir, la cantidad reducida o la ausencia total de) la proteína similar a SSN6 o ARNm correspondiente. Métodos adecuados se describen en otra parte de esta solicitud. Ensayo enzimático de PVA: una parte alícuota del sobrenadante se mezcló con el sustrato fenoximetilpenicilina-potasio se incubó a 22°C. La presencia de la enzima PVA activa dará como resultado la escisión del sustrato de una manera dependiente del título. La reacción se detuvo después de 60 min mediante la adición de metanol enfriado con hielo. La cantidad del producto de escisión ácido fenoxi acético se determinó mediante HPLC cuantitativa.
3. Comparación de diferentes sistemas de expresión
Con el fin de comparar la expresión de proteínas de diferentes sistemas de expresión, se puede llevar a cabo cualquier método adecuado que sea conocido por una persona experta en la técnica. En la presente invención, se ha aplicado el siguiente protocolo para este propósito:
Los sobrenadantes obtenidos del sistema de expresión pLLP y del sistema pGAP (mismo volumen) se cargaron directamente en geles SDS-PAGE para comparaciones relativas del sistema pLLP frente a pGAP.
4. Identificación de secuencias de ADN reguladoras
Hay varias herramientas disponibles para predecir secuencias de ADN reguladoras, revisadas, por ejemplo, por Wassermann et al., Nature Reviews Genetics 5, 276-287. También hay herramientas para la predicción de la longitud total de una secuencia de promotor, así como herramientas que predicen distintas posiciones dentro de un promotor de este tipo, que supuestamente se unen a determinados factores de transcripción, etc. Una de estas herramientas en línea está disponible en la Universidad de Copenhagen, Centro de Bioinformática, en http://jaspar.binf.ku.dk/. Los autores de la invención utilizaron el servidor de desarrollo JASPAR, Versión 5.0_ALPHA. Ajustes de esta herramienta en línea fueron: hongos JASPAR CORE, se eligieron todos los modelos de matrices JASPAR (los autores de la invención realizaron búsquedas de todos los sitios de reconocimiento de la transcripción enumerados para los hongos en la base de datos de hongos JASPER CORE), el umbral de puntuación de perfil se estableció en el 95%. La secuencia de entrada de los autores de la invención fue la secuencia del promotor de LLP SEQ ID NO: 12. Este análisis dio como resultado 63 sitios de unión predichos para factores de transcripción dentro de la secuencia testada tal como se muestra en la tabla que figura más adelante.
Se pueden encontrar más detalles sobre la predicción del sitio de unión del factor de transcripción en Nat Rev Genet.
2004:4, 276-87.
5. Transformación y cultivo de cepas
Las construcciones de expresión se linearizaron mediante digestión con una enzima de restricción adecuada y se transformaron en cepas de Pichia mediante electroporación. Los transformantes se sembraron posteriormente en placas de agar que contenían zeocina (concentración final: 100 mg/L) y/o geneticina (concentración final: 300 mg / L).
Colonias individuales o reservas de glicerol se sometieron a estudios de expresión en placas de 48 pocillos utilizando un medio de cultivo celular basado en almidón/amilasa. La DO (densidad óptica) a 600 nm en el momento de la recolección fue de alrededor de 10.
6. Ensayo de la actividad de promotor
La actividad de promotor puede medirse mediante cualquier método adecuado conocido por una persona experta en la técnica. Un ejemplo de un método de este tipo es el uso de qPCR o ensayos de genes informadores (p. ej., luciferasa, proteína verde fluorescente (GFP), etc.), ambos métodos estándares son conocidos por una persona experta en la técnica. Por ejemplo, la parte más adecuada del promotor de LLP para el alto nivel de expresión de un GOI puede determinarse mediante versiones sucesivamente acortadas de la secuencia del promotor de LLP de acuerdo con SEQ ID NO. 12, insertando secuencias de promotor de LLP acortadas de este tipo junto con una secuencia de Kozak y una secuencia de proteína modelo tal como DLX521 (scFv), hGH, HSA, PVA, etc. y junto con una secuencia señal tal como la secuencia señal MFalfa pre-pro con o sin repetición EAEA, la secuencia señal natural de dicha proteína modelo, etc.en un vector pLLP que lleva un marcador de resistencia tal como geneticina, zeocina, etc. y transfectar un vector pLLP de este tipo en una célula de levadura adecuada, tal como, por ejemplo, células YJK_PVA_021, células SSS1, células NRRL Y-11430, etc. Los clones individuales o los clones agrupados de dichas células de levadura transformadas se pueden cultivar en
condiciones de crecimiento estándares en placas profundas, matraces agitadores, termentadores, etc. y la cantidad de expresión de dicha proteína modelo que se mide utilizando métodos tales como SDS-PAGE, ELISA o ensayos de actividad proteica tal como el ensayo PVA descrito en otra parte de esta solicitud, etc. Versiones acortadas del promotor podrían representar partes de la secuencia del promotor descrito en SEQ ID NO: 12, por ejemplo, un promotor de LLP que tiene una longitud de 1000, 775, 675, 605, 576, 512, 472, 415, 404, 372, 305, 285, 235, 165, 100 nucleótidos, etc. contados en cada caso a partir del extremo 3' de SEQ ID NO: 12.
7. Evaluación del grado de identidad de las secuencias de nucleótidos o de aminoácidos
"Identidad de secuencia" o "% de identidad" se refiere al porcentaje de coincidencias de residuos entre al menos dos secuencias de polipéptidos o polinucleótidos alineadas utilizando un algoritmo estandarizado. Un algoritmo de este tipo puede insertar, de forma estandarizada y reproducible, huecos en las secuencias que se comparan con el fin de optimizar el alineamiento entre dos o más secuencias y, por lo tanto, lograr una comparación más significativa de las dos secuencias. Para los propósitos de la presente invención, la identidad de secuencia entre dos secuencias de aminoácidos o nucleótidos se determina utilizando el programa NCBI BLAST versión 2.2.29 (06-enero-2014) (Altschul et al., Nucleic Acids Res. (1997) 25:3389-3402). La identidad de secuencia de dos secuencias de aminoácidos se puede determinar con blastp establecido en los siguientes parámetros: Matriz: BLOSUM62, Tamaño de Palabra: 3; Valor esperado: 10; Costo del hueco: Existencia = 11, Extensión = 1; Filtro = baja complejidad activado; Cadena de Filtro: L; Ajustes de composición: ajuste de matriz de puntuación de composición condicional. Para los propósitos de la presente invención, la identidad de secuencia entre dos secuencias de nucleótidos se determina utilizando el programa NCBI BLAST versión 2.2.29 (06-ene-2014) con blastn establecido en los siguientes parámetros ejemplares: Tamaño de Palabra: 11; Valor esperado: 10; Costos del hueco: Existencia = 5, Extensión = 2; Filtro = baja complejidad activado; Puntuaciones de Coincidencia/Discordancia: 2-3; Cadena de Filtro: L; m.
8. Generación de la cepa super-secretora (SSS1)
Un casete de expresión que codifica la enzima PVA (penicilina V amidasa) bajo el control del promotor de GAP y otro casete de expresión que codifica zeocina se transformó en la cepa de P. pastoris NRRL Y-11430 (véase la tabla que figura más adelante). Los clones que secretan altos niveles de PVA activa se seleccionaron mediante el siguiente ensayo enzimático:
La escisión del sustrato de PVA penicilina V a los productos 6-APA (ácido 6-aminopenicilánico) y ácido fenoxi acético se determinó cuantificando la cantidad de ácido fenoxi acético por HPLC.
Se identificó un clon que mostraba altos títulos de PVA y se denominó YJK_PVA_021. Sorprendentemente, este clon no solo segregaba grandes cantidades de PVA, sino también la proteína LLP en niveles incluso más altos. Por lo tanto, YJK_PVA_021 se caracterizó, además, por la secuenciación del genoma completo realizada por la compañía Illumina Inc., San Diego, CA, EE.UU. Después del ensamblaje de novo del genoma realizado por Illumina Inc. (véanse las SEQ ID Nos: 67-115, que muestran los resultados de la secuenciación genómica), se identificó que la localización de la secuencia de la construcción de expresión de PVA estaba en SEQ ID NO: 103 y las secuencias genómicas adyacentes se compararon con la cepa de referencia (P. Pastoris CBS 7435, gi|328351301 |emb|FR839629.11) para la identificación del sitio de inserción. Se encontró que una sola copia del casete de expresión que codifica PVA se integró aleatoriamente en la posición 807,480 del cromosoma 1 de la cepa de referencia Pichia pastoris CBS 7435. Esta posición se encuentra dentro de la secuencia del gen similar a ssn6 que da como resultado la interrupción del gen similar a ssn6 que conduce a una proteína truncada C-terminal (véase la Fig.2 B, véase la SEQ ID NO: 9) y a una región codificante truncada en 3' del gen similar a ssn6, respectivamente (para detalles véase la Fig.1 S, véase la SEQ ID NO: 23. No se encontraron más desviaciones obvias de la secuencia de referencia. Por lo tanto, este único evento de integración aleatoria resultó en un alto nivel de secreción de LLP. El casete de expresión de PVA se eliminó de YJK_PVA_021, dando como resultado el clon SSS1 (véase también la Figura 3).
El vector pGAPk se amplificó por PCR (linearizado por PCR) utilizando oligo2395 (TCCTCGTCCAATCAGGTAG; SEQ ID NO: 119) y oligo2398 (AGTGGTACCTGCAGCTAAG; SEQ ID NO: 120) y el producto de PCR se transformó en la cepa de levadura YJK_PVA_021. La recombinación homóloga reemplazó el vector de expresión pGAP -PVA que contenía el marcador de resistencia a zeocina por la secuencia de vector vacía de pGAPk (casete de expresión vacío y marcador de resistencia a geneticina). Se rastrearon los clones con resistencia a geneticina y sin actividad de PVA. La PVA se midió como se indicó arriba. Una cepa que no expresa PVA, pero que expresa grandes cantidades de LLP se designó SSS1 y se utilizó para estudios de expresión posteriores de diferentes GOIs.
9. Caracterización de la secuencia señal de LLP
La proteína LLP secretada se secuenció N-terminalmente mediante degradación de Edman para identificar el sitio de escisión de la secuencia señal de LLP (Seq. ID NO: 3, Fig. 1 C). Con el fin de probar la funcionalidad general de la secuencia señal de LLP, que da como resultado la secreción de proteínas heterólogas fusionadas a la secuencia señal de LLP, se realizaron los siguientes experimentos:
La secuencia señal de LLP se fusionó con el extremo 3' de la secuencia codificante de HSA reemplazando la secuencia señal de HSA nativa, dando como resultado la secuencia de acuerdo con SEQ. ID NO: 121, (Fig. 1 T) y se clonó en el plásmido pLLP a través de los sitios de enzimas de restricción EcoRV y NotI . Se optimizó con codones de la secuencia codificante de HSA (realizada por DNA2.0 Inc., Menelo Park, EE.UU.) y se insertó una mutación puntual silenciosa en la secuencia señal de LLP en la posición 45 intercambiando G por una C, que no cambia la secuencia de aminoácido del péptido señal LLP, pero que elimina el sitio de la enzima de restricción Pstl de la secuencia señal de LLP. El plásmido resultante se transformó en la cepa de levadura SSS1. Se seleccionaron aleatoriamente 10 clones y se sometieron a cultivo en placas de pocillos profundos. Se cargaron directamente 15-20 pl/pista de sobrenadante de cultivos en placa de pocillos profundos en geles SDS-PAGE (Novex NuPage 4-12% Bis-Tris Gels de Invitrogen con tampón de desarrollo MES). La Fig.12 A muestra los resultados de este experimento: Las pistas 3 y 7 representan clones que no portan inserto de HSA, las pistas 2, 4, 8 y 10 representan clones de acuerdo con la opción 1 (solo HSA expresado) y las pistas 1, 5, 6 y 9 representan clones de acuerdo con la opción 2 (HSA expresada en paralelo a LLP). La Fig. 12 B muestra el resultado de una expresión en fermentador de 1 litro utilizando el mismo clon utilizado en la pista 2 del gel en la Fig. 12 A. Se recogió una muestra del sobrenadante del fermentador después de 48, 72 y 96 horas y 15 pl de cada una de las muestras sometidas a SDS-PAGE, seguida de tinción con azul de Coomassie utilizando el sistema "SimplyBlue SafeStain" de Life Technologies de acuerdo con las instrucciones del fabricante.
10. Caracterización del sistema de expresión del promotor de LLP/similar a ssn6
La siguiente tabla muestra las características básicas de las construcciones/vectores de expresión y las células de levadura utilizados con el fin de evaluar el funcionamiento del sistema de expresión para diversas clases de proteínas/genes de interés (GOIs), a saber hormonas, anticuerpos, enzimas y proteínas estructurales. Los resultados de expresión de GOI representados en las figuras se generaron con las combinaciones de construcciones de expresión / vectores / cepa huésped enumeradas en la tabla que figura más adelante. La comparación de la expresión de un GOI utilizando un promotor GAP estándar o el promotor de LLP se realizó utilizando SDS-PAGE, ELISA y/o ensayos de actividad enzimática, tal como se describe en las fi uras.
Nombre Clase de Uso de Secuencia GOI Plásmido Marcador Cepa Comentarios de la proteína codón para señal insertado (linearizado de huésped proteína I en el con) resistencia
entre
* Este plásmido también se linearizó mediante PCR tal como se describe en otra parte
de esta solicitud (véase el párrafo 8). "Generación de la cepa super-secretora (SSS1)").
** La secuencia codificante de HSA se optimizó de forma independiente con codones,
lo que resultó en secuencias de aminoácidos idénticas pero en secuencias de
nucleótidos ligeramente diferentes en comparación con la secuencia de HSA una fila
por encima
*** La secuencia señal de P. pastoris contiene una mutación puntual silenciosa en la
posición 45 que cambia G a C con el fin de eliminar un sitio de enzima de restricción
11. Identificación de secuencias consenso similar a ssn6
La secuencia similar a ssn6 de la cepa NRRL Y-11430 de Pichia pastoris se utilizó para una búsqueda BLAST de secuencias similares. BLAST se realizó en http://blast.ncbi.nlm.nih.gov/. Parámetros de BLAST eran "parámetros de ajuste automático para secuencias de entrada cortas", Umbral esperado: 10, Tamaño de palabra: 3, Coincidencias máx en una consulta de rango: 0, Matriz: BLOSUM62, Costos del hueco: Existencia:: 11 Extensión:1, Ajustes composicionales: "Ajuste de matriz de puntuación de composición condicional. Las 39 secuencias superiores se originan a partir de los siguientes organismos (véase también la Fig. 9A): Komagataella pastoris CBS 7435 (Sinónimo/otros nombres: Pichia pastoris, Pichia pastoris CBS 7435), Komagataella pastoris GS115 (Sinónimo/otros nombres: Pichia pastoris, Pichia pastoris GS115), Scheffersomyces stipitis CBS 6054 (Sinónimo/otros nombres: Pichia stipitis, Pichia stipitis CBS 6054), Millerozyma farinosa CBS 7064 (otro nombre: Pichia farinosa CBS 7064), Candida parapsilosis, Candida orthopsilosis Co 90-125, Debaryomyces hansenii CBS767, Spathaspora passalidarum NRRL Y-27907, Candida albicans, Candida albicans SC5314, Candida maltosa Xu316, Candida tropicalis MYA-3404 (otro nombre: Candida tropicalis T1), Lodderomyces elongisporus NRRL YB-4239 (otro nombre: Saccharomyces elongisporus), Clavispora lusitaniae ATCC 4272 (anamorfo de genebank: Candida lusitaniae ATCC 42720), Meyerozyma guilliermondii ATCC 6260 (anamorfo de genebank: Pichia guilliermondii ATCC 6260), Wickerhamomyces ciferrii, Ogataea parapolymorpha DL-1 (sinónimo y otros nombres:: Hansenula polymorpha, Hansenula polymorpha DL-1, Ogataea angusta DL-1, Ogataea parapolymorpha ATCC 26012, Ogataea parapolymorpha DL-1, Pichia angusta DL-1), Cyberlindnera fabianii (sinónimo y otros nombres: Hansenula fabianii, Pichia fabianii, ...), Kuraishia capsulata CBS 1993, Dictyostelium discoideum AX4 (pertenece a amoebae social), Tetrapisispora phaffii CBS 4417 (sinónimo: Fabospora phafii, Dictyostelium purpureum (pertenece a amoebae social), Pseudozyma flocculosa PF-1, Malassezia globosa CBS 7966, Botryobasidium botryosum FD-172 SS1 (basidiomiceto), Naumovozyma dairenensis CBS 421 (sinónimo: Saccharomyces dairenensis), Tetrapisispora blattae CBS 6284, Mucor circinelloides f. circinelloides 1006PhL (linaje fúngico divergente temprano), Malassezia sympodialis ATCC 42132, Kazachstania naganishii CBS 8797 (Saccharomyces naganishii), Saccharomyces cerevisiae YJM789, Saccharomyces cerevisiae FostersB, Saccharomyces cerevisiae, Saccharomyces cerevisiae S288c, Ustilago hordei (hongo tizón del maíz, basidiomiceto), Meyerozyma guilliermondii ATCC 6260 (sinónimo/otros nombres: Candida guilliermondii, Pichia guilliermondii ATCC 6260), Ustilago maydis 521,(hongo tizón del maíz, basidiomiceto).
Las 39 secuencias de aminoácidos identificadas superiores se alinearon con la secuencia de aminoácidos similar a ssn6 (= idéntica a CCA36593.1) revelando similitudes significativas (véanse las Figs. 9 B y 9 C). El alineamiento se realizó utilizando la herramienta en línea Clustal Omega proporcionada por EMBL-EBI (http://www.ebi.ac.uk/Tools/msa/clustalo/) que se describe por Sievers et al., Molecular Systems Biology 7, número de artículo: 539, Valentin et al., Nucleic acids research, 2010, 38, Supl. W695-9, y por McWilliam et al., Nucleic acids research, 2013, Jul; 41 (problema del servidor web): W597-600. Clustal Omega utiliza el algoritmo HHalign y su configuración por defecto como motor de alineamiento central. El algoritmo se describe en Soding, J. (2005) 'Protein homology detection by HMM-HMM comparison'. Bioinformatics 21, 951-960. La matriz de transición por defecto es Gonnet, la penalización por apertura del hueco es de 6 bits, la extensión del hueco es de 1 bit. Los símbolos utilizados para la secuencia consenso en la parte inferior del alineamiento son los siguientes. Un "*" (asterisco) indica posiciones de aminoácidos que tienen un único residuo completamente conservado en las 40 secuencias alineadas. Un ":" (dos puntos) indica conservación entre grupos de aminoácidos de propiedades muy similares - puntuación > 0,5 en la matriz Gonnet PAM 250. Un "." (punto) indica conservación entre grupos de aminoácidos de propiedades débilmente similares - puntuación > 0,5 en la matriz Gonnet PAM 250. La secuencia CCA36593.1 corresponde a la secuencia SSN6 de Pichia pastoris identificada en esta solicitud. La Fig. 9 A muestra solo la parte del alineamiento con la mayor similitud entre las 40 secuencias. La Fig. 9 B muestra la secuencia consenso correspondiente a los aminoácidos 352 a 372 similar a SSN6 (CCA36593.1) de Pichia pastoris. La Fig. 9 C muestra la secuencia consenso correspondiente a los aminoácidos 394 a 417 similar a SSN6 (CCA36593.1) de Pichia pastoris.
Los aminoácidos que son idénticos en las 40 secuencias están escritos en blanco con fondo negro. La secuencia consenso muestra aminoácidos individuales que son idénticos en las 40 secuencias o muestra un grupo de aminoácidos entre paréntesis "( )" y cada uno de los aminoácidos en dicho conjunto de paréntesis se puede elegir alternativamente para esa posición en la secuencia consenso. Un "-" (guión) indica que el aminoácido en esta posición también puede omitirse de la secuencia consenso, que es, por ejemplo, una posibilidad para las posiciones 406 y 407 de la secuencia consenso representada en la Fig. 9 C. Por ejemplo, el inicio del aminoácido en la posición 352 de la secuencia consenso en la Fig. 9 B es "W", lo que significa que la secuencia consenso en esta posición contiene un Triptófano, la posición 353 de la secuencia consenso en la Fig. 9 B se escribe como "(CGL)" lo que significa que en esta posición de la secuencia consenso puede ubicarse Cisteína, Glicina o Leucina, la posición 354 está marcada como "(SlTa )", lo que significa que en esta posición puede ubicarse Serina, Leucina, Treonina o Alanina, etc. La misma nomenclatura se utiliza para la segunda secuencia consenso representada en la Fig. 9 C. Las secuencias consenso pueden ser más cortas o más largas que las dos secuencias consenso ejemplares mostradas en las Fig. 9 B y 9 C. Las secuencias consenso pueden deducirse del alineamiento de secuencia de la Fig. 9A o se puede deducir de otras partes del alineamiento de secuencias preparado a partir de las 40 secuencias arriba mencionadas utilizando el método de alineamiento de secuencias como se describe arriba. Preferiblemente, la secuencia consenso contiene al menos 24 aminoácidos, preferiblemente 23, 22, 21, 20, 19, 18, 17 aminoácidos, más preferiblemente al menos 16, 15, 14, 13, 12, 11 o 10 aminoácidos, lo más preferiblemente al menos 9, 8, 7, 6, 5 o 4 aminoácidos. Preferiblemente, una proteína similar a SSN6 contiene al menos una o dos secuencias consenso, más preferiblemente las dos secuencias consenso mostradas en la Fig. 9 B y la Fig. 9 C, más preferiblemente al menos una secuencia consenso, lo más preferiblemente una secuencia consenso seleccionada de las secuencias mostradas en la Fig.9 B y 9 C.
12. Caracterización de la funcionalidad del promotor de LLP
El plásmido pLLPk que contenía DLX521 con la secuencia señal MFalfa se utilizó como molde de PCR en combinación con los siguientes cebadores de PCR para generar versiones acortadas / truncadas del promotor de LLP (fragmento A).
Cebador inverso utilizado:
Nombre del s e q ID cebad Secuencia (extremo 5’ a 3’) Fragmento Aor NO.:
Cebador directo utilizado:
Los productos de la PCR resultantes se ligaron mediante sitios de enzimas de restricción Spel y AvrlI en el vector DLX521 que contiene pLLPk_. Las secuencias correctas de los plásmidos resultantes se confirmaron mediante secuenciación de A d N. Los plásmidos se linearizaron con AvrII y se transformaron en la cepa YJK_PVA_021. Se seleccionaron aleatoriamente 11 clones por plásmido y se sometieron a cultivos en placas de pocillos profundos utilizando un medio sintético. En el momento de la recolección, se cargaron directamente 15-30 pl de muestras de sobrenadante en geles SDS-PAGE (Novex NuPage 4-12% Bis-Tris Gels de Invitrogen con tampón de desarrollo MES) para analizar la expresión de scFv mediante tinción de los geles (Simply Blue Safe Stain). La DO600, es decir, el número de células de levadura por ml de medio de cultivo en el momento de la recolección era comparable para todos los clones analizados.
M = Marcador de Proteína VI.
Los resultados se muestran en la Fig.13 A a la Fig.13 D.
13. Ejemplos de mutantes similares a ssn6
La cepa de levadura contiene el gen similar a ssn6 modificado que codifica los aminoácidos 1 a 367 y, además, siete aminoácidos (EWYLQLR; SEQ ID NO: 139) que se originan a partir del vector insertado en el gen similar a ssn6 con el fin de interrumpir el gen similar a ssn6. Alternativamente, las versiones modificadas similares a ssn6 podrían contener un gen similar a ssn6 modificado que codifique las siguientes regiones de aminoácidos de la proteína similar a SSN6, en el sentido de que la proteína similar a SSN6 modificada no es capaz de ejercer su función de tipo salvaje y/o actividad de tipo salvaje:
Versiones modificadas de proteína similar a SSN6 que comprenden los aminoácidos 1 a 44, 1 a 77, 1 a 100, 1 a 122, 1 a 155, 1 a 189, 1 a 235, 1 a 275, 1 a 315, 1 a 348, 1 a 400, 1 a 450, 1 a 500, 1 a 550, 1 a 600, 1 a 650, 1 a 367, 1 a 400, 1 a 450, 1 a 500, 1 a 550, 1 a 600, 1 a 650, y/o 1 a 700 de proteína similar a SSN6 de acuerdo con SEQ ID NO: 9.
En otra versión alternativa, las versiones modificadas de similar a ssn6 podrían contener la región del gen similar a ssn6 que codifica bloques de aminoácidos similares a SSN6 de acuerdo con SEQ ID NO. 9, a saber, los aminoácidos 1 a 44, 45 a 77, 78 a 100, 101 a 122, 123 a 155, 156 a 189, 190 a 235, 236 a 275, 276 a 315, 316 a 348, 348 a 367, 368 a 400, 401 a 450, 451 a 500, 501 a 550, 551 a 600, 601 a 650, 651 a 700 y/o 701 a 736. Cada uno de estos bloques de aminoácidos puede combinarse con uno o más bloques de otros aminoácidos, preferiblemente en el mismo orden en que aparecen en SEQ ID NO. 9, en donde no falta ninguno, uno o más bloques de aminoácidos entre dos bloques de aminoácidos.
Claims (13)
1. Una célula eucariota modificada, en donde esta célula eucariota modificada es una célula de Pichia pastoris, que se modifica en comparación con su célula de tipo salvaje al menos por que comprende
- un gen similar a ssn6 modificado y/o
- un nivel de expresión modificado de proteína similar a SSN6, o
por que
- se elimina un gen similar a ssn6,
respectivamente, en el sentido de que
- la célula de Pichia pastoris modificada no es capaz de proporcionar una proteína similar a SSN6 que ejerza su función de tipo salvaje y/o actividad de tipo salvaje,
- la cantidad de proteína similar a SSN6 que todavía está presente en la célula de Pichia pastoris modificada difiere de la cantidad de proteína similar a SSN6 que está presente en su forma salvaje, y/o
- esencialmente ninguna proteína similar a SSN6 está presente en la célula de Pichia pastoris modificada, en donde se aplican las siguientes definiciones:
• el gen similar a ssn6 se define como que comprende la SEQ ID NO: 1,
• la secuencia de nucleótidos del gen similar a ssn6 se modifica mediante la introducción de una mutación puntual, una deleción parcial o completa o un reemplazo por una secuencia de nucleótidos diferente, y
• la célula de Pichia pastoris modificada, en comparación con su tipo salvaje sin modificar, se define como que exhibe una actividad proteica similar a SSN6 reducida o nula y/o función en la regulación de un promotor de l Lp , comprendiendo este promotor de LLP la SEQ ID NO: 133.
2. La célula de Pichia pastoris modificada de acuerdo con la reivindicación 1, en donde dicha célula de Pichia pastoris modificada exhibe una actividad de proteína similar a SSN6 reducida y/o una función reducida, o ninguna actividad de proteína similar a SSN6 y/o función en absoluto, en la regulación de la expresión de genes que están bajo el control del promotor de LLP.
3. La célula de Pichia pastoris modificada de acuerdo con cualquiera de las reivindicaciones precedentes, en donde dicha célula de tipo salvaje contiene una proteína similar a SSN6, proteína que comprende una o ambas de las secuencias de aminoácidos consenso representadas en SEQ ID NO: 63 y 64.
4. Una secuencia de polinucleótidos que comprende un gen similar a ssn6 modificado,
en donde se aplican las siguientes definiciones:
• el gen similar a ssn6 se define como que comprende la SEQ ID NO: 1,
• la secuencia de nucleótidos del gen similar a ssn6 se modifica mediante la introducción de una mutación puntual o una deleción parcial,
en donde, si dicha secuencia de polinucleótidos
(a) se introduce en un sistema de expresión adecuado y se intenta expresar, esencialmente no se expresa proteína similar a Ss N6 alguna, o
(b) se expresa en un sistema de expresión adecuado, se expresa una proteína similar a SSN6 que no ejerce su función de tipo salvaje y/o actividad de tipo salvaje, y/o
(c) se expresa en un sistema de expresión adecuado, se expresa una cantidad de proteína similar a SSN6 que difiere de la cantidad de proteína similar a SSN6 de tipo salvaje;
o
• la secuencia de polinucleótidos comprende la SEQ ID NO: 7.
5. Un vector de expresión que comprende un promotor, en donde dicho promotor se caracteriza porque se reprime en presencia de una proteína similar a SSN6 si dicho vector de expresión se introduce en un sistema de expresión adecuado, en donde la proteína similar a SSN6 se define como que comprende la secuencia de aminoácidos representada en la SEQ ID NO: 8, y
en donde dicho promotor es un promotor de LLP que comprende, preferiblemente consiste en SEQ ID NO: 133 o versiones modificadas de la misma, caracterizándose dichas versiones modificadas porque todavía exhiben la función del promotor, en donde LLP, que se define por la secuencia de nucleótidos representada en SEQ ID NO: 16, no es codificada por la secuencia de polinucleótidos de este vector de expresión.
6. El vector de expresión de acuerdo con la reivindicación 5, en donde dicho vector de expresión comprende, además, uno o más genes de interés que están bajo el control del promotor de LLP; preferiblemente, dicho gen o genes de interés se seleccionan del grupo que consiste en genes que codifican enzimas, anticuerpos o fragmentos de los mismos, hormonas, proteínas estructurales y antígenos proteicos que están presentes en vacunas.
7. La célula de Pichia pastoris de acuerdo con cualquiera de las reivindicaciones 1 a 3, que comprende el vector de expresión de acuerdo con la reivindicación 5 o 6.
8. La célula de Pichia pastoris modificada de acuerdo con cualquiera de las reivindicaciones 1 a 3, que comprende, además, un promotor tal como se define en la reivindicación 5 o 6, y/o
que comprende además (a) gen o genes de interés que están bajo el control del promotor tal como se define en la reivindicación 5 o 6, preferiblemente
en donde el gen o los genes de interés se seleccionan del grupo que consiste en genes que codifican enzimas, anticuerpos o fragmentos de los mismos, hormonas, proteínas estructurales y antígenos de proteínas que están presentes en las vacunas,
en donde la célula de Pichia pastoris modificada comprende además, opcionalmente, una proteína LLP que se expresa bajo el control de un promotor de LLP.
9. Uso de
(A) la célula de Pichia pastoris modificada,
(B) la secuencia de polinucleótidos, y/o
(C) el vector de expresión,
de acuerdo con cualquiera de las reivindicaciones 1 a 8,
en un método para expresar gen o genes de interés.
10. Uso de un promotor de LLP que comprende SEQ ID NO: 133 en un vector para la expresión de un gen de interés en una célula de Pichia pastoris modificada tal como se define en cualquiera de las reivindicaciones 1 a 3.
11. Uso de un vector de expresión de acuerdo con la reivindicación 5 para la expresión de un gen de interés en una célula de Pichia pastoris modificada tal como se define en cualquiera de las reivindicaciones 1 a 3.
12. Célula huésped que comprende un vector de expresión de acuerdo con la reivindicación 5 o 6.
13. Método para preparar una proteína recombinante mediante el uso de un vector de expresión tal como se define en la reivindicación 5 y/o una célula de Pichia pastoris modificada tal como se define en cualquiera de las reivindicaciones 1 a 3.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15157284 | 2015-03-03 | ||
PCT/EP2016/054478 WO2016139279A1 (en) | 2015-03-03 | 2016-03-02 | Constitutive yeast LLP promoter-based expression system |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2881279T3 true ES2881279T3 (es) | 2021-11-29 |
Family
ID=52596407
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES16707460T Active ES2881279T3 (es) | 2015-03-03 | 2016-03-02 | Sistema de expresión basado en promotor de LLP de levadura constitutivo |
Country Status (6)
Country | Link |
---|---|
US (2) | US11203620B2 (es) |
EP (2) | EP3265475B1 (es) |
KR (1) | KR20170118104A (es) |
ES (1) | ES2881279T3 (es) |
SG (1) | SG11201707056UA (es) |
WO (1) | WO2016139279A1 (es) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2965485T3 (es) * | 2017-08-23 | 2024-04-15 | Novartis Ag | Sistema de expresión de proteínas con múltiples copias génicas |
EP3794151A4 (en) * | 2018-05-17 | 2022-03-23 | Bolt Threads, Inc. | SEC-MODIFIED STRAINS FOR IMPROVED SECRETATION OF RECOMBINANT PROTEINS |
US11866714B2 (en) | 2018-06-07 | 2024-01-09 | Basf Se | Promoter for yeast |
CN108913732B (zh) * | 2018-07-31 | 2022-02-08 | 华东理工大学 | 一种莫纳可林j异源生产的方法及应用 |
CN111218406B (zh) * | 2020-01-10 | 2022-03-15 | 浙江工业大学 | 卷枝毛霉mf-8及其提高土茯苓中花旗松素含量的应用 |
WO2022130163A1 (en) * | 2020-12-14 | 2022-06-23 | Indian Institute Of Science | Nucleotide sequence, expression vectors, recombinant yeast cells and applications thereof |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2144696A (en) | 1937-06-25 | 1939-01-24 | Bendix Aviat Corp | Liquid level |
FR839628A (fr) | 1937-07-08 | 1939-04-07 | Perfectionnements apportés aux dispositifs pour préparer et répandre des mélanges de bitumes, goudrons ou huiles avec des matières pulvérulentes asphaltiques ou analogues | |
CH206979A (de) | 1937-08-17 | 1939-09-15 | Junghans Geb Ag | Uhrwerk mit Kronenaufzug und mit Zeigerstellvorrichtung. |
FR839630A (fr) | 1938-06-22 | 1939-04-07 | Metallurg D Aubrives & Villeru | Emballage pour corps creux ou autres applications similaires |
FR839631A (fr) | 1938-06-22 | 1939-04-07 | Perfectionnements aux machines pour l'extrusion ou filage à la presse | |
AU4055000A (en) * | 1999-04-13 | 2000-11-14 | Daniel K. Hsu | Galectin expression is induced in cirrhotic liver and hepatocellular carcinoma |
KR20100048224A (ko) | 2008-10-30 | 2010-05-11 | 삼성전자주식회사 | 갈락토오스의 대사 이용율을 증대시키는 유전자, 이를 포함하는 재조합 벡터 및 재조합 미생물 |
CA2853341A1 (en) * | 2011-10-28 | 2013-05-02 | Merck Sharp & Dohme Corp. | Engineered lower eukaryotic host strains for recombinant protein expression |
-
2016
- 2016-03-02 EP EP16707460.8A patent/EP3265475B1/en active Active
- 2016-03-02 SG SG11201707056UA patent/SG11201707056UA/en unknown
- 2016-03-02 KR KR1020177024609A patent/KR20170118104A/ko not_active Application Discontinuation
- 2016-03-02 US US15/554,552 patent/US11203620B2/en active Active
- 2016-03-02 WO PCT/EP2016/054478 patent/WO2016139279A1/en active Application Filing
- 2016-03-02 EP EP21171822.6A patent/EP3889169A1/en active Pending
- 2016-03-02 ES ES16707460T patent/ES2881279T3/es active Active
-
2021
- 2021-10-25 US US17/509,544 patent/US20220220161A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
KR20170118104A (ko) | 2017-10-24 |
SG11201707056UA (en) | 2017-09-28 |
EP3265475A1 (en) | 2018-01-10 |
EP3889169A1 (en) | 2021-10-06 |
US11203620B2 (en) | 2021-12-21 |
EP3265475B1 (en) | 2021-05-05 |
WO2016139279A1 (en) | 2016-09-09 |
US20220220161A1 (en) | 2022-07-14 |
US20180079788A1 (en) | 2018-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2881279T3 (es) | Sistema de expresión basado en promotor de LLP de levadura constitutivo | |
US20200347391A1 (en) | Promoter variants | |
ES2913825T3 (es) | Promotor regulable | |
US20100297738A1 (en) | Expression system | |
ES2962560T3 (es) | Célula fúngica con capacidad mejorada de producción de proteínas | |
EP2683732A1 (en) | Vector-host system | |
Schalén et al. | Effect of secretory pathway gene overexpression on secretion of a fluorescent reporter protein in Aspergillus nidulans | |
Shen et al. | Identification of a novel promoter for driving antibiotic-resistant genes to reduce the metabolic burden during protein expression and effectively select multiple integrations in Pichia Pastoris | |
US20120064630A1 (en) | Eukaryotic host cell comprising an expression enhancer | |
US20180327801A1 (en) | METHOD FOR PREPARING RECOMBINANT PROTEINS THROUGH REDUCTION OF rnpA GENE EXPRESSION | |
JP5997140B2 (ja) | 生産細胞株 | |
CN114410496A (zh) | 一种提高毕赤酵母外源蛋白产量的方法 | |
CN111718929B (zh) | 利用环形rna进行蛋白翻译及其应用 | |
WO2016173556A1 (zh) | 新型基因打靶方法 | |
Zavilgelsky et al. | Sequencing and comparative analysis of the lux operon of Photorhabdus luminescens strain Zm1: ERIC elements as putative recombination hot spots | |
WO2017163946A1 (ja) | 誘導型プロモーター | |
US20120094294A1 (en) | Bms1 protein expression system | |
KR101550217B1 (ko) | 숙주세포의 생체 회로 간섭 없이 외래 유전자를 발현하기 위한 재조합 벡터 및 이의 용도 | |
WO2024155597A1 (en) | Methods and compositions of co-expression of t7rna polymerase and inhibitory rna aptamers | |
Charlesantony et al. | Molecular analysis of translation initiation machinery involved in the recognition of UUG start codon in saccharomyces cerevisiae | |
JP5713286B2 (ja) | 二本鎖核酸の製造方法 | |
KR100541848B1 (ko) | 비특이적 DNA 결합단백질 dps와 목적 단백질을 대장균에서 동시에 발현시킴으로써 목적 단백질을생산하는 방법, 그에 사용되는 벡터 및 형질전환된 대장균 | |
US9273090B1 (en) | Heterologous expression of cellular adhesion molecules | |
Opitz | Analysis of the Asc1p/RACK1 microenvironment in Saccharomyces cerevisiae using proximity-dependent Biotin Identification (BioID) and high-resolution mass spectrometry | |
Inge-Vechtomov et al. | Anton A. Nizhnikov• Zalina M. Magomedova• Alexandr A. Rubel• Alexandra M. Kondrashkina• |