ES2750005T3 - Sistema de coexpresión inducible - Google Patents

Sistema de coexpresión inducible Download PDF

Info

Publication number
ES2750005T3
ES2750005T3 ES16201998T ES16201998T ES2750005T3 ES 2750005 T3 ES2750005 T3 ES 2750005T3 ES 16201998 T ES16201998 T ES 16201998T ES 16201998 T ES16201998 T ES 16201998T ES 2750005 T3 ES2750005 T3 ES 2750005T3
Authority
ES
Spain
Prior art keywords
expression
gene
host cell
promoter
cells
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16201998T
Other languages
English (en)
Inventor
Sean Mcclain
Mark Valasek
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Absci LLC
Original Assignee
Absci LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Absci LLC filed Critical Absci LLC
Application granted granted Critical
Publication of ES2750005T3 publication Critical patent/ES2750005T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/24Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against cytokines, lymphokines or interferons
    • C07K16/241Tumor Necrosis Factors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2803Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6424Serine endopeptidases (3.4.21)
    • C12N9/6429Thrombin (3.4.21.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/10Immunoglobulins specific features characterized by their source of isolation or production
    • C07K2317/14Specific host cells or culture conditions, e.g. components, pH or temperature
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • C07K2317/21Immunoglobulins specific features characterized by taxonomic origin from primates, e.g. man
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • C07K2317/24Immunoglobulins specific features characterized by taxonomic origin containing regions, domains or residues from different species, e.g. chimeric, humanized or veneered
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/90Immunoglobulins specific features characterized by (pharmaco)kinetic aspects or by stability of the immunoglobulin
    • C07K2317/92Affinity (KD), association rate (Ka), dissociation rate (Kd) or EC50 value
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/001Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
    • C12N2830/002Vector systems having a special element relevant for transcription controllable enhancer/promoter combination inducible enhancer/promoter combination, e.g. hypoxia, iron, transcription factor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0051Oxidoreductases (1.) acting on a sulfur group of donors (1.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y108/00Oxidoreductases acting on sulfur groups as donors (1.8)
    • C12Y108/01Oxidoreductases acting on sulfur groups as donors (1.8) with NAD+ or NADP+ as acceptor (1.8.1)
    • C12Y108/01007Glutathione-disulfide reductase (1.8.1.7), i.e. glutathione reductase (NADPH)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/21Serine endopeptidases (3.4.21)
    • C12Y304/21005Thrombin (3.4.21.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y503/00Intramolecular oxidoreductases (5.3)
    • C12Y503/04Intramolecular oxidoreductases (5.3) transposing S-S bonds (5.3.4)
    • C12Y503/04001Protein disulfide-isomerase (5.3.4.1), i.e. disufide bond-forming enzyme
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y603/00Ligases forming carbon-nitrogen bonds (6.3)
    • C12Y603/02Acid—amino-acid ligases (peptide synthases)(6.3.2)
    • C12Y603/02003Glutathione synthase (6.3.2.3)

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Slot Machines And Peripheral Devices (AREA)
  • Circuit Arrangement For Electric Light Sources In General (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

Una célula hospedadora de E. coli que comprende una supresión en el operón de araBAD que reduce el catabolismo de la arabinosa, una supresión en el operón de sbm-ygfDGH que elimina la función de uno o más genes implicados en la biosíntesis de 2-metilcitrato y en la que el promotor de araE nativo se ha reemplazado con un promotor constitutivo.

Description

DESCRIPCIÓN
Sistema de coexpresión inducible
Campo de la invención
La presente invención pertenece a los campos técnicos generales de la biología molecular y la fabricación biotecnológica. Más particularmente, la presente invención pertenece al campo técnico de la expresión de proteínas recombi­ nantes.
Antecedentes de la invención
La producción de sustancias biotecnológicas es un proceso complejo, más aún cuando el producto deseado es una combinación de moléculas codificadas por genes diferentes, tal como una proteína multímera formada a partir de dos o más polipéptidos diferentes. Una coexpresión con éxito de múltiples productos génicos requiere superar una serie de retos, que se ven agravados por la expresión simultánea de más de un producto génico. Los problemas que deben superarse incluyen la creación de vectores de expresión compatibles cuando se emplea más de un tipo de vector; la obtención de la relación estequiométrica correcta de los productos; la producción de productos génicos que se pliegan correctamente y con la conformación apropiada con respecto a las parejas de unión; la purificación de los productos deseados, alejados de células y proteínas no deseadas, tales como proteínas que se pliegan de forma incorrecta y/o que tienen una conformación incorrecta; y la reducción al mínimo de la formación de cuerpos de inclusión, como un aspecto para maximizar el rendimiento del o de los productos deseados. Se han adoptado muchos enfoques diferentes para hacer frente a estos retos, pero todavía existe una necesidad de métodos de coexpresión más adecuados.
Se han ideado diversos sistemas de expresión inducible de proteínas bacterianas, que incluyen plásmidos que con­ tienen los promotores lac y ara, para expresar proteínas individuales. Estos sistemas tienen una utilidad limitada en la coexpresión de proteínas difíciles de expresar, ya que no pueden inducir a las proteínas de forma homogénea en toda la población del cultivo en crecimiento en E. coli de tipo silvestre (Khlebnikov y Keasling, ""Effect of lacY expression on homogeneity of induction from the Ptac and Ptrc promoters by natural and synthetic inducers", Biotechnol Prog 2002 May-Jun; 18(3): 672- 674). Cuando la expresión de las proteínas de transporte para inductores es dependiente de la presencia de un inductor, como es el caso para los sistemas lac y ara de E. coli de tipo silvestre, la concentración celular del inductor debe alcanzar un nivel umbral para iniciar la producción de las proteínas de transporte, pero una vez que se ha alcanzado ese umbral, se puede producir un bucle de retroalimentación positiva descontrolado, en donde el resultado es un alto nivel de inductor en la célula y niveles elevados correspondientes de expresión desde los promotores inducibles: el fenómeno de "todo o nada". El aumento de la concentración del inductor en el medio de crecimiento aumenta la proporción de células en la población que está en modo de expresión elevada. Aunque este tipo de sistema da como resultado una inducción dependiente de la concentración de la expresión de proteínas a escala de población, es subóptimo para la expresión y la producción de proteínas que requieren un control estricto de la expresión, incluyendo las que son tóxicas, tienen una solubilidad inadecuada o requieren concentraciones especí­ ficas por otras razones.
Se han realizado algunos esfuerzos para abordar el fenómeno de inducción "todo o nada" en sistemas de expresión de un solo promotor, eliminando el transporte del inductor dependiente de inductor. Un ejemplo es tener una mutación nula en el gen de la lactosa permeasa (lacYam) y emplear un inductor alternativo del promotor lac, tal como IPTG (isopropil-tio-p-D-galactósido), que puede pasar a través de la membrana celular en cierto grado en ausencia de un transportador (Jensen et al., "The use of lac-type promoters in control analysis", Eur J Biochem 1993 Jan 15; 211(1-2): 181-191). Otro enfoque es el uso de un promotor inducible con arabinosa en una cepa que carece de los genes transportadores de arabinosa, pero que tiene una mutación en el gen de la lactosa permeasa, lacY(A117C), que le permite el transporte de arabinosa dentro de la célula (Morgan-Kiss et al., "Long-term and homogeneous regulation of the Escherichia coli araBAD promoter by use of a lactose transporter of relaxed specificity", Proc Natl Acad Sci U S A, 2002 May 28; 99(11): 7373-7377).
Los componentes de sistemas de expresión de proteínas individuales son frecuentemente incompatibles, lo que impide su uso en sistemas de coexpresión, ya que pueden verse afectados negativamente por los efectos de “comunicación cruzada” entre diferentes sistemas de inductor-promotor, o requieren modificaciones genómicas que se excluyen mu­ tuamente, o están sujetos a una regulación del metabolismo en general. Un intento de abordar el problema de “comu­ nicación cruzada” entre los sistemas de promotores inducibles lac y ara incluía un desarrollo dirigido del activador de la transcripción AraC para mejorar su capacidad para inducir el promotor araBAD en presencia de IPTG, un inductor del promotor lac (Lee et al., "Directed evolution of AraC for improved compatibility of arabinose- and lactose-inducible promoters", Appl Environ Microbiol 2007 Sep; 73(18): 5711-5715; Epub 20 de julio 2007). Sin embargo, la compatibi­ lidad entre vectores de expresión basados en los promotores inducibles lac y ara es todavía limitada debido a la necesidad de modificaciones genómicas mutuamente excluyentes: una mutación puntual de lacY (lacY(A117C)) para la inducción homogénea del promotor araBAD mediante arabinosa, y un gen lacY nulo para la inducción homogénea del promotor lac mediante IPTG. La regulación del metabolismo en general - por ejemplo, la represión por catabolito de carbono (CCR) - también puede afectar a la compatibilidad de los promotores inducibles. La CCR se caracteriza por la represión de genes necesarios para la utilización de un compuesto que contiene carbono cuando está presente un compuesto más preferido, como se observa en la utilización preferente de la glucosa antes que otros azúcares. En el caso de los sistemas de promotores inducibles ara y prp, la presencia de arabinosa reduce la capacidad del propionato para inducir la expresión a partir del promotor prpBCDE, un efecto que se cree que implica CCR (Park et al., "The mechanism of sugar-mediated catabolite repression of the propionate catabolic genes in Escherichia coli', Gene 2012 Aug 1; 504(1): 116-121, Epub 3 de mayo 20l2). Existe claramente una necesidad de un sistema de coexpresión inducible que supere estos problemas.
R. M. MORGAN-KISS, “Long-term and homogeneous regulation of the Escherichia coli araBAD promoter by use of a lactose transporter of relaxed specificity”, PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES, (20020528), vol. 99, n.° 11, doi:10.1073/pnas.122227599, ISSN 0027-8424, páginas 7373 - 7377 desvela la expresión de una GFP inestable en una célula hospedadora deficiente en araBAD, araE y araFGH y que tiene un LacY mutante.
En el documento EP 2386641, se describe un método que implica la coexpresión de una porina en la membrana externa del microorganismo a partir de un plásmido y una proteína de interés a partir de otro plásmido. Los plásmidos tienen diferentes promotores inducibles (propionato y arabinosa a través de pABAD).
S. K. LEE ET AL, “A Propionate-Inducible Expression System for Enteric Bacteria”, APPLIED AND ENVIRONMENTAL MICROBIOLOGY, (20051101), vol. 71, n.° 11, doi:10.1128/AEM.71.11.6856-6862.2005, ISSN 0099-2240, páginas 6856 - 6862 desvela vectores de expresión para la regulación de la expresión de genes en E. coli. Los vectores contienen el promotor de prpBCDE (PprpB) y prpR que codifica el regulador positivo de este promotor. El sistema se ensayó colocando el gen que codifica GFP bajo el control del PprpB inducible de E. coli.
JULIE LOBSTEIN ET AL, “SHuffle, a novel Escherichia coli protein expression strain capable of correctly folding disulfide bonded proteins in its cytoplasm”, MICROBIAL CELL FACTORIES, BIOMED CENTRAL, LONDRES, NL, (20120508), vol. 11, n.° 1, doi:10.1186/1475-2859-11-56, ISSN 1475-2859 desvela una cepa de expresión de proteína de E. coli denominada SHuffle que está basada en la cepa supresora de trxB gor SMG96. Sus rutas reductoras citoplasmáticas están disminuidas, lo que permite la formación de enlaces disulfuro en el citoplasma y ha integrado en su cromosoma una isomerasa de enlaces disulfuro sin secuencia señal, DsbC.
Compendio de la invención
La presente invención proporciona sistemas de coexpresión inducible, capaces de una inducción controlada de cada componente del producto génico.
En un primer aspecto, la invención proporciona una célula hospedadora de E. coli que comprende una supresión en el operón de araBAD que reduce el catabolismo de la arabinosa, una supresión en el operón de sbm-ygfDGH que elimina la función de uno o más genes implicados en la biosíntesis de 2-metilcitrato y en la que el promotor de araE nativo se ha reemplazado con un promotor constitutivo. El promotor constitutivo puede ser el promotor J23104.
En un segundo aspecto, la invención proporciona una célula SHuffle Express de E. coli modificada para comprender las alteraciones genómicas del primer aspecto de la invención.
En un tercer aspecto, la invención proporciona una célula hospedadora SHuffle Express de E. coli modificada para comprender una expresión en el operón de araBAD que reduce el catabolismo de la arabinosa y una supresión en el operón de sbm-ygfDGH que elimina la función de uno o más genes implicados en la biosíntesis de 2-metilcitrato. El promotor de araE nativo puede reemplazarse con un promotor constitutivo.
En un cuarto aspecto, la invención proporciona una célula hospedadora de E. coli que comprende una mutación de inactivación del operón de araBAD y un gen de metabolismo de proprionato inactivado, prpD, y que expresa una formación citoplasmática de la disulfuro isomerasa DsbC que carece de un péptido señal y caracterizada adicional­ mente por la expresión génica seleccionada del grupo que consiste en expresión de araE y araFGH de promotores constitutivos y la expresión de una mutación puntual en el gen lacY (A117C) en un fondo deficiente en araEFGH. La célula puede comprender además un operón de scpA-argK-scpBC inactivado. La célula puede tener un nivel reducido de función génica para el gen de tiorredoxina reductasa (trxB) y un gen seleccionado del grupo que consiste en el gen de la glutatión reductasa (gor) y el gen de la glutatión sintetasa (gshB). La célula puede expresar la sulfhidrilo oxidasa mitocondrial de levadura Erv1 p en el citoplasma de la célula hospedadora. La célula puede comprender dos vectores de expresión compatibles. En una realización, un vector de expresión comprende una secuencia polinucleotídica que codifica la cadena pesada de un anticuerpo de longitud completa y el otro vector de expresión comprende una se­ cuencia polinucleotídica que codifica la cadena ligera de un anticuerpo de longitud completa.
En un quinto aspecto, la invención proporciona un método para inducir la coexpresión de productos génicos que com­ prende aplicar L arabinosa y propionato a la célula hospedadora del cuarto aspecto de la invención. En una realización, se expresan cadenas de anticuerpos. Las cadenas de anticuerpo pueden formar enlaces disulfuro. En una realización se expresan proteínas en el citoplasma.
Se desvela en el presente documento una célula hospedadora que comprende dos o más tipos de estructuras artifi­ ciales de expresión, en donde la estructura artificial de expresión de cada tipo comprende un promotor inducible y una secuencia de polinucleótidos que codifica un producto génico, siendo dicha secuencia polinucleotídica para transcribir a partir del promotor inducible; en donde (1) al menos uno de dichos promotores inducibles es sensible a un inductor que no es un inductor de otro de dichos promotores inducibles; y al menos uno de dichos productos génicos forma un multímero con otro de dichos productos génicos; o (2) al menos uno de dichos productos génicos se selecciona a partir del grupo que consiste en: (a) un polipéptido que carece de un péptido señal y que forma al menos tres enlaces disulfuro; (b) un polipéptido seleccionado a partir del grupo que consiste en enzimas que utilizan arabinosa y xilosa; y (c) un polipéptido seleccionado a partir del grupo que consiste en peroxidasas que degradan lignina. También se desvela una célula hospedadora que comprende dos o más tipos de construcciones de expresión, en donde la cons­ trucción de expresión de cada tipo comprende un promotor inducible y una secuencia polinucleotídica que codifica un producto génico, siendo dicha secuencia polinucleotídica para transcribir a partir del promotor inducible; en donde cada promotor inducible no es un promotor inducible por lactosa; y en donde al menos uno de dichos productos génicos es un polipéptido que forma al menos dos enlaces disulfuro, o forma al menos dos y menos de diecisiete enlaces disulfuro, o forma al menos dos y menos de diez enlaces disulfuro, o forma un número de enlaces disulfuro seleccio­ nado a partir del grupo que consiste en dos, tres, cuatro, cinco, seis, siete, ocho y nueve. Esta célula hospedadora puede ser una célula procariota, y en algunos casos, es una célula de E. coli. Como alternativa, la célula hospedadora puede ser una célula eucariota, y en algunos casos se trata de una célula de levadura, y en algunos casos adicionales, es una célula de Saccharomyces cerevisiae. Las estructuras artificiales de expresión comprendidas en una célula hospedadora pueden comprender cada una al menos un promotor inducible, en donde el promotor inducible es un promotor inducible con L-arabinosa o un promotor inducible con propionato, o se selecciona a partir del grupo que consiste en: el promotor araBAD, el promotor prpBCDE, el promotor rhaSR y el promotor xylA, o en donde el promotor inducible no es un promotor inducible por lactosa. Al menos una estructura artificial de expresión comprendida en una célula hospedadora puede comprender además una secuencia de polinucleótidos que codifica un regulador transcripcional que se une a un promotor inducible; la secuencia de polinucleótidos que codifica un regulador transcripcional y el promotor inducible al que se une dicho regulador transcripcional, pueden estar en la misma estructura artificial de expresión; y en otros casos, el regulador de transcripcional se selecciona a partir del grupo que consiste en: AraC, PrpR, RhaR y XylR; o en particular es AraC o PrpR. Al menos una estructura artificial de expresión comprendida en una célula hospedadora se puede producir mediante un método que comprende una etapa de inserción de una se­ cuencia de polinucleótidos en un plásmido seleccionado a partir del grupo que consiste en: pBAD18, pBAD18-Cm, pBAD18-Kan, pBAD24, pBAD28, pBAD30, pBAD33, pPRO18, pPRO18-Cm, pPRO18-Kan, pPRO24, pPRO30 y pPRO33; o particularmente en pBAD24 o pPRO33. Otros ejemplos incluyen una célula hospedadora que comprende dos o más tipos de estructuras artificiales de expresión, en donde la estructura artificial de expresión de cada tipo comprende un promotor inducible y una secuencia de polinucleótidos que codifica un producto génico, en donde al menos un producto génico es un polipéptido, o se selecciona a partir del grupo que consiste en: (a) una cadena pesada de inmunoglobulina; (b) una cadena ligera de inmunoglobulina; y (c) un fragmento de cualquiera de (a) - (b), o es una cadena ligera de inmunoglobulina, o es una cadena pesada de inmunoglobulina; o es una cadena pesada o ligera de infliximab o un fragmento del mismo, o tiene una identidad de secuencia de aminoácidos de al menos 80% o 90% con SEQ ID N°: 30 o SEQ ID N°: 31 a lo largo de al menos 50% o 80% de la longitud de SEQ ID N°: 30 o SEQ ID N°: 31, respectivamente, o tiene la secuencia de aminoácidos de SEQ ID N°: 30 o SEQ ID N°: 31.
La célula hospedadora puede comprender dos o más tipos de construcciones de expresión, en donde la construcción de expresión de cada tipo comprende un promotor inducible y una secuencia polinucleotídica que codifica un producto génico, siendo dicha secuencia polinucleotídica para transcribir a partir del promotor inducible; en donde al menos un producto génico es un polipéptido que carece de un péptido señal y que forma al menos tres enlaces disulfuro, o al menos tres y menos de diecisiete enlaces disulfuro, o al menos dieciocho y menos de un centenar de enlaces disulfuro, o al menos tres y menos de diez enlaces disulfuro, o al menos tres y menos de ocho enlaces disulfuro; o forma una cantidad de enlaces disulfuro seleccionada a partir del grupo que consiste en tres, cuatro, cinco, seis, siete, ocho y nueve; o es un polipéptido seleccionado a partir del grupo que consiste en: (a) una cadena pesada de inmunoglobulina; (b) una cadena ligera de inmunoglobulina; (c) manganeso peroxidasa; y (d) un fragmento de cualquiera de (a) - (c); o es una cadena pesada o ligera de infliximab o un fragmento del mismo, o tiene al menos 80% o 90% de identidad de secuencia de aminoácidos con SEQ ID N°: 30 o SEQ ID N°: 31 a lo largo de al menos 50% o 80% de la longitud de SEQ ID N°: 30 o SEQ ID N°: 31, respectivamente, o tiene la secuencia de aminoácidos de SEQ ID N°: 30 o SEQ ID N°: 31; o tiene al menos 80% o 90% de identidad de secuencia de aminoácidos con SEQ ID N°: 13, SEQ ID N°: 15 o SEQ ID N°: 23 a lo largo de al menos 50% u 80% de la longitud de SEQ ID N°: 13, SEQ ID N°: 15 o SEQ ID N°: 23, respectivamente, o tiene la secuencia de aminoácidos de SEQ ID N°: 13, SEQ ID N°: 15 o SEQ ID N°: 23; o es un polipéptido seleccionado a partir del grupo que consiste en enzimas que utilizan arabinosa y xilosa - tal como xilosa isomerasa; o es un polipéptido seleccionado a partir del grupo que consiste en peroxidasas que degradan lignina, tales como manganeso peroxidasa o peroxidasa versátil.
Una célula hospedadora que comprende dos tipos de estructuras artificiales de expresión, y en ciertos casos, un tipo de estructura artificial de expresión se produce mediante un método que comprende una etapa de inserción de una secuencia de polinucleótidos en una secuencia de polinucleótidos de pBAD24, y el otro tipo de estructura artificial de expresión se produce mediante un método que comprende una etapa de inserción de una secuencia de polinucleótidos en una secuencia de polinucleótidos de pPRO33.
También se desvela en el presente documento una célula hospedadora que comprende dos o más tipos de construc­ ciones de expresión, en donde la construcción de expresión de cada tipo comprende un promotor inducible y en donde la célula hospedadora tiene una alteración de la función génica de al menos un gen que codifica una proteína trans­ portadora para un inductor de al menos uno de dichos promotores inducibles, y como otro ejemplo, en donde el gen que codifica la proteína transportadora se selecciona a partir del grupo que consiste en araE, araF, araG, araH, rhaT, xylF, xylG y xylH, o particularmente es araE. Se proporciona una célula hospedadora que comprende dos o más tipos de construcciones de expresión, en donde la construcción de expresión de cada tipo comprende un promotor inducible y en donde la célula hospedadora tiene un nivel reducido de función génica de al menos un gen que codifica una proteína que metaboliza un inductor de al menos uno de dichos promotores inducibles y, como ejemplos adicionales, en donde el gen que codifica una proteína que metaboliza un inductor de al menos uno de dichos promotores induci­ bles, se selecciona a partir del grupo que consiste en araA, araB, araD, prpB, prpD, rhaA, rhaB, rhaD, xylA y xylB. Como un ejemplo adicional, se proporciona una célula hospedadora que comprende dos o más tipos de construcciones de expresión, en donde la construcción de expresión de cada tipo comprende un promotor inducible, y en donde la célula hospedadora tiene un nivel reducido de función génica de al menos un gen que codifica una proteína implicada en la biosíntesis de un inductor de al menos uno de dichos promotores inducibles, que puede seleccionarse a partir del grupo que consiste en scpA/sbm, argK/ygfD, scpB/ygfG, scpC/ygfH, rmlA, rmlB, rmlC y rmlD.
También se desvela en el presente documento una célula hospedadora que comprende dos o más tipos de construc­ ciones de expresión, en donde la construcción de expresión de cada tipo comprende un promotor inducible, y en donde la célula hospedadora tiene una función génica alterada de un gen que afecta al entorno de reducción/oxidación del citoplasma de la célula hospedadora, el cual en algunos ejemplos se selecciona a partir del grupo que consiste en gor y gshB; o en donde la célula hospedadora tiene un nivel reducido de función génica de un gen que codifica una reductasa, que puede ser trxB; o en donde la célula hospedadora comprende al menos una estructura artificial de expresión que codifica al menos una proteína isomerasa de enlace disulfuro, que puede ser DsbC; o en donde la célula hospedadora comprende al menos un polinucleótido que codifica una forma de DsbC que carece de un péptido señal; o en donde la célula hospedadora comprende al menos un polinucleótido que codifica Erv1p.
Se proporciona una célula hospedadora que comprende dos o más tipos de construcciones de expresión, en donde la construcción de expresión de cada tipo comprende un promotor inducible, en donde la estructura artificial de expre­ sión de cada tipo comprende un promotor inducible, que no es un promotor inducible de la estructura artificial de expresión de cada otro tipo, o en donde la estructura artificial de expresión de cada tipo comprende un origen de replicación que es diferente del origen de replicación de la estructura artificial de expresión de cada otro tipo.
Como un ejemplo particular, se proporciona una célula hospedadora de E. coli, que comprende dos tipos de estructu­ ras artificiales de expresión, en donde un tipo de estructura artificial de expresión se produce por un método que comprende una etapa de inserción de una secuencia de polinucleótidos en una secuencia de polinucleótidos de pBAD24, y el otro tipo de estructura artificial de expresión se produce por un método que comprende una etapa de inserción de una secuencia de polinucleótidos en una secuencia de polinucleótidos de pPRO33; y en donde la célula hospedadora comprende además dos o más de los siguientes: (a) una deleción de los genes araBAD; (b) una función génica alterada de los genes araE y araFGH; (c) un gen lacY(A117C); (d) una función génica reducida de los genes prpB y prpD; (e) una función génica reducida de los genes sbm/scpA-ygfD/argK-ygfGH/scpBC, sin alterar la expresión del gen ygfI; (f) una función génica reducida de los genes gor y trxB; (g) una función génica reducida del gen AscG; (h) un polinucleótido que codifica una forma de DsbC que carece de péptido señal; e (i) un polinucleótido que codifica Erv1p, ChuA o una chaperona; y en ciertos ejemplos, la célula hospedadora comprende además al menos una estruc­ tura artificial de expresión que comprende una secuencia de polinucleótidos que codifica un producto génico, dicha secuencia de polinucleótidos que se transcribe a partir de un promotor inducible, y en algunos casos, el producto génico se selecciona a partir del grupo que consiste en: (a) una cadena pesada de inmunoglobulina; (b) una cadena ligera de inmunoglobulina; (c) manganeso peroxidasa; y (d) un fragmento de cualquiera de (a) - (c); o es una cadena pesada o ligera de infliximab o un fragmento del mismo, o tiene al menos 80% o 90% de identidad de secuencia de aminoácidos con SEQ ID N°: 30 o SEQ ID N°: 31 a lo largo de al menos 50% u 80% de la longitud de SEQ ID N°: 30 o SEQ ID N°: 31, respectivamente, o tiene la secuencia de aminoácidos de SEQ ID N°: 30 o SEQ ID N°: 31; o tiene al menos 80% o 90% de identidad de secuencia de aminoácidos con SEQ ID N°: 13, SEQ ID N°: 15 o SEQ ID N°: 23 a lo largo de al menos 50% o 80% de la longitud de SEQ ID N°: 13, SEQ ID N°: 15 o SEQ ID N°: 23, respectivamente, o tiene la secuencia de aminoácidos de SEQ ID N°: 13, SEQ ID N°: 15 o SEQ ID N°: 23; o es un polipéptido seleccionado a partir del grupo que consiste en enzimas que utilizan arabinosa y xilosa tales como la xilosa isomerasa; o es un polipéptido seleccionado a partir del grupo que consiste en peroxidasas que degradan lignina, tales como manganeso peroxidasa o peroxidasa versátil.
También se desvelan en el presente documento métodos para producir productos tales como hacer crecer un cultivo de una célula hospedadora de la invención como se ha descrito anteriormente; y añadir al cultivo un inductor de al menos un promotor inducible; también se proporciona un producto génico o un producto multímero producido por este método, y en algunos casos es un anticuerpo, o en casos más particulares, es un anticuerpo aglicosilado, un anticuerpo quimérico o un anticuerpo humano.
Los sistemas y métodos desvelados en el presente documento también proporcionan kits que comprenden una célula hospedadora, comprendiendo la célula hospedadora dos o más tipos de construcciones de expresión, en donde la construcción de expresión de cada tipo comprende un promotor inducible; y kits que comprende un producto génico o un producto multímero producido mediante el cultivo de una célula hospedadora desvelada en el presente documento y la adición de al menos un inductor al cultivo, en donde en algunos casos, el producto multímero es un anticuerpo, o en casos más particulares, es un anticuerpo aglicosilado, un anticuerpo quimérico o un anticuerpo humano.
Breve descripción de los dibujos
La Fig. 1 es una ilustración esquemática del sistema de coexpresión inducible, que incluye una célula hospedadora (1) que comprende dos vectores de expresión inducible diferentes (3) y (4), que expresan diferentes productos génicos después de la aplicación de inductores (5), formando un producto multímero (6).
La Fig. 2 es una ilustración esquemática de un uso particular del sistema de coexpresión inducible, en el que el genoma de la célula hospedadora E. coli (2) codifica una forma citoplásmica de la disulfuro isomerasa DsbC que carece de un péptido señal; el vector de expresión pBAD24 (3) proporciona una expresión inducible con L-arabinosa de una cadena pesada de inmunoglobulina, y el vector de expresión pPRO33 (4) proporciona una expresión inducible con propionato de una cadena ligera de inmunoglobulina; formando después de la inducción (5) el producto de anticuerpo multímero (6).
La Fig. 3 muestra el resultado de la coexpresión de las cadenas pesadas y ligeras de inmunoglobulina en células bacterianas. Las células SHuffle® Express y BL21 que contienen tanto los vectores de expresión inducible pBAD24-HC como pPRO33-LC, fueron inducidos mediante crecimiento en L-arabinosa y propionato. Extractos de proteínas solubles procedentes de células inducidas y controles no inducidos se separaron por electroforesis en gel de SDS en condiciones reductoras, sobre un gel de Bis-Tris al 4-12%. Carril 1: SHuffle® Express inducidas. Carril 2: SHuffle® Express no inducidas. Carril 3: BL21 inducidas. Carril 4: BL21 no inducidas. Las flechas indican una banda de proteína (la cadena pesada de IgG1) en 51 kDa y otra banda de proteína (cadena ligera de IgG1) en 26 kDa; estas bandas están presentes en las células inducidas, pero no en las células no inducidas.
La Fig. 4 muestra el resultado de la coexpresión de cadenas pesadas y ligeras de inmunoglobulina en células bacterianas. Los mismos extractos de proteínas solubles procedentes de células SHuffle® Express y BL21 inducidas y no inducidas que contenían tanto los vectores de expresión inducible pBAD24-HC como pPRO33-LC, tal como se ha descrito para la Figura 3, se separaron por electroforesis en gel en condiciones naturales (no reductoras) sobre un gel de Tris-glicina al 10-20%. Carril 1: SHuffle® Express inducidas. Carril 2: SHuffle® Express no inducidas. Carril 3: BL21 inducidas. Carril 4: BL21 no inducidas. La flecha indica una banda de proteína (anticuerpo IgG1 que comprende cadenas pesadas y ligeras) en 154 kDa; esta banda está presente en las células SHuffle® Express inducidas, pero se reduce significativamente o está ausente en las células BL21 inducidas y en las células no inducidas.
La Fig. 5 muestra el resultado de la coexpresión, en células bacterianas, de manganeso peroxidasa (MnP) y proteína disulfuro isomerasa (PDI) en presencia de grupos hemo. Las células SHuffle® Express que contenían tanto el vector de expresión inducible pPRO33-MnP-ChuA como pBAD24-PDI, fueron inducidas mediante el crecimiento en L-arabinosa y propionato. Extractos de proteínas solubles procedentes de células inducidas y no inducidas fueron separados por electroforesis en gel en condiciones reductoras en un gel de Bis-glicina al 10%.
Marcadores: Patrón de Bio-Rad Precision Plus Protein® (teñido previamente)
Carril 1: No se induce (sin hemina, sin propionato, sin arabinosa)
Carril 2: propionato 50 mM 0,002% de arabinosa
Carril 3: propionato 25 mM 0,002% de arabinosa
Carril 4: propionato 12,5 mM 0,002% de arabinosa
Carril 5: propionato 50 mM 0,01% de arabinosa
Carril 6: propionato 25 mM 0,01% de arabinosa
Carril 7: propionato 12,5 mM 0,01% de arabinosa
Carril 8: propionato 50 mM 0,05% de arabinosa
Carril 9: propionato 25 mM 0,05% de arabinosa
Carril 10: propionato 12,5 mM 0,05% de arabinosa
Las flechas indican las bandas de proteínas, MnP en 39 kDa y PDI en 53 kDa; estas bandas están presentes en las células SHuffle® Express más fuertemente bajo algunas de las condiciones de inducción, pero se reducen de manera significativa en las células no inducidas.
La Fig. 6 muestra el resultado de la coexpresión, en células bacterianas, de una forma madura alternativa de manga­ neso peroxidasa (MnP_FT) y proteína disulfuro isomerasa (PDI) en presencia de grupos hemo. Las células SHuffle® Express que contenían los vectores de expresión inducible pBAD24-MnP_FT-ChuA y pPRO33-PDI, fueron inducidos mediante el crecimiento en 0,1% de L-arabinosa y propionato 50 mM. Extractos de proteínas solubles procedentes de células no inducidas e inducidas fueron separados por electroforesis en gel en condiciones reductoras sobre un gel de Bis-glicina al 10%.
Carril 1: Marcadores del peso molecular
Patrón de Bio-Rad Precisión Plus Protein® (teñido previamente)
Carril 2: Coexpresión inducida (0,1% de L-arabinosa, propionato 50 mM)
Carril 3: Sin inducir (sin hemina, sin L-arabinosa, sin propionato)
Carril 4: Control inducido (no hay insertos que codifican proteínas)
Carril 5: Control no inducido (no hay insertos que codifican proteínas)
Descripción detallada de la invención
El problema de componentes de sistemas de coexpresión incompatibles se aborda con el desarrollo de sistemas de coexpresión bacteriana coordinados que utilizan sistemas de promotores compatibles, inducibles de forma homogé­ nea, situados en estructuras artificiales de expresión distintas y, en algunas realizaciones, activados por diferentes inductores. Las ventajas de la presente invención incluyen, sin limitación: 1) mejora de la compatibilidad de los com­ ponentes en el sistema de coexpresión inducible; 2) expresión inducible de productos génicos que juntos forman multímeros, u otras combinaciones de productos génicos (coexpresión de dos o más productos génicos); 3) mejora del control de la coexpresión de productos génicos mediante una inducción que se puede valorar independientemente; 4) mejora de la expresión de complejos de productos génicos y otros productos que son difíciles de expresar, tales como productos multímeros y productos que forman enlaces disulfuro; 5) optimización simplificada de la coexpresión de productos génicos.
Productos génicos coexpresados. Los sistemas de coexpresión inducible de la invención están diseñados para coex­ presar dos o más productos génicos diferentes que contribuyen a un producto deseado. El producto deseado puede ser un multímero, formado a partir de productos génicos coexpresados, o la coexpresión se puede utilizar para producir una combinación del producto deseado además de un producto o productos adicionales que ayudan en la expresión del producto deseado.
Un "producto multímero" se refiere a un conjunto de productos génicos que se ensamblan entre sí para llevar a cabo la función del producto multímero, y no se refiere a asociaciones transitorias entre productos génicos y otras moléculas, tales como enzimas modificadoras (cinasas, peptidasas y similares), chaperonas, transportadores, etc. En ciertas rea­ lizaciones de la invención, los productos multímeros son heteromultímeros. En muchas realizaciones, los productos génicos coexpresados serán polipéptidos que son subunidades de proteínas multímeras. Sin embargo, también es posible utilizar los sistemas de coexpresión inducible de la invención para coexpresar múltiples moléculas de ARN no codificante diferentes, o una combinación de polipéptido y productos génicos de ARN no codificante. Las moléculas de ARN no codificante, también denominadas ARN que no codifica proteínas (npcARN), ARN no mensajero (nmARN) y ARN funcional (fARN), incluyen muchos tipos diferentes de moléculas de ARN tales como microARNs que no son ARNs mensajeros y que, por lo tanto, no son moldes para la formación de polipéptidos a través de la traducción.
Muchos productos biológicamente importantes se forman a partir de combinaciones de diferentes cadenas de polipép­ tidos. Además de los anticuerpos y los fragmentos de anticuerpos, otros productos multímeros que se pueden producir por los métodos de coexpresión inducible de la invención, incluyen receptores acoplados a proteínas G y canales iónicos regulados por ligandos, tales como los receptores nicotínicos de acetilcolina, los receptores de g AbAa, los receptores de glicina, los receptores de serotonina, los receptores de glutamato y los receptores regulados por ATP, tales como los receptores de P2X. La neurotoxina botulínica (a menudo referida como BoTN, BTX o como una de sus formas disponibles en el mercado, BOTOX® (toxina botulínica tipo A)) se forma a partir de una cadena pesada y una cadena ligera, unidas por un enlace disulfuro (Simpson et al., "The role of the interchain disulfide bond in governing the pharmacological actions of botulinum toxin", J Pharmacol Exp Ther 2004 Mar; 308(3): 857-864, Epub 14 Nov 2003). Otro ejemplo de un producto formado a partir de diferentes cadenas de polipéptidos es la insulina, la cual en eucariotas se traduce primero como una sola cadena polipeptídica, se pliega y luego se escinde en última instancia en dos cadenas polipeptídicas unidas por enlaces disulfuro. Una producción eficaz de la neurotoxina botulínica o de insulina madura en una única célula hospedadora, son ejemplos de usos de los métodos de coexpresión inducible de la inven­ ción.
Los métodos de la invención están diseñados para producir productos génicos que han sido plegados y/o ensamblados correctamente en forma de productos funcionales, y que tienen un número deseado de enlaces disulfuro en los lugares deseados dentro de tales productos funcionales (que se pueden determinar por métodos tales como el del Ejemplo 11). El número de enlaces disulfuro para un producto génico tal como un polipéptido, es el número total de enlaces intramoleculares e intermoleculares formados por ese producto génico, cuando está presente en un producto funcional deseado. Por ejemplo, una cadena ligera de un anticuerpo de IgG humana normalmente tiene tres enlaces disulfuro (dos enlaces intramoleculares y un enlace intermolecular), y una cadena pesada de un anticuerpo de IgG humana, normalmente tiene siete enlaces disulfuro (cuatro enlaces intramoleculares y tres enlaces intermoleculares). En algu­ nas realizaciones, los productos génicos deseados se coexpresan con otros productos génicos, tales como chapero­ nas, que son beneficiosas para la producción del producto génico deseado. Las chaperonas son proteínas que ayudan al plegamiento no covalente o el desplegamiento, y/o el ensamblaje o desensamblaje de otros productos génicos, pero no se producen en las estructuras resultantes de productos génicos monómeros o multímeros, cuando las estructuras están realizando sus funciones biológicas normales (habiendo completado los procesos de plegamiento y/o ensam­ blaje). Las chaperonas se pueden expresar a partir de un promotor inducible o un promotor constitutivo dentro de un estructura artificial de expresión, o se pueden expresar a partir del cromosoma de la célula hospedadora; preferible­ mente, la expresión de proteína(s) chaperona(s) en la célula hospedadora tiene un nivel suficientemente alto para producir productos génicos coexpresados que están correctamente plegados y/o ensamblados en el producto deseado. Ejemplos de chaperonas presentes en células hospedadoras de E. coli son los factores de plegamiento DnaK/DnaJ/GrpE, DsbC/DsbG, GroEL/GroES, IbpA/IbpB, Skp, Tig (factor de activación) y FkpA, que han sido utiliza­ das para evitar la agregación proteica de proteínas citoplasmáticas o periplásmicas. DnaK/DnaJ/GrpE, GroEL/GroES y ClpB pueden actuar sinérgicamente para ayudar en el plegamiento de una proteína y, por lo tanto, la expresión de estas chaperonas en combinaciones ha mostrado ser beneficiosa para la expresión de proteínas (Makino et al., "Strain engineering for improved expression of recombinant proteins in bacteria", Microb Cell Fact 2011 May 14; 10: 32). Cuando se expresan proteínas eucariotas en células hospedadoras procariotas, una proteína chaperona eucariota, tal como una proteína disulfuro isomerasa (PDI) de la misma especie o de una especie eucariota relacionado, se coex­ presa o se coexpresa de forma inducible con el producto génico deseado en ciertas realizaciones de la invención.
Promotores inducibles. Lo siguiente es una descripción de promotores inducibles que se pueden emplear en estruc­ turas artificiales de expresión para la coexpresión de productos génicos, junto con algunas de las modificaciones genéticas que se pueden realizar en las células hospedadoras que contienen tales estructuras artificiales de expresión. Ejemplos de estos promotores inducibles y genes relacionados proceden, a menos que se especifique lo contrario, de la cepa MG1655 (depósito en la American Type Culture Collection ATCC 700926) de Escherichia coli (E. coli), que es una subcepa de E. coli K-12 (depósito en la American Type Culture Collection ATCC 10798). La Tabla 1 enumera las ubicaciones genómicas, en E. coli MG1655, de las secuencias de nucleótidos para estos ejemplos de promotores inducibles y genes relacionados. Una información adicional sobre los promotores, los genes y las cepas de E. coli descritas en este documento, se puede encontrar en muchas fuentes públicas, incluyendo el medio EcoliWiki en línea, ubicado en ecoliwiki.net.
Promotor de arabinosa. (Tal como se emplea en este documento, 'arabinosa' significa L-arabinosa). Diversos operones de E. coli implicados en la utilización de arabinosa son inducibles con arabinosa - araBAD, araC, araEy araFGH - pero las expresiones “promotor de arabinosa” y “promotor ara” se utilizan normalmente para designar el promotor araBAD. Se han empleado diversos términos adicionales para indicar el promotor araBAD de E. coli, tales como Para, ParaB, ParaBAD y Pbad. El uso en esta memoria de “promotor ara” o cualquiera de los términos alternativos proporcionados anteriormente, significa el promotor araBAD de E. coli. Como se puede observar a partir de la utilización de otro tér­ mino, “promotor araC-araBAD”, el promotor araBAD se considera que forma parte de un promotor bidireccional, en donde el promotor araBAD controla la expresión del operón araBAD en una dirección, y el promotor araC, en estrecha proximidad y en la cadena opuesta al promotor araBAD, que controla la expresión de la secuencia que codifica araC en la otra dirección. La proteína AraC es un regulador transcripcional tanto positivo como negativo del promotor ara­ BAD. En ausencia de arabinosa, la proteína AraC inhibe la transcripción desde Pbad, pero en presencia de arabinosa, la proteína AraC, que altera su conformación después de la unión a arabinosa, se convierte en un elemento regulador positivo que permite la transcripción desde Pbad. El operón araBAD codifica proteínas que metabolizan la L-arabinosa convirtiéndola, a través de los compuestos intermedios L-ribulosa y L-ribulosa-fosfato, en D-xilulosa-5-fosfato. Con el fin de maximizar la inducción de la expresión desde un promotor inducible con arabinosa, es útil eliminar o reducir la función de AraA, que cataliza la conversión de L-arabinosa a L-ribulosa y, opcionalmente, eliminar o reducir también la función de por lo menos una de AraB y AraD. Eliminar o reducir la capacidad de las células hospedadoras para disminuir la concentración eficaz de arabinosa en la célula, mediante la eliminación o la reducción de la capacidad de la célula para convertir la arabinosa en otros azúcares, permite que esté disponible más arabinosa para la inducción del promotor inducible con arabinosa. Los genes que codifican los transportadores que llevan la arabinosa dentro de la célula hospedadora, son araE, que codifica el simportador de protones y L-arabinosa de baja afinidad, y el operón araFGH, que codifica las subunidades de un transportador de L-arabinosa de la superfamilia ABC de alta afinidad. Otras proteínas que pueden transportar L-arabinosa dentro de la célula son ciertos mutantes de la lactosa permeasa LacY: las proteínas LacY(A177C) y LacY(A177V), que tienen un aminoácido cisteína o valina en lugar de alanina en la posición 177, respectivamente (Morgan-Kiss et al., "Long-term and homogeneous regulation of the Escherichia coli araBAD promoter by use of a lactose transporter of relaxed specificity", Proc Natl Acad Sci U S A 2002 May 28; 99(11): 7373-7377). Con el fin de conseguir una inducción homogénea de un promotor inducible con arabinosa, es útil realizar el transporte de arabinosa en la célula, independientemente de la regulación con arabinosa. Esto se puede lograr mediante la eliminación o la reducción de la actividad de las proteínas transportadoras AraFGH y la alteración de la expresión de araE, de modo que solo se transcribe a partir de un promotor constitutivo. La expresión constitutiva de araE se puede lograr mediante la eliminación o la reducción de la función del gen araE natural, y la introducción en la célula de una estructura artificial de expresión que incluye una secuencia que codifica la proteína AraE, expresada a partir de un promotor constitutivo. Alternativamente, en una célula que carece de la función AraFGH, el promotor que controla la expresión del gen araE cromosómico de la célula hospedadora, se puede cambiar desde un promotor inducible con arabinosa a un promotor constitutivo. De forma similar, como alternativas adicionales para la inducción homogénea de un promotor inducible con arabinosa, una célula hospedadora que carece de la función AraE puede tener cualquier secuencia funcional que codifica AraFGH presente en la célula expresada a partir de un promotor constitutivo. Como otra alternativa, es posible expresar tanto el gen araE como el operón araFGH a partir de promo­ tores constitutivos, mediante la sustitución de los promotores araE y araFGH naturales por promotores constitutivos en el cromosoma del hospedador. También es posible eliminar o reducir la actividad de los transportadores de arabinosa AraE y AraFGH, y en esa situación utilizar una mutación en la lactosa permeasa LacY que permite que esta proteína transporte arabinosa. Dado que la expresión del gen lacY no está regulada normalmente por arabinosa, el uso de un mutante de LacY, tal como LacY(A117C) o LacY(A177V), no dará lugar al fenómeno de inducción de 'todo o nada' cuando el promotor inducible con arabinosa se induce con la presencia de arabinosa. Debido a que la proteína LacY(A117C) parece ser más eficaz para el transporte de arabinosa dentro de la célula, el uso de polinucleótidos que codifican la proteína LacY(A117C) se prefiere el uso de polinucleótidos que codifican la proteína LacY(A117V).
Promotor de propionato. El "promotor de propionato" o "promotor prp" es el promotor para el operón prpBCDE de E. coli, y también se denomina PprpB. Del mismo modo que el promotor ara, el promotor prp forma parte de un promotor bidireccional, que controla la expresión del operón prpBCDE en una dirección, y con el promotor prpR controla la expresión de la secuencia que codifica prpR en la otra dirección. La proteína PrpR es el regulador transcripcional del promotor prp, y activa la transcripción desde el promotor prp cuando la proteína PrpR se une a 2-metilcitrato ("2-MC"). El propionato (también denominado propanoato) es el ion, CH3CH2COO', de ácido propiónico (o 'ácido propanoico'), y es el más pequeño de los ácidos 'grasos' que tienen la fórmula general H(CH2)nCOOH, que comparte ciertas propie­ dades de esta clase de moléculas: producir una capa aceitosa cuando se produce una precipitación salina con agua y tener una sal de potasio jabonosa. El propionato disponible comercialmente se vende generalmente como una sal de catión monovalente de ácido propiónico, tal como propionato de sodio (CH3CH2COONa), o como una sal de catión divalente, tal como propionato de calcio (Ca(CH3CH2COO)2). El propionato es permeable a membranas y se metaboliza a 2-MC por la conversión de propionato a propionil-CoA a través de PrpE (propionil-CoA sintetasa), y luego la conversión de propionil-CoA a 2-MC a través de PrpC (2-metilcitrato sintasa). Las otras proteínas codificadas por el operón prpBCDE, PrpD (2-metilcitrato deshidratasa) y PrpB (2-metilisocitrato liasa), están involucradas en un catabo­ lismo adicional de 2-MC en productos más pequeños, como piruvato y succinato. Con el fin de maximizar la inducción de un promotor inducible con propionato mediante propionato añadido al medio de crecimiento celular, es deseable, por lo tanto, disponer de una célula hospedadora con actividad PrpC y PrpE, para convertir el propionato en 2-MC, pero también que no tenga actividad PrpD o que esté reducida y, opcionalmente, también una actividad PrpB eliminada o reducida, para evitar que 2-MC sea metabolizado. Otro operón que codifica proteínas que participan en la biosíntesis de 2-MC es el operón scpA-argK-scpBC también denominado el operón sbm-ygfDGH. Estos genes codifican proteínas requeridas para la conversión de succinato en propionil-CoA, que luego se puede convertir en 2-MC a través de PrpC. La eliminación o la reducción de la función de estas proteínas podría eliminar una ruta paralela para la producción del inductor 2-MC y, por lo tanto, podría reducir los niveles de fondo de expresión de un promotor inducible con propionato, y aumentar la sensibilidad del promotor inducible con propionato para suministrar propionato de forma exógena. Se ha encontrado que una deleción de sbm-ygfD-ygfG-ygfH-ygfl, introducida en E. coli BL21(DE3) para crear la cepa JSB ("Lee y Keasling, "A propionate-inducible expression system for enteric bacteria", Appl Environ Microbiol 2005 Nov; 71(11): 6856-6862), era útil en la reducción de la expresión de fondo en ausencia de inductor suministrado de forma exógena, pero esta deleción también reducía la expresión general del promotor prp en la cepa JSB. Cabe señalar, sin embargo, que la deleción de sbm-ygfD-ygfG-ygfH-ygfl también afecta aparentemente a ygfl, que codifica un regulador transcripcional putativo de la familia LysR, con función desconocida. Los genes sbm-ygfDGH se transcriben como un operón, e ygfl se transcribe desde la hebra opuesta. Los extremos 3' de las secuencias que codifican ygfH y ygfl se solapan en unos pocos pares de bases, por lo que una deleción que elimina todo el operón sbm-ygfDGH, aparente­ mente elimina también la función que codifica ygfl. La eliminación o la reducción de la función de un subconjunto de los productos génicos de sbm-ygfDGH, tal como YgfG (también denominado ScpB, metilmalonil-CoA descarboxilasa), o la deleción de la mayoría del operón sbm-ygfDGH (o scpA-argK-scpBC), aunque deja suficiente del extremo 3' del gen ygfH (o scpC) de modo que la expresión de ygfl no se ve afectada, podría ser suficiente para reducir la expresión de fondo desde un promotor inducible con propionato, sin reducir el nivel máximo de expresión inducida.
Promotor de ramnosa. (Tal como se usa en este documento, 'ramnosa' significa L-ramnosa). El "promotor de ramnosa" o "promotor rha" o PrhaSR, es el promotor del operón rhaSR de E. coli. Al igual que los promotores ara y prp, el promotor rha forma parte de un promotor bidireccional, que controla la expresión del operón rhaSR en una dirección, y con el promotor rhaBAD controla la expresión del operón rhaBAD en la otra dirección. El promotor rha, sin embargo, tiene dos reguladores transcripcionales implicados en la modulación de la expresión: RhaR y RhaS. La proteína RhaR activa la expresión del operón rhaSR en presencia de ramnosa, mientras que la proteína RhaS activa la expresión de los operones catabólicos y de transporte de L-ramnosa, rhaBAD y rhaT, respectivamente (Wickstrum et al., "The AraC/XylS family activator RhaS negatively autoregulates rhaSR expression by preventing cyclic AMP receptor protein activation", J Bacteriol Jan 2010; 192(1): 225-232). Aunque la proteína RhaS también puede activar la expresión del operón rhaSR, de hecho RhaS autorregula negativamente esta expresión al interferir con la capacidad de la proteína receptora de AMP cíclico (CRP) para coactivar la expresión con RhaR a un nivel mucho mayor. El operón rhaBAD codifica las proteínas catabólicas de ramnosa RhaA (L-ramnosa isomerasa), que convierte L-ramnosa en L-ramnulosa; RhaB (ramnulocinasa), que fosforila la L-ramnulosa para formar L-ramnulosa-1-P; y RhaD (ramnulosa-1-fosfato aldolasa), que convierte L-ramnulosa-1-P a L-lactaldehído y DHAP (fosfato de dihidroxiacetona). Para maximizar la canti­ dad de ramnosa en la célula disponible para una inducción de la expresión desde un promotor inducible con ramnosa, es deseable reducir la cantidad de ramnosa que se descompone por catálisis, eliminando o reduciendo la función de RhaA, u opcionalmente de RhaA y al menos una de Rhab y RhaD. Las células de E. coli también pueden sintetizar L-ramnosa a partir de alfa-D-glucosa-1-P a través de las actividades de las proteínas Rm1A, Rm1B, Rm1C y Rm1D (también denominadas RfbA, RfbB, RfbC y RfbD, respectivamente) codificadas por el operón rmlBDACX (o rfbB-DACX). Para reducir la expresión de fondo de un promotor inducible con ramnosa, y para mejorar la sensibilidad de la inducción del promotor inducible con ramnosa a través de ramnosa suministrada de forma exógena, puede ser útil eliminar o reducir la función de una o varias de las proteínas Rm1A, Rm1B, Rm1C y Rm1D. L-ramnosa se transporta dentro de la célula a través de RhaT, la permeasa de ramnosa o el simportador de L-ramnosa:protón. Como se ha señalado anteriormente, la expresión de RhaT se activa a través del regulador transcripcional RhaS. Para hacer que la expresión de RhaT sea independiente de la inducción con ramnosa (que induce la expresión de RhaS), la célula hospedadora puede ser alterada de modo que todas las secuencias que codifican RhaT funcional en la célula, se expresen a partir de promotores constitutivos. Además, las secuencias que codifican RhaS se pueden delecionar o inactivar, de modo que no se produce RhaS funcional. Mediante la eliminación o la reducción de la función de RhaS en la célula, el nivel de expresión a partir del promotor rhaSR se incrementa debido a la ausencia de una autorregula­ ción negativa a través de RhaS, y el nivel de expresión del operón catalítico de ramnosa rhaBAD se reduce, aumen­ tando aún más la capacidad de la ramnosa para inducir la expresión a partir del promotor rha.
Promotor de xilosa. (Tal como se usa en este documento, 'xilosa' significa D-xilosa). El promotor de xilosa, o “promotor xyl” o PxylA, significa el promotor para el operón xylAB de E. coli. La región promotora de xilosa es similar en la organi­ zación a otros promotores inducibles, en donde el operón xylAB y el operón xylFGHR se expresan ambos a partir de promotores adyacentes inducibles con xilosa, en direcciones opuestas sobre el cromosoma de E. coli (Song y Park, "Organization and regulation of the D-xylose operons in Escherichia coli K-12: XylR acts as a transcriptional activator", J Bacteriol. Nov 1997; 179(22): 7025-7032). El regulador transcripcional tanto del promotor PxylA como PxylF es XylR, que activa la expresión de estos promotores en presencia de xilosa. El gen xylR se expresa ya sea como parte del operón xylFGHR o a partir de su propio promotor débil, que no es inducible con xilosa, situado entre las secuencias que codifican proteínas xylH y xylR. La D-xilosa se cataboliza con XylA (D-xilosa isomerasa), que convierte D-xilosa en D-xilulosa, que luego se fosforila con XylB (xilulocinasa) para formar D-xilulosa-5-P. Para maximizar la cantidad de xilosa en la célula, disponible para una inducción de la expresión a partir de un promotor inducible con xilosa, es deseable reducir la cantidad de xilosa que se descompone por catálisis, mediante la eliminación o la reducción de la función de al menos XylA, u opcionalmente tanto de XylA como de XylB. El operón xylFGHR codifica XylF, XylG y XylH, las subunidades de un transportador de alta afinidad de D-xilosa de la superfamilia ABC. El gen xylE, que codifica el simportador de xilosa-protón de baja afinidad de E. coli, representa un operón distinto, cuya expresión también es inducible con xilosa. Para hacer que la expresión de un transportador de xilosa sea independiente de la inducción con xilosa, la célula hospedadora puede ser alterada de modo que todos los transportadores de funcionales de xilosa se expresen a partir de promotores constitutivos. Por ejemplo, el operón xylFGHR se podría modificar de manera que se delecionen las secuencias que codifican xylFGH, dejando a XylR como la única proteína activa expresada a partir del promotor inducible con xilosa PxylF, y en donde la secuencia que codifica xylE se expresa a partir de un promotor constitutivo, en lugar de su promotor natural. Como otro ejemplo, la secuencia que codifica xylR se expresa a partir del promotor PxylA o el promotor PxylF en una estructura artificial de expresión, mientras que el operón xylFGHR se deleciona y xylE se expresa constitutivamente o, alternativamente, un operón xylFGH (que carece de la secuencia que codifica xylR ya que está presente en una estructura artificial de expresión) se expresa a partir de un promotor cons­ titutivo y la secuencia que codifica xylE se deleciona o se altera de manera que no produce una proteína activa.
Promotor de lactosa. La expresión "promotor de lactosa" se refiere al promotor inducible con lactosa para el operón lacZYA, un promotor que también se denomina lacZp1; este promotor de lactosa se encuentra en aprox. 365603 -365568 (cadena negativa, con el sitio de unión a la polimerasa de ARN ("-35 ') sitio a aprox. 365603 - 365598, la caja de Pribnow ('-10') a 365579 - 365573, y un sitio de iniciación de la transcripción a 365567) en el secuencia genómica de la subcepa MG1655 de E. coli K-12 (Secuencia de referencia en NCBI NC_000913.2, 11-ENE-2012). En algunas realizaciones, los sistemas de coexpresión inducibles de la invención pueden comprender un promotor inducible por lactosa tal como el promotor de lacZYA. En otras realizaciones, los sistemas de coexpresión inducibles de la invención comprenden uno o más promotores inducibles que no son promotores inducibles por lactosa.
Tabla 1. Ubicaciones genómicas de promotores y genes relacionados inducibles de E. coli [1]
Figure imgf000010_0001
Figure imgf000011_0001
Figure imgf000012_0001
Figure imgf000013_0001
Notas para la Tabla 1:
[1] Todas las ubicaciones de secuencias genómicas se refieren a la secuencia genómica de la subcepa MG1655 de E. coli K-12, proporcionada por el Centro Nacional de Información Biotecnológica (NCBI) como Referencia de Secuen­ cia NCBI NC_000913.2, 11-ENE-2012.
[2] La ubicación del extremo 5' (o “aguas arriba”) de la región promotora es aproximada; para los promotores “bidireccionales”', una ubicación de la secuencia de nucleótidos que es aproximadamente equidistante entre los sitios de inicio de la transcripción se selecciona como el “'extremo” 5' designado para ambos promotores individuales. En la práctica, la porción de promotor de una estructura artificial de expresión puede tener algo menos de secuencia en su extremo 5' que las secuencias promotoras, tal como se indica en la tabla, o puede tener una secuencia de nucleótidos que incluye una secuencia adicional desde la región 5' (o “aguas arriba”) de las secuencias promotoras tal como se indica en la tabla, a la vez que conserva la capacidad de favorecer la transcripción de una secuencia codificante aguas abajo, de una manera inducible.
[3] Smith y Schleif, “Nucleotide sequence of the L-arabinose regulatory region of Escherichia coli K12”, J Biol Chem 1978 Oct. 10; 253(19): 6931-6933.
[4] 'ARN pol' indica ARN polimerasa a lo largo de la tabla.
[5] Miyada, et al., “DNA sequence of the araC regulatory gene from Escherichia coli B/r”, Nucleic Acids Res 1980 Nov.
25; 8(22): 5267-5274.
[6] Stoner y Schleif, “E. coli araE regulatory region araE codes for the low affinity L-arabinose uptake protein”, Número de registro de la base de datos de GenBank X00272.1, fecha de revisión 6 JUL. 1989.
[7] Hendrickson et al., “Sequence elements in the Escherichia coli araFGH promoter”, J Bacteriol 1992 Nov; 174(21): 6862-6871.
[8] Documento de patente de EE.UU. n° 8178338 B2; 15 de Mayo, 2012; Keasling, Jay; Figura 9.
[9] Wickstrum et al., “The AraC/XylS family activator RhaS negatively autoregulates rhaSR expression by preventing cyclic AMP receptor protein activation”, J Bacteriol 2010 Jan; 192(1): 225-232.
[10] Vía et al., “Transcriptional regulation of the Escherichia coli rhaT gene”, Microbiology 1996 Jul; 142(Pt 7): 1833­ 1840.
[11] Song y Park, “Organization and regulation of the D-xylose operons in Escherichia coli K-12: XylR acts as a tran­ scriptional activator”, J Bacteriol. 1997 Nov; 179(22): 7025-7032.
[12] Davis y Henderson, “The cloning and DNA sequence of the gene xylE for xylose-proton symport in Escherichia coli K12”, J Biol Chem 1987 Oct 15; 262(29): 13928-13932.
Estructuras artificiales de expresión. Las estructuras artificiales de expresión son polinucleótidos diseñados para la expresión de uno o varios productos génicos de interés y, por lo tanto, no son moléculas presentes en la naturaleza. Las estructuras artificiales de expresión se pueden integrar en un cromosoma de la célula hospedadora, o mantenerse dentro de la célula hospedadora como moléculas de polinucleótidos que se replican independientemente del cromo­ soma de la célula hospedadora, tales como plásmidos o cromosomas artificiales. Un ejemplo de una estructura artificial de expresión es un polinucleótido resultante de la inserción de una o varias secuencias de polinucleótidos en un cromosoma de la célula hospedadora, en donde las secuencias de polinucleótidos insertadas alteran la expresión de las secuencias que codifican cromosomas. Un vector de expresión es una estructura artificial de expresión plasmídica, utilizada específicamente para la expresión de uno o varios productos génicos. Una o varias estructuras artificiales de expresión se pueden integrar en un cromosoma de la célula hospedadora o se pueden mantener en un polinucleótido extracromosómico, tal como un plásmido o un cromosoma artificial. Las siguientes son descripciones de los tipos particulares de secuencias de polinucleótidos que se pueden utilizar en estructuras artificiales de expresión para la coexpresión de productos génicos.
Orígenes de replicación. Las estructuras artificiales de expresión deben comprender un origen de replicación, también denominado replicón, con el fin de mantenerse dentro de la célula hospedadora como polinucleótidos que se replican independientemente. Diferentes replicones que utilizan el mismo mecanismo para la replicación, no se pueden man­ tener juntos en una única célula hospedadora a lo largo de divisiones celulares repetidas. Como resultado de ello, los plásmidos se pueden clasificar en grupos de incompatibilidad en función del origen de replicación que contienen, como se muestra en la Tabla 2.
Tabla 2. Orígenes de replicación y plásmidos representativos para uso en estructuras artificiales de expresión [1]
Figure imgf000014_0001
Notas para la Tabla 2:
[1] Adaptado de www.bio.davidson.edu/courses/Molbio/Protocols/ORIs.html, y Sambrook y Russell, "Molecular Cloning: A Laboratory Manual", 3' Ed., Cold Spring Harbor Laboratory Press, 2001.
[2] Kües y Stahl, "Replication of plasmids in gram-negative bacteria", Microbiol Rev 1989 Dec; 53(4): 491-516.
[3] El plásmido pPRO33 (documento de Patente de Estados Unidos n° 8178338 B2, 15 mayo de 2012; Keasling, Jay) está disponible en Addgene (www.addgene.org) como plásmido 17810 de Addgene.
[4] openwetware.org/wiki/CH391L/S12/Origins_of_Replication; visitada 03 Ago de 2013.
Los orígenes de replicación se pueden seleccionar para uso en estructuras artificiales de expresión basándose en el grupo de incompatibilidad, el número de copias y/o el tipo de hospedador, entre otros criterios. Como se ha descrito anteriormente, si dos o más estructuras artificiales de expresión diferentes se van a utilizar en la misma célula hospedadora para la coexpresión de múltiples productos génicos, lo mejor es que las diferentes estructuras artificiales de expresión contengan orígenes de replicación procedentes de diferentes grupos de incompatibilidad: un replicón pMB1 en una estructura artificial de expresión y un replicón p15A en otra, por ejemplo. El número promedio de copias de una estructura artificial de expresión en la célula, en relación con el número de moléculas de cromosomas del hospe­ dador, se determina por el origen de replicación contenido en esa estructura artificial de expresión. El número de copias puede variar desde unas pocas copias por célula a varios cientos (Tabla 2). En una realización de la invención, se emplean diferentes estructuras artificiales de expresión que comprenden promotores inducibles que se activan con el mismo inductor, pero que tienen diferentes orígenes de replicación. Mediante la selección de orígenes de replicación que conservan cada estructura artificial de expresión diferente en un cierto número de copias aproximado en la célula, es posible ajustar los niveles de producción total de un producto génico expresado a partir de una estructura artificial de expresión, en relación con otro producto génico expresado a partir de una diferente estructura artificial de expresión. A modo de ejemplo, para coexpresar subunidades A y B de una proteína multímera, se crea una estructura artificial de expresión que comprende el replicón colE1, el promotor ara y una secuencia codificadora de la subunidad A ex­ presada a partir del promotor ara: 'colE1-Para-A'. Otra estructura artificial de expresión se crea de modo que comprenda el replicón p15A, el promotor ara y una secuencia codificadora de la subunidad B: 'p15A-Para-B'. Estas dos estructuras artificiales de expresión se pueden mantener juntas en las mismas células hospedadoras, y la expresión de ambas subunidades A y B se induce mediante la adición de un inductor, arabinosa, al medio de crecimiento. Si el nivel de expresión de la subunidad A se tiene que aumentar significativamente en relación con el nivel de expresión de la subunidad B, con el fin de que la relación estequiométrica de las cantidades expresadas de las dos subunidades se acerque a una proporción deseada, por ejemplo, se podría crear una nueva estructura artificial de expresión para la subunidad A, que tenga un replicón pMB1 modificado como se encuentra en el origen de replicación del plásmido pUC9 ('pUC9ori'): pUC9ori-Para-A. Expresar la subunidad A a partir de una estructura artificial de expresión con un número elevado de copias, tal como pUC9ori-Para-A, debe aumentar la cantidad de subunidad A producida, en relación con la expresión de la subunidad B desde p15A-Para-B. De manera similar, el uso de un origen de replicación que conserva estructuras artificiales de expresión con un número de copias inferior, tal como pSC101, podría reducir el nivel general de un producto génico expresado a partir de esa estructura artificial. La selección de un origen de repli­ cación también puede determinar qué células hospedadoras pueden mantener una estructura artificial de expresión que comprenda ese replicón. Por ejemplo, estructuras artificiales de expresión que comprenden el origen de replica­ ción colE1 tienen un margen relativamente reducido de hospedadores disponibles, las especies dentro de la familia Enterobacteriaceae, cuyas estructuras artificiales de expresión que comprenden el replicón RK2, se pueden mantener en E. coli, Pseudomonas aeruginosa, Pseudomonas putida, Azotobacter vinelandii y Alcaligenes eutrophus, y si una estructura artificial de expresión comprende el replicón RK2 y algunos genes reguladores procedentes del plásmido RK2, se puede mantener en células hospedadoras tan diversas como Sinorhizobium meliloti, Agrobacterium tumefaciens, Caulobacter crescentus, Acinetobacter calcoaceticus y Rhodobacter sphaeroides (Kues y Stahl, "Replication of plasmids in gram-negative bacteria", Microbiol Rev 1989 Dec; 53(4): 491-516).
Consideraciones similares se pueden emplear para crear estructuras artificiales de expresión para la coexpresión inducible en células eucariotas. Por ejemplo, el plásmido circular de 2 micras de Saccharomyces cerevisiae es com­ patible con plásmidos de otras cepas de levadura, tales como pSR1 (depósito de la ATCC n° 48233 y 66069; Araki et al., "Molecular and functional organization of yeast plasmid pSR1", J Mol Biol 20 Mar 1985; 182(2): 191-203) y pKD1 (depósito de la ATCC n° 37519; Chen et al., "Sequence organization of the circular plasmid pKD1 from the yeast Kluyveromyces drosophilarum", Nucleic Acids Res 11 Jun 1986; 14(11): 4471-4481).
Marcadores seleccionables. Las estructuras artificiales de expresión generalmente comprenden un gen de selección, también denominado un marcador seleccionable, que codifica una proteína necesaria para la supervivencia o el cre­ cimiento de células hospedadoras en un medio de cultivo selectivo. Las células hospedadoras que no contienen la estructura artificial de expresión que comprende el gen de selección, no sobrevivirán en el medio de cultivo. Los genes de selección típicos codifican proteínas que confieren resistencia a antibióticos u otras toxinas, o que complementan deficiencias auxotróficas de la célula hospedadora. Un ejemplo de un esquema de selección utiliza un fármaco, tal como un antibiótico, para detener el crecimiento de una célula hospedadora. Aquellas células que contienen una es­ tructura artificial de expresión que comprende el marcador seleccionable, producen una proteína que confiere resis­ tencia al fármaco y sobreviven al régimen de selección. Algunos ejemplos de antibióticos que se utilizan comúnmente para la selección de marcadores seleccionables (y abreviaturas que indican genes que proporcionan fenotipos de resistencia a antibióticos) son: ampicilina (AmpR), cloranfenicol (CmlR o CmR), kanamicina (KanR), espectinomicina (SpcR), estreptomicina (StrR) y tetraciclina (TetR). Muchos de los plásmidos representativos de la Tabla 2 comprenden marcadores seleccionables, tales como pBR322 (AmpR, TetR); pMOB45 (CmR, TetR); pACYC177 (AmpR, KanR); y pGBMI (SpcR, StrR). La región del promotor natural para un gen de selección, generalmente se incluye junto con la secuencia que codifica su producto génico, como parte de una porción de marcador seleccionable de una estructura artificial de expresión. Alternativamente, la secuencia que codifica el gen de selección se puede expresar a partir de un promotor constitutivo.
Promotor inducible. Como se describe en el presente documento, existen varios promotores inducibles diferentes que se pueden incluir en estructuras artificiales de expresión como parte de los sistemas de coexpresión inducible de la invención. Los promotores inducibles preferidos comparten al menos 80% de identidad de secuencia de polinucleótidos (más preferiblemente, al menos 90%) de identidad y lo más preferiblemente, al menos 95% de identidad) con al menos 30 (más preferiblemente, al menos 40 y lo más preferiblemente, al menos 50) bases contiguas de una secuen­ cia de polinucleótidos de promotor, tal como se definen en la Tabla 1, en función de la secuencia genómica de la subcepa MG1655 de E. coli K-12, en donde el porcentaje de identidad de secuencia de los polinucleótidos se deter­ mina usando los métodos del Ejemplo 13. Por condiciones de inducción “convencionales” (véase el Ejemplo 5), los promotores inducibles preferidos tienen al menos 75% (más preferiblemente, al menos 100%, y lo más preferible­ mente, al menos 110%) de la fuerza del promotor inducible de “tipo silvestre” correspondiente de la subcepa MG1655 de E. coli K-12, como se determina utilizando el método de PCR cuantitativa de De Mey et al. (Ejemplo 8). Dentro de la estructura artificial de expresión, un promotor inducible se coloca en 5' (o “aguas arriba de”) la secuencia que codifica el producto génico que se va a expresar de manera inducible, por lo que la presencia del promotor inducible dirigirá la transcripción de la secuencia que codifica el producto génico en dirección 5' a 3' con respecto a la cadena codificante del polinucleótido que codifica el producto génico.
Sitio de unión al ribosoma. Para los productos génicos de polipéptidos, la secuencia de nucleótidos de la región entre el sitio de iniciación de la transcripción y el codón de iniciación de la secuencia codificante del producto génico que se va a expresar de manera inducible se corresponde con la región 5' no traducida ('UTR') del ARNm para el producto génico del polipéptido. Preferiblemente, la región de la estructura artificial de expresión que se corresponde con la UTR 5', comprende una secuencia de polinucleótidos similar al sitio de unión a ribosoma de consenso (RBS, también llamado la secuencia de Shine-Dalgarno) que se encuentra en las especies de la célula hospedadora. En procariotas (arqueas y bacterias), la secuencia de consenso de RBS es GGAGG o GGAGGU, y en bacterias tales como E. coli, la secuencia de consenso de RBS es AGGAGG o AGGAGGU. El RBS se separa normalmente del codón de iniciación por 5 a 10 nucleótidos intermedios. En estructuras artificiales de expresión, la secuencia de RBS es preferiblemente al menos 55% idéntica a la secuencia de consenso AGGAGGU, más preferiblemente al menos 70% idéntica, y lo más preferiblemente al menos 85% idéntica, y se separa del codón de iniciación por 5 a 10 nucleótidos intermedios, más preferentemente por 6 a 9 nucleótidos intermedios, y lo más preferiblemente por 6 o 7 nucleótidos intermedios. La capacidad de un determinado RBS para producir una tasa de iniciación de la traducción deseable se puede calcular en el sitio web salis.psu.edu/software/RBSLibraryCalculatorSearchMode, usando la calculadora RBS; la misma herra­ mienta se puede utilizar para optimizar un RBS sintético para una tasa de traducción a lo largo de un margen de 100.000 veces (Salis, "The ribosome binding site calculator", Methods Enzymol 2011; 498: 19-42).
Sitio de clonación múltiple. Un sitio de clonación múltiple (MCS), también denominado un polienlazador, es un polinu­ cleótido que contiene múltiples sitios de restricción próximos o solapados entre sí. Los sitios de restricción en el MCS se presentan normalmente una vez dentro de la secuencia de MCS, y preferiblemente no aparecen dentro del resto del plásmido u otra estructura artificial de polinucleótidos, permitiendo que las enzimas de restricción corten el plásmido u otra estructura artificial de polinucleótidos solo dentro del MCS. Los ejemplos de secuencias de MCS son los de la serie pBAD de vectores de expresión, que incluyen pBAD18, pBAD18-Cm, pBAD18-Kan, pBAD24, pBAD28, pBAD30 y pBAD33 (Guzman et al., "Tight regulation, modulation, and high-level expression by vectors containing the arabinose PBAD promoter", J Bacteriol 1995 Jul; 177(14): 4121-4130); o los de la serie pPRO de vectores de expresión obtenidos a partir de los vectores pBAD, tales como pPRO18, pPRO18-Cm, pPRO18-Kan, pPRO24, pPRO30 y pPRO33 (docu­ mento de Patente de e E.UU. n° 8178338 B2; 15 de mayo 2012; Keasling, Jay). Un sitio de clonación múltiple se puede utilizar en la creación de una estructura artificial de expresión: mediante la colocación de un sitio de clonación múltiple en 3' (o aguas abajo) de una secuencia de promotor, el MCS se puede utilizar para insertar la secuencia que codifica un producto génico que se va a coexpresar en la estructura artificial, en la ubicación correcta en relación con el pro­ motor, de modo que se produzca la transcripción de la secuencia codificante. Dependiendo de qué enzima de restric­ ción se utiliza para cortar dentro del MCS, puede haber alguna parte de la secuencia de MCS que permanezca dentro de la estructura artificial de expresión después de que se inserte la secuencia codificante u otra secuencia de polinu­ cleótidos en la estructura artificial de expresión. Cualquier secuencia de MCS que permanezca, puede ser aguas arriba o aguas abajo, o en ambos lados de la secuencia insertada. Un sitio de unión al ribosoma se puede colocar aguas arriba del m Cs , preferiblemente inmediatamente adyacente, o separado del MCS por solo unos pocos nucleótidos, en cuyo caso el r Bs estará aguas arriba de cualquier secuencia codificante insertada en el MCS. Otra alternativa es incluir un sitio de unión al ribosoma dentro del MCS, en cuyo caso la elección de las enzimas de restricción usadas para cortar dentro del MCS, determinará si el RBS se conserva, y en qué relación frente a, las secuencias insertadas. Una alternativa adicional es incluir un RBS dentro de la secuencia de polinucleótidos que se va a insertar en la estruc­ tura artificial de expresión en el MCS, preferiblemente en una relación apropiada con cualquiera de las secuencias codificadoras, para estimular el inicio de la traducción desde el ARN mensajero transcrito.
Expresión desde promotores constitutivos. Las estructuras artificiales de expresión de la invención también pueden comprender secuencias codificadoras que se expresan a partir de promotores constitutivos. A diferencia de los promotores inducibles, los promotores constitutivos inician una producción continua de producto génico bajo la mayo­ ría de las condiciones de crecimiento. Un ejemplo de un promotor constitutivo es el del gen Tn3 bla, que codifica betalactamasa y es responsable del fenotipo de resistencia a la ampicilina (AmpR) conferido a la célula hospedadora a través de muchos plásmidos, incluyendo pBR322 (ATCC 31344), pACYC177 (ATCC 37031) y pBAD24 (ATCC 87399). Otro promotor constitutivo que se puede utilizar en estructuras artificiales de expresión es el promotor para el gen de la lipoproteína de E. coli, Ipp, que se encuentra en las posiciones 1755731-1755406 (hebra positiva) en la subcepa MG1655 de E. coli K-12 (Inouye e Inouye, "Up-promoter mutations in the Ipp gene of Escherichia coli', Nucleic Acids Res 1985 May 10; 13(9): 3101-3110). Un ejemplo adicional de un promotor constitutivo que se ha utilizado para la expresión génica heteróloga en E. coli es el promotor trpLEDCBA, que se encuentra en las posiciones 1321169­ 1321133 (hebra negativa) de la subcepa MG1655 de E. coli K-12 (Windass et al., "The construction of a synthetic Escherichia coli trp promoter and its use in the expression of a synthetic interferon gene", Nucleic Acids Res 1982 Nov 11; 10(21): 6639-6657). Los promotores constitutivos se pueden utilizar en estructuras artificiales de expresión para la expresión de marcadores de selección, como se describe en el presente documento, y también para la expresión constitutiva de otros productos génicos, útiles para la coexpresión del producto deseado. Por ejemplo, reguladores de la transcripción de los promotores inducibles, tales como AraC, PrpR, RhaR y XylR, si no se expresan a partir de un promotor inducible bidireccional, se pueden expresar, alternativamente, a partir de un promotor constitutivo, ya sea en la misma estructura artificial de expresión que el promotor inducible que regulan, o una estructura artificial de expresión diferente. Del mismo modo, los productos génicos útiles para la producción o el transporte del inductor, tal como PrpEC, AraE o Rha, o proteínas que modifican el entorno de reducción-oxidación de la célula, como algunos ejemplos, se pueden expresar a partir de un promotor constitutivo dentro de una estructura artificial de expresión. Los productos génicos útiles para la producción de productos génicos coexpresados, y el producto resultante deseado, también in­ cluyen proteínas chaperonas, transportadores de cofactores, etc.
Péptidos señal. Los productos génicos de polipéptidos coexpresados por los métodos de la invención pueden contener péptidos señal o carecer de ellos, dependiendo de si es deseable que tales productos génicos se exporten desde el citoplasma de la célula hospedadora al periplasma, o que queden retenidos en el citoplasma, respectivamente. Los péptidos señal (también denominados secuencias señal, secuencias líder o péptidos líder) se caracterizan estructu­ ralmente por un segmento de aminoácidos hidrófobos, con aproximadamente cinco a veinte aminoácidos de longitud y frecuentemente aproximadamente diez a quince aminoácidos de longitud, que tiene una tendencia a formar una sola hélice alfa. Este segmento hidrófobo, frecuentemente está precedido inmediatamente por un segmento más corto enriquecido con aminoácidos cargados positivamente (particularmente lisina). Los péptidos señal que se van a escindir del polipéptido maduro, por lo general terminan en un segmento de aminoácidos que es reconocido y escindido por la peptidasa señal. Los péptidos señal se pueden caracterizar funcionalmente por la capacidad para dirigir el transporte de un polipéptido, ya sea de modo cotraduccional o postraduccional, a través de la membrana plasmática de proca­ riotas (o la membrana interna de bacterias Gram-negativas tales como E. coli), o dentro del retículo endoplásmico de las células eucariotas. El grado en que un péptido señal permite que un polipéptido sea transportado al espacio periplásmico de una célula hospedadora tal como E. coli, por ejemplo, se puede determinar mediante una separación de las proteínas periplásmicas procedentes de proteínas retenidas en el citoplasma, utilizando un método tal como el que se proporciona en el Ejemplo 12.
Células hospedadoras. Los sistemas de coexpresión inducible de la invención están diseñados para expresar múltiples productos génicos. Los productos génicos se coexpresan en una célula hospedadora. Se proporcionan ejemplos de células hospedadoras que permiten una coexpresión inducible eficaz y rentable de componentes de productos multímeros. Las células hospedadoras pueden incluir, además de las células aisladas en cultivo, células que forman parte de un organismo multicelular, o células que crecen dentro de un organismo o un sistema de organismos diferente. Además, las estructuras artificiales de expresión de los sistemas de coexpresión inducible desvelados en el presente documento se pueden utilizar en sistemas exentos de células, tales como los basados en extractos de germen de trigo o en extractos de células bacterianas, tales como un sistema de síntesis proteica exento de células con intercambio continuo (CECF), utilizando extractos de E. coli y un aparato de incubación, como el RTS ProteoMaster (Roche Diagnostics GmbH, Mannheim, Alemania). (Jun et al., "Continuous-exchange cell-free protein synthesis using PCR-generated DNA and an RNase E-deficient extract", Biotechniques 2008 Mar; 44(3): 387-391).
Células hospedadoras procariotas. Las estructuras artificiales de expresión diseñadas para la coexpresión de produc­ tos génicos se proporcionan en células hospedadoras, preferiblemente células hospedadoras procariotas. Las células hospedadoras procariotas pueden incluir arqueas (tales como Haloferax volcanii, Sulfolobus solfataricus), bacterias Gram-positivas (tales como Bacillus subtilis, Bacillus licheniformis, Brevibacillus choshinensis, Lactobacillus brevis, Lactobacillus buchneri, Lactococcus lactis y Streptomyces lividans), o bacterias Gram-negativas, que incluyen las alfaproteobacterias (Agrobacterium tumefaciens, Caulobacter crescentus, Rhodobacter sphaeroides y Sinorhizobium meliloti), betaproteobacterias (Alcaligenes eutrophus), y gammaproteobacterias (Acinetobacter calcoaceticus, Azotobacter vinelandii, Escherichia coli, Pseudomonas aeruginosa y Pseudomonas putida). Las células hospedadoras pre­ feridas incluyen gammaproteobacterias de la familia Enterobacteriaceae, tales como Enterobacter, Erwinia, Esche­ richia (incluyendo E. coli), Klebsiella, Proteus, Salmonella (incluyendo Salmonella typhimurium), Serratia (incluyendo Serratia marcescens) y Shigella.
Células hospedadoras eucariotas. Muchos otros tipos de células hospedadoras se pueden utilizar para los sistemas de coexpresión inducible desvelados en el presente documento, incluyendo células eucariotas tales como levadura (Candida shehatae, Kluyveromyces lactis, Kluyveromyces fragilis, otras especies de Kluyveromyces, Pichia pastoris, Saccharomyces cerevisiae, Saccharomyces pastorianus también conocido como Saccharomyces carlsbergensis, Schizosaccharomyces pombe, especies de Dekkera/Brettanomyces y Yarrowia lipolytica); otros hongos (Aspergillus nidulans, Aspergillus niger, Neurospora crassa, Penicillium, Tolypocladium, Trichoderma reesia); líneas celulares de insecto (células Schneider 2 de Drosophila melanogaster y células Sf9 de Spodoptera frugiperda); y líneas celulares de mamífero incluyendo líneas celulares inmortalizadas (células de ovario de hámster chino (CHO), células HeLa, células de riñón de hámster neonato (BHK), células de riñón de mono (COS), células de riñón embrionario humano (HEK, 293 o HEK-293) y células de carcinoma hepatocelular humano (Hep G2)). Las células hospedadoras anteriores están disponibles de la American Type Culture Collection.
Alteraciones de las funciones génicas de células hospedadoras. Se pueden realizar ciertas alteraciones de las funcio­ nes génicas de las células hospedadoras que comprenden estructuras artificiales de expresión inducible, para favore­ cer una inducción eficaz y homogénea de la población de células hospedadoras a través de un inductor. Preferible­ mente, la combinación de estructuras artificiales de expresión, el genotipo de la célula hospedadora y las condiciones de la inducción da como resultado que al menos 75% (más preferiblemente al menos 85%, y lo más preferiblemente, al menos 95%) de las células en el cultivo expresan el producto génico de cada promotor inducido, tal como se mide por el método de Khlebnikov et al., descrito en el Ejemplo 8. Para células hospedadoras distintas de E. coli, estas alteraciones pueden implicar la función de genes que son estructuralmente similares a un gen de E. coli, o a genes que llevan a cabo una función dentro de la célula hospedadora similar a la del gen de E. coli. Las alteraciones de las funciones de genes de células hospedadoras incluyen eliminar o reducir la función génica mediante una deleción de la secuencia génica que codifica la proteína en su totalidad, o la deleción de una gran porción suficiente del gen, la inserción de una secuencia en el gen, o alterando de otra forma la secuencia del gen, de modo que se produce un nivel reducido de producto génico funcional desde ese gen. Las alteraciones de las funciones génicas de células hospedadoras también incluyen el aumento de la función génica mediante, por ejemplo, una alteración del promotor natural para crear un promotor más fuerte que dirige un mayor nivel de transcripción del gen, o la introducción de una mutación de sentido erróneo en la secuencia que codifica la proteína que da lugar a un producto génico mucho más activo. Las alteraciones de las funciones génicas de células hospedadoras incluyen la alteración de la función génica de cualquier modo, incluyendo, por ejemplo, la alteración de un promotor inducible natural para crear un promotor que está activado de forma constitutiva. Además de las alteraciones en las funciones de genes para el transporte y el metabolismo de los inductores, como se describen en este documento con relación a los promotores inducibles, y una expresión alterada de las proteínas chaperonas, también es posible alterar el sistema regulador mediante represión por catabolito de carbono (CCR) y/o el entorno de oxidación-reducción de la célula hospedadora.
Represión por catabolito de carbono (CCR). La presencia de un sistema regulador por CCR activo dentro de un hospedador puede afectar a la capacidad de un inductor para activar la transcripción desde un promotor inducible. Por ejemplo, cuando una célula hospedadora, tal como E. coli, se cultiva en un medio que contiene glucosa, los genes necesarios para la utilización de otras fuentes de carbono, tales como los operones araBAD y prpBCDE, se expresan como mucho a un nivel bajo, incluso si el inductor arabinosa o propionato también está presente en el medio de crecimiento. También existe una jerarquía en la utilización de fuentes de carbono diferentes de la glucosa: como en el caso de los sistemas de promotores inducibles ara y prp, en donde la presencia de arabinosa reduce la capacidad del propionato para inducir la expresión a partir del promotor prpBCDE (Park et al., "The mechanism of sugar-mediated catabolite repression of the propionate catabolic genes in Escherichia coli, Gene 2012 Aug 1; 504(1): 116-121; Epub 2012 May 3). El mecanismo de CCR de la célula, por tanto, hace que sea más difícil utilizar dos o más inductores de fuentes de carbono en un sistema de coexpresión inducible, ya que la presencia del inductor que es la fuente de carbono preferida inhibirá la inducción con fuentes de carbono menos preferidas. Los autores Park et al. intentaron atenuar la represión del promotor prp mediante arabinosa, ya fuera mediante el uso de un gen crp mutante que produce una proteína alterada del receptor de AMPc que puede actuar de manera independiente del AMPc, o una deleción de genes de PTS (sistema de fosfotransferasa) implicados en la regulación de CCR; ambos enfoques no tuvieron mucho éxito. Sin embargo, la cepa inactivada para PTS, utilizada por los autores Park et al., se basa en la cepa TP2811 que es una deleción del operón ptsHI-crr de E. coli (Hernandez-Montalvo et al., "Characterization of sugar mixtures utilization by an Escherichia coli mutant devoid of the phosphotransferase system", Appl Microbiol Biotechnol 2001 Oct; 57(1-2): 186-191). Se ha encontrado que la deleción de todo el operón ptsHI-crr afecta a la síntesis total de AMPc de forma más significativa que una deleción de solo el gen crr (Lévy et al., "Cyclic AMP synthesis in Escherichia coli strains bearing known deletions in the pts phosphotransferase operon", Gene 1990 Jan 31; 86(1): 27-33). Un enfoque diferente es eliminar o reducir la función del gen ptsG en la célula hospedadora, que codifica EII A específico de glucosa (EII Aglc), un elemento clave para la CCR en E. coli (Kim et al., "Simultaneous consumption of pentose and hexose sugars: an optimal microbial phenotype for efficient fermentation of lignocellulosic biomass", Appl Microbiol Biotechnol 2010 Nov; 88(5): 1077-1085, Epub 2010 Sep 14). Otra alteración en el genoma de una célula hospedadora tal como E. coli, que conduce a un aumento de la transcripción del promotor prp, es eliminar o reducir la función génica del gen ascG, que codifica AscG. AscG es el represor del operón ascFB de utilización de beta-D-glucósido en condi­ ciones de crecimiento normales, y también inhibe la transcripción del promotor prp; se ha observado que una interrup­ ción de la secuencia que codifica AscG aumenta la transcripción desde el promotor prp (Ishida et al., "Participation of regulator AscG of the beta-glucoside utilization operon in regulation of the propionate catabolism operon", J Bacteriol 2009 Oct; 191(19): 6136-6144; Epub 2009 Jul 24). Una alternativa adicional es aumentar la expresión del regulador transcripcional de promotores, inducible a través del inductor de fuente de carbono menos preferida, colocándolo ya sea bajo el control de un promotor constitutivo fuerte, o bajo el control del inductor de fuente de carbono más preferida. Por ejemplo, para aumentar la inducción de genes necesarios para la utilización de la xilosa que es una fuente de carbono menos preferida, en presencia de la arabinosa más preferida, la secuencia que codifica XylR se coloca en el operón araBAD de E. coli (Groff et al., "Supplementation of intracellular XylR leads to coutilization of hemicellulose sugars", Appl Environ Microbiol 2012 Apr; 78(7): 2221-2229, Epub 2012 Jan 27). Por tanto, las células hospedadoras que comprenden estructuras artificiales de coexpresión inducible, incluyen preferiblemente un mayor nivel de función génica para reguladores de la transcripción de promotores, inducible con el o los inductores de fuentes de carbono menos preferidas, y una función génica eliminada o reducida para los genes implicados en el sistema CCR, tales como crr y/o ptsG y/o ascG.
Transporte celular del grupo hemo y otros cofactores. Cuando se utilizan los sistemas de coexpresión inducible de la invención para producir enzimas que requieren cofactores para actuar, es útil usar una célula hospedadora capaz de sintetizar el cofactor a partir de precursores disponibles, o de tomarlos desde el entorno. Los cofactores comunes incluyen ATP, coenzima A, dinucleótido de flavina adenina (FAD), NAD+/NADH y grupos hemo. Los grupos hemo comprenden un ion de hierro en el centro de un anillo heterocíclico orgánico grande llamado porfirina. El tipo más común entre los grupos hemo es hemo B; otros tipos principales son hemo A, hemo C y hemo O, que varían en las cadenas laterales de la porfirina. La hemina es cloruro de hemo B y se puede añadir al medio de crecimiento bacteriano como fuente de hemo. Otras fuentes potenciales de hemo incluyen citocromos, hemoglobina y sustancias que contie­ nen hemoglobina, tales como la sangre. Las cepas de laboratorio de E. coli obtenidas a partir de E. coli K12, normal­ mente carecen de un receptor de hemo en la membrana externa, y por lo tanto no transportan hemo dentro de la célula, no pudiendo crecer en medios en los que hemo es la única fuente de hierro. Cepas patógenas de E. coli tales como 0157:H7 y CFT073 contienen un segmento genómico de aproximadamente 9 kb que no está presente en E. coli K12, y que contiene dos operones transcritos de forma divergente que codifican proteínas implicadas en la captación y utilización de hemo: el operón de chuAS y el operón chuTWXYUhmuV. Este segmento genómico se encuentra en E. coli CFT073 e incluye la secuencia de referencia de NCBI NC_004431.1 (20-ENE-2012) desde la posición 4.084.974 a 4.093.975. La transformación con el gen chuA (por ejemplo, n° de id. del gen de NCBI 1037196), que codifica un receptor específico de hemina en la membrana externa, era suficiente para conferir a una cepa de E. coli obtenida a partir de K12, la capacidad para crecer sobre hemina como fuente de hierro (Torres y Payne, "Haem iron-transport system in enterohaemorrhagic Escherichia coli 0157:H7", Mol Microbiol 1997 Feb; 23(4): 825-833). Además de ChuA, algunos otros receptores de hemo heterólogos pueden permitir que cepas de E. coli obtenidas a partir de K12 capten el grupo hemo: Yersinia enterocolitica HemR, Serratia marcescens HasR y Shigella dysenteriae Shua; y a partir de bacterias Gram-negativas: Bordatella pertussis y B. bronchiseptica y Bhur, Pseudomonas aeruginosa Phur y P. fluorescens PfhR. La proteína ChuS también está involucrada en la utilización de hemo: es una hemo oxigenasa degra­ dante de hemo. En una cepa de E. coli aroB, que es deficiente en la síntesis de la molécula enterobactina quelante de hierro, la transformación con chuS era útil para reducir la toxicidad celular causada por el crecimiento sobre hemina en ausencia de enterobactina. La transcripción de los operones chuAS y chuTWXYUhmuV, y varios otros operones que están involucrados en el metabolismo del hierro y presentes en las cepas de E. coli K12, está inhibida por el regulador transcripcional de E. coli Fur, cuando se asocia con Fe2+; la transcripción de estos genes se activa por tanto cuando hay una caída en la concentración intracelular de iones de hierro.
Células hospedadoras tales como cepas de E. coli obtenidas a partir de K12 se pueden alterar para que puedan captar hemo mediante transformación del mismo con la totalidad o parte de la región de chuAS - chuTWXYUhmuV que contiene al menos chuA, o con el operón chuAS, que incluye opcionalmente genes adicionales procedentes del operón chuTWXYUhmuV. En realizaciones en las que el promotor que dirige la transcripción de chuA se puede inhibir con Fur, la represión con Fur se puede eliminar o reducir delecionando el gen de la célula hospedadora que codifica Fur, cultivando las células hospedadoras en ausencia de hierro libre, cultivando las células hospedadoras en presencia de un agente quelante de iones de hierro libres tal como EDTA (ácido etilendiaminotetraacético), o mediante la transfor­ mación de las células con estructuras artificiales de polinucleótidos (tales como plásmidos mantenidos con un número de copias elevado) que comprenden múltiples copias del sitio de unión a Fur, para reducir la cantidad de complejo Fur-Fe2+ disponible inhibir operones del metabolismo del hierro. En una realización preferida, una estructura artificial de expresión se introduce en la célula hospedadora, en donde la estructura artificial de expresión comprende un polinucleótido que codifica ChuA y, opcionalmente, también codifica ChuS, bajo el control transcripcional de un promotor constitutivo.
Entorno de reducción-oxidación de una célula hospedadora. Muchos productos génicos multímeros, tales como anti­ cuerpos, contienen enlaces disulfuro. El citoplasma de E. coli y de muchas otras células se mantiene normalmente en un estado reducido a través de los sistemas enzimáticos de tiorredoxina y glutarredoxina/glutatión. Esto impide la formación de enlaces disulfuro en el citoplasma, y las proteínas que necesitan enlaces disulfuro se exportan al periplasma en donde la formación de enlaces disulfuro y la isomerización están catalizadas por el sistema de Dsb, que comprende DsbABCD y DsbG. El aumento de la expresión de la cisteína oxidasa DsbA, la disulfuro isomerasa DsbC o combinaciones de las proteínas Dsb, las cuales se transportan todas normalmente al periplasma, se ha utilizado en la expresión de proteínas heterólogas que requieren enlaces disulfuro (Makino et al., "Strain engineering for improved expression of recombinant proteins in bacteria", Microb Cell Fact 2011 May 14; 10:32). También es posible expresar formas citoplasmáticas de estas proteínas Dsb, tales como una versión citoplásmica de DsbC ('cDsbC'), que carece de un péptido señal y por lo tanto no se transporta al periplasma. Proteínas Dsb citoplasmáticas tales como cDsbC son útiles para hacer el citoplasma de la célula hospedadora más oxidante y, por lo tanto, más propicio para la forma­ ción de enlaces disulfuro en proteínas heterólogas producidas en el citoplasma. El citoplasma de la célula hospedadora también se puede hacer más oxidante alterando directamente los sistemas enzimáticos de tiorredoxina y glutarredoxina/glutatión: cepas mutantes defectuosas para la glutatión reductasa (gor) o glutatión sintetasa (gshB), junto con la tiorredoxina reductasa (trxB), vuelven el citoplasma oxidante. Estas cepas son incapaces de reducir ribonucleótidos y, por lo tanto, no pueden crecer en ausencia de un agente reductor exógeno, tal como ditiotreitol (DTT). Mutaciones supresoras (ahpC*) en el gen ahpC, que codifica la peroxirredoxina AhpC, lo convierten en una disulfuro reductasa que genera glutatión reducido, lo que permite la canalización de electrones a la enzima ribonucleótido re­ ductasa y permite que las células defectuosas para gor y trxB, o defectuosas para gshB y trxB, crezcan en ausencia de DTT. Una clase diferente de formas mutadas de AhpC puede permitir que las cepas defectuosas en la actividad gamma-glutamilcisteína sintetasa (gshA) y defectuosas en trxB, crezcan en ausencia de DTT; estas incluyen AhpC V164G, AhpC S71F, AhpC E173/S71F, AhpC E171Ter y AhpC dup162-169 (Faulkner et al., "Functional plasticity of a peroxidase allows evolution of diverse disulfide-reducing pathways", Proc Natl Acad Sci U S A 2008 May 6; 105(18): 6735-6740, Epub 2008 May 2). En tales cepas con citoplasma oxidante, las cisteínas proteicas expuestas se oxidan fácilmente en un proceso que está catalizado por tiorredoxinas, en una inversión de su función fisiológica, lo que da lugar a la formación de enlaces disulfuro.
Otra alteración que se puede realizar en las células hospedadoras es expresar la sulfhidrilo oxidasa Erv1p desde el espacio de la membrana interna de las mitocondrias de levadura en el citoplasma de la célula hospedadora, lo que se ha observado que aumenta la producción de una variedad de complejos, proteínas enlazadas a disulfuro de origen eucariota en el citoplasma de E. coli, incluso en ausencia de mutaciones en gor o trxB (Nguyen et al., "Pre-expression of a sulfhydryl oxidase significantly increases the yields of eukaryotic disulfide bond containing proteins expressed in the cytoplasm of E. coli' Microb Cell Fact 2011 Jan 7; 10:1). Las células hospedadoras que comprenden estructuras artificiales con coexpresión inducible, preferiblemente también expresan cDsbC y/o Erv1p, que son deficientes en la función del gen trxB, también son deficientes en la función génica de cualquiera entre gor, gshB o gshA, y expresan una forma mutante adecuada de AhpC, de modo que las células hospedadoras se pueden cultivar en ausencia de DTT.
Glicosilación de productos génicos de polipéptidos. Las células hospedadoras pueden tener alteraciones en su capa­ cidad para glicosilar polipéptidos. Por ejemplo, las células hospedadoras eucarióticas pueden haber eliminado o redu­ cido la función génica en los genes de glicosiltransferasa y/o oligosacariltransferasa, impidiendo una glicosilación eucariótica normal de los polipéptidos para formar glicoproteínas. Las células hospedadoras procariotas tales como E. coli, que normalmente no glicosilan polipéptidos, se pueden alterar para expresar un conjunto de genes eucariotas y procariotas que proporcionan una función de glicosilación (DeLisa et al., "Glycosylated protein expression in prokaryotes", documento WO2009089154A2, 2009 Jul 16).
Cepas de células hospedadoras disponibles con funciones génicas alteradas. Para crear cepas preferidas de células hospedadoras que se van a utilizar en los sistemas de coexpresión inducible y los métodos de la invención, es útil comenzar con una cepa que ya comprende las alteraciones genéticas deseadas (Tabla 3).
Tabla 3. Ce as de células hos edadoras
Figure imgf000020_0001
Métodos para alterar las funciones génicas de células hospedadoras. Existen muchos métodos conocidos en la técnica para la realización de alteraciones en genes de células hospedadoras con el fin de eliminar, reducir o cambiar la función génica. Los métodos para realizar alteraciones específicas de genes en células hospedadoras tales como E. coli y otras procariotas, han sido descritos (Muyrers et al., "Rapid modification of bacterial artificial chromosomes by ET- recombination", Nucleic Acids Res 1999 Mar 15; 27(6): 1555-1557; Datsenko y Wanner, "One-step inactivation of chromosomal genes in Escherichia coli K-12 using PCR products", Proc Natl Acad Sci U S A 2000 Jun 6; 97(12): 6640­ 6645), y los kits para el uso de métodos similares de recombinación Red/ET están comercialmente disponibles (por ejemplo, el kit de deleción de genes en E. coli Quick & Easy de Gene Bridges GmbH, Heidelberg, Alemania). En una realización de la invención, la función de uno o varios genes de las células hospedadoras se elimina o se reduce mediante la identificación de una secuencia de nucleótidos dentro de la secuencia que codifica el gen que se va a alterar, tal como una de las secuencias codificadoras de la subcepa MG1655 de E. coli K-12 incorporada en este documento como referencia, para la ubicación genómica de la secuencia, y más específicamente mediante la selec­ ción de dos segmentos adyacentes de 50 nucleótidos cada uno, dentro de esa secuencia codificante. El kit de deleción de genes en E. coli Quick & Easy se utiliza a continuación de acuerdo con las instrucciones del fabricante para insertar una estructura artificial de polinucleótido que contiene un marcador seleccionable entre los segmentos adyacentes seleccionados de la secuencia codificante, eliminando o reduciendo la función normal del gen. Los métodos de recom­ binación Red/ET también se pueden utilizar para reemplazar una secuencia de promotor con la de un promotor dife­ rente, tal como un promotor constitutivo, o un promotor artificial que se prevé que favorece un cierto nivel de la trans­ cripción (De Mey et al., "Promoter knock-in: a novel rational method for the fine tuning of genes", BMC Biotechnol 2010 Mar 24; 10: 26). La función de los genes de la célula hospedadora también se puede eliminar o reducir por métodos de silenciamiento de ARN (Man et al., "Artificial transencoded small non-coding RNAs specifically silence the selected gene expression in bacteria", Nucleic Acids Res 2011 Apr; 39(8): e50, Epub 2011 Feb 3). Además, mutaciones cono­ cidas que alteran la función génica de la célula hospedadora se pueden introducir en las células hospedadoras a través de métodos genéticos tradicionales.
Sistemas de coexpresión inducible de la invención
Los sistemas de coexpresión inducible de la invención implican células hospedadoras que comprenden dos o más estructuras artificiales de expresión, en donde las estructuras artificiales de expresión comprenden promotores inducibles que dirigen la expresión de productos génicos, y las células hospedadoras tienen funciones alteradas de genes que permiten una expresión inducible homogénea de los productos génicos. La Fig. 1 muestra una representación esquemática de un sistema de coexpresión inducible de la invención, con los siguientes componentes: (1) célula hos­ pedadora, (2) genoma del hospedador (incluyendo las alteraciones genéticas), (3) un vector de expresión 'X' que comprende un promotor inducible que dirige la expresión de un producto génico, (4) un vector de expresión diferente 'Y' que comprende un promotor inducible que dirige la expresión de otro producto génico, (5) inductores químicos de la expresión y (6) producto de coexpresión multímera.
La Fig. 2 muestra una representación esquemática de un ejemplo particular de un sistema de coexpresión inducible de la invención, que emplea el promotor araBAD sobre un vector de expresión pBAD24 en combinación con un pro­ motor inducible con propionato (promotor prpBCDE) sobre un vector de expresión pPRO33 (documento de Patente de EE.UU. n° 8178338 B2, 15 mayo de 2012; Keasling, Jay), en una célula hospedadora E. coli que alberga las alteraciones genómicas apropiadas que permiten una expresión inducible de forma homogénea. De esta manera, se puede lograr un estrecho control y una optimización de la expresión de cada componente de un producto multímero, para uso en una variedad de aplicaciones de la coexpresión. En esta realización, la célula hospedadora (1) es la bacteria Gram-negativa Escherichia coli, que se utiliza comúnmente en la técnica para la expresión de proteínas. El genoma del hospedador (2) es el genoma del organismo de la célula hospedadora con mutaciones u otras alteraciones que facilitan la coexpresión inducible de proteínas de forma homogénea, incluyendo la expresión de una forma citoplásmica de la disulfuro isomerasa DsbC que carece de un péptido señal. En una realización, las alteraciones genómicas incluyen tanto una mutación que inactiva el operón araBAD como la expresión de araEy araFGH desde promo­ tores constitutivos, o una mutación puntual en el gen lacY (A117C) en un fondo que carece de araEFGH, para facilitar una inducción homogénea de promotores ara basados en plásmidos con L-arabinosa aplicada de forma exógena, y también un gen del metabolismo del propionato inactivado, prpD, para facilitar una inducción homogénea de promo­ tores de propionato basados en plásmidos, con propionato aplicado de forma exógena, que se convierte en 2-metilcitrato in vivo. Otras alteraciones genómicas que son útiles para el sistema de coexpresión inducible y que se pueden introducir en la célula hospedadora, incluyen, sin limitación: una inactivación dirigida del operón scpA-argK-scpBC, para reducir la expresión de fondo desde el promotor prpBCDE; una expresión del regulador transcripcional (prpR) para la fuente de carbono menos preferida (propionato) desde un promotor inducible con L-arabinosa tal como el promotor araBAD, y/o una función génica eliminada o reducida para genes implicados en el sistema CCR, como crr y/o ptsG, para evitar la supresión mediante el sistema CCR de una inducción con propionato en presencia de L-arabinosa; reducciones del nivel de la función génica para la glutatión reductasa (gor) o la glutatión sintetasa (gshB), junto con la tiorredoxina reductasa (trxB) y/o la expresión de la sulfhidrilo oxidasa Erv1p mitocondrial de levadura en el citoplasma de la célula hospedadora, para proporcionar un entorno reductor menos fuerte en el citoplasma de la célula hospedadora y favorecer la formación de enlaces disulfuro; aumento de los niveles de expresión, por ejemplo, desde un promotor constitutivo fuerte, de proteínas chaperonas tales como DnaK/DnaJ/GrpE, DsbC/DsbG, GroEL/GroES, IbpA/IbpB, Skp, Tig (factor desencadenante) y/o FkpA; y otras mutaciones para reducir la actividad de proteasas endógenas (tal como la de las proteasas Lon y OmpT) y actividades de recombinasa.
Como se muestra en la Fig. 2, dos vectores de expresión compatible (3, 4) se mantienen en la célula hospedadora para permitir una expresión simultánea (coexpresión) de dos productos génicos diferentes. En esta realización, un vector de expresión (“vector de expresión inducido con L-arabinosa”) contiene un promotor inducido con L-arabinosa, y es similar o idéntico a pBAD o plásmidos relacionados en los que un promotor araBAD dirige la expresión de una secuencia de expresión insertada, clonada en el sitio de clonación múltiple (MCS). El vector de expresión inducido con L-arabinosa también contiene una secuencia que codifica un gen de resistencia a antibióticos (tal como el gen Tn3 bla, que codifica la beta-lactamasa y confiere resistencia a la ampicilina) para facilitar la selección de células hospe­ dadoras (colonias bacterianas) que contienen un vector de expresión intacto. Se requiere un origen de replicación (ORI) para la propagación del plásmido dentro de las células hospedadoras bacterianas. El plásmido de expresión inducida con L-arabinosa también contiene una secuencia de polinucleótidos que codifica araC, un regulador transcripcional que permite la inducción con L-arabinosa del promotor araBAD y a través de represión transcripcional reduce la expresión de fondo "con fugas" en el estado no inducido. El otro vector de expresión ("vector de expresión inducido con propionato") es similar o idéntico a pPRO o a plásmidos relacionados, en los que un promotor de expresión indu­ cido con propionato dirige la expresión de una secuencia de expresión insertada, clonada en el sitio de clonación múltiple (Mc S). El plásmido también contiene una secuencia que codifica un gen de resistencia a antibióticos (tal como el gen cat, que codifica la cloranfenicol acetiltransferasa, que confiere resistencia al cloranfenicol) para facilitar la selección de las células hospedadoras que contienen un vector de expresión intacto. Se requiere un origen de replicación (ORI) para la propagación del plásmido dentro de las células hospedadoras bacterianas. Además, el vector de expresión inducido con propionato contiene una secuencia de polinucleótidos que codifica prpR, un regulador trans­ cripcional que permite la inducción con propionato (2-metilcitrato) del promotor prpBCDE y reduce la expresión de fondo "con fugas" en el estado no inducido. Para facilitar una valoración por separado de la inducción, una compatibi­ lidad de los plásmidos y la copropagación de los vectores de expresión, es útil que los vectores de expresión contengan promotores que respondan a diferentes inductores, orígenes de replicación compatibles y diferentes marcadores de resistencia a antibióticos. En una realización de la invención, un pBAD24 o un vector de expresión relacionado (pMB1 o 'pBR322' ORI, AmpR) que contiene un promotor araBAD inducible con L-arabinosa, se combina en una célula hospedadora con un pPRO33 o un vector de expresión relacionado (p15A ORI, CmR) que contiene un promotor prpBCDE inducible con propionato. Los vectores de expresión se propagan conjuntamente y se mantienen utilizando medio de crecimiento complementado con ampicilina y cloranfenicol. En una realización, un vector de expresión comprende una secuencia de polinucleótidos que codifica la cadena pesada de un anticuerpo de longitud completa, y el otro vector de expresión comprende una secuencia de polinucleótidos que codifica la cadena ligera de un anticuerpo de longitud completa, estando clonada cada secuencia codificadora en marco en el MCS del vector de expresión respectivo. Para la producción de ciertos productos génicos tales como anticuerpos, la optimización de la secuencia codificadora para el organismo hospedador (incluyendo el ajuste para el sesgo de codones y contenido en GC, entre otras considera­ ciones) determinará las secuencias codificadoras que se van a insertar en las estructuras artificiales de expresión del sistema de coexpresión.
Haciendo referencia de nuevo a la Fig. 2, la coexpresión de productos génicos es inducida por metabolitos químicos no costosos, aplicados exógenamente, L-arabinosa y propionato (5). El nivel de inducción de la expresión de cada producto génico se valora de forma independiente con su propio inductor químico, facilitando de este modo la optimi­ zación de la coexpresión de proteínas. Esto es útil para la expresión de complejos proteicos y proteínas que requieren una pareja de unión para la estabilización, y puede facilitar la expresión de proteínas que son difíciles de expresar de otro modo, tales como las que tienen una mala solubilidad o toxicidad celular. En este ejemplo, después de la induc­ ción, las cadenas pesadas y ligeras de anticuerpos se expresan cada una por separado, a continuación, las proteínas se unen y forman puentes disulfuro intercatenarios (dentro del citoplasma de la bacteria hospedadora), lo que permite la formación y estabilización de un anticuerpo de longitud completa, compuesto por las cadenas pesadas y ligeras. Las proteínas se pueden dirigir a distintos compartimentos del organismo hospedador. Por ejemplo, en E. coli la pro­ teína se puede expresar en el citoplasma, la membrana celular, el periplasma o se puede secretar en el medio. Des­ pués de un tiempo de incubación apropiado, se recogen las células y los medios, y la proteína total extraída, que incluye los productos génicos coexpresados (6). Después de la extracción, el producto deseado se puede purificar utilizando una serie de métodos bien conocidos en la técnica, dependiendo de la naturaleza de los productos génicos que se producen en el sistema de coexpresión (por ejemplo cromatografía líquida). En el ejemplo mostrado en la Fig. 2, el producto multímero (anticuerpo de longitud completa) se extrae y se purifica utilizando métodos cromatográficos. El anticuerpo intacto purificado se visualiza sobre un gel no desnaturalizante usando técnicas convencionales, inclu­ yendo colorantes que se unen a proteínas o inmunohistoquímica. El producto de anticuerpo de longitud completa se puede utilizar entonces para una serie de aplicaciones en investigación, diagnóstico u otras aplicaciones.
Productos preparados por los métodos de la invención
Existe una amplia versatilidad en la utilización de los sistemas de coexpresión inducible de la presente invención en numerosas aplicaciones de la coexpresión, y en las propiedades de los productos.
Glicosilación. Los productos génicos coexpresados por los métodos de la invención pueden estar glicosilados o no. En una realización de la invención, los productos génicos coexpresados son polipéptidos. Los polipéptidos glicosilados son polipéptidos que comprenden un grupo glicosilo fijado covalentemente, e incluyen polipéptidos que comprenden todos los grupos glicosilo que están fijados normalmente a determinados residuos de ese polipéptido (polipéptidos totalmente glicosilados), polipéptidos parcialmente glicosilados, polipéptidos con glicosilación en uno o varios residuos, en donde la glicosilación no se produce normalmente (glicosilación alterada), y polipéptidos glicosilados con al menos un grupo glicosilo que difiere en la estructura del grupo glicosilo que está fijado normalmente a uno o varios residuos especificados (glicosilación modificada). Un ejemplo de glicosilación modificada es la producción de polipéptidos "desfucosilados" o "carentes de fucosa", polipéptidos que carecen de restos de fucosilo en los grupos glicosilo fijados a ellos, mediante la expresión de polipéptidos en células hospedadoras que carecen de la capacidad de fucosilar poli­ péptidos. Los polipéptidos no glicosilados son polipéptidos que no comprenden un grupo glicosilo unido covalente­ mente. Un polipéptido no glicosilado puede ser el resultado de la desglicosilación de un polipéptido, o de la producción de un polipéptido aglicosilado. Los polipéptidos desglicosilados se pueden obtener mediante polipéptidos glicosilados que están desglicosilados enzimáticamente, mientras que los polipéptidos aglicosilados se pueden producir mediante la expresión de polipéptidos en células hospedadoras que no tienen la capacidad de glicosilar polipéptidos, tales como las células procariotas o células en las que la función de al menos una enzima de glicosilación se ha eliminado o reducido. En una realización particular, los polipéptidos coexpresados están aglicosilados, y en una realización más específica, los polipéptidos aglicosilados se coexpresan en células procariotas tales como E. coli.
Otras modificaciones de productos génicos. Los productos génicos coexpresados por los métodos de la invención se pueden unir covalentemente a otros tipos de moléculas. Ejemplos de moléculas que pueden unirse covalentemente a los productos génicos coexpresados, sin limitar el alcance de la invención, incluyen polipéptidos (tales como recepto­ res, ligandos, citocinas, factores de crecimiento, hormonas polipeptídicas, dominios de unión a ADN, dominios de interacción con proteínas, tales como dominios PDZ, dominios de cinasa, anticuerpos y fragmentos de cualquiera de tales polipéptidos); polímeros solubles en agua (tales como polietilenglicol (PEG), carboximetilcelulosa, dextrano, poli(alcohol vinílico), polioles polioxietilados (por ejemplo, glicerol), propionaldehído de polietilenglicol, y compuestos similares, derivados o mezclas de los mismos; y agentes citotóxicos (tales como agentes quimioterapéuticos, agentes inhibidores del crecimiento, toxinas (tales como toxinas enzimáticamente activas de origen bacteriano, fúngico, vegetal o animal, o fragmentos de las mismas), e isótopos radiactivos).
Además, los productos génicos que se coexpresan por los métodos de la invención pueden estar diseñados para incluir restos moleculares que ayudan en la purificación y/o la detección de los productos génicos. Muchos de estos restos son conocidos en la técnica; a modo de ejemplo, un producto génico de polipéptido se puede diseñar para incluir una secuencia "marcadora" de polihistidina - una serie de seis o más histidinas, preferiblemente de seis a diez residuos de histidina, y lo más preferiblemente seis histidinas - en su extremo N-terminal o C-terminal. La presencia de una secuencia de polihistidina en el extremo de un polipéptido permite que se una mediante medios de afinidad a base de cobalto o níquel, y se separe de otros polipéptidos. La secuencia marcadora de polihistidina se puede eliminar mediante exopeptidasas. Como otro ejemplo, las secuencias de proteínas fluorescentes se pueden expresar como parte de un producto génico del polipéptido, añadiendo la secuencia de aminoácidos de la proteína fluorescente pre­ feriblemente en el extremo N-terminal o C-terminal de la secuencia de aminoácidos del producto génico del polipéptido. La proteína de fusión resultante emite fluorescencia cuando se expone a la luz de ciertas longitudes de onda, lo que permite que la presencia de la proteína de fusión se detecte visualmente. Una proteína fluorescente bien conocida es la proteína verde fluorescente de Aequorea victoria, y muchas otras proteínas fluorescentes están disponibles comer­ cialmente, junto con las secuencias de nucleótidos que las codifican.
Anticuerpos. En una realización de la invención, los productos génicos coexpresados son anticuerpos. El término "anticuerpo" se utiliza en el sentido más amplio e incluye específicamente anticuerpos "naturales", anticuerpos com­ pletamente humanos, anticuerpos humanizados, anticuerpos quiméricos, anticuerpos multiespecíficos (tales como an­ ticuerpos biespecíficos), anticuerpos monoclonales, anticuerpos policlonales, fragmentos de anticuerpos y otros poli­ péptidos obtenidos a partir de anticuerpos que son capaces de unirse a un antígeno. A menos que se indique lo contrario en el presente documento, la numeración de los residuos en una cadena pesada de inmunoglobulina (“nu­ meración EU”) es la del índice EU (la numeración EU de residuos del anticuerpo humano IgG1) como en Kabat et al., Sequences of Proteins of Immunological Interest, Quinta edición, 1991, National Institute of Health, Bethesda, Maryland.
Los anticuerpos "naturales" son normalmente glicoproteínas heterotetrámeras de aproximadamente 150.000 daltons, compuestas por dos cadenas ligeras (L) idénticas y dos cadenas pesadas (H) idénticas. Cada cadena ligera está unida a una cadena pesada por un enlace disulfuro covalente, aunque el número de enlaces disulfuro intercatenarios varía entre las cadenas pesadas de diferentes isotipos de inmunoglobulinas. Cada cadena pesada y ligera también tiene puentes disulfuro intracatenarios, espaciados regularmente. Cada cadena pesada tiene en su extremo N-terminal un dominio variable (Vh) seguido por un número de dominios constantes. Cada cadena ligera tiene un dominio variable en su extremo N-terminal (Vl) y un dominio constante en su extremo C-terminal; el dominio constante de la cadena ligera está alineado con el primer dominio constante de la cadena pesada, y el dominio variable de la cadena ligera está alineado con el dominio variable de la cadena pesada. El término "variable" se refiere al hecho de que ciertas porciones de los dominios variables difieren ampliamente en la secuencia entre los anticuerpos y se utilizan en la unión y la especificidad de cada anticuerpo particular con un antígeno. Sin embargo, la variabilidad no se distribuye unifor­ memente a través de los dominios variables de los anticuerpos. Se concentra en tres segmentos llamados regiones hipervariables (HVRs), tanto en los dominios variables de la cadena ligera como de la cadena pesada. Las porciones más conservadas de los dominios variables se denominan las regiones marco (FR). Los dominios variables de las cadenas pesadas y ligeras naturales comprenden cada uno cuatro regiones FR, conectadas por tres HVRs, y con las HVRs de la otra cadena, contribuyen a la formación del sitio de unión a antígeno de los anticuerpos.
La expresión "región Fc" se refiere a una región C-terminal de una cadena pesada de inmunoglobulina, e incluye regiones Fc naturales y regiones Fc variantes. Aunque los límites de la región Fc de una cadena pesada de inmunoglobulina pueden variar, la región Fc de la cadena pesada de una IgG humana se puede definir por extenderse desde un residuo de aminoácido en la posición Cys226, o desde Pro230, hasta el carboxilo-terminal de la misma. Alternati­ vamente, la región Fc se puede definir por extenderse desde el residuo N-terminal (Ala231) del dominio conservado de la inmunoglobulina Ch2 hasta el extremo C-terminal, y puede incluir múltiples dominios conservados, tales como Ch2, Ch3 y Ch4. La lisina C-terminal (residuo 447 según el sistema de numeración EU) de la región natural Fc se puede eliminar, por ejemplo, durante la producción o la purificación del anticuerpo, o por ingeniería recombinante del ácido nucleico que codifica una cadena pesada del anticuerpo. En consecuencia, una composición de anticuerpos intactos puede comprender poblaciones de anticuerpos con todos los residuos K447 eliminados, poblaciones de anticuerpo sin residuos K447 eliminados, y poblaciones de anticuerpo que tienen una mezcla de anticuerpos con y sin el residuo K447. La región Fc de un anticuerpo es crucial para el reclutamiento de células inmunológicas y la citotoxicidad dependiente de anticuerpos (ADCC). En particular, la naturaleza de la respuesta de ADCC provocada por anti­ cuerpos, depende de la interacción de la región Fc con los receptores (FcRs) que se encuentran en la superficie de muchos tipos de células. Los seres humanos contienen al menos cinco clases diferentes de receptores de Fc. La unión de un anticuerpo a FcRs determina su capacidad para reclutar otras células inmunológicas y el tipo de célula reclutada. Por lo tanto, la capacidad para diseñar anticuerpos con regiones Fc alteradas que pueden reclutar solo ciertos tipos de células, puede ser de importancia decisiva para la terapia (documento de Solicitud de Patente de EE.UU.
20090136936 A1, 05-28-2009, Georgiou, George). Los anticuerpos naturales producidos por células de mamífero comprenden normalmente un oligosacárido ramificado, biantenario que está fijado generalmente por un enlace N con Asn297 del dominio CH2 de la región Fc. En ciertas realizaciones, los anticuerpos producidos por los métodos de la invención no están glicosilados o están aglicosilados, por ejemplo, debido a una sustitución en el residuo 297 de la región Fc, o a la expresión en una célula hospedadora que no tiene la capacidad de glicosilar polipéptidos. Debido a las respuestas de ADCC alteradas, los anticuerpos no glicosilados pueden estimular un nivel más bajo de respuestas inflamatorias, tales como la neuroinflamación. Además, dado que un anticuerpo que tiene una región Fc aglicosilada tiene una afinidad de unión muy baja hacia los receptores Fc, tales anticuerpos no se unirán a una gran cantidad de células inmunes que son portadoras de estos receptores. Esto es una ventaja significativa, ya que se reduce la unión no específica, y también se aumenta la semivida del anticuerpo in vivo, por lo que este atributo es muy beneficioso en la terapéutica.
Las expresiones "anticuerpo de longitud completa", "anticuerpo intacto" y "anticuerpo completo" se usan indistinta­ mente para referirse a un anticuerpo en su forma sustancialmente intacta "natural", no a fragmentos de anticuerpo como se definen a continuación. Las expresiones se refieren especialmente a un anticuerpo con cadenas pesadas que comprenden cada una un dominio variable y una región Fc. Los "fragmentos de anticuerpo" comprenden una porción de un anticuerpo intacto, que comprende preferiblemente la región de unión a antígeno del mismo. Ejemplos de fragmentos de anticuerpos incluyen fragmentos Fab, Fab', F(ab')2, Fc, Fd y Fv; diacuerpos; anticuerpos lineales; moléculas de anticuerpo de cadena sencilla, tales como scFv; y anticuerpos multiespecíficos formados a partir de fragmentos de anticuerpos.
Un "anticuerpo humano" es uno que posee una secuencia de aminoácidos correspondiente a la de un anticuerpo producido por un ser humano. Un anticuerpo "quimérico" es uno en el que una porción de la cadena pesada y/o ligera es idéntica a, o comparte un cierto grado de identidad de secuencia de aminoácidos con secuencias correspondientes en anticuerpos obtenidos a partir de una especie particular o que pertenecen a una clase o subclase de anticuerpo particular, mientras que el resto de la o las cadenas es idéntico a, o comparte un cierto grado de identidad de secuencia de aminoácidos con, secuencias correspondientes en anticuerpos obtenidos a partir de otras especies o pertenecien­ tes a otra clase o subclase de anticuerpo, así como fragmentos de tales anticuerpos. Un anticuerpo "humanizado" es un anticuerpo quimérico que contiene residuos de aminoácidos mínimos obtenidos a partir de moléculas de inmunoglobulina no humana. En una realización, un anticuerpo humanizado es una inmunoglobulina humana (anticuerpo receptor) en la que los residuos de HVR del anticuerpo receptor se sustituyen por residuos de una HVR de inmunoglobulina de una especie no humana (anticuerpo donante), tal como ratón, rata, conejo o primate no humano. En algunos casos, los residuos de FR del anticuerpo receptor humano se sustituyen por residuos no humanos correspon­ dientes. Además, los anticuerpos humanizados pueden comprender residuos que no se encuentran en el anticuerpo receptor o en el anticuerpo donante. La expresión "anticuerpo monoclonal" se refiere a un anticuerpo obtenido a partir de una población de anticuerpos sustancialmente homogéneos, en donde los anticuerpos individuales que compren­ den la población son idénticos excepto por posibles mutaciones, tales como mutaciones de origen natural, que pueden estar presentes en cantidades menores. De este modo, el modificador "monoclonal" indica el carácter del anticuerpo como que no es una mezcla de anticuerpos discretos. En contraste con preparaciones de anticuerpos policlonales, que normalmente incluyen diferentes anticuerpos dirigidos contra diferentes determinantes (epítopos), cada anticuerpo monoclonal de una preparación de anticuerpos monoclonales está dirigido contra el mismo determinante particular en un antígeno. Además de su especificidad, las preparaciones de anticuerpos monoclonales son ventajosas porque normalmente no están contaminadas con otras inmunoglobulinas.
La "afinidad de la unión" de una molécula, tal como un anticuerpo, se refiere en general a la fuerza de la suma total de interacciones no covalentes entre un único sitio de unión de una molécula y su pareja de unión (tal como un anti­ cuerpo y el antígeno al que se une). A menos que se indique lo contrario, "afinidad de la unión" se refiere a la afinidad de la unión intrínseca que refleja una interacción 1:1 entre los miembros de una pareja de unión (tal como anticuerpo y antígeno). La afinidad de una molécula X hacia su pareja Y, se puede representar en general por la constante de disociación (Kd). Los anticuerpos con baja afinidad (Kd más alta), en general se unen lentamente al antígeno y tienden a disociarse con facilidad, mientras que los anticuerpos de alta afinidad (Kd más baja) se unen al antígeno general­ mente más rápido y tienden a permanecer unidos durante más tiempo. Se conoce en la técnica una variedad de formas de medir la afinidad de la unión, pudiéndose utilizar cualquiera de ellas para los fines de la presente invención. Métodos ilustrativos específicos para medir la afinidad de la unión se describen en el Ejemplo 10. Los anticuerpos y los frag­ mentos de anticuerpos producidos y/o utilizados en los métodos de la invención, preferiblemente tienen afinidades de unión de menos de 100 nM, más preferiblemente tienen afinidades de unión de menos de 10 nM y lo más preferible­ mente tienen afinidades de unión de menos de 2 nM, según se mide mediante un ensayo de resonancia de plasmón superficial, como se describe en el Ejemplo 10.
Anticuerpos (secundarios) que reconocen anticuerpos aglicosilados. La producción de anticuerpos en sistemas de expresión procariotas basados en E. coli u otros sin enzimas de glicosilación, generalmente produce anticuerpos agli­ cosilados que se pueden utilizar como anticuerpos primarios. Además de utilizar los sistemas de coexpresión inducible de la invención para producir anticuerpos primarios aglicosilados, los sistemas de coexpresión inducible de la invención también se pueden utilizar para producir de forma eficaz anticuerpos secundarios que reconocen específicamente anticuerpos primarios aglicosilados. Un aspecto de la presente invención es un sistema de anticuerpo secundario capaz de detectar un anticuerpo primario no glicosilado o aglicosilado para fines de investigación, analítica, diagnóstico o terapéuticos. A modo de ejemplo, se proporciona un sistema de anticuerpo secundario con los siguientes compo­ nentes: epítopo, anticuerpo primario, anticuerpo secundario y sistema de detección. El epítopo es una porción de un antígeno (por lo general una proteína) que es el determinante antigénico que produce una respuesta inmunológica cuando se introduce en un animal vivo o puede ser reconocido de otra manera por un anticuerpo. En la práctica, el epítopo de interés puede estar presente dentro de una mezcla o un tejido. En una realización, el epítopo es una proteína expresada en células de carcinoma en el tejido humano. El anticuerpo primario es un fragmento de anticuerpo, un anticuerpo aislado de longitud completa (monoclonal), o una mezcla de diferentes anticuerpos de longitud completa (policlonales), que reconoce y se une al epítopo, y preferiblemente se une específicamente al epítopo. Un anticuerpo de longitud completa en este ejemplo comprende dos cadenas polipeptídicas pesadas y dos cadenas polipeptídicas ligeras, unidas por puentes disulfuro. Cada una de las cadenas comprende una región constante (Fc) y una región variable (Fv). Hay dos sitios de unión a antígeno en el anticuerpo de longitud completa. En una realización de la presente invención, el anticuerpo primario es un anticuerpo aglicosilado de longitud completa (tal como el producido en un sistema de expresión basado en E. coli) que reconoce y se une a un epítopo de interés. El anticuerpo secundario es un fragmento de anticuerpo, un anticuerpo aislado de longitud completa (monoclonal), o una mezcla de diferentes anticuerpos de longitud completa (policlonales), que reconoce y se une al anticuerpo primario aglicosilado, y preferi­ blemente se une específicamente al anticuerpo primario aglicosilado. En una realización de la presente invención, el anticuerpo secundario es un anticuerpo de longitud completa que reconoce y se une a la porción Fc aglicosilada de un anticuerpo primario de longitud completa. En este caso, los sitios de unión al anticuerpo se seleccionan y/o se modifican genéticamente para reconocer específicamente la porción Fc del anticuerpo primario aglicosilado, con o sin el residuo de lisina C-terminal. En otras realizaciones, el anticuerpo secundario se podría modificar genéticamente para reconocer regiones adicionales (epítopos) del anticuerpo primario aglicosilado, o epítopos adicionales modifica­ dos genéticamente, incluyendo pero no limitados a secuencias de polipéptidos fijadas covalentemente al anticuerpo primario. El anticuerpo secundario se puede dirigir a sitios únicos o múltiples (epítopos) presentes en moléculas aglicosiladas de anticuerpos de longitud completa (incluyendo diversas clases de inmunoglobulinas, tales como IgG, IgA, etc.) o fragmentos de anticuerpos, tales como Fab o Fc. Por lo tanto, algunos anticuerpos secundarios generados de esta forma tendrían una amplia especificidad para cualquier anticuerpo aglicosilado de longitud completa. Los anti­ cuerpos primarios y secundarios de la presente invención también pueden incluir los producidos por métodos tradicio­ nales (producción de anticuerpos policlonales usando conejos inmunizados o producción de anticuerpos monoclonales usando hibridomas de ratón) y tecnología de ADN recombinante, tal como los métodos de presentación en fagos para identificar polipéptidos que se unen a antígeno.
Los sistemas de detección comprenden generalmente un agente que está ligado a o que se une al anticuerpo secun­ dario, lo que permite una detección, visualización y/o cuantificación del anticuerpo secundario. Se conocen bien en la técnica diversos sistemas de detección, incluyendo pero no limitados a colorantes fluorescentes, enzimas, isótopos radiactivos o metales pesados. Estos pueden implicar o no una conexión física directa de polipéptidos adicionales con el anticuerpo secundario. Las aplicaciones de este sistema de anticuerpos secundarios incluyen, pero no se limitan a la inmunohistoquímica, transferencia de tipo Western y ensayo de inmunoabsorción ligado a enzimas (ELISA). Por ejemplo, en una realización para uso en inmunohistoquímica, el epítopo de interés estará presente en una sección delgada de tejido, a continuación, un anticuerpo primario aglicosilado se aplica al tejido y se permite la unión con el epítopo. El anticuerpo primario no unido se elimina, y después un anticuerpo secundario capaz de unirse específica­ mente con el anticuerpo primario aglicosilado, se aplica al tejido y se permite que se una con el anticuerpo primario. El anticuerpo secundario no unido se retira, y después se aplican los reactivos del sistema de detección. Por ejemplo, si el anticuerpo secundario se uniera con una enzima, entonces sustratos enzimáticos con coloración se aplicarían al tejido y se dejaría que reaccionaran. Entonces se podría realizar una visualización microscópica o fluoroscópica directa de los sustratos enzimáticos reactivos. Otros métodos de detección son bien conocidos en la técnica. Las ventajas de un sistema que utiliza anticuerpos secundarios que reconocen anticuerpos aglicosilados incluyen, sin limitación, las siguientes: 1) aumento de la especificidad en la inmunohistoquímica debido a que el anticuerpo secundario está dise­ ñado para unirse a la porción Fc aglicosilada del anticuerpo primario que no está presente de otro modo en los tejidos eucariotas; 2) disminución de la tinción de fondo debido a una mayor especificidad hacia el anticuerpo primario; 3) disminución de los costes de producción del sistema de anticuerpos secundarios debido a que los anticuerpos prima­ rios y/o secundarios se pueden generar en procariotas tales como E. coli; y 4) se evita la utilización innecesaria de mamíferos, incluyendo ratones y conejos, ya que todo el proceso de desarrollo de los anticuerpos se puede realizar en procariotas tales como E. coli.
Enzimas utilizadas en aplicaciones industriales. Muchos procesos industriales emplean enzimas que se pueden pro­ ducir por los métodos de la invención. Estos procesos incluyen el tratamiento de aguas residuales y otros procesos de biorremediación y/o descontaminación; blanqueo de materiales en la industria papelera y textil; y degradación de la biomasa en material que se puede fermentar de manera eficaz en biocombustibles. En muchos casos, sería deseable producir enzimas para estas aplicaciones en células hospedadoras microbianas o preferiblemente en células hospedadoras bacterianas, pero la enzima activa es difícil de expresar en grandes cantidades debido a problemas con el plegamiento de la enzima y/o el requisito de un cofactor. En las siguientes realizaciones de la invención, los métodos de coexpresión inducible de la invención se usan para producir enzimas con aplicaciones industriales.
Enzimas que emplean arabinosa y xilosa. La D-xilosa es la pentosa más abundante en la biomasa vegetal, que se encuentra en polisacáridos, hemicelulosa y pectina, siendo la L-arabinosa la segunda pentosa más abundante. Para el desarrollo y la producción de biocarburantes y otros bioproductos, es útil convertir D-xilosa y L-arabinosa en hexosas, tales como glucosa y fructosa, ya que las hexosas fermentan de manera más eficaz en biocombustibles tales como el etanol. Como se ha descrito anteriormente, el operón araBAD de E. coli codifica proteínas que metabolizan la L-arabinosa del modo siguiente: L-arabinosa con L-arabinosa isomerasa (AraA, EC 5.3.1.4) a L-ribulosa; L-ribulosa con L-ribulocinasa (AraB, EC 2.7.1.16) a L-ribulosa-fosfato; L-ribulosa-fosfato con L-ribulosa-5-fosfato 4-epimerasa (AraD, EC 5.1.3.4) a D-xilulosa-5-fosfato (también denominada D-xilulosa-5-P), que forma parte de la vía de la pentosa fosfato para la formación de fructosa y glucosa. Otra vía enzimática (una "vía oxo-reductora") que convierte la L-arabinosa en xilitol, que luego se puede convertir en D-xilulosa-5-P, es del modo siguiente: L-arabinosa con L-arabinosa/D-xilosa reductasa (EC 1.1.1.21) a L-arabinitol; L-arabinitol con L-arabinitol deshidrogenasa (EC 1.1.1.12) a L-xilulosa; y L-xilulosa con L xilulosa reductasa (EC 1.1.1.10) a xilitol. El operón xylAB de E. coli codifica una vía enzi­ mática (la "vía isomerasa") para la utilización de D-xilosa, del modo siguiente: D-xilosa con D-xilosa isomerasa (XylA, EC 5.3.1.5) a D-xilulosa; D-xilulosa con xilulocinasa (XylB, EC 2.7.1.17) a D-xilulosa-5-P. Otra vía enzimática (una "vía oxo-reductora") para la conversión de D-xilosa en D-xilulosa-5-P es: D-xilosa con D-xilosa reductasa (EC 1.1.1.21) a xilitol; xilitol con xilitol deshidrogenasa (EC 1.1.1.9) a D-xilulosa; D-xilulosa con xilulocinasa (XylB, EC 2.7.1.17) a D-xilulosa-5-P. Debido a los diferentes cofactores necesarios en las vías oxo-reductoras, como NADPH, NAD‘ y ATP, y el grado en que estos cofactores están disponibles para el uso, un desequilibrio puede dar lugar a una sobreproducción de subproducto xilitol. D-xilulosa- 5-P más eritrosa 4-fosfato se pueden convertir mediante una transcetolasa (EC 2.2.1.1) en gliceraldehído 3-fosfato más fructosa 6-fosfato.
Los métodos de coexpresión inducible de la invención se pueden usar para producir enzimas que utilizan arabinosa y xilosa, que se definen como las enzimas que se mencionan con el número EC en el párrafo anterior. El número EC (o "Comisión de Enzimas", EC del inglés “Enzyme Commission”) para cada enzima se estableció por la Unión Interna­ cional de Bioquímica y Biología Molecular (IUBBM). Más información sobre estas enzimas y ejemplos específicos de las mismas se puede obtener fácilmente a través de la base de datos de proteínas UniProt (www.uniprot.org/uniprot) y la base de datos BRENDA, (www.brenda-enzymes.org/index). En algunas realizaciones una enzima que emplea arabinosa y xilosa se coexpresa con una proteína chaperona; en realizaciones adicionales de la invención, una enzima que emplea arabinosa o xilosa se coexpresa con un transportador para un cofactor. En ciertas realizaciones, la L-arabinosa isomerasa (AraA, EC 5.3.1.4) o la L arabinosa reductasa (EC 1.1.1.21) es producida por los métodos de la invención; en estas realizaciones, un promotor inducible con arabinosa no se utiliza en ninguna estructura artificial de expresión debido a que el inductor, L-arabinosa, se convertiría en L-ribulosa o L-arabinitol, respectivamente. Para la producción de enzimas que emplean arabinosa, distintas de L-arabinosa isomerasa (AraA, EC 5.3.1.4) o L-arabinosa reductasa (EC 1.1.1.21), un promotor inducible con arabinosa se puede utilizar si la célula hospedadora carece de EC 5.3.1.4 y/o EC 1.1.1.21, tal como un mutante araA, y no puede catabolizar la L-arabinosa. Del mismo modo, en reali­ zaciones en las que la D-xilosa isomerasa (XylA, EC 5.3.1.5) o D-xilosa reductasa (EC 1.1.1.21) se produce por los métodos de la invención, un promotor inducible con xilosa no se utiliza en ninguna estructura artificial de expresión porque el inductor, D-xilosa, se convierte en D-xilulosa o xilitol, respectivamente. Para la producción de enzimas que emplean xilosa, distintas de la D-xilosa isomerasa (XylA, EC 5.31.5) o D-xilosa reductasa (EC 1.1.1.21), un promotor inducible con xilosa se puede utilizar si la célula hospedadora carece de EC 5.3.1.5 y/o EC 1.1.1.21, tal como un mutante de xylA, y no puede catabolizar la D-xilosa.
La xilosa isomerasa (XylA, EC 5.3.1.5) es una enzima que se encuentra en microorganismos, hongos anaerobios y plantas, que cataliza la interconversión de un azúcar aldo (D-xilosa) a un azúcar ceto (D-xilulosa). También puede isomerizar D-ribosa a D-ribulosa y D-glucosa a D-fructosa. Esta enzima pertenece a la familia de las isomerasas, específicamente a las oxidorreductasas intramoleculares que interconvierten aldosas y cetosas. El nombre sistemático de esta clase de enzimas es D-xilosa aldosa-cetosa-isomerasa. Otros nombres de uso común incluyen D-xilosa iso­ merasa, D-xilosa cetoisomerasa, D-xilosa cetol-isomerasa y glucosa isomerasa. La enzima se utiliza industrialmente para convertir glucosa en fructosa en la fabricación de jarabe de maíz con alto contenido en fructosa y, como se ha descrito anteriormente, se puede utilizar en la conversión de pentosas a hexosas para la producción de biocombustible. La xilosa isomerasa es un homotetrámero y requiere dos cationes divalentes - Mg2+, Mn2+ y/o Co2+ - para una actividad máxima. La actividad xilosa isomerasa se puede medir usando un ensayo con arabitol deshidrogenasa ligado a NADH (Smith et al., "D-Xylose (D-glucose) isomerase from Arthrobacter strain N.R.R.L. B3728. Purification and properties", Biochem J 1991 Jul 1; 277 (Pt 1): 255-261), en el que una unidad de actividad xilosa isomerasa es la cantidad de enzima que convierte 1 micromol de D-xilosa en D-xilulosa en un minuto. En al menos algunas especies, la xilosa isomerasa requiere magnesio (o manganeso en el caso de plantas) para su actividad, aunque el cobalto puede ser necesario para estabilizar la estructura tetrámera de la enzima. Cada subunidad de xilosa isomerasa contiene un barril alfa/beta plegado de forma similar a la de otras enzimas TIM divalentes con barril (triosafosfato isomerasa) que de­ penden de metal, y la parte C-terminal más pequeña forma un plegamiento helicoidal extendido, implicado en la multimerización. Los residuos conservados en todas las xilosa isomerasas conocidas son una histidina en la sección N-terminal de la enzima, que se ha mostrado que está involucrada en el mecanismo catalítico de la enzima, y dos resi­ duos de glutamato, una histidina y cuatro residuos de aspartato que forman los dos sitios de unión a metal, cada uno de los cuales se une a un ion de magnesio, cobalto o manganeso (Katz et al., "Locating active-site hydrogen atoms in D-xylose isomerase: time-of-flight neutron diffraction", Proc Natl Acad Sci USA 2006 May 30; 103(22): 8342-8347; Epub 2006 May 17).
En algunas realizaciones de la invención, la coexpresión inducible se utiliza para expresar una proteína xilosa isomerasa; en ciertas realizaciones, la xilosa isomerasa ("XI") se selecciona a partir del grupo que consiste en: XI de Arthrobacter sp. de la cepa NRRL B3728 (UniProt P12070); XI de Bacteroides stercoris (UniProt B0NPH3); XI de Bifidobacterium longum (UniProt Q8G3Q1); XI de Burkholderia cenocepacia (UniProt Q1BG90); XI de Ciona intestinalis (UniProt F6WBF5); XI de Clostridium phytofermentans (UniProt A9KN98); XI ukk1 de Orpinomyces sp. (UniProt B7SLY1); XI E2 de Piromyces sp. (UniProt Q9P8C9); XI de Streptomyces lividans (UniProt Q9RFM4); XI TK24 de Streptomyces lividans (UniProt D6ESI7); XI JW 200 de Thermoanaerobacter ethanolicus (UniProt D2DK62); XI de Thermoanaerobacter yonseii (UniProt Q9KGU2); XI de Thermotoga neapolitana (UniProt P45687); XI de Thermus thermophilus (UniProt P26997); y XI de Vibrio sp. cepa XY-214 (UniProt C7G532). En realizaciones particulares, una xilosa isomerasa se coexpresa de manera inducible con un transportador de iones divalentes tal como CorA (UniProt P0ABI4): emplear un promotor inducible para controlar la coordinación y la duración del transporte de iones, puede ser útil para reducir la toxicidad en las células hospedadoras procedente de iones metálicos tales como Co2+. En realizaciones adicionales, se introducen mutaciones en proteínas xilosa isomerasas que afectan a la interacción entre parejas de monómeros de XI; por ejemplo, la introducción de residuos de cisteína de modo que se pueden formar enlaces disulfuro entre una pareja de monómeros (véase, Varsani et al., "Arthrobacter D-xylose isomerase: proteinengineered subunit interfaces", Biochem J 1993 Apr 15; 291 (Pt 2): 575-583). En este ejemplo, debido a que los residuos de cisteína se introducen en lugares recíprocos pero no idénticos dentro de los monómeros, se producen dos tipos diferentes de monómeros alterados, y los sistemas de coexpresión inducible de la invención se utilizan para valorar la expresión relativa de los dos tipos de monómeros para lograr la relación estequiométrica deseada.
Peroxidasas degradantes de lignina. Las peroxidasas son un subgrupo de las oxidorreductasas y se usan para catali­ zar una variedad de procesos industriales. Las oxidorreductasas pueden descomponer la lignina o actuar como reductasas en la degradación de la celulosa y la hemicelulosa, permitiendo a las enzimas utilizadas en el procesamiento de la biomasa vegetal, un acceso más sencillo a los residuos de sacáridos durante la producción de biocombustibles, tales como el etanol. Las oxidorreductasas pueden ser oxidasas o deshidrogenasas. Las oxidasas utilizan oxígeno molecular como un aceptor de electrones, mientras que las deshidrogenasas oxidan un sustrato mediante la transfe­ rencia de un grupo H- a un aceptor, tal como NAD/NADP+ o una enzima dependiente de flavina. Las peroxidasas catalizan la reducción de un peróxido, tal como peróxido de hidrógeno (H2O2). Otros tipos de oxidorreductasas incluyen oxigenasas, hidroxilasas y reductasas. Además del oxígeno, el dinucleótido de flavina adenina (FAD) y los dinucleótidos de nicotinamida adenina NAD y NADP, cofactores potenciales de oxidorreductasas incluyen citocromos y grupos hemo, disulfuro y proteínas de hierro-azufre.
Las peroxidasas degradantes de lignina pueden oxidar una variedad de compuestos aromáticos, incluyendo compues­ tos de alto potencial redox como la lignina, colorantes industriales, plaguicidas, etc. Se han identificado y caracterizado cuatro tipos de enzimas que modifican la lignina: lignina peroxidasa (LiP, EC 1.11.1.14), manganeso peroxidasa (MnP, EC 1.11.1.13), peroxidasa versátil (VP, EC 1.11.1.16) y lacasa (EC 1.10.3.2). LiP, MnP y VP son hemoproteínas con cuatro o cinco enlaces disulfuro y dos sitios de unión para iones Ca2+ estructurales, y son peroxidasas de alto potencial redox que pueden oxidar directamente sustratos de alto potencial redox y/o Mn2+. La actividad peroxidasa de MnP se puede medir usando el ensayo de oxidación de 2,6-dimetoxifenol (2,6-DMP) descrito en el Ejemplo 4, Sección E, a continuación; la actividad de LiP se puede medir mediante la oxidación de alcohol veratrílico a aldehído veratrílico en presencia de H2O2 (Orth et al., "Overproduction of lignin-degrading enzymes by an isolate of Phanerochaete chrysosporium", Appl Environ Microbiol 1991 Sep; 57(9): 2591-2596). Las lacasas no están asociadas con grupos hemo, pero están asociadas con iones de cobre (generalmente 4 iones de cobre por proteína de lacasa), y son oxido­ rreductasas de bajo potencial redox, que solo pueden oxidar sustratos de alto potencial redox en presencia de media­ dores redox. La actividad de las lacasas se puede medir usando el ensayo de oxidación ABTS (2,2'-azinobis-(ácido 3-etilbenzotiazolin-6-sulfónico)) como se describe en Zhao et al., "Characterisation of a novel white laccase from the deuteromycete fungus Myrothecium verrucaria NF-05 and its decolourisation of dyes", PLoS One 2012; 7(6): e38817; Epub 2012 Jun 8; una unidad de actividad se define como la producción de 1 micromol de producto por minuto.
Los métodos de coexpresión inducible de la invención se pueden utilizar para producir peroxidasas degradantes de lignina, que se definen como las enzimas que se mencionan por el número de EC en el párrafo anterior. En algunas realizaciones, una peroxidasa degradante de lignina se coexpresa con una proteína chaperona; en realizaciones adi­ cionales de la invención, una peroxidasa degradante de lignina se coexpresa con un transportador para un cofactor, tal como un grupo hemo.
LiP se puede expresar utilizando los sistemas de coexpresión inducible de la invención; en ciertas realizaciones, la LiP se selecciona a partir del grupo que consiste en: isoenzimas de LiP de Phanerochaete chrysosporium (Sporotrichum pruinosum) "ligninasa A" (UniProt P31837), "ligninasa B" (UniProt P31838), "ligninasa H2" (UniProt p 11542), "ligninasa H8" (UniProt P06181), "ligninasa LG2" (UniProt P49012), "ligninasa LG3" (UniProt P21764), "ligninasa LG5" (UniProt P11543) y "ligninasa LG6" (UniProt P50622); "ligninasa-3" de Phlebia radiata (UniProt P20010); isoenzimas de LiP de Trametes versicolor (Coriolus versicolor) "ligninasa C" (UniProt P20013), LP7 (UniProt Q99057) y LP12 (UniProt Q7LHY3); y LiP de Trametopsis cervina (UniProt Q3C1R8) y (UniProt Q60FD2).
En algunas realizaciones de la invención, la coexpresión inducible se utiliza para expresar MnP; en ciertas realizacio­ nes, la MnP se selecciona a partir del grupo que consiste en: MnP de Agaricus bisporus (UniProt Q5TJC2); MnP de Agrocybe praecox (UniProt G4WG41); MnP de Ganoderma lucidum (UniProt C0IMT8); MnP de Lenzites gibbosa (Uni­ Prot C3V8Q9); isoenzimas de MnP de Phanerochaete chrysosporium MnP1 (UniProt Q02567); H3 (UniProt P78733); y H4 (UniProt P19136); isoenzimas de MnP de Phlebia radiata MnP2 (UniProt Q70LM3) y MnP3 (UniProt Q96TS6); MnP b19 de Phlebia sp. (UniProt B2BF37); isoenzimas de MnP MG60 de Phlebia sp. MnP1, MnP2, MnP3 (UniProt B1B554, B1B555 y B1B556, respectivamente); MnP3 de Pleurotus ostreatus (UniProt B9VR21); MnP5 de Pleurotus pulmonarius (UniProt Q2VT17); MnP FERM P-18171 de Spongipellis sp. (UniProt Q2HWK0); e isoenzimas de MnP de Trametes versicolor (Coriolus versicolor) (UniProt Q99058, Q6B6M9, Q6B6N0, Q6B6N1 y Q6B6N2). La coexpresión de MnP con la proteína disulfuro isomerasa en presencia de hemo, se describe en el Ejemplo 4.
La lacasa se puede expresar utilizando los sistemas de coexpresión inducible de la invención; en ciertas realizaciones, la lacasa se selecciona entre el grupo que consiste en: isoenzimas de lacasa de Botryotinia fuckeliana (Botrytis cinerea) (UniProt Q12570, Q96UM2 y Q96WM9); isoenzimas de lacasa WR1 de Cerrena sp. (UniProt E7b Lq 8, E7BLQ9 y E7BLR0); lacasa de Cerrena unicolor (Daedalea unicolor) (UniProt B8YQ97); isoenzimas de lacasa de Ganoderma lucidum (UniProt Q6RYA2, B5G547, B5G549, B5G550, B5G551 y B5G552); lacasa de Melanocarpus albomyces (Uni­ Prot Q70KY3); isoenzimas de lacasa de Pleurotus ostreatus (UniProt Q12729, Q12739, Q6RYA4, Q6 RYA4 y G3FGX5); isoenzimas de lacasa de Pycnoporus cinnabarinus (UniProt 059896, Q9UVQ2, D2CSG0, D2CSG1, D2CSG4, D2CSG6 y D2CSG7); isoenzimas de lacasa de Pycnoporus coccineus (UniProt D2CSF2, D2CSF5, D2CSF6, D2CSM7 y D7F484); lacasa de Trametes hirsuta (Coriolus hirsutus) (UniProt Q02497); lacasa de Trametes maxima (Cerrena maxima) (UniProt D0VWU3); isoenzimas de lacasa de Trametes versicolor (Coriolus versicolor) (UniProt Q12717, Q12718 y Q12719); e isoenzimas de lacasa de Trametes villosa (UniProt Q99044, Q99046, Q99049, Q99055 y Q99056).
Aunque las tres principales enzimas modificadoras de lignina de hongos de pudrición blanca son LiP, MnP y lacasa, otro tipo de peroxidasa, la peroxidasa versátil (VP), se encuentra en varias especies de los géneros Pleurotus y Bjerkandera. VP es de interés debido a su versatilidad catalítica: puede oxidar sustratos de LiP, alcohol veratrílico, metoxibencenos y compuestos modelo de lignina no fenólicos, así como el sustrato de MnP Mn2+. La actividad versátil de VP se puede someter a ensayo usando el ensayo con 2,6-DMP de MnP, o el ensayo con alcohol veratrílico de LiP, o el ensayo con ABTS de lacasa (véase más arriba). En algunas realizaciones de la invención, la coexpresión inducible se utiliza para expresar VP; en ciertas realizaciones, la VP se selecciona a partir del grupo que consiste en: VP de Bjerkandera adusta (UniProt A5JTV4); isoenzimas de VP de Pleurotus eryngii (UniProt 094753, Q9UR19 y Q9UVP6); y VP de Pleurotus pulmonarius (UniProt I6TLM2).
También se desvela en el presente documento:
1. Una célula hospedadora que comprende dos o más tipos de construcciones de expresión,
en donde la construcción de expresión de cada tipo comprende un promotor inducible y una secuencia polinucleotídica que codifica un producto génico para transcribir a partir del promotor inducible; y
al menos uno de dichos promotores inducibles es sensible a un inductor que es diferente del inductor de otro de dichos promotores inducibles; y
al menos uno de dichos productos génicos forma un multímero con otro de dichos productos génicos.
2. Una célula hospedadora que comprende dos o más tipos de construcciones de expresión,
en donde la construcción de expresión de cada tipo comprende un promotor inducible y una secuencia polinucleotídica que codifica un producto génico para transcribir a partir del promotor inducible; y
al menos uno de dichos productos génicos se selecciona del grupo que consiste en:
(a) un polipéptido que carece de un péptido señal y que forma al menos tres enlaces disulfuro;
(b) un polipéptido seleccionado del grupo que consiste en enzimas de utilización de arabinosa y xilosa; y
(c) un polipéptido seleccionado del grupo que consiste en peroxidasas degradantes de lignina.
3. La célula hospedadora del párrafo 1 o 2 en donde al menos un promotor inducible es un promotor inducible por L-arabinosa.
4. La célula hospedadora del párrafo 1 o 2 en donde al menos un promotor inducible es un promotor inducible por propionato.
5. La célula hospedadora del párrafo 1 o 2 en donde al menos un promotor inducible se selecciona del grupo que consiste en: el promotor de araBAD, el promotor de prpBCDE, el promotor de rhaSR y el promotor de xlyA.
6. La célula hospedadora del párrafo 1 o 2 en donde cada promotor inducible no es un promotor inducible por lactosa.
7. La célula hospedadora del párrafo 1 o 2 en donde al menos una construcción de expresión comprende además una secuencia polinucleotídica que codifica un regulador de la transcripción que se une con un promotor inducible.
8. La célula hospedadora del párrafo 7 en donde la secuencia polinucleotídica que codifica un regulador de la trans­ cripción y el promotor inducible con el que se une dicho regulador de la transcripción están en la misma construcción de expresión.
9. La célula hospedadora del párrafo 7 en donde el regulador de la transcripción se selecciona del grupo que consiste en: AraC, PrpR, RhaR y XylR.
10. La célula hospedadora del párrafo 1 o 2 en donde al menos una construcción de expresión se produjo mediante un método que comprende una etapa de insertar una secuencia polinucleotídica en un plásmido seleccionado del grupo que consiste en: pBAD18, pBAD18-Cm, pBAD18-Kan, pBAD24, pBAD28, pBAD30, pBAD33, pPRO18, pPRO18-Cm, pPRO18-Kan, pPRO24, pPRO30 y pPRO33.
11. La célula hospedadora del párrafo 1 en donde al menos un producto génico es un polipéptido.
12. La célula hospedadora del párrafo 1 o 2 en donde al menos un producto génico se selecciona del grupo que consiste en: (a) una cadena pesada de inmunoglobulina; (b) una cadena ligera de inmunoglobulina; y (c) un fragmento de cualquiera de (a) - (b).
13. La célula hospedadora del párrafo 12 en donde el producto génico es una cadena ligera de inmunoglobulina. 14. La célula hospedadora del párrafo 12 en donde el producto génico es una cadena pesada de inmunoglobulina.
15. La célula hospedadora del párrafo 1 o 2 en donde al menos un producto génico es un polipéptido que carece de un péptido señal y que forma al menos tres enlaces disulfuro.
16. La célula hospedadora del párrafo 15 en donde el polipéptido forma varios enlaces disulfuro seleccionados del grupo que consiste en: (a) al menos tres y menos de diecisiete enlaces disulfuro; y (b) al menos dieciocho y menos de cien enlaces disulfuro.
17. La célula hospedadora del párrafo 15 en donde el polipéptido forma al menos tres y menos de diez enlaces disul­ furo.
18. La célula hospedadora del párrafo 15 en donde el polipéptido forma al menos tres y menos de ocho enlaces disulfuro.
19. La célula hospedadora del párrafo 15 en donde el polipéptido se selecciona del grupo que consiste en: (a) una cadena pesada de inmunoglobulina; (b) una cadena ligera de inmunoglobulina; (c) manganeso peroxidasa; y (d) un fragmento de cualquiera de (a) - (c).
20. La célula hospedadora del párrafo 2 en donde al menos un producto génico es un polipéptido seleccionado del grupo que consiste en enzimas de utilización de arabinosa y xilosa.
21. La célula hospedadora del párrafo 20 en donde el polipéptido es xilosa isomerasa.
22. La célula hospedadora del párrafo 2 en donde al menos un producto génico es un polipéptido seleccionado del grupo que consiste en peroxidasas degradantes de lignina.
23. La célula hospedadora del párrafo 22 en donde el polipéptido es manganeso peroxidasa.
24. La célula hospedadora del párrafo 22 en donde al menos un producto génico adicional es proteína disulfuro isomerasa.
25. La célula hospedadora del párrafo 22 en donde el polipéptido es peroxidasa versátil.
26. La célula hospedadora del párrafo 1 o 2 en donde la célula hospedadora comprende dos tipos de construcciones de expresión.
27. La célula hospedadora del párrafo 26 en donde un tipo de construcción de expresión se produce mediante un método que comprende una etapa de insertar una secuencia polinucleotídica en un plásmido pBAD24 y el otro tipo de construcción de expresión se produce mediante un método que comprende una etapa de insertar una secuencia poli­ nucleotídica en un plásmido pPRO33.
28. La célula hospedadora del párrafo 1 o 2 en donde la célula hospedadora tiene una alteración de la función génica de al menos un gen que codifica una proteína transportadora para un inductor de al menos uno de dichos promotores inducibles.
29. La célula hospedadora del párrafo 28 en donde el gen que codifica una proteína transportadora se selecciona del grupo que consiste en araE, araF, araG, araH, rhaT, xylF, xylG y xylH.
30. La célula hospedadora del párrafo 1 o 2 en donde la célula hospedadora tiene un nivel reducido de función génica de al menos un gen que codifica una proteína que metaboliza un inductor de al menos uno de dichos promotores inducibles.
31. La célula hospedadora del párrafo 30 en donde el gen que codifica una proteína que metaboliza un inductor de al menos uno de dichos promotores inducibles se selecciona del grupo que consiste en araA, araB, araD, prpB, prpD, rhaA, rhaB, rhaD, xylA y xylB.
32. La célula hospedadora del párrafo 1 o 2 en donde la célula hospedadora tiene un nivel reducido de función génica de al menos un gen que codifica una proteína implicada en la biosíntesis de un inductor de al menos uno de dichos promotores inducibles.
33. La célula hospedadora del párrafo 32 en donde el gen que codifica una proteína implicada en la biosíntesis de un inductor de al menos uno de dichos promotores inducibles se selecciona del grupo que consiste en scpA/sbm, argK/ygfD, scpB/ygfG, scpC/ygfH, rmlA, rmlB, rmlC y rmlD.
34. La célula hospedadora del párrafo 1 o 2 en donde la célula hospedadora es una célula procariota.
35. La célula hospedadora del párrafo 34 en donde la célula hospedadora es E. coli.
36. La célula hospedadora del párrafo 1 o 2 en donde la célula hospedadora tiene una función génica alterada de un gen que afecta al ambiente de reducción/oxidación del citoplasma de la célula hospedadora.
37. La célula hospedadora del párrafo 36 en donde el gen que afecta al ambiente de reducción/oxidación del cito­ plasma de la célula hospedadora se selecciona del grupo que consiste en gor y gshB.
38. La célula hospedadora del párrafo 1 o 2 en donde la célula hospedadora tiene un nivel reducido de función génica de un gen que codifica una reductasa.
39. La célula hospedadora del párrafo 38 en donde el gen que codifica una reductasa es trxB.
40. La célula hospedadora del párrafo 1 o 2 en donde la célula hospedadora comprende al menos una construcción de expresión que codifica al menos una proteína isomerasa de enlace disulfuro.
41. La célula hospedadora del párrafo 40 en donde al menos una construcción de expresión codifica la proteína iso­ merasa de enlace disulfuro DsbC.
42. La célula hospedadora del párrafo 1 o 2 en donde la célula hospedadora comprende al menos un polinucleótido que codifica una forma de DsbC que carece de un péptido señal.
43. La célula hospedadora del párrafo 1 o 2 en donde la célula hospedadora comprende al menos un polinucleótido que codifica Erv1p.
44. La célula hospedadora del párrafo 1 o 2 en donde la construcción de expresión de cada tipo comprende un pro­ motor inducible que es diferente del promotor inducible de la construcción de expresión de cada otro tipo.
45. La célula hospedadora del párrafo 1 o 2 en donde la construcción de expresión de cada tipo comprende un origen de replicación que es diferente del origen de replicación de la construcción de expresión de cada otro tipo.
46. Una célula hospedadora de E. coli que comprende dos tipos de construcciones de expresión, en donde un tipo de construcción de expresión se produce mediante un método que comprende una etapa de insertar una secuencia polinucleotídica en un plásmido pBAD24 y el otro tipo de construcción de expresión se produce mediante un método que comprende una etapa de insertar una secuencia polinucleotídica en un plásmido pPRO33; y que comprende además dos o más de los siguientes: (a) una supresión de los genes araBAD; (b) una función génica alterada de los genes araE y araFGH; (c) un gen lacY(A177C); (d) una función génica reducida de los genes prpB y prpD; (e) una función génica reducida de los genes sbm/scpA-ygfD/argK-ygfGH/scpBC, preferentemente sin afectar a la expresión del gen ygfI; (f) una función génica reducida de los genes gor y trxB; (g) una función génica del gen AscG; (h) un polinucleótido que codifica una forma de DsbC que carece de un péptido señal; (i) un polinucleótido que codifica Erv1p; (j) un poli­ nucleótido que codifica proteína disulfuro isomerasa; (j) un polinucleótido que codifica ChuA; y (l) un polinucleótido que codifica una chaperona.
47. La célula hospedadora del párrafo 46 en donde al menos una construcción de expresión comprende además una secuencia polinucleotídica que codifica un producto génico para transcribir a partir de un promotor inducible.
48. La célula hospedadora del párrafo 47 en donde el producto génico se selecciona del grupo que consiste en: (a) una cadena pesada de inmunoglobulina; (b) una cadena ligera de inmunoglobulina; y (c) un fragmento de cualquiera de (a) - (b).
49. Un método para producir un producto génico, comprendiendo el método dejar crecer un cultivo de la célula hospedadora del párrafo 1 o 2 y añadir un inductor de al menos un promotor inducible al cultivo.
50. Un producto génico producido por el método del párrafo 49.
51. El producto génico del párrafo 50, en donde el producto génico es un producto multimérico.
52. El producto multimérico
Figure imgf000031_0001
del párrafo 51, en donde el producto multimérico es un anticuerpo.
53. El producto multimérico
Figure imgf000031_0002
del párrafo 52, en donde el producto multimérico es un anticuerpo aglucosilado.
54. El producto multimérico
Figure imgf000031_0003
del párrafo 52, en donde el producto multimérico es un anticuerpo humano.
55. Un kit que comprende la célula hospedadora del párrafo 1 o 2.
56. Un kit que comprende el producto génico del párrafo 50.
57. Un kit que comprende el producto multimérico del párrafo 51.
Ejemplo 1 [ejemplo comparativo]
Coexpresión inducible de cadenas pesadas y ligeras de IgG1 para producir anticuerpos de longitud completa en célu­ las bacterianas
A. Construcción de los vectores de expresión
El sistema de coexpresión inducible se utilizó para producir anticuerpos de longitud completa, específicamente anti­ cuerpos de IgG1 de ratón anti-CD19 humano, en células bacterianas. La secuencia que codifica la cadena pesada de
IgG1 de ratón anti-CD19 humano ("cadena pesada de IgG1", "IgG1HC", "cadena pesada" o "HC") se proporciona
como SEQ ID N°: 1 y es la misma que la de GenBank n° de orden AJ555622.1, y específicamente las bases 13 hasta
1407 de la secuencia de nucleótidos de GenBank AJ555622.1. La secuencia de aminoácidos correspondiente de la cadena pesada de IgG1 de ratón anti-CD19 humano de longitud completa, se proporciona como SEQ ID N°: 2 (y es la misma que la de GenBank n° de orden CAD88275.1). La secuencia que codifica la cadena ligera de IgG1 de ratón
anti-CD19 humano ("cadena ligera de IgG1", "IgG1LC", "cadena ligera" o "LC") se proporciona como SEQ ID N°: 3 y es la misma que la de GenBank n° de orden AJ555479.1, y específicamente las bases 23 a 742 de la secuencia de nucleótidos de GenBank AJ555479.1. La secuencia de aminoácidos correspondiente de la cadena ligera de IgG1 de
ratón anti-CD19 humano de longitud completa, se proporciona como SEQ ID N°: 4 (y es la misma que la de GenBank n° de orden CAD88204.1).
La síntesis de polinucleótidos que codifican las cadenas pesadas y ligeras de IgG1, y la optimización de la expresión
en E. coli, se llevó a cabo mediante GenScript (Piscataway, NJ). El sistema de diseño de genes OptimumGene® utiliza
un algoritmo, el algoritmo OptimumGene®, que tiene en cuenta una variedad de factores involucrados en diferentes etapas de la expresión de proteínas, tales como el sesgo de uso de codones, el contenido en GC, el contenido en dinucleótido CpG, la estructura prevista de ARNm y varios elementos en cis en la transcripción y la traducción. Las secuencias optimizadas para las cadenas pesadas y ligeras de IgG1 se proporcionan como SEQ ID N°: 5 y SEQ ID
N°: 6, respectivamente; estas secuencias optimizadas incluyen algunos nucleótidos adicionales aguas arriba y aguas abajo de la secuencia codificante; las secuencias codificadoras son las bases 25 hasta 1419 de SEQ ID N°: 5, y las bases 25 hasta 747 de SEQ ID N°: 6. La secuencia codificante optimizada en SEQ ID N°: 10 para la cadena ligera de
IgG1, codifica un aminoácido adicional, un residuo de alanina, en la posición 2 de la secuencia de aminoácidos codi­ ficada, en relación con la secuencia de aminoácidos de la cadena ligera de IgG1, SEQ ID N°: 4. Las secuencias optimizadas de la cadena pesada y ligera, contienen ambas codones de parada TAA y una secuencia preferida de unión al ribosoma de E. coli (AGGAGG), situada a -14 a -9 bases aguas arriba del codón de iniciación. Además, la secuencia optimizada de la cadena pesada de IgG1 (SEQ ID N°: 5) contiene un sitio de restricción de NcoI que com­ prende el codón de iniciación ATG, y un sitio de restricción de HindIII inmediatamente aguas abajo del codón de parada
TAA, mientras que la secuencia optimizada de la cadena ligera de IgG1 (SEQ ID N°: 6) contiene un sitio de restricción
de NheI inmediatamente aguas arriba de la secuencia de unión al ribosoma, y también un sitio de restricción de HindIII inmediatamente aguas abajo del codón de parada TAA.
Las secuencias codificadoras optimizadas para las cadenas pesadas y ligeras de IgG1 se obtuvieron a partir de GenS­ cript como insertos de polinucleótidos clonados en pUC57. El vector pBAD24 se obtuvo de la American Type Culture Collection (ATCC) como ATCC 87399, y tiene la secuencia de nucleótidos mostrada en la base de datos GenBank n° de orden X81837.1 (25-OCT-1995); el vector pPRO33 se obtuvo de la Universidad de California (Berkeley, California), y tiene la secuencia de nucleótidos mostrada en SEQ ID N°: 7. La secuencia de nucleótidos de pPRO33 se compiló a partir de las secuencias del vector pBAD18 (GenBank n° de orden X81838.1), la secuencia genómica de E. coli de la región prpR-Pjp, y el vector pBAD33, como se describe en Guzman et al., "Tight regulation, modulation, and high-level expression by vectors containing the arabinose PBAD promoter", J Bacteriol 1995 Jul; 177(14): 4121-4130, y en el documento de patente de EE.UU. n° 8178338 B2; 15 de mayo de 2012; Keasling, Jay. Para clonar la cadena pesada
de IgG1 en el vector pBAD24, y la cadena ligera de IgG1 en el vector pPRO33, las estructuras artificiales pUC57-HC
y pUC57-LC se transformaron primero en células de E. coli BL21 (New England Biolabs (o 'NEB'), Ipswich, Massachusetts) usando el método de choque térmico. A continuación, el ADN del plásmido para cada uno de estos vectores se obtuvo por un método de miniprep. A menos que se indique lo contrario, el crecimiento de las células de E. coli en cultivo líquido era a 37°C con agitación rotatoria a 250 rpm. Cepas de células de E. coli que contenían plásmidos (BL21 que contenía pUC57-HC, BL21 que contenía pUC57-LC y DH5alpha que contenía pBAD24) se cultivaron cada una en 8 mL de medio LB ampicilina (“AMP”), y las células de E. coli DH10B (Life Technologies, Grand Island, Nueva York) que contenían pPRO33 se cultivaron en 5 mL de medio LB cloranfenicol (“CAM”), durante 14 horas o durante una noche, a continuación, las células se sedimentaron, se lisaron y el ADN del plásmido se separó por medio de una columna de centrifugación QIAprep® (QIAGEN, Germantown, MD) de acuerdo con el protocolo del fabricante. Para mayores rendimientos, el protocolo de columna de centrifugación QIAprep® se realizó con 100% de etanol añadido al tampón PE, y el material sobrenadante se pasó a través de la columna dos veces, en lugar de una vez.
Para clonar la cadena pesada de IgG1 en pBAD24, los plásmidos purificados pUC57-HC y pBAD24 se digirieron con las enzimas de restricción NcoI y HindIII (NEB), entonces el fragmento NcoI-HindIII de IgG1HC y el plásmido pBAD24 cortado con NcoI-HindIII se separaron de otros fragmentos de polinucleótidos mediante electroforesis en gel, se es­ cindieron del gel y se purificaron usando el kit de purificación de bandas illustra GFX Gel (GE Healthcare Life Sciences, Piscataway, NJ) según las instrucciones del fabricante. A continuación, se ligó el fragmento NcoI-HindIII de IgG1HC (durante una noche a 16°C) con el plásmido pBAD24 cortado con NcoI-HindIII para formar la estructura artificial de expresión pBAD24-HC. Debido a que el sitio de restricción de NcoI en el fragmento NcoI-HindIII de IgG1HC comprende el codón de iniciación ATG de la secuencia que codifica IgG1HC, cuando se inserta el fragmento NcoI-HindIII de IgG1HC en el vector pBAD24 cortado con NcoI-HindIII, la secuencia que codifica IgG1HC se coloca aguas abajo de una secuencia preferida de E. coli de unión al ribosoma, AGGAGG, presente en el vector pBAD24 (véase la Figura 1 de Guzman et al., "Tight regulation, modulation, and high-level expression by vectors containing the arabinose PBAD promoter", J Bacteriol 1995 Jul; 177(14): 4121-4130). En la estructura artificial de expresión resultante pBAD24-HC, la secuencia de unión al ribosoma se encuentra localizada desde -14 a -9 a bases aguas arriba del codón de iniciación de IgG1HC.
Para clonar la cadena ligera de IgG1 en pPRO33, los plásmidos pUC57-LC y pPRO33 purificados se digirieron con las enzimas de restricción NheI y HindIII (NEB). Debido a que el plásmido pPRO33 tiene dos sitios de restricción de HindIII, había dos fragmentos que se tenían que purificar en gel procedentes de la digestión de pPRO33 con NheI-HindIII: un fragmento de 4,4 kb y un fragmento de 1,5 kb. Después de la purificación en gel de todos los fragmentos deseados, utilizando un kit de purificación de bandas illustra g Fx Gel (véase más arriba), el fragmento de pPRO33 de 4.4 kb purificado se trató con fosfatasa alcalina (también denominada fosfatasa intestinal de ternera o CIP) (NEB), de acuerdo con las instrucciones del fabricante. El fragmento de 4,4 kb de pPRO33 tratado con CIP, se purificó de la mezcla de reacción de fosfatasa utilizando un kit de purificación illustra g Fx (véase más arriba), y después se ligó al fragmento de 1,5 kb de pPRO33 (a 16°C durante 10,5 horas). El plásmido resultante pPRO33 cortado con NheI-HindIII se ligó al fragmento NheI-HindIII de IgG1LC (durante una noche a 16°C) para formar la estructura artificial de expresión pPRO33-LC. Debido a que el sitio de restricción de NheI en el fragmento NheI-HindIII de IgG1LC se encuentra inme­ diatamente aguas arriba de la secuencia de unión al ribosoma AGGAGG en la secuencia optimizada de la cadena ligera (SEQ ID N°: 6), cuando se inserta el fragmento NheI-HindIII de IgG1LC en el vector pPRo33 cortado con NheI-HindIII, la secuencia de IgG1LC conserva su secuencia preferida de unión al ribosoma de E. coli.
B. Coexpresión inducible de las cadenas pesada y ligera de IgG1 en células bacterianas
La estructura artificial de expresión pBAD24-HC y la estructura artificial de expresión pPRO33-LC se co-transformaron en células de E. coli BL21 y en células de E. coli SHuffle® Express (NEB), utilizando el método de choque térmico. Las células transformadas BL21 (pBAD24-HC/pPRO33-LC) y SHuffle® Express (pBAD24-HC/pPRO33-LC) se cultivaron a 37°C durante una noche en 5 mL de medio LB con 30 microgramos/mL de CAM y 100 microgramos/mL de AMP. Debido a que las células SHuffle® Express parecen crecer más lentamente que las células BL21, 2% (100 microlitros) del cultivo de una noche de SHuffle® Express (pBAD24-HC/pPRO33-LC) y 1% (50 microlitros) del cultivo de una noche de BL21 (pBAD24-HC/pPRO33-LC), se utilizaron para inocular 5 mL de medio mínimo M9 con casaminoácidos y 0,2% de glicerol, más 30 microgramos/mL de CAM y 100 microgramos/mL de AMP. Estos cultivos se dejaron crecer hasta que la DO60 era de aproximadamente 0,5: 3,1 horas para las células SHuffle® Express (pBAD24-HC/pPRO33-LC) y 2.5 horas para las células BL21 (pBAD24-HC/pPRO33-LC). Antes de la inducción, se tomaron muestras de control de cada cultivo que había crecido sin inducción. El resto de cultivos celulares de SHuffle® Express (pBAD24-HC/pPRO33-LC) y BL21 (pBAD24-HC/pPRO33-LC) se indujo entonces con la adición de 0,2% de arabinosa y propionato 50 mM, y crecieron en paralelo con las muestras de control no inducidas durante 6 horas. Al final de ese tiempo, se centrifu­ garon todos los cultivos celulares para sedimentar las células, y se colocaron en un congelador a -80°C. Los sedimen­ tos celulares se descongelaron sobre hielo, y las células se lisaron usando un kit de lisis bacteriana Qproteome (QIA­ GEN), según las instrucciones del fabricante, con las excepciones de que se añadió un comprimido de mezcla de inhibidores de proteasas Complete Mini (Roche, Indianapolis, Indiana) a 10 mL de tampón de lisis natural, antes de añadir la lisozima y la nucleasa, y que las muestras se centrifugaron a 25°C en lugar de a 4°C.
Los extractos de proteínas solubles procedentes de las células inducidas y los controles no inducidos se separaron por electroforesis en gel de SDS en condiciones reductoras, en un gel de Bis-Tris al 4-12% de NuPAGE® (Life Tech­ nologies, Grand Island, Nueva York). El gel se tiñó usando RAPIDstain® (G-Biosciences, St. Louis, Missouri). Como se muestra en la Figura 3, se observó que una banda de proteína (cadena pesada) migraba a 51 kDa y otra banda de proteína (cadena ligera) a 26 kDa; estas bandas están presentes en las células inducidas, pero no en las células no inducidas. Los mismos extractos de proteínas solubles a partir de células SHuffle® Express y BL21 inducidas y no inducidas que contenían tanto los vectores de expresión inducibles pBAD24-HC como pPRO33-LC, se separaron por electroforesis en gel en condiciones naturales (no reductoras) sobre un gel NOVEX® de Tris-Glicina al 10-20% (Life Technologies). El gel se tiñó usando RAPIDstain® (G-Biosciences). Como se muestra en la Figura 4, una banda de proteína (anticuerpo IgG1 que comprendía las cadenas pesadas y ligeras) migra a 154 kDa; esta banda está presente en las células SHuffle® Express inducidas, pero se reduce significativamente o está ausente en las células b L21 indu­ cidas y en las células no inducidas.
Ejemplo 2
Caracterización de las estructuras artificiales de expresión y anticuerpos IgG1 de longitud completa producidos en células bacterianas
A. Caracterización de los vectores de expresión
La secuencia de las estructuras artificiales de expresión pBAD24-HC y pPRO33-LC se confirma utilizando los ceba­ dores mostrados en la tabla siguiente, para iniciar las reacciones de secuenciación de terminación de cadena didesoxi, junto con otros cebadores diseñados según sea necesario. La secuencia de nucleótidos del promotor prpBCDE y la región del vector pPRO24 aguas arriba del MCS, como se muestra en la Figura 1C del documento de Patente de EE.UU. n° 8178338 B2, se utiliza para diseñar al menos un cebador directo de oligonucleótidos para secuenciar se­ cuencias clonadas en el MCS de los vectores de expresión pPRO.
Tabla 4. Cebadores de oligonucleótidos
Figure imgf000033_0001
B. Detección de los anticuerpos de longitud completa de IgG1 de ratón sobre una transferencia Western
Los geles de proteínas utilizados para separar los extractos de proteínas solubles mediante electroforesis (geles Bis-Tris al 4-12% de NuPAGE® o geles Tris-Glicina al 10-20% de NOVEX®), como se describen en el Ejemplo 1, se colocan en un módulo de transferencia XCell II® (Life Technologies, Grand Island, Nueva York). Se aplica corriente al gel de acuerdo con las instrucciones del fabricante, lo que da lugar a la transferencia de proteínas desde el gel a una mem­ brana de nitrocelulosa. La membrana de nitrocelulosa se incuba entonces con un anticuerpo primario, IgG anti-ratón, a 4°C durante una noche. La membrana de nitrocelulosa se lava después para eliminar el anticuerpo no unido, y se incuba con un anticuerpo secundario, IgG de cabra anti-ratón conjugado con fosfatasa alcalina, durante una hora a temperatura ambiente. La membrana de nitrocelulosa se lava entonces para eliminar el anticuerpo secundario no unido, se incuba con una solución que contiene tetrazolio de nitroazul (NBT) y 5-bromo-4-cloro-indolil-fosfato (BCIP) para teñir la o las bandas de proteínas, y después se lava para eliminar el exceso de solución de tinción.
Ejemplo 3
Introducción de alteraciones genómicas en células hospedadoras para facilitar la coexpresión
Como se ha descrito anteriormente, ciertos cambios en la expresión génica de la célula hospedadora pueden mejorar la coexpresión del o de los productos génicos deseados. Las siguientes deleciones y alteraciones se realizaron en el genoma de la célula hospedadora de E. coli SHuffle® Express de Gene Bridges GmbH (Heidelberg, Alemania), utili­ zando un método de modificación por recombinación, descrito como una deleción por contraselección, que elimina perfectamente secuencias genómicas. Una deleción del operón araBAD de la célula hospedadora se realizó para reducir el catabolismo de la arabinosa a través de la célula hospedadora, de manera que estaba disponible más in­ ductor arabinosa para la inducción de un producto génico coexpresado procedente de una estructura artificial de ex­ presión que comprendía el promotor araBAD. Esta deleción elimina 4269 pares de bases del operón araBAD, corres­ pondientes a la posición 70.135 hasta 65.867 (de la cadena negativa) del genoma de E. coli (las posiciones dentro de las secuencias de nucleótidos genómicas se proporcionan como en la Tabla 1), de modo que la mayor parte del promotor natural araBAD a lo largo de casi todos los codones de la región que codifica AraD, se elimina. La secuencia de nucleótidos (cadena negativa) alrededor de la unión en la deleción (posición 70.136 | posición 65.866) es: TTAT I TACG. Otra deleción se realizó dentro del operón sbm-ygfDGH (también llamado scpA-argK-scpBC), eliminando la función de los genes implicados en la biosíntesis de 2 -metilcitrato, para aumentar la sensibilidad del promotor inducible con propionato de las células hospedadoras, hacia el propionato suministrado exógenamente. La deleción sbmygfDGH elimina 5542 pares de bases (posición 3.058.754 hasta 3.064.295 del genoma de E. coli), extrayendo el promotor sbm-ygfDGH y todo el operón excepto el último codón de la secuencia que codifica ygfH, dejando la secuen­ cia adyacente que codifica ygfl y el codón de parada intacto. La secuencia de nucleótidos (cadena positiva) alrededor de la unión en la deleción (posición 3058753 | posición 3064296) es: ACAA I GGGT. Además de estas deleciones realizadas en el genoma de la célula hospedadora de E. coli SHuffle® Express, Gene Bridges GmbH introdujo una mutación puntual en la secuencia genómica que codificaba el gen rpsL, que se extiende en la hebra negativa desde la posición 3.472.574 hasta 3.472.200, cambiando la A en la posición 3.472.447 por una G, alterando el codón de Lys43 a un codón de Arg, lo que da como resultado un fenotipo resistente a la estreptomicina cuando se expresa el gen mutante rpsL-Arg43. Otra alteración del genoma de la célula hospedadora, que permite una expresión inducible controlada más estrechamente como se ha descrito anteriormente, es hacer que el promotor araE sea constitutivo más que sensible a la arabinosa. La mayor parte del promotor araE natural, incluyendo los sitios de unión a CRP-cAMP y AraC, se eliminó mediante la deleción de 97 pares de bases (posición 2.980.335 hasta 2.980.239 (cadena negativa)) y la sustitución de esa secuencia por la secuencia de 35 pares de bases del promotor J23104 constitutivo, con las secuencias de sitios de unión resultantes: TGAA | T T G A ^ promotor J23104 ^ TAGC | TTCA. Una célula hospedadora de E. coli, tal como una célula hospedadora de E. coli SHuffle® Express, con cualquiera de estas altera­ ciones genómicas, o cualquier combinación de las mismas, se puede emplear en la coexpresión inducible de productos génicos.
Ejemplo 4 [ejemplo comparativo]
Coexpresión inducible de manganeso peroxidasa y proteína disulfuro isomerasa en presencia de grupos hemo
A. Construcción de vectores de expresión
La manganeso peroxidasa ('MnP'; también denominada peroxidasa dependiente de manganeso) es una enzima que permite que algunos tipos de hongos degraden la lignina a dióxido de carbono, y median en la oxidación de una amplia variedad de contaminantes orgánicos. Un ejemplo de manganeso peroxidasa es la isoenzima H4 (denominada en este documento "MnP-H4") del hongo de pudrición blanca Phanerochaete chrysosporium (UniProtKB/Swiss-Prot n° de or­ den P19136). En su forma funcional, MnP-H4 está asociada con un ion de manganeso (Mn2+), una molécula de hemo que contiene hierro y dos iones de calcio (Ca2+); MnP-H4 también tiene cinco enlaces disulfuro (Sundaramoorthy et al., "The crystal structure of manganese peroxidase from Phanerochaete chrysosporium at 2.06-Á resolution", J Biol Chem 1994 Dec 30; 269(52): 32759-32767). La inactivación térmica de la enzima MnP-H4 implica una pérdida de las interacciones entre MnP-H4 y los iones de calcio. La creación de un enlace disulfuro adicional en MnP-H4 mediante la alteración de la secuencia de aminoácidos de MnP-H4 para sustituir una cisteína por otro aminoácido en dos posi­ ciones cerca del sitio de interacción de calcio distal, tal como una variante MnP-H4 A48C/A63C, hace que la enzima resultante MnP-H4 A48C/A63C sea más resistente a la inactivación térmica (Reading y Aust, "Engineering a disulfide bond in recombinant manganese peroxidase results in increased thermostability", Biotechnol Prog 2000 May-Jun; 16(3): 326-333). Para expresar MnP-H4 de una manera que favorezca la formación de los enlaces disulfuro, se creó una estructura artificial de expresión que codificaba una enzima MnP-H4 que carecía del péptido señal, de modo que la proteína permanecía en el entorno citoplasmático oxidante de la célula hospedadora (E. coli SHuffle® Express).
La secuencia de aminoácidos de MnP-H4 sin un péptido señal se muestra como SEQ ID N°: 13; esta forma de la proteína MnP-H4 tiene un residuo de metionina inicial fijado a la secuencia de aminoácidos madura prevista, a partir de A14 de la secuencia de aminoácidos de longitud completa, como se describe en Pease et al., "Manganesedependent peroxidase from Phanerochaete chrysosporium. Primary structure deduced from cDNA sequence", J Biol Chem 1989 Aug 15; 264(23): 13531-13535. En otras referencias, como Sundaramoorthy et al., "The crystal structure of manganese peroxidase from Phanerochaete chrysosporium at 2.06-A resolution", J Biol Chem 1994 Dec 30; 269(52): 32759-32767, la secuencia de aminoácidos MnP-H4 madura se indica como a partir de A25 de la secuencia de aminoácidos de longitud completa.
Las proteínas que comprenden los aminoácidos 13 hasta 370 de SEQ ID N°: 13 (que se corresponde a la secuencia de aminoácidos madura más corta) también son producidas por los métodos de la invención, y en ciertas realizaciones tienen un residuo de metionina inicial fijado a los aminoácidos 13 hasta 370 de SEQ ID N°: l3, y por lo tanto, tienen la secuencia de aminoácidos mostrada como SEQ ID N°: 23. La secuencia de nucleótidos que se ha optimizado para la expresión de la forma de SEQ ID N°: 13 de MnP-H4 en E. coli, se muestra como SEQ ID N°: 14; estructuras artificiales de expresión que comprenden SEQ ID N°: 14 se usaron en los métodos de la invención para expresar MnP-H4. Los nucleótidos 37 hasta 1110 de SEQ ID N°: 14 codifican la secuencia de aminoácidos madura de MnP-H4 más corta (a partir de A25 de la secuencia de aminoácidos de longitud completa); los polinucleótidos que comprenden los nucleó­ tidos 37 hasta 1110 de SEQ ID N°: 14, se utilizan en algunas realizaciones de la invención para la producción de la proteína MnP-H4, y en ciertas realizaciones comprenden un codón ATG para un residuo de metionina inicial fijado al extremo 5' de la secuencia de nucleótidos desde 37 hasta 1110 de SEQ ID N°: 14.
Una estructura artificial de expresión similar se crea para la expresión de una proteína MnP-H4 correspondiente a la proteína A48C/A63C MnP-H4 y que carece de un péptido señal (secuencia de aminoácidos mostrada como SEQ ID N°: 15; la secuencia codificadora optimizada se muestra como SEQ ID N°: 16). Debido a los doce aminoácidos adicio­ nales en SEQ ID N°: 15, en comparación con la secuencia de aminoácidos de MnP-H4 madura más corta, las altera­ ciones de alanina a cisteína se indican como A60C/A75C en SEQ ID N°: 15. Ejemplos adicionales de estructuras artificiales de expresión que se utilizan en los métodos de la invención, codifican una proteína que comprende SEQ ID N°: 15, o los aminoácidos 13 hasta 370 de SEQ ID N°: 15, o un residuo de metionina inicial fijado a los aminoácidos 13 hasta 370 de SEQ ID N°: 15. En ciertas realizaciones, las estructuras artificiales de expresión que se utilizan en los métodos de la invención comprenden SEQ ID N°: 16, o los nucleótidos 37 a 1110 de SEQ ID N°: 16, o un codón ATG de un residuo de metionina inicial fijado al extremo 5' de la secuencia de nucleótidos desde 37 hasta 1110 de SEQ ID N°: 16. Otra variación de la secuencia de aminoácidos de MnP-H4 se produce en la posición 105 de la secuencia de aminoácidos de longitud completa, en donde una serina se cambia por una asparagina. Los métodos de la invención se usan para producir proteínas MnP-H4 con esta variación (serina cambiada a asparagina en la posición 93 de SEQ ID N°: 13 o SEQ ID N°: 15), con las estructuras artificiales de expresión que comprenden secuencias de nucleótidos que tienen una G en la posición 278 de SEQ ID N°: 14 o SEQ ID N°: 16 cambiada por una A, alterando el codón AGC de serina a un codón a Ac de asparagina.
Además de favorecer la formación de enlaces disulfuro en MnP-H4, para producir una enzima MnP-H4 totalmente activa, la enzima se expresa de forma óptima en presencia de grupos hemo. Para permitir que la célula hospedadora de E. coli capte moléculas que contienen grupos hemo, tales como hemina, desde el medio, una secuencia de nucleó­ tidos que codifica el receptor específico de hemina de la membrana externa de E. coli O157:H7 ChuA, también se incluye en la estructura artificial de expresión MnP-H4. El polipéptido ChuA tiene la misma secuencia de aminoácidos N-terminal, incluyendo el péptido señal, como la proteína natural ChuA de E. coli O157:H7 cepa EC4113 (SEQ ID N°: 17), de manera que se inserta en la membrana externa de la célula hospedadora E. coli. La secuencia codificadora optimizada para el polipéptido ChuA (SEQ ID N°: 17) se muestra en las posiciones 68 hasta 2047 de SEQ ID N°: 19. La secuencia de aminoácidos de ChuA mostrada en SEQ ID N°: 17, procedente de E. coli O157:H7 cepa EC4113, difiere de la de la secuencia de aminoácidos ChuA de E. coli CFT073 (NCBI n° de ID de gen 1037196) por tener una valina (EC4113) en lugar de una isoleucina (CFT073) en la posición 106 de SEQ ID N°: 17. Un cambio V106I en la secuencia de aminoácidos de ChuA puede estar codificado por un cambio en el codón GTG de Val a un codón ATT o ATC de Ile en las posiciones 383-385 de SEQ ID N°: 19. Otras variaciones en la secuencia de aminoácidos de proteí­ nas ChuA empleadas en la expresión de proteínas asociadas a hemo incluyen, por ejemplo, un cambio desde ácido glutámico a glicina en la posición 259 de SEQ ID N°: 17 (codificado por un cambio en el codón GAG de Glu a un codón GGT o GGC de Gly en las posiciones 842-844 de SEQ ID N°: 19), o un cambio desde ácido glutámico a asparagina en la posición 262 de SEQ ID N°: 17 (codificado por un cambio en el codón GAG de Glu a un codón GAT o GAC de Asp en las posiciones 851-853 de Se Q ID N°: 19).
La optimización para la expresión en E. coli y la síntesis de polinucleótidos que corresponden a SEQ ID N°s 18, 19 y 22 se llevó a cabo mediante DNA2.0 (Menlo Park, CA). Se Q ID N°: 18 codifica la proteína MnP-H4, y está diseñada para ser insertada inmediatamente aguas abajo de un promotor, tal como un promotor inducible. La secuencia de nucleótidos de SEQ ID N°: 18 comienza en su extremo 5' con un sitio de restricción GCTAGC de NheI, y tiene un sitio de unión al ribosoma AGGAGG en los nucleótidos 7 hasta 12 de SEQ ID N°: 18, seguido de la secuencia optimizada que codifica MnP-H4 en los nucleótidos 21 hasta 1130 de SEQ ID N°: 18. Aguas abajo del codón de parada de MnP-H4 está el doble terminador B0015, desde la posición 1142 hasta 1270 de SEQ ID N°: 18, seguido por un sitio de restricción de XbaI, TCTAGA. La secuencia de nucleótidos del doble terminador B0015 se obtuvo a partir de la página web partsregistry.org. SEQ ID N°: 19 codifica ChuA e incluye un promotor constitutivo, por lo que esta estructura artificial de expresión para ChuA se podría colocar en cualquier vector de expresión o en el genoma de la célula hospedadora; debido a que la secuencia que codifica ChuA se ha colocado bajo el control del promotor constitutivo J23104, su transcripción ya no está sujeta a la represión por parte de Fur. En esta realización, SEQ ID N°: 19 comienza en su extremo 5' con un sitio de restricción de XbaI TCTAGA, y está diseñada para ser colocada dentro de un vector de expresión en 3' de las secuencias de SEQ ID N°: 18. Los nucleótidos 7 a 41 de SEQ ID N°: 19 son el promotor constitutivo J23104 y los nucleótidos 50 hasta 61 de SEQ ID N°: 19 son el sitio de unión al ribosoma de B0034, ambos situados aguas arriba de la secuencia que codifica ChuA en los nucleótidos 68 hasta 2047 de SEQ ID N°: 19; las secuencias de nucleótidos de J23104 y B0034 fueron obtenidas a partir de la página web partsregistry.org. SEQ ID N°: 19 termina con un sitio de restricción de SalI GTCGAC. Los sitios de Xbal en SEQ ID N°: 18 y SEQ ID N°: 19 permiten que estas secuencias de nucleótidos se liguen entre sí en un sitio de XbaI; la secuencia de nucleótidos de la estructura artificial de expresión MnP-H4 ChuA resultante se muestra en SEQ ID N°: 20. Los sitios Nhel y SalI en SEQ ID N°s 18 y 19, respectivamente, y en SEQ ID N°: 20, permiten que la estructura artificial de expresión MnP-H4 ChuA se inserte en un vector de expresión, tal como pPRO33 utilizando los sitios de restricción NheI y SalI en su sitio de clonación múltiple.
Para facilitar la producción de la enzima MnP-H4 correctamente plegada, MnP-H4 se coexpresaba con la proteína chaperona disulfuro isomerasa ('PDI') procedente de Humicola insolens, un hifomiceto del suelo termófilo, celulolítico y saprófito (hongo de pudrición blanda). La secuencia de aminoácidos de la PDI que se coexpresaba se muestra como SEQ ID N°: 21; carece del péptido señal de la proteína natural, de manera que permanece en el citoplasma de la célula hospedadora mientras que se producen los polipéptidos MnP-H4. La secuencia de nucleótidos que codifica PDI tam­ bién se optimizó para la expresión en E. coli; la estructura artificial de expresión de PDI se muestra como SEQ ID N°: 22. SEQ ID N°: 22 contiene un sitio de restricción de NheI GCTAGC en su extremo 5', un sitio de unión al ribosoma AGGAGG en los nucleótidos 7 a 12, la secuencia que codifica PDI en los nucleótidos 21 hasta 1478, y un sitio de restricción de SalI GTCGAC en su extremo 3'. La secuencia de nucleótidos de SEQ ID N°: 22 fue diseñada para ser insertada inmediatamente aguas abajo de un promotor, tal como un promotor inducible. Los sitios de restricción de NheI y SalI en SEQ ID N°: 22 se utilizaron para insertarla en el sitio de clonación múltiple del vector de expresión pBAD24.
Las estructuras artificiales de expresión sintetizadas que comprenden SEQ ID N°: 20 y SEQ ID N°: 22, y los vectores pPRO33 y pBAD24, se cortaron con las enzimas de restricción NheI y SalI, y los fragmentos de la estructura artificial de expresión sintetizada se ligaron en los vectores para crear pPRO33-MnP-ChuA y pBAD24-PDI, como se ha descrito inmediatamente antes, y en el Ejemplo 1. Células de E. coli SHuffle® Express (New England Biolabs (o 'NEB'), Ipswich, Massachusetts) se cotransformaron con los vectores de expresión resultantes (pPRO33-MnP-ChuA y pBAD24-PDI) usando el método de choque térmico.
B. Coexpresión inducible de manganeso peroxidasa y proteína disulfuro isomerasa en células bacterianas
Las células hospedadoras cotransformadas con los vectores de expresión pPRO33-MnP-ChuA y pBAD24-PDI (células SHuffle® Express (pPRO33-MnP-ChuA/pBAD24-PDI)) se utilizaron para inocular cuatro tubos de agitación, en donde cada uno contenía 5 mL de medio LB más 34 microgramos/mL de CAM y 100 microgramos/mL de AMP. Después de la incubación (a 30°C con agitación rotatoria a 250 rpm) durante 16 horas, se centrifugaron las células a 4000 rpm durante 10 minutos a 4°C, el medio LB se separó por decantación, y las células se resuspendieron en 4 x 400 microlitros de medio mínimo M9 con casaminoácidos y 0,2% de glicerol, además de 34 microgramos/mL de CAM y 100 microgramos/mL de AMP ('M9-CA-gly CAM AMP'). A continuación, se añadieron 75 microlitros del volumen com­ binado de 1,6 mL de células resuspendidas a cada uno de los diez tubos de agitación que contenían 5 mL de M9-CA-gly CAM AMP, y se determinó que la DO600 del cultivo resultante era 0,6. La hemina (Sigma-Aldrich, St. Louis, Missouri) se añadió hasta una concentración final de 8 micromolar en todos los tubos, excepto el tubo 1, el control no inducido. Los inductores L-arabinosa y propionato se añadieron a los tubos de 2-10 con las siguientes concentraciones:
Tubo 1 No inducido (sin hemina, sin propionato, sin arabinosa)
Tubo 2 propionato 50 mM 0,002% de arabinosa
Tubo 3 propionato 25 mM 0,002% de arabinosa
Tubo 4 propionato 12,5 mM 0,002% de arabinosa
Tubo 5 propionato 50 mM 0,01% de arabinosa
Tubo 6 propionato 25 mM 0,01% de arabinosa
Tubo 7 propionato 12,5 mM 0,01% de arabinosa
Tubo 8 propionato 50 mM 0,05% de arabinosa
Tubo 9 propionato 25 mM 0,05% de arabinosa
Tubo 10 propionato 12,5 mM 0,05% de arabinosa
Se indujeron las células a 25°C durante 12 horas con agitación por rotación, a continuación, se centrifugaron y se colocaron en un congelador a -80°C. Los sedimentos celulares se descongelaron sobre hielo, y se lisaron las células utilizando un kit de lisis bacteriana Qproteome (QIAGEN), según las instrucciones del fabricante; no se añadió una mezcla de inhibidores de proteasas y las muestras se centrifugaron a 4°C. Los extractos de proteínas solubles proce­ dentes de las células inducidas y el control no inducido se separaron por electroforesis en gel de SDS, en condiciones reductoras sobre un gel de Bis-Tris al 10% (Life Technologies, Grand Island, Nueva York). El gel se tiñó usando RAPIDstain® (G-Biosciences). Como se muestra en la Figura 5, el lisado de las células inducidas contenía proteínas correspondientes a PDI (53 kDa) y MnP-H4 (39 kDa), lo que indicaba que estas proteínas se expresaban como pro­ teínas solubles en las células bacterianas. La mayor cantidad de MnP-H4 soluble se producía por inducción con propionato 50 mM y 0,002% de arabinosa (carril 2).
C. Coexpresión inducible de una forma madura alternativa de manganeso peroxidasa junto con proteína disulfuro isomerasa, y medición de la actividad de MnP-H4
Los vectores de expresión se prepararon para expresar una versión de MnP-H4 truncada más completamente, deno­ minada MnP-H4_FT, que se corresponde con la versión madura de la proteína MnP-H4 como se describe en Sundaramoorthy et al., 1994 (citado anteriormente). Por tanto, la secuencia de aminoácidos de MnP-H4_FT tiene un residuo de metionina inicial fijado a los aminoácidos 13 hasta 370 de SEQ ID N°: 13, y se proporciona como SEQ ID N°: 23. En este experimento, la secuencia que codifica MnP-H4_FT optimizada para la expresión en E. coli (obtenida a partir de la secuencia que codifica MnP-H4 optimizada, descrita anteriormente), y la secuencia que codifica ChuA, se ex­ presaron en el vector pBAD24, y la secuencia que codifica PDI (optimizada de manera similar para la expresión en E. coli, como se ha descrito anteriormente) se expresó en el vector ppRO33. La estructura artificial de expresión pBAD24-MnP_FT-ChuA se preparó mediante amplificación con PCR de la secuencia que codificaba MnP-H4 y el terminador a partir de un molde que comprendía la secuencia de nucleótidos de SEQ ID N°: 18, utilizando el cebadore directo e inverso de SEQ ID N°s 24 y 25, respectivamente. El uso del cebador directo de SEQ ID N°: 24 coloca un sitio de restricción de NcoI y un codón ATG inmediatamente aguas arriba de la secuencia que codifica los aminoácidos 13 hasta 370 de SEQ ID N°: 13, y por lo tanto crea una secuencia que codifica la secuencia de aminoácidos de MnP-H4_FT de SEQ ID N°: 23. Las secuencias de la estructura artificial de expresión de ChuA se amplificaron por PCR a partir de un molde que comprendía la secuencia de nucleótidos de SEQ ID N°: 19, utilizando los cebadores directo e inverso de SEQ ID N°s 26 y 27, respectivamente. Los productos de la PCR de MnP-H4_FT y ChuA se cortaron con NcoI y SalI, y con SalI y HindIII, respectivamente, y se purificaron en gel y se ligaron juntos en el vector pBAD24, que se había cortado con NcoI y HindIII, tratado con CIP y purificado en gel. Los productos pBAD24-MnP_FT-ChuA ligados comprenden la secuencia que codifica MnP-H4_FT expresada a partir del promotor pBAD, seguida por el terminador doble B0015, el promotor constitutivo J23104, el sitio de unión al ribosoma B0034 y la secuencia que codifica la pro­ teína ChuA. Esta estructura artificial de expresión pBAD24-MnP_FT-ChuA tiene la secuencia de nucleótidos propor­ cionada en SEQ ID N°: 28.
La estructura artificial de expresión pPRO33-PDI se preparó cortando el vector pPRO33 y la estructura artificial de expresión PDI, optimizada para la expresión en E. coli como se ha descrito anteriormente y que comprendía la se­ cuencia de nucleótidos de SEQ ID N°: 22, con NheI y SalI, tratando el vector pPRO33 cortado vector con CIP, purifi­ cando en gel los fragmentos y ligándolos entre sí. La estructura artificial de expresión pPRO33-PDI resultante tiene la secuencia de nucleótidos proporcionada en SEQ ID N°: 29. Las estructuras artificiales de expresión pBAD24-MnP_FT-ChuA y pPRO33-PDI se utilizaron para cotransformar células E. coli SHuffle® Express (n Eb ) a 37 grados C durante una noche, para formar células SHuffle® Express (pBAD24-MnP_FT-ChuA/pPRO33-PDI).
Se utilizaron células SHuffle® Express (pBAD24-MnP_FT-ChuA/pPRO33-PDI) y control SHuffle® Express (pBAD24/pPRO33) para inocular 5 ml de medio LB CAM (34 microgramos/mililitro) AMP (100 microgramos/mililitro) y se dejaron crecer durante una noche a 30 grados C con agitación a 250 rpm. Las células se centrifugaron a 4000 rpm durante 10 minutos a 4 grados C, y se resuspendieron, primero en 400 microlitros de medio mínimo M9 (CA_no-Glicerol: con casaminoácidos como una fuente de carbono, pero sin glicerol) CAM AMP, y luego 75 microlitros del mismo se añadieron a 5 mililitros de medio mínimo M9 (CA_noGlicerol) CAM AMP. Después que el cultivo, que crecía a 30 grados C con agitación a 250 rpm, alcanzó una DO600 de 0,6, se tomaron diez partes alícuotas de células SHuffle® Express (pBAD24-MnP_FT-ChuA/pPRO33-PDI) y se indujeron con concentraciones variables de hemina y los inductores arabinosa y propionato. La muestra 1, el control, no recibió hemina ni inductores; las otras nueve mues­ tras tenían hemina añadida hasta una concentración final de 8 micromolar; concentraciones de arabinosa de 0,025%, 0,05% o 0,1%; y concentraciones de propionato de 12,5 mM, 25 mM o 50 mM. También se incluyeron células de control SHuffle® Express (pBAD24/pPRo33) (sin insertos) en el proceso de inducción, con una muestra "inducida" y una muestra de control no inducida. Las células fueron inducidas durante 12 horas a 25 grados C con agitación a 250 rpm, a continuación, se centrifugaron y se almacenaron a -80 grados C. Para visualizar las proteínas producidas por la coexpresión inducida, los sedimentos celulares congelados se descongelaron y se lisaron usando un kit de lisis bacteriana Qproteome (QIAGEN) de acuerdo con las instrucciones, pero empleando 35 microlitros de tampón de lisis por cada 1 microlitro de cultivo bacteriano. Extractos de proteínas solubles procedentes de las células inducidas SHuf­ fle® Express (pBAD24-MnP_FT-ChuA/pPRO33-PDI) y el control no inducido se separaron por electroforesis en gel de SDS en condiciones reductoras, en un gel de Bis-Tris al 10%; las muestras se calentaron a 70 grados C durante 10 minutos antes de cargarlas en el gel. Después de la tinción del gel con RAPIDstain® (gel no mostrado), había bandas visibles correspondientes a MnP-H4_FT y PDI en todas las muestras inducidas, pero no en el control no inducido, y la densidad aparente de las bandas en el gel indicaba que la combinación de 0,1% de arabinosa y propionato 50 mM producían la mayor parte de proteína MnP-H4_FT, y que las concentraciones más altas de arabinosa generalmente producían más MnP-H4_FT, mientras que las concentraciones de arabinosa inferiores producían generalmente más PDI, debido posiblemente a la represión catabólica del promotor de propionato mediante arabinosa.
Para determinar los niveles de actividad de MnP-H4_FT producida por coexpresión inducible, 0,5 mililitros de la frac­ ción de lisis celular soluble, obtenidos a partir de la coexpresión de la proteína MnP-H4_FT en 0,1% de arabinosa y propionato 50 mM, se dializó frente a acetato de sodio 10 milimolar, CaCb 5 milimolar, pH 4,5, utilizando un Slide-A-Lyzer® de 0,5 mililitros, MWCO 20000 (corte de peso molecular) (Thermo Fisher Scientific Inc., Waltham MA). La muestra se dializó a 4 grados C durante 2 horas, el tampón se cambió por tampón de nuevo aporte y la diálisis continuó a 4 grados C durante una noche. No hubo precipitación de proteínas al final de la diálisis, pero la proteína MnP-H4_FT todavía era soluble y activa, como se mostró por electroforesis en gel, y con un ensayo de actividad enzimática colorimétrica. La muestra de proteína dializada que contenía MnP-H4_FT, junto con las fracciones de proteínas solubles obtenidas a partir de células SHuffle® Express de control no inducidas (pBAD24-MnP_FT-ChuA/pPRO33-PDI), y a partir de células SHuffle® Express de control inducidas y no inducidas sin inserto (pBAD24/pPRO33), se separaron por electroforesis en gel de SDS en condiciones reductoras en un gel de Bis-Tris al 10%; las muestras se calentaron a 70 grados C durante 10 minutos antes de cargarlas en el gel. Después de la tinción del gel con RAPIDstain®, como se muestra en la Figura 6, las bandas correspondientes a PDI (54 kDa) y MnP-H4_FT (38 kDa) son claramente visibles en la muestra de proteína dializada, producida por la coexpresión en 0,1% de arabinosa y propionato 50 mM (Figura 6, carril 2), y no son visibles en ninguna de las muestras de control (carril 3 - SHuffle® Express (pBAD24-MnP_FT-ChuA/pPRO33-PDI) control no inducido; carril 4 - control inducido sin inserto; carril 5 - control no inducido sin inserto). La actividad enzimática de la proteína MnP-H4_FT producida por la coexpresión inducible se sometió a ensayo usando el ensayo colorimétrico de manganeso peroxidasa descrito en la sección E del Ejemplo 4 a continuación, y se observó que la proteína MnP-H4_FT coexpresada tenía actividad manganeso peroxidasa comparable a la de una muestra de MnP de control positivo.
D. Producción y purificación de manganeso peroxidasa
Las células hospedadoras que han sido cotransformadas con vectores de expresión MnP-ChuA y PDI se sembraron en placas LB con cloranfenicol y ampicilina. Se recogen las colonias individuales y cada una se usa para inocular un tubo de agitación que contiene 15 ml de medio LB AMP CAM. Después de la incubación (a 30-37°C con agitación rotatoria a 250 rpm) durante un periodo de tiempo adecuado para generar cultivos en fase estacionaria, se emplean 5 ml de cada tubo con crecimiento adecuado para inocular un matraz de agitación Erlenmeyer que contiene 100 ml de medio LB CAM AMP. Después de una incubación adicional (a 30 - 37°C con agitación rotatoria a 250 rpm) sufi­ ciente para generar cultivos en fase estacionaria, en una muestra de cada matraz de agitación se comprueba la den­ sidad celular adecuada. Un volumen apropiado de un matraz de agitación se introduce en un biorreactor esterilizado con el pH calibrado y se cultiva a 30 - 37°C con agitación; después de un período de crecimiento, las células se cultivan en medio que contiene hemina u otra fuente de grupos hemo, hasta que las células alcanzan una DO600 de aproxima­ damente 0,5. Las células se inducen después mediante la adición de arabinosa y propionato; por ejemplo, 0,02% de arabinosa y propionato 50 mM, o como se determina por los métodos de valoración del Ejemplo 7, y continúa el crecimiento a 25-30°C con agitación. Después de la incubación, las células se recuperan del medio de cultivo, se lisan y se recoge el material sobrenadante de la lisis (extracto de proteína soluble). La proteína MnP-H4 se purifica a partir del extracto de proteína soluble, utilizando métodos tales como cromatografía líquida rápida de proteínas (FPLC) con una columna de exclusión por tamaño o una columna de intercambio de iones.
E. Ensayo de la actividad manganeso peroxidasa
La cantidad de actividad manganeso peroxidasa en una muestra y, por lo tanto, la concentración de manganeso per­ oxidasa activa, se puede determinar mediante un ensayo de la capacidad para oxidar 2,6-dimetoxifenol (2,6-DMP) en coerulignona, en presencia de manganeso y peróxido de hidrógeno. El siguiente ensayo es para una muestra de 10 microlitros; cantidades alternativas para una muestra de 1 microlitro se proporcionan entre paréntesis. Se añade lo siguiente a una cubeta espectrofotométrica antes de la adición de la muestra: 0,590 mL de dH2O (0,599 mL de dH2O); 0,1 mL de solución de malonato monohidrato de sal disódica (MDSH) (5 g de MDSH en 60 mL de dH2O, pH 4,5); y 0,1 mL de solución MnSO4 ■ H2O (0,06 g de MnSO4 ■ H2O en 90 mL de dH2O). Inmediatamente antes de medir, 0,1 mL de solución 2,6-DMP (0,014 g de 2,6-dimetoxifenol en 90 mL de dH2O) y la muestra de 10 microlitros (1 microlitro) se añade a la cubeta. La cubeta se coloca en el espectrofotómetro y se hace una puesta a cero a 469 nm y, a continua­ ción, se añaden 0,1 mL de H2O2 de nuevo aporte (3,4 microlitros de H2O2 al 30% en 30 mL de dH2O) a la cubeta. El contenido de la cubeta se mezcla pipeteando arriba y abajo tres veces. Un minuto después de la adición de H2O2, se mide la DO a 469 nm. Si la DO es mayor que 0,2, el tamaño de la muestra se reduce a 1 microlitro, o la muestra que se va a medir se diluye; si la DO es inferior a 0,005, el tamaño de la muestra se incrementa a 0,1 mL y el volumen de dH2O se reduce a 0,500 mL, permaneciendo todos los demás volúmenes iguales; a continuación, se repite el ensayo.
La absorbancia medida se utiliza para calcular la concentración de enzima (CE) en Unidades/L, de acuerdo con la siguiente ecuación:
CE [U/L] = (Absorbancia) (Volumen del ensayo [mL] (106 umol/mol)(1 cm)
(£1 cm)*(Volumen de la muestra [mL])
en donde £1 cm = 49600 absorbancia/Mcmmin y la longitud de la vía = 1 cm. La concentración de enzima como se calculó anteriormente se convierte a mg/L, de acuerdo con la siguiente ecuación: CE [mg/L] = concentración de la enzima [U/L] / actividad enzimática específica [U/mg], en donde una actividad enzimática específica estándar para MnP es 160 U/mg. La actividad enzimática específica se calcula para cualquier muestra de MnP, midiendo indepen­ dientemente la concentración de proteína en la muestra en mg/L, por ejemplo, mediante un análisis espectrofotométrico a 280 nm. Cuando la concentración enzimática (CE) se determina utilizando el ensayo de oxidación de 2,6-DMP anterior, la actividad específica en U/mg se calcula como: CE [U/L] / concentración [mg/L] = actividad específica [U/mg].
Ejemplo 5 [ejemplo comparativo]
Coexpresión inducible de infliximab
Infliximab es un anticuerpo monoclonal quimérico que se une a TNF-alfa, una citocina inflamatoria, y se utiliza en el tratamiento de afecciones que implican TNF-alfa, tales como enfermedades autoinmunes (enfermedad de Crohn, ar­ tritis reumatoide, psoriasis, etc.). Infliximab se forma a partir de una cadena pesada (secuencia de aminoácidos mos­ trada como SEQ ID N°: 30) y una cadena ligera (secuencia de aminoácidos mostrada como SEQ ID N°: 31); cada una de estas cadenas tiene una secuencia de dominio variable obtenida a partir de anticuerpos anti-TNF-alfa de ratón, y un dominio constante humano. La optimización de codones para la expresión en E. coli y la síntesis de polinucleótidos que codifican SEQ ID N°s 30 y 31 se realizó mediante DNA2.0 (Menlo Park, CA). La estructura artificial de expresión formada por ligación de la secuencia codificadora optimizada para la cadena pesada de infliximab en el sitio de clona­ ción múltiple (MCS) del vector de expresión pBAD24, es pBAD24-Infliximab_HC, que tiene la secuencia de nucleótidos mostrada como SEQ ID N°: 32. La estructura artificial de expresión formada por ligación de la secuencia codificadora optimizada para la cadena ligera de infliximab en el MCS del vector de expresión pPRO33, es pPRO33-Infliximab_LC, que tiene la secuencia de nucleótidos mostrada como SEQ ID N°: 33. Las estructuras artificiales de expresión pBAD24-Infliximab_HC y pPRO33-Infliximab_LC se usan para transformar células de E. coli SHuffle® Express (NEB) a 37 gra­ dos C durante una noche, creando células SHuffle® Express (pBAD24- Infliximab_HC / pPRO33-Infliximab_LC). Estas células se cultivan generalmente como se describe en los Ejemplos 1 y 4, incluyendo la adición de compuestos selec­ tivos tales como ampicilina y/o cloranfenicol, según sea necesario, con la excepción de que el hierro se añade prefe­ riblemente, aunque opcionalmente al medio de crecimiento LB, por ejemplo, en forma de FeSO4-7 H2O a una concen­ tración de 3,0 miligramos por litro. Las células se centrifugan y se resuspenden en medio M9, preferiblemente, pero opcionalmente con acetato de etilo (por ejemplo, acetato de sodio al 0,27% (C2H3O2Na)) que se añade como fuente de carbono junto con casaminoácidos (que proporcionan aminoácidos esenciales, además de ser una fuente de car­ bono), y también preferiblemente, pero opcionalmente con la administración de suplementos de hierro a los medios, como se ha descrito anteriormente, y se cultivan hasta que la densidad óptica (DO600) del cultivo alcanza 0,8. (Véase, Paliy y Gunasekera, "Growth of E. coli BL21 in minimal media with different gluconeogenic carbon sources and salt contents", Appl Microbiol Biotechnol 2007 Jan; 73(5): 1169-1172; Epub 2006 Aug 30; Errata en: Appl Microbiol Biotechnol 2006 Dec; 73(4): 968). En ese momento, las células se inducen por la adición de arabinosa (inicialmente a concentraciones que incluyen 0,1%) y propionato de etilo (inicialmente a concentraciones que incluyen 50 mM). El ajuste de las concentraciones de arabinosa y propionato se puede realizar como se describe en el Ejemplo 7, y los anticuerpos de infliximab producidos se purifican y se caracterizan como se describe en el Ejemplo 9, hasta el Ejemplo 11.
Ejemplo 6 [Ejemplo Comparativo]
Coexpresión inducible de proteínas en células de levadura
Estructuras artificiales de expresión para la coexpresión inducible en células hospedadoras de levadura de MnP-H4_FT con PDI y las cadenas pesadas y ligeras de anticuerpo IgG1 de ratón anti-CD19 humano, han sido creadas por el siguiente método llevado a cabo por GenWay Biotech Inc. (San Diego CA). Los vectores pJ1231-03C y pJ1234-03C (DNA2.0, Menlo Park, CA) se utilizaron como la parte de la estructura principal de las estructuras artificiales de expresión de levadura, ya que contienen elementos necesarios para el mantenimiento del plásmido en E. coli (origen de replicación de pUC) o Saccharomyces cerevisiae (origen de replicación de plásmido circular de 2 micras, junto con marcadores seleccionables útiles en cualquier hospedador: KanR (E. coli) y Leu2 (levadura) en pJ1231-03C; AmpR (E. coli) y Ura3 (levadura) en pJ1234 -03C. Las secuencias de nucleótidos de los vectores pJ1231-03C y pJ1234-03C se muestran como SEQ ID N°s 34 y 35, respectivamente. Los vectores pJ1231-03C y pJ1234-03C fueron tratados con la endonucleasa de restricción BfuA1 (NEB, n° de catálogo R0701S); los fragmentos de los vectores que no fueron retenidos después de la digestión con BfuA1 comprenden un promotor de la expresión, la secuencia que codifica DasherGFP y la secuencia terminadora de CYC1. La PCR se realizó en cuatro estructuras artificiales de expresión que contienen secuencias que codifican los polipéptidos que se van a expresar, para crear secuencias que a conti­ nuación, se ligan en los vectores pJ1231-03C y pJ1234-03C cortados con BfuA1. Todas las reacciones de PCR se realizaron utilizando ADN polimerasa Pfx Platinum® (Life Technologies, Grand Island, Nueva York, n° de catálogo 11708021) y el kit de purificación de ADN QIAEX II (QIAGEN, n° de catálogo 20051) se utilizó para la purificación del producto de la PCR y fragmentos de vector, de acuerdo con las instrucciones del fabricante.
La estructura artificial de expresión pBAD24-MnP_FT-ChuA (SEQ ID N°: 28), que contiene la secuencia que codifica AraC, el promotor inducible con arabinosa pBAD y las secuencias que codifican MnP-H4_FT y ChuA, se utiliza como molde en dos reacciones de PCR distintas, con el fin de agregar un marcador 6xHis en los extremos C-terminales de la secuencia que codifica MnP-H4_FT y la secuencia que codifica ChuA, y sitios de restricción de BsaI para la clonación en los vectores. (Preferiblemente, pero opcionalmente, la secuencia que codifica ChuA no está alterada para añadir un marcador His en su extremo C-terminal; esto se puede lograr mediante el uso de un cebador con una secuencia similar a la de SEQ ID N°: 39, pero sin las bases 21 hasta 38 de SEQ ID N°: 39). Los cebadores usados en estas dos reacciones de PCR son (1) el cebador BsaI-AraC-MnP-H4_FT (SEQ ID N°: 36) y el cebador MnP-H4_FT-6xHis-inverso (SEQ ID N°: 37), y (2) el cebador MnP-H4_FT-6xHis-directo (SEQ ID N°: 38) y el cebador ChuA-6xHis-BsaI (SEQ ID N°: 39). Una reacción de PCR adicional se lleva a cabo a continuación, sobre los dos productos de PCR purificados, utilizando los cebadores BsaI-AraC-MnP-H4_FT y ChuA-6xHis-BsaI, para crear un único producto (AraC-MnP-H4_FT-ChuA, SEQ ID N°: 40) que se purifica, se corta con Bsal (NEB, n° de catálogo R0535S), y se liga en el vector pJ1231-03C cortado con BfuA1, utilizando ADN ligasa de T4 (Life Technologies, n° de catálogo 15224025) para crear la es­ tructura artificial de expresión pJ1231-AraC-MnP-H4_FT-ChuA. (Preferiblemente, el fragmento AraC-MnP-H4_FT-ChuA cortado con Bsal también se liga en el vector pJ1234-03C cortado con BfuA1, para crear la estructura artificial de expresión pJ1234-AraC-MnP-H4_FT-ChuA).
La estructura artificial de expresión pPRO33-PDI (SEQ ID N°: 29), que contiene la secuencia que codifica PrpR, el promotor de pPRO inducible con propionato y la secuencia que codifica PDI, se utilizó como molde en una reacción PCR, que añadía un marcador 5xHis en el extremo C-terminal de la secuencia que codifica PDI, y sitios de restricción Bsal para la clonación en los vectores. (Preferiblemente, pero opcionalmente, la secuencia que codifica PDI no está alterada para añadir un marcador His en su extremo C-terminal; esto se puede lograr mediante el uso de un cebador con una secuencia semejante a la de SEQ ID N°: 42, pero sin las bases 21 hasta 35 de SEQ ID N°: 42). Los cebadores utilizados en esta reacción de PCR eran el cebador BsaI-PrpR-PDI (SEQ ID N°: 41) y el cebador PDI-5xHis-BsaI (SEQ ID N°: 42), creando un producto de PCR (PrpR-PDI, SEQ ID N°: 43) que se purificó, se cortó con BsaI y se ligó en el vector pJ1231-03C cortado con BfuA1, utilizando ADN ligasa de T4 para crear la estructura artificial de expresión pJ1231-PrpR-PDI. (Preferiblemente, el fragmento PrpR-PDI cortado con BsaI también se liga en el vector pJ1234-03C cortado con BsaI para crear la estructura artificial de expresión pJ1234-PrpR-PDI).
Las estructuras artificiales de expresión que codifican la cadena pesada de IgG1 de ratón anti-CD19 humano y la cadena ligera de IgG1 de ratón anti-CD19 humano - pBAD24-HC y pPRO33-LC, respectivamente - se utilizaron como moldes en dos reacciones de PCR distintas, cada una con el fin de eliminar la secuencia señal de cada secuencia codificante y para añadir sitios de restricción BsaI para la clonación en los vectores. Para pBAD24-HC, los cebadores usados en estas dos reacciones de PCR eran (1) el cebador BsaI-AraC-HC-directo (SEQ ID N°: 44) y el cebador HC-inverso (SEQ ID N°: 45), y (2) el cebador HC-directo (SEQ ID N°: 46) y el cebador HC-BsaI-inverso (SEQ ID N°: 47). Para pPRO33-LC, los cebadores usados en estas dos reacciones de PCR eran (1) el cebador BsaI-PrpR-LC-directo (SEQ ID N°: 48) y el cebador LC-inverso (SEQ ID N°: 49), y (2) el cebador LC-directo (SEQ ID N°: 50) y el cebador LC-BsaI-inverso (SEQ ID N°: 51). El uso del cebador BsaI-AraC-HC-directo (SEQ ID N°: 44) y el cebador BsaI-PrpR-LC-directo (SEQ ID N°: 48) en estas reacciones da lugar a secuencias que codifican HC y LC que carecen de secuen­ cia señal, a las que se hace referencia como HC_NS (sin señal, del inglés “no signal”) y LC_NS: la secuencia que codifica HC_NS modificada da como resultado un polipéptido HC_NS que tiene un residuo de metionina inicial seguido por los aminoácidos 20 hasta 464 de SEQ ID N°: 2; la secuencia que codifica LC_NS modificada da como resultado un polipéptido LC_NS que tiene un residuo de metionina inicial seguido de un residuo de alanina y después los ami­ noácidos 21 hasta 239 de SEQ ID N°: 4. A continuación, se llevó a cabo una reacción de PCR adicional en cada conjunto de dos productos de PCR purificados, utilizando los cebadores BsaI-AraC-HC-directo y HC-BsaI-inverso, y los cebadores BsaI-PrpR-LC-directo y LC-BsaI-inverso, respectivamente, para crear dos productos individuales (AraC-HC_NS, SEQ ID N°: 52 y PrpR-LC_NS, SEQ ID N°: 53) que se purificaron cada uno, se cortaron con BsaI y se ligaron en el vector pJ1231-03C cortado con BfuA1 (PrpR-LC_NS) o el vector pJ1234-03C cortado con BfuA1 (AraC-HC_NS) utilizando la ligasa de ADN de T4, para crear las estructuras artificiales de expresión pJ1231-PrpR-LC_NS y pJ1234-AraC-HC_NS.
Las mezclas de ligasa se transformaron en células de E. coli DH5alfa y se sembraron en placas de agar LB con cantidades suficientes de kanamicina o ampicilina para mantener los plásmidos en las células DH5alfa. La preparación de ADN plasmídico se realizó de acuerdo con métodos convencionales. (De forma opcional, pero preferiblemente, el ADN plasmídico preparado se utiliza en reacciones de secuenciación para confirmar las secuencias de los insertos de plásmidos).
Células INVSc-1 de S. cerevisiae competentes se prepararon usando el kit de transformación S.c. EasyComp® (Life Technologies, n° de catálogo K5050-01) según las instrucciones del fabricante. La cepa INVSc-1 de S. cerevisiae tiene el siguiente genotipo (MATa his3A1 leu2 trp1-289 ura3-52/MATa his3A1 leu2 trp1-289 ura3-52) y el fenotipo: His'", Leu', Trp-, Ura-. Resumiendo, una sola colonia de la cepa INVSc-1 se inoculó en 10 mL de medio YPD (contiene, por litro: 10 g de extracto de levadura, 20 g de peptona, 20 g de glucosa) y se dejó crecer durante una noche a 30 grados C en una incubadora con agitación a 250 rpm. Al día siguiente, el cultivo de una noche se diluyó en 10 mililitros de medio YPD de nuevo aporte hasta una DO600 de 0,3 y se dejó crecer hasta que la DO600 alcanzó 0,8. Las células se recogieron por centrifugación a 1500 rpm durante 5 minutos a temperatura ambiente. Después de eso, las células se resuspendieron en 10 mL de Solución de 1 (solución de lavado) y se recogieron mediante centrifugación a 1500 rpm durante 5 minutos a temperatura ambiente. El material sobrenadante se desechó y las células se resuspendieron en 1 mililitro de Solución 2 (solución de resuspensión), se dividió en partes alícuotas de 50 microlitros y se almacenó a -80 grados C. Para transformar las células de levadura competentes con las estructuras artificiales de expresión, 50 microlitros de las células INVSc-1 competentes se mezclaron con 1,2 microgramos de cada vector de expresión o vector de control y 500 microlitros de Solución 3 (solución de transformación). Luego, las células se mezclaron vigo­ rosamente y se incubaron en un baño de agua a 30 grados C durante 1 hora y se agitaron en vórtice durante 10 segundos cada 15 minutos. Partes alícuotas de 100 y 400 microlitros de las mezclas de transformación se sembraron en placas de agar mínimo SC, en ausencia de reactivo selectivo apropiado. El medio mínimo SC contiene, por litro: 6,7 g de base nitrogenada de levadura, 20 g de glucosa, 0,05 g de ácido aspártico, 0,05 g de histidina, 0,05 g de isoleucina, 0,05 g de metionina, 0,05 g de fenilalanina, 0,05 g de prolina, 0,05 g de serina, 0,05 g de tirosina, 0,05 g de valina, 0,1 g de adenina, 0,1 g de arginina, 0,1 g de cisteína, 0,1 g de leucina (omitida en los medios selectivos -Leu), 0,1 g de lisina, 0,1 g de treonina, 0,1 g de triptófano y 0,1 g de uracilo (omitido en los medios selectivos -Ura). Células INVSc-1 transformadas con pJ1231-PrpR-PDI, con pJ1231-PrpR-LC_NS y con el vector de control pJ 1231-03C, se seleccionaron sobre placas sin leucina a 30 grados C durante 48-72 horas. Células INVSc-1 transformadas con pJ1234-AraC-HC_NS y con el vector de control pJ1234-03C, se cultivaron en las mismas condiciones en placas de agar mínimo SC sin uracilo. (Preferiblemente, las células INVSc-1 transformadas con pJ1231-AraC-MnP-H4_FT-ChuA, con pJ1234-AraC-MnP-H4_FT-ChuA y con pJ1234-PrpR-PDI también se cultivan en las mismas condiciones en placas de agar mínimo SC sin uracilo). Células INVSc-1 cotransformadas simultáneamente con pJ1234-AraC-HC_NS y pJ1231-PrpR-LC_NS fueron seleccionadas en las mismas condiciones en placas de agar mínimo SC sin leucina o uracilo. (Preferiblemente, las células INVSc-1 cotransformadas de forma simultánea con pJ1231-AraC-MnP-H4_FT-ChuA y pJ1234-PrpR-PDI, o con pJ1234-AraC-MnP-H4_FT-ChuA y pJ1231-PrpR-PDI, se seleccionan en las mismas condiciones en placas de agar mínimo SC sin leucina o uracilo).
Las células de todas las colonias de cada transformación se rasparon y se resuspendieron en 4 mL de medio mínimo SC líquido, en ausencia de reactivo selectivo apropiado y fuente de carbono. La DO600 en cada cultivo se midió y se normalizó a 0,4 unidades ópticas. La expresión de proteínas se indujo mediante la adición de 2% de arabinosa filtrada de forma estéril (Sigma-Aldrich, St. Louis, Missouri, n° de catálogo A3256-25G) a cultivos transformados con pJ1234-AraC-HC_NS. En las células transformadas con pJ1231-PrpR-PDI y con pJ1231-PrpR-LC_NS, la expresión de pro­ teínas se indujo con la adición de 2% de propionato filtrado de forma estéril (Sigma-Aldrich, número de catálogo P188-100G). Y la coexpresión de pJ1234-AraC HC_NS y pJ1231-PrpR-LC_NS en el cultivo correspondiente fue inducida por la adición de 1% de arabinosa y 1% de propionato. (Preferiblemente, el medio de inducción para la expresión de proteínas a través de las células transformadas con pJ1231-AraC-MnP-H4_FT-ChuA, y para las células cotransforma­ das con pJ1231-AraC-MnP-H4_FT-ChuA y pJ1234-PrpR-PDI, o con pJ1234- AraC-MnP-H4_FT-ChuA y pJ1231-PrpR-PDI, también contiene hemina (Sigma-Aldrich, n° de catálogo H9039 o 51280) añadida hasta una concentración final de 8 micromolar). El curso de tiempo para la expresión de proteínas era de 24 horas, a 30 grados C en una incubadora con agitación a 250 rpm. Las células procedentes de 0,5 mililitros de cada cultivo inducido previamente se recogieron mediante centrifugación, se lavaron con 1 mililitro de agua desionizada y se almacenaron a -80 grados C. Las muestras procedentes de cultivos inducidos posteriormente se prepararon de la misma manera. Los extractos de proteínas totales se prepararon a partir de cultivos inducidos previa y posteriormente, se resolvieron en 4-20% de SDS-PAGE y se transfirieron a una membrana de PDVF. El nivel de expresión de las proteínas diana se analizó mediante transfe­ rencia Western, utilizando marcador anti-6xHis y anticuerpos anti-IgG humana.
Ejemplo 7
Valoración de la coexpresión mediante la variación de la concentración de inductor
Para optimizar la producción de un producto multímero utilizando los sistemas de coexpresión inducible de la inven­ ción, es posible ajustar de forma independiente o valorar la concentración de los inductores. Las células hospedadoras que contienen estructuras artificiales de expresión inducibles con L-arabinosa y propionato se cultivan hasta la densi­ dad deseada (tal como una DO600 de aproximadamente 0,5) en medio mínimo M9 que contiene los antibióticos apro­ piados, a continuación, las células se dividen en partes alícuotas en volúmenes pequeños de medio mínimo M9, pre­ parado opcionalmente sin ninguna fuente de carbono tal como glicerol, y con los antibióticos apropiados y concentra­ ciones variables de cada inductor. La concentración de L-arabinosa necesaria para inducir la expresión es normal­ mente menor que 2%. En un experimento de valoración, las concentraciones sometidas a ensayo de L-arabinosa pueden variar de 2% a 1,5%, 1%, 0,5%, 0,2%, 0,1%, 0,05%, 0,04%, 0,03%, 0,02%, 0,01%, 0,005%, 0,002% y 0,001%. Las concentraciones de L-ramnosa o D-xilosa necesarias para inducir la expresión de los promotores inducibles con L-ramnosa o D-xilosa se analizan de manera similar, con las concentraciones analizadas en el intervalo desde 5% a 0,01%. Para cada concentración 'x' de L-arabinosa (o L-ramnosa o D-xilosa) que se somete a ensayo, la concentración de un inductor diferente, tal como propionato, añadido a cada uno de los tubos que contienen la concentración 'x' del primer inductor, varía en cada serie de muestras, que en el caso del propionato está en el intervalo desde 1 M a 750 mM, 500 mM, 250 mM, 100 mM, 75 mM, 50 mM, 25 mM, 10 mM, 5 mM y 1 mM. Alternativamente, los experimentos de valoración pueden comenzar con una combinación "estándar" de las concentraciones de inductor, que es 0,002% de cualquiera entre L-arabinosa, L-ramnosa o D-xilosa, y/o propionato 50 mM, y someter a ensayo nuevas combina­ ciones de concentraciones de inductor que varían de la combinación "estándar". Experimentos de valoración similares se pueden realizar con cualquier combinación de inductores utilizados en un sistema de coexpresión inducible de la invención, incluyendo pero no limitados a, L-arabinosa, propionato, L-ramnosa y D-xilosa. Después del crecimiento en presencia de inductores durante 6 horas, las células se sedimentan, el producto deseado se extrae de las células y el rendimiento de producto por valor de la masa de las células se determina con un ensayo inmunológico cuantitativo, tal como ELISA, o mediante la purificación del producto y cuantificación por absorbancia de UV a 280 nm.
También es posible valorar las concentraciones de inductor utilizando un ensayo de alto rendimiento, en el que las proteínas que se van a expresar han sido diseñadas para incluir un resto de proteína fluorescente, tal como la propor­ cionada por la proteína fluorescente de color rojo mKate2 (Evrogen, Moscú, Rusia), o las proteínas fluorescentes verdes mejoradas de Aequorea victoria y Bacillus cereus. Otro enfoque para determinar la cantidad y la actividad de los productos génicos producidos con diferentes concentraciones de inductores en un experimento de valoración de alto rendimiento es el uso de un sensor capaz de medir la interacciones de unión biomolecular, tal como un sensor que detecta la resonancia de plasmón superficial, o un sensor que emplea interferometría de bio-capa (BLI) (por ejemplo, un sistema Octet® QK de forteBIO, Menlo Park, CA).
Ejemplo 8
Medición de la fuerza de los promotores y la homogeneidad de la expresión inducible
La fuerza de un promotor se mide como la cantidad de transcripción de un producto génico, iniciada por ese promotor, respecto a un control adecuado. Para promotores constitutivos que dirigen la expresión de un producto génico en una estructura artificial de expresión, un control adecuado podría utilizar la misma estructura artificial de expresión, excepto que se emplee la versión "de tipo silvestre" del promotor, o un promotor de un gen de “mantenimiento”, en lugar del promotor que se va a someter a ensayo. Para los promotores inducibles, la expresión del producto génico desde el promotor se puede comparar en condiciones inductoras y no inductoras.
A. Medición de la fuerza del promotor usando PCR cuantitativa para determinar los niveles de ARN transcrito desde el promotor
El método de De Mey et al. ("Promoter knock-in: a novel rational method for the fine tuning of genes", BMC Biotechnol 2010 Mar 24; 10: 26) se utiliza para determinar la fuerza relativa de los promotores en células hospedadoras que pueden crecer en un cultivo. Las células hospedadoras que contienen una estructura artificial de expresión con el promotor que se va a someter a ensayo, y células hospedadoras de control que contienen una estructura artificial de expresión de control, se dejan crecer en cultivo por triplicado. Se recogen muestras de un mL a una DO600 = 1,0 para el ARNm y la recogida de proteínas. La extracción de ARN total se consigue mediante un mini kit RNeasy (QIAGEN, Países Bajos). La pureza del ARN se verifica en un gel de agarosa FA según lo recomendado por QIAGEN y la concentración de ARN se determina midiendo la absorbancia a 260 nm. Dos microgramos de ARN se utilizan para sintetizar ADNc, utilizando un cebador aleatorio y transcriptasa inversa RevertAid H Minus M-MulV (Fermentas, Glen Burnie, Maryland). La fuerza del promotor se determina por RT-qPCR realizada en un iCycler IQ® (Bio-Rad, Eke, Bélgica) utilizando cebadores directos e inversos, diseñados para amplificar el ADNc correspondiente al transcrito producido desde el promotor. (Para este propósito, los autores De Mey et al. utilizaron los cebadores Fw-ppc-qPCR y Rv-ppc-qPCR, y los cebadores Fw-rpoB-qPCR y Rv-rpoB-qPCR desde el gen de mantenimiento de control rpoB). La supermezcla s Yb R Greener qPCR (Life Technologies, Grand Island, Nueva York) se utiliza para realizar una breve incubación con UDG (uracil ADN glicosilasa) (50°C durante 2 min) seguida inmediatamente por la amplificación con PCR (95°C durante 8,5 min; 40 ciclos a 95°C durante 15 s y 60°C durante 1 min) y el análisis de la curva de fusión (95°C durante 1 min, 55°C durante 1 min y 80 ciclos de 55°C 0,5°C/ciclos durante 10 s) para identificar la presencia de dímeros de cebadores y analizar la especificidad de la reacción. Esta etapa de incubación con UDG antes de la PCR cíclica destruye cualquier producto contaminante que contiene dU de las reacciones anteriores. La UDG se inac­ tiva después mediante temperaturas elevadas durante el ciclo normal de PCR, lo que permite la amplificación de secuencias diana auténticas. Cada muestra se realiza por triplicado. Las proporciones de expresión relativa se calculan utilizando el "método delta-delta ct" de PE Applied Biosystems (Perkin Elmer, Foster City, California).
B. Medición de la fuerza del promotor inducible y la homogeneidad de la inducción usando un gen informador fluores­ cente
Estos experimentos se llevan a cabo utilizando los métodos de Khlebnikov et al. ("Regulatable arabinose-inducible gene expression system with consistent control in all cells of a culture", J Bacteriol 2000 Dec; 182(24): 7029-7034). Los experimentos que miden la inducción de un promotor inducible se realizan en medio C complementado con 3,4% de glicerol como fuente de carbono (Helmstetter, "DNA synthesis during the division cycle of rapidly growing Escherichia coli B/r", J Mol Biol 1968 Feb 14; 31(3): 507-518). Cepas de E. coli que contienen estructuras artificiales de expresión que comprenden al menos un promotor inducible que controla la expresión de un gen informador fluo­ rescente, se hacen crecer a 37°C con selección con antibióticos a una densidad óptica a 600 nm (DO600) desde 0,6 a 0,8. Las células se recogen por centrifugación (15.000 x g), se lavan en medio C sin una fuente de carbono, se resuspenden en medio C de nuevo aporte que contiene antibióticos, glicerol y/o inductor (para la inducción de la expresión génica) a una DO600 desde 0,1 a 0,2, y se incuban durante 6 h. Las muestras se toman de manera rutinaria durante el período de crecimiento para el análisis. La fluorescencia del cultivo se mide en un fluorómetro Versafluor (Bio-Rad Inc., Hercules, California) con excitación a una longitud de onda de 360/40 nm y filtros de emisión con una longitud de onda de 520/10 nm. La fuerza de la expresión de un promotor inducible después de la inducción se puede expresar como la relación de la fluorescencia de población máxima promediada (proporción de fluorescencia/DO) de las células inducidas, con respecto a la de las células de control (como células no inducidas). Para determinar la homogeneidad de la inducción dentro de la población celular, se realiza una citometría de flujo en un citómetro de flujo de Beckman-Coulter EPICS XL (Beckman Instruments Inc., Palo Alto, California) equipado con un láser de argón (emisión a una longitud de onda de 488 nm y 15 mW) y un filtro de paso de banda con una longitud de onda de 525 nm. Antes del análisis, las células de la muestra se lavan con solución salina tamponada con fosfato que se había filtrado (tamaño de poro del filtro, 0,22 micrómetros), se diluyen hasta una DO600 de 0,05 y se colocan sobre hielo. Para cada muestra, se recogen 30.000 eventos con una tasa de entre 500 y 1.000 eventos/s. El porcentaje de células inducidas (fluorescentes) en cada muestra se puede calcular a partir de los datos de la citometría de flujo.
Ejemplo 9
Purificación de anticuerpos
Los anticuerpos producidos por los sistemas de coexpresión inducible de la invención se purifican por centrifugación de las muestras de células hospedadoras lisadas, a 10.000 x g durante 10 minutos, para eliminar cualquier célula y residuo. El material sobrenadante se filtra a través de un filtro de 0,45 micrómetros. Una columna de 1 mL de proteína G recombinante - Sepharose® 4B (Life Technologies, Grand Island, Nueva York) está configurada para alcanzar cau­ dales de 1 mL/min, y se utiliza con los siguientes tampones: tampón de unión: fosfato de sodio 0,02 M, pH 7,0; tampón de elución: glicina-HCl 0,1 M, pH 2,7; y tampón de neutralización: Tris-HCl 1 M, pH 9,0. La columna se equilibra con 5 volúmenes de columna (5 mL) de tampón de unión, y después la muestra se aplica a la columna. La columna se lava con 5-10 volúmenes de columna de tampón de unión para eliminar las impurezas y el material no unido, continuando hasta que no se detecta ninguna proteína en el eluyente (determinado por absorbancia de UV a 280 nm). La columna se eluye a continuación con 5 volúmenes de columna de tampón de elución, y la columna se vuelve a equilibrar inmediatamente con 5-10 volúmenes de columna de tampón de unión.
Ejemplo 10
Medición de la afinidad de unión del anticuerpo
La afinidad de unión del anticuerpo, expresada como "Kd" o "valor de Kd", se mide mediante un ensayo de unión a antígeno radiomarcado (RIA) realizado con la versión Fab de un anticuerpo de interés y su antígeno, tal como se describe mediante el siguiente ensayo. La producción de la versión Fab de un anticuerpo de longitud completa es bien conocida en la técnica. La afinidad de unión en solución de los Fabs hacia un antígeno se mide equilibrando un Fab con una concentración mínima de antígeno marcado con (125I) en presencia de una serie de valoraciones de antígeno no marcado, a continuación, se captura el antígeno unido con una placa recubierta de anticuerpo anti-Fab (véase, por ejemplo, Chen et al., "Selection and analysis of an optimized anti-VEGF antibody: crystal structure of an affinitymatured Fab in complex with antigen", J Mol Biol 1999 Nov 5; 293(4): 865-881). Para establecer las condiciones del ensayo, placas de microtitulación (Dynex Technologies, Inc., Chantilly, Virginia) se recubren durante una noche con 5 microgramos/mL de un anticuerpo anti-Fab de captura (Cappel Labs, West Chester, Pensilvania) en carbonato de sodio 50 mM (pH 9,6), y posteriormente se bloquean con 2% (p/v) de albúmina de suero bovino en PBS durante dos a cinco horas a temperatura ambiente (aproximadamente 23°C). En una placa no adsorbente (Nunc n° 269620; Thermo Scientific, Rochester, Nueva York), se mezcla antígeno (125I) 100 pM o 26 pM con diluciones en serie de un Fab de interés (por ejemplo, en consonancia con la determinación del anticuerpo anti-VEGF, Fab-12, en Presta et al., "Humanization of an anti-vascular endothelial growth factor monoclonal antibody for the therapy of solid tumors and other disorders", Cancer Res 1997 Oct 15; 57(20): 4593-4599). El Fab de interés se incuba después durante una noche; sin embargo, la incubación puede continuar durante un período más largo (por ejemplo, aproximadamente 65 horas) para asegurar que se alcanza el equilibrio. A continuación, las mezclas se transfieren a la placa de captura para incubar a temperatura ambiente (por ejemplo, durante una hora). A continuación, se retira la solución y se lava la placa ocho veces con 0,1% de tensioactivo Tween-20® en PBS. Cuando las placas se han secado, se añaden 150 microlitros/pocillo de líquido de centelleo (Microscint-20® PerkinElmer, Waltham, Massachusetts), y se hace un recuento de las placas en un contador gamma TOPCOUNT® (PerkinElmer) durante diez minutos. Las concentraciones de cada Fab que proporcionan menos o igual a un 20% de unión máxima, se eligen para uso en ensayos de unión competitiva.
Alternativamente, la Kd o el valor de Kd se mide utilizando ensayos de resonancia de plasmón de superficie, usando un instrumento BIAcore®-2000 o BIAcore®-3000 (BIAcore, Inc., Piscataway, New Jersey) a 25°C con chips con antí­ geno CM5 inmovilizado, a ~10 unidades de respuesta (UR). Brevemente, chips de biosensores con dextrano carboximetilado (CM5, BIAcore Inc). se activan con clorhidrato de N-etil-N'-(3-dimetilamino-propil)carbodiimida (EDC) y N-hidroxisuccinimida (NHS) de acuerdo con las instrucciones del proveedor. El antígeno se diluye con acetato de sodio 10 mM, pH 4,8, a 5 microgramos/mL (~0,2 micromolar) antes de la inyección con un caudal de 5 microlitros/minuto, para conseguir aproximadamente 10 UR de proteína acoplada. Después de la inyección de antígeno, se inyecta etanolamina 1 M para bloquear los grupos que no han reaccionado. Para las mediciones de cinética, se inyectan dilucio­ nes dobles en serie de Fab (0,78 nM a 500 nM) en PBS con 0,05% de tensioactivo Tween 20® (PBST) a 25°C con un caudal de aproximadamente 25 microlitros/min. Las tasas de asociación (kon) y las tasas de disociación (koff) se calcu­ lan usando un modelo simple de unión a uno-a-uno de Langmuir (programa informático de evaluación de BIAcore®, versión 3.2) mediante el ajuste simultáneo de los sensogramas de asociación y disociación. La constante de disocia­ ción en equilibrio (Kd) se calcula como la relación koff/kon. Si la tasa de asociación excede a 106 M'1 s_1 en el ensayo de resonancia de plasmón superficial anterior, entonces la tasa de asociación se puede determinar mediante el uso de una técnica de extinción de la fluorescencia que mide el incremento o la disminución de la intensidad de la emisión de fluorescencia (excitación = 295 nm; emisión = 340 nm, banda de paso de 16 nm) a 25°C de un anticuerpo antiantígeno 20 nM (forma Fab) en PBS, pH 7,2, en presencia de concentraciones crecientes de antígeno, tal como se mide en un espectrómetro, como un espectrofotómetro equipado con flujo interrumpido (Aviv Instruments) o un espec­ trómetro de 8000 series SLM-AMINCO® (ThermoSpectronic) con una cubeta agitada.
Ejemplo 11
Caracterización de los enlaces disulfuro presentes en los productos de coexpresión
La cantidad y la ubicación de los enlaces disulfuro en los productos de proteínas coexpresadas se pueden determinar mediante la digestión de la proteína con una proteasa, tal como tripsina, en condiciones no reductoras, y someter los fragmentos peptídicos resultantes a espectrometría de masas (MS) combinando etapas de MS de disociación de transferencia de electrones secuencial (ETD) y disociación inducida por colisión (CID) (MS2, MS3) (Nili et al., "Defining the disulfide bonds of insulin-like growth factor-binding protein-5 by tandem mass spectrometry with electron transfer dissociation and collision-induced dissociation", J Biol Chem 2012 Jan 6 ; 287(2): 1510-1519; Epub 2011 Nov 22).
Digestión de proteínas coexpresadas. Para evitar los reordenamientos de los enlaces disulfuro, cualquier residuo de cisteína libre se bloquea primero mediante alquilación: la proteína coexpresada se incuba protegida de la luz con el agente alquilante yodoacetamida (5 mM) con agitación durante 30 minutos a 20°C en tampón con urea 4 M, y a continuación, se separa mediante SDS-PAGE no reductor, usando geles prefabricados. Alternativamente, la proteína coexpresada se incuba en el gel después de la electroforesis con yodoacetamida, o sin ella como control. Las bandas de proteínas se tiñen, se destiñen con agua doblemente desionizada, se escinden y se incuban dos veces en 500 microlitros de bicarbonato de amonio 50 mM, 50% (v/v) de acetonitrilo, mientras que se agita durante 30 minutos a 20°C. Las muestras de proteína se deshidratan en 100% de acetonitrilo durante 2 minutos, se secan por centrifugación a vacío y se rehidratan con 10 mg/mL de tripsina o quimotripsina en tampón que contiene bicarbonato de amonio 50 mM y cloruro de calcio 5 mM durante 15 minutos sobre hielo. El exceso de tampón se elimina y se reemplaza con 50 microlitros del mismo tampón sin enzima, seguido de incubación durante 16 horas a 37°C o 20°C, para tripsina y quimotripsina, respectivamente, con agitación. Las digestiones se detienen mediante la adición de 3 microlitros de ácido fórmico al 88%, y después de una breve agitación en vórtice, se retira el material sobrenadante y se almacenan a -20°C hasta el análisis.
Localización de los enlaces disulfuro por espectrometría de masas. Los péptidos se inyectan en una columna de atrapamiento de 1 mm x 8 mm (Michrom BioResources, Inc., Auburn, CA) a 20 microlitros/minuto en una fase móvil que contiene ácido fórmico al 0,1%. El cartucho de atrapamiento se coloca entonces en línea con una columna de 0,5 mm x 250 mm que contiene 5 mm de fase estacionaria Zorbax SB-C18 (Agilent Technologies, Santa Clara, CA), y los péptidos se separan por un gradiente de acetonitrilo de 2-30% durante 90 minutos a 10 microlitros/minuto, con HPLC capilar en serie 1100 (Agilent Technologies). Los péptidos se analizan utilizando una trampa de iones lineal LTQ Velos con una fuente de ETD (Thermo Scientific, San Jose, CA). La ionización por electroespray se realiza usando una fuente de Captive Spray (Michrom BioResources, Inc.). Las exploraciones Ms de vigilancia están seguidas por siete exploraciones dependientes de los datos que consisten en exploraciones MS2 CID y ETD en el ion más intenso en la exploración de vigilancia, seguidas por cinco exploraciones MS3 CID en el primer hasta el quinto ion más intenso en la exploración MS2 ETD. Las exploraciones CID utilizan energía de colisión normalizada de 35, y las exploraciones ETD utilizan un tiempo de activación de 100 ms con activación suplementaria permitida. Las señales mínimas para iniciar las exploraciones MS2 CID y ETD son 10.000, las señales mínimas para el inicio de exploraciones MS3 CID son 1000, y las anchuras de aislamiento para todas las exploraciones MS2 y MS3 son 3,0 m/z. La característica dinámica de exclusión del programa informático está habilitada con un número de repetición de 1 , un tamaño de exclusión de la lista de 100 y una duración de la exclusión de 30 s. Se emplean listas de inclusión para especies diana reticuladas específicas para la recogida de las exploraciones MS2 ETD. Los archivos de datos separados para las exploraciones de MS2 y MS3 están creados por Bioworks 3.3 (Thermo Scientific) utilizando un análisis de estado de carga de ZSA. La adecuación de las exploraciones MS2 y MS3 a las secuencias de péptidos se realiza mediante Sequest (V27, Rev 12, Thermo Scientific). El análisis se realiza sin especificidad de la enzima, una tolerancia de masa de ion primario de 2,5, una tolerancia de masa de fragmento de 1,0, y una masa variable de 16 para los residuos de metionina oxidados. Los resultados se analizan después usando el programa de Scaffold (V3_00_08, Proteoma Soft­ ware, Portland, OR) empleando probabilidades mínimas de péptidos y proteínas de 95 y 99%. Los péptidos de los resultados de MS3 se ordenan por el número de exploración, y los péptidos que contienen cisteína se identifican a partir de grupos de exploraciones MS3 producidas a partir de los cinco iones más intensos observados en las explo­ raciones MS2 ETD. Las identidades de los péptidos con cisteína que participan en las especies unidas por puentes disulfuro se confirman adicionalmente por un examen manual de las masas de iones primarias, observadas en la exploración de vigilancia y la exploración MS2 ETD.
Ejemplo 12
Aislamiento de productos de coexpresión procedentes del periplasma de células bacterianas, de esferoplastos y de células completas
El sistema de coexpresión inducible de la invención se puede utilizar para expresar productos génicos que se acumu­ lan en diferentes compartimentos de la célula, tales como el citoplasma o el periplasma. Las células hospedadoras tales como E. coli o S. cerevisiae tienen una membrana celular externa o pared celular, y pueden formar esferoplastos cuando se retira la membrana o pared externa. Las proteínas coexpresadas producidas en tales hospedadores se pueden purificar específicamente a partir del periplasma o de esferoplastos o de células completas, utilizando el si­ guiente método (Schoenfeld, "Convenient, rapid enrichment of periplasmic and spheroplasmic protein fractions using the new PeriPreps™ Periplasting Kit", Epicentre Forum 1998 5(1): 5; véase www.epibio.com/newsletter/f5_l/f5_lpp.asp). Este método, que emplea el kit PeriPreps® Periplasting (Epicentre® Biotechnologies, Madison WI; protocolo disponible en www.epibio.com/pdftechlit/107p10612.pdf), está diseñado para E. coli y otras bacterias Gram-negativas, pero el enfoque general se puede modificar para otras células hospedadoras tales como S. cerevisiae.
1. El cultivo de células hospedadoras bacterianas se deja crecer solo hasta la fase logarítmica tardía, ya que los cultivos celulares más antiguos en fase estacionaria muestran comúnmente una cierta resistencia al tratamiento con lisozima. Si la expresión de la proteína recombinante es excesiva, las células se pueden lisar prematuramente; por lo tanto, los cultivos celulares no se cultivan en medio rico o a temperaturas de crecimiento más elevadas que puedan inducir una síntesis de proteínas en exceso. A continuación, se induce la expresión de proteínas; las células deben estar en fase logarítmica o en la fase estacionaria temprana.
2. El cultivo celular se sedimenta por centrifugación a un mínimo de 1.000 x g durante 10 minutos a temperatura ambiente. Nota: las células deben ser frescas, no congeladas. El peso húmedo del sedimento celular se determina con el fin de calcular la cantidad de reactivos necesarios para este protocolo.
3. Las células se vuelven a suspender a fondo en un mínimo de 2 mL de tampón PeriPreps Periplasting (Tris-HCl 200 mM pH 7,5, 20% de sacarosa, EDTA 1 mM y 30 U/microlitro de lisozima Ready-Lyse) por cada gramo de células, ya sea por mezclado en vórtice o pipeteando la suspensión celular hasta que sea homogénea. Nota: una agitación exce­ siva puede causar una lisis prematura de los esferoplastos dando lugar a una contaminación de la fracción periplásmica con proteínas citoplasmáticas.
4. Incubar durante cinco minutos a temperatura ambiente. La lisozima Ready-Lyse está activa de forma óptima a temperatura ambiente. La lisis a temperaturas más bajas (0°C-4°C) requiere un tiempo de incubación adicional; a tales temperaturas, los tiempos de incubación se extienden de 2 a 4 veces.
5. Añadir 3 mL de agua purificada a 4°C por cada gramo de peso de sedimento celular original (Etapa 2) y mezclar mediante inversión.
6. Incubar durante 10 minutos en hielo.
7. Las células lisadas se sedimentan por centrifugación a un mínimo de 4.000 x g durante 15 minutos a temperatura ambiente.
8. El material sobrenadante que contiene la fracción periplásmica se transfiere a un tubo limpio.
9. Para degradar los ácidos nucleicos contaminantes, se añade opcionalmente la endonucleasa OmniCleave al tam­ pón de lisis PeriPreps. La inclusión de una nucleasa generalmente mejora el rendimiento de la proteína y la facilidad de manejo de los lisados, pero la adición de una nucleasa no es deseable en algunos casos: por ejemplo, el uso de una nucleasa se debe evitar si la actividad nucleasa residual o una exposición transitoria al cofactor de magnesio va a interferir con ensayos o usos posteriores de la proteína purificada. La adición de EDTA al lisado para inactivar la endonucleasa OmniCleave, del mismo modo, puede interferir con el ensayo o el uso posterior de la proteína purificada. Si se va a añadir nucleasa, se diluyen 2 microlitros de endonucleasa OmniCleave y 10 microlitros de MgCb 1,0 M hasta 1 mL con el tampón de lisis PeriPreps (Tris-HCl 10 mM pH 7,5, KCl 50 mM, EDTA 1 mM y 0,1% de desoxicolato) por cada mililitro de tampón de lisis necesario en la Etapa 10.
10. El sedimento se resuspende en 5 mL de tampón de lisis PeriPreps por cada gramo de peso de sedimento celular original.
11. El sedimento se incuba a temperatura ambiente durante 10 minutos (si se incluye, la actividad de la endonucleasa OmniCleave causará una disminución significativa de la viscosidad; la incubación continúa hasta que la suspensión celular tiene la consistencia del agua).
12. Los restos celulares se sedimentan por centrifugación a un mínimo de 4.000 x g durante 15 minutos a 4°C.
13. El material sobrenadante que contiene la fracción de esferoplastos se transfiere a un tubo limpio.
14. Si se había añadido endonucleasa OmniCleave al tampón de lisis PeriPreps, se añaden 20 microlitros de EDTA 500 mM por cada mililitro de la fracción esferoplástica resultante, para quelar el magnesio (la concentración final de EDTA en el lisado es 10 mM). Después de la hidrólisis de los ácidos nucleicos con endonucleasa OmniCleave, los lisados pueden contener cantidades sustanciales de monooligonucleótidos u oligonucleótidos. La presencia de estos productos de degradación puede afectar adicionalmente al procesamiento del lisado: por ejemplo, los nucleótidos pueden disminuir la capacidad de unión de resinas de intercambio aniónico mediante una interacción con la resina.
El protocolo anterior se puede utilizar para preparar proteína celular total con las siguientes modificaciones. Las células sedimentadas en la Etapa 2 pueden ser frescas o congeladas; en la Etapa 4, las células se incuban durante 15 minutos; las Etapas 5 a 8 se omiten; en la Etapa 10, se añaden 3 mL de tampón de lisis PeriPreps por cada gramo de peso de sedimento celular original.
Después de la preparación de muestras de proteínas periplásmicas o esferoplásticas o de células completas, las muestras se pueden analizar mediante cualquiera de una variedad de métodos de caracterización y/o cuantificación de proteínas. En un ejemplo, el fraccionamiento con éxito de proteínas periplásmicas y esferoplásticas se confirma mediante el análisis de una parte alícuota de ambas fracciones periplásmicas y esferoplásticas mediante SDS-PAGE (dos microlitros de cada fracción es generalmente suficiente para la visualización con una tinción con Coomassie Brilliant Blue). La presencia de proteínas únicas o el enriquecimiento de proteínas específicas en una fracción dada, indica un fraccionamiento exitoso. Por ejemplo, si la célula hospedadora contiene un plásmido con un número elevado de copias con el marcador de resistencia a la ampicilina, a continuación, la presencia de p-lactamasa (31,5 kDa) principalmente en la fracción periplásmica, indica un fraccionamiento exitoso. Otras proteínas de E. coli que se en­ cuentran en el espacio periplásmico incluyen fosfatasa alcalina (50 kDa) y factor de elongación Tu (43 kDa). La canti­ dad de proteína que se encuentra en una fracción dada se puede cuantificar utilizando cualquiera entre una serie de métodos (por ejemplo, SDS-PAGE y análisis densitométrico de bandas de proteínas teñidas o marcadas, recuento de centelleo de las proteínas radiomarcadas, ensayo de inmunoabsorción ligado a enzimas (ELISA), o ensayo de cente­ lleo de proximidad, entre otros métodos). La comparación de las cantidades de una proteína que se encuentra en la fracción periplásmica en comparación con la fracción esferoplástica, indica el grado en que se ha exportado la proteína desde el citoplasma al periplasma.
Ejemplo 13
Determinación de la similitud de la secuencia de polinucleótidos o de aminoácidos
El porcentaje de identidad de la secuencia de polinucleótidos o de la secuencia de aminoácidos se define como el número de símbolos alineados, es decir, nucleótidos o aminoácidos, que son idénticos en las dos secuencias alinea­ das, dividido por el número total de símbolos en la alineación de las dos secuencias, incluyendo los huecos. El grado de similitud (porcentaje de identidad) entre dos secuencias se puede determinar alineando las secuencias utilizando el método de alineamiento global de Needleman y Wunsch (J. Mol. Biol. 48: 443, 1970), implementado por el Centro Nacional de Información sobre Biotecnología (NCBl) en la herramienta de alineación de secuencias global Needleman-Wunsch, disponible a través de la página web blast.ncbi.nlm.nih.gov/Blast.cgi. En una realización, los parámetros de alineación de Needleman y Wunsch se establecen para los valores por defecto (Puntuaciones de Emparejamiento/No emparejamiento de 2 y -3, respectivamente, y los costes por huecos por su existencia y extensión de 5 y 2, respecti­ vamente). Otros programas utilizados por los expertos en la técnica de comparación de secuencias, también se pue­ den utilizar para alinear secuencias, tales como, por ejemplo, la herramienta de búsqueda de alineamiento local básico o programa Blast® (Altschul et al., "Basic local alignment search tool", J Mol Biol 1990 Oct 5; 215(3): 403-410), tal y como se implementa en el NCBI, usando los ajustes de parámetros por defecto que se describen en el sitio web blast.ncbi.nlm.nih.gov/Blast.cgi. El algoritmo BLAST tiene varios parámetros opcionales, incluyendo dos que se pue­ den utilizar de la siguiente manera: (A) inclusión de un filtro para enmascarar segmentos de la secuencia de consulta que tienen baja complejidad composicional o segmentos que consisten en repeticiones internas de corta periodicidad, que preferiblemente no se utilizan o están desactivados, y (B) un umbral de significación estadística para informar de emparejamientos frente a secuencias de bases de datos, llamado el “Expect” o puntuación E (del inglés “E-score”) (la probabilidad esperada de emparejamientos que se encuentran simplemente por casualidad, si la significación esta­ dística atribuida a un emparejamiento es superior a este umbral de puntuación E, no se informará del emparejamiento). Si este valor 'Expect' o puntuación E se ajusta desde el valor predeterminado (10), los valores umbrales preferidos son 0,5, o con el fin de aumentar la preferencia, 0,25, 0,1, 0,05, 0,01, 0,001, 0,0001, 0,00001 y 0,000001.
En la práctica de la presente invención, se utilizan opcionalmente muchas técnicas convencionales en biología mole­ cular, microbiología y tecnología de ADN recombinante. Tales técnicas convencionales se refieren a vectores, células hospedadoras y métodos recombinantes. Estas técnicas son bien conocidas y se explican en, por ejemplo, Berger y Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology volumen 152 Academic Press, Mc, San Diego, CA; Sambrook et al., Molecular Cloning - A Laboratory Manual (3a Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, Nueva York, 2000; y Current Protocols in Molecular Biology, F.M. Ausubel et al., compiladores, Current Protocols, a joint venture between Greene Publishing Associates, Inc. y John Wiley & Sons, Inc., (complementado hasta el 2006). Otras referencias útiles, por ejemplo, para el aislamiento y cultivo celular y para un aislamiento posterior de ácidos nucleicos o proteínas, incluyen Freshney (1994) Culture of Animal Cells, a Manual of Basic Technique, tercera edición, Wiley-Liss, New York y las referencias citadas en el mismo; Payne et al. (1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. Nueva York, NY; Gamborg y Phillips (compiladores) (1995) Plant Cell, Tissue and Organ Culture; Fundamental Methods Springer Lab Manual, Springer- Verlag (Berlin Heidelberg New York); y Atlas y Parks (compiladores) The Handbook of Microbiological Media (1993) CRC Press, Boca Raton, FL. Métodos para preparar ácidos nucleicos (por ejemplo, mediante amplificación in vitro, purificación a partir de células o síntesis química), métodos para la manipulación de ácidos nucleicos (por ejemplo, mediante mutagénesis dirigida al sitio, digestión con enzimas de restricción, ligación, etc.), y diversos vectores, líneas celulares y similares, útiles en la manipulación y la preparación de ácidos nucleicos, se describen en las referencias anteriores. Además, esencialmente, cualquier polinucleótido (incluyendo polinucleótidos marcados o biotinilados) se puede orde­ nar de forma personalizada o convencional a partir de cualquiera entre una variedad de fuentes comerciales.
La presente invención se ha descrito en términos de realizaciones particulares, encontradas o propuestas para com­ prender ciertos modos para la práctica de la invención.
Secuencias presentadas en el listado de secuencias
Figure imgf000047_0001
Figure imgf000048_0001
Figure imgf000049_0001

Claims (14)

REIVINDICACIONES
1. Una célula hospedadora de E. coli que comprende una supresión en el operón de araBAD que reduce el catabolismo de la arabinosa, una supresión en el operón de sbm-ygfDGH que elimina la función de uno o más genes implicados en la biosíntesis de 2-metilcitrato y en la que el promotor de araE nativo se ha reemplazado con un promotor constitu­ tivo.
2. La célula hospedadora de la reivindicación 1 en donde el promotor constitutivo es el promotor J23104.
3. Una célula de E. coli SHuffle Express modificada para comprender las alteraciones genómicas de la reivindicación 1.
4. Una célula hospedadora de E. coli SHuffle Express modificada para comprender una supresión en el operón de araBAD que reduce el catabolismo de la arabinosa y una supresión en el operón de sbm-ygfDGH que elimina la función de uno o más genes implicados en la biosíntesis de 2-metilcitrato.
5. Una célula hospedadora de E. coli que comprende una mutación de inactivación del operón de araBAD y un gen de metabolismo de proprionato inactivado, prpD, y que expresa una forma citoplásmica de la disulfuro isomerasa DsbC que carece de un péptido señal y caracterizado adicionalmente por la expresión génica seleccionada del grupo que consiste en expresión de araE y araFGH de promotores constitutivos y la expresión de una mutación puntual en el gen lacY (A117C) en un fondo deficiente en araEFGH.
6. La célula hospedadora de la reivindicación 5 que comprende además un operón de scpA-argK-scpBC inactivado.
7. La célula hospedadora de la reivindicación 5 que tiene además un nivel reducido de función génica para el gen de la tiorredoxina reductasa (trxB) y un gen seleccionado del grupo que consiste en el gen de la glutatión reductasa (gor) y el gen de la glutatión sintetasa (gshB).
8. La célula hospedadora de la reivindicación 5 que expresa además la sulfhidrilo oxidasa mitocondrial de levadura Erv1p en el citoplasma de la célula hospedadora.
9. La célula hospedadora de la reivindicación 5 que comprende además dos vectores de expresión compatibles.
10. La célula hospedadora de la reivindicación 9 en donde un vector de expresión comprende una secuencia polinucleotídica que codifica la cadena pesada de un anticuerpo de longitud completa y el otro vector de expresión com­ prende una secuencia polinucleotídica que codifica la cadena ligera de un anticuerpo de longitud completa.
11. Un método para inducir la coexpresión de productos génicos que comprende aplicar L arabinosa y propionato a la célula hospedadora de la reivindicación 5.
12. El método de la reivindicación 11 en donde se expresan cadenas de anticuerpos.
13. El método de la reivindicación 12 en donde las cadenas de anticuerpos forman enlaces disulfuro.
14. El método de la reivindicación 11 en donde se expresan proteínas en el citoplasma.
ES16201998T 2012-08-05 2013-08-05 Sistema de coexpresión inducible Active ES2750005T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201261679751P 2012-08-05 2012-08-05
US201261747246P 2012-12-29 2012-12-29

Publications (1)

Publication Number Publication Date
ES2750005T3 true ES2750005T3 (es) 2020-03-24

Family

ID=49111529

Family Applications (3)

Application Number Title Priority Date Filing Date
ES13756743.4T Active ES2621320T3 (es) 2012-08-05 2013-08-05 Sistema de coexpresión inducible
ES16201998T Active ES2750005T3 (es) 2012-08-05 2013-08-05 Sistema de coexpresión inducible
ES19187102T Active ES2954516T3 (es) 2012-08-05 2013-08-05 Sistema de coexpresión inducible

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES13756743.4T Active ES2621320T3 (es) 2012-08-05 2013-08-05 Sistema de coexpresión inducible

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES19187102T Active ES2954516T3 (es) 2012-08-05 2013-08-05 Sistema de coexpresión inducible

Country Status (12)

Country Link
US (8) US9617335B2 (es)
EP (4) EP4273257A3 (es)
JP (3) JP6457387B2 (es)
CN (2) CN104603274B (es)
AU (3) AU2013299910B2 (es)
CA (1) CA2880285C (es)
DK (2) DK3187586T3 (es)
ES (3) ES2621320T3 (es)
HK (1) HK1210804A1 (es)
IL (3) IL236975B (es)
PL (1) PL3591057T3 (es)
WO (1) WO2014025663A1 (es)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104718284A (zh) * 2012-05-25 2015-06-17 塞勒克提斯公司 工程化用于免疫疗法的异体和免疫抑制耐受性t细胞的方法
US20180282405A1 (en) * 2012-08-05 2018-10-04 Absci, Llc Cytoplasmic expression system
US20150353940A1 (en) * 2013-08-05 2015-12-10 Absci, Llc Vectors for use in an inducible coexpression system
US11077144B2 (en) 2013-05-13 2021-08-03 Cellectis CD19 specific chimeric antigen receptor and uses thereof
JP6788255B2 (ja) * 2015-11-19 2020-11-25 国立大学法人信州大学 新規ベクター及びこれを用いた可溶化タンパク質の製造方法
CN106190940B (zh) * 2016-07-19 2019-06-14 北京三元基因药业股份有限公司 表达抗TNF抗体Fab片段的重组大肠杆菌工程菌
MX2019002835A (es) 2016-09-13 2019-09-04 Allergan Inc Composiciones no proteínicas de toxina clostridial.
WO2019175881A1 (en) * 2018-03-14 2019-09-19 Technion Research & Development Foundation Limited A prognostic biomarker in cancer
JP7174990B2 (ja) * 2018-07-23 2022-11-18 国立大学法人山口大学 原核生物用発現ベクター
WO2020069011A1 (en) 2018-09-25 2020-04-02 Absci, Llc Protein purification methods
CN113166717B (zh) * 2018-11-08 2024-02-20 苏特罗生物制药公司 具有氧化细胞质的大肠杆菌菌株
CN109371049A (zh) * 2018-11-14 2019-02-22 天津大学 分子伴侣在促进单克隆抗体的形成和/或提高单克隆抗体的表达量中的应用
CN111269294B (zh) * 2018-12-05 2023-03-28 广州中国科学院先进技术研究所 纤维寡糖转运蛋白LacY的突变位点、突变转运蛋白LacY及其制备方法和应用
BR112021018925A2 (pt) * 2019-04-04 2022-01-18 Braskem Sa Modificação metabólica para consumo simultâneo de xilose e glicose para produção de produtos químicos a partir de açúcares de segunda geração
CN110616181A (zh) * 2019-09-27 2019-12-27 北京理工大学 一株基于大肠杆菌改造的工程菌株
CN112980891B (zh) * 2019-12-16 2023-12-12 中国科学院分子植物科学卓越创新中心 一种基于CRISPR-Cas的大肠杆菌基因组编辑工具
CN113122552B (zh) * 2021-04-21 2022-07-26 西北农林科技大学 黄瓜谷氧还蛋白基因CsGRX4及其灰霉菌感病性的应用
CN118339289A (zh) 2021-09-17 2024-07-12 艾伯赛公司 转移rna的组成和在含有非标准氨基酸的蛋白质产生中的用途
WO2024006269A1 (en) * 2022-06-29 2024-01-04 Absci Corporation Affinity screening method
WO2024040020A1 (en) 2022-08-15 2024-02-22 Absci Corporation Quantitative affinity activity specific cell enrichment
US20240239854A1 (en) 2022-12-21 2024-07-18 Donald Danforth Plant Science Center Antimicrobial peptides and modifications thereof
CN116875524B (zh) * 2023-09-08 2024-03-26 清华大学 一种在微生物中调控多基因表达的方法及其应用
CN118064437B (zh) * 2024-04-24 2024-09-10 山东福洋生物科技股份有限公司 一种多启动子结构元件及其构建方法和应用

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997038123A1 (en) * 1996-04-05 1997-10-16 Board Of Regents, The University Of Texas System Methods for producing soluble, biologically-active disulfide bond-containing eukaryotic proteins in bacterial cells
US6083715A (en) * 1997-06-09 2000-07-04 Board Of Regents, The University Of Texas System Methods for producing heterologous disulfide bond-containing polypeptides in bacterial cells
CN1064052C (zh) * 1997-09-29 2001-04-04 中国科学院微生物研究所 甲状旁腺素相关蛋白人源化抗体及其制备方法
US6872563B1 (en) * 1999-10-05 2005-03-29 President And Fellows Of Harvard College Compositions and methods for production of disulfide bond containing proteins in host cells
AU4926501A (en) 2000-03-24 2001-10-08 Xoma Technology Ltd Improved methods and cells for expression of recombinant protein products
US6979556B2 (en) * 2000-12-14 2005-12-27 Genentech, Inc. Separate-cistron contructs for secretion of aglycosylated antibodies from prokaryotes
MXPA04001566A (es) * 2001-08-27 2004-05-17 Genentech Inc Un sistema para expresion y ensamblado de anticuerpos.
EP1511772B1 (en) * 2002-05-28 2011-11-23 Omrix Biopharmaceuticals Inc. Method for obtaining anti-idiotype antibodies
DE60325611D1 (de) * 2002-07-03 2009-02-12 Dow Global Technologies Inc Benzoat- und antranilatinduzierbare promotoren
DE50307835D1 (de) * 2002-12-02 2007-09-13 Basf Ag L-rhamnose-induzierbare expressionssysteme
BRPI0611112A2 (pt) * 2005-06-06 2010-08-10 Dow Global Technologies Inc sistemas promotores induzidos por manitol em células hospedeiras bacterianas
US7351563B2 (en) 2005-06-10 2008-04-01 The Board Of Trustees Of The Leland Stanford Junior University Cell-free extracts and synthesis of active hydrogenase
US8178338B2 (en) 2005-07-01 2012-05-15 The Regents Of The University Of California Inducible expression vectors and methods of use thereof
JP4270466B2 (ja) * 2005-09-02 2009-06-03 国立大学法人福井大学 NADase、SNIおよびSLO遺伝子を含むオペロンから発現するタンパク質の製造方法、それにより得られるタンパク質およびその使用
US7816117B2 (en) 2006-04-26 2010-10-19 President And Fellows Of Harvard College Prokaryotic host cells for expressing proteins rich in disulfide bonds
EP2155868A2 (en) * 2007-04-19 2010-02-24 Codon Devices, Inc Engineered nucleases and their uses for nucleic acid assembly
US8629245B2 (en) 2007-05-01 2014-01-14 Research Development Foundation Immunoglobulin Fc libraries
CN107119095B (zh) 2008-01-03 2022-07-05 康乃尔研究基金会有限公司 原核生物中的糖基化蛋白表达
FI20095615A0 (fi) * 2009-06-02 2009-06-02 Oulun Yliopisto Menetelmä luonnollisesti laskostuneiden proteiinien tuottamiseksi prokaryootti-isännässä
WO2011116184A2 (en) * 2010-03-17 2011-09-22 Cornell University Methods and compositions for targeted mutagenesis in bacteria
EP2386641A1 (en) 2010-05-11 2011-11-16 Université Catholique De Louvain Method for extracellular production of recombinant biomolecules in a microorganism
FI20115115A0 (fi) 2011-02-04 2011-02-04 Oulun Yliopisto Menetelmä disulfidisidoksia sisältävien proteiinien tuottamiseksi prokaryoottisytoplasmassa

Also Published As

Publication number Publication date
AU2022204192A1 (en) 2022-07-07
AU2013299910B2 (en) 2019-01-24
US20170159061A1 (en) 2017-06-08
PL3591057T3 (pl) 2023-10-02
WO2014025663A1 (en) 2014-02-13
HK1210804A1 (en) 2016-05-06
JP2019068830A (ja) 2019-05-09
EP3187586B1 (en) 2019-09-25
EP3187586A1 (en) 2017-07-05
CA2880285A1 (en) 2014-02-13
DK2880168T3 (en) 2017-04-18
US20220090093A1 (en) 2022-03-24
AU2013299910A1 (en) 2015-03-12
EP3591057C0 (en) 2023-06-07
CN111748510B (zh) 2023-08-15
IL264384B (en) 2020-08-31
IL264384A (en) 2019-02-28
EP2880168A1 (en) 2015-06-10
DK3187586T3 (da) 2019-10-14
US11447781B2 (en) 2022-09-20
CN104603274B (zh) 2020-08-18
EP4273257A2 (en) 2023-11-08
US20160152701A1 (en) 2016-06-02
JP2015524281A (ja) 2015-08-24
AU2019202844B2 (en) 2022-03-17
JP2022068332A (ja) 2022-05-09
US20230340501A1 (en) 2023-10-26
US20200063116A1 (en) 2020-02-27
EP3591057B1 (en) 2023-06-07
IL236975A0 (en) 2015-03-31
US20150225731A1 (en) 2015-08-13
US20200032276A1 (en) 2020-01-30
US10465197B2 (en) 2019-11-05
IL276141B (en) 2022-03-01
ES2621320T3 (es) 2017-07-03
EP2880168B1 (en) 2017-01-11
EP3591057B9 (en) 2023-07-19
US9617335B2 (en) 2017-04-11
AU2019202844A1 (en) 2019-05-16
US20200172915A1 (en) 2020-06-04
IL236975B (en) 2019-06-30
CN111748510A (zh) 2020-10-09
EP3591057A1 (en) 2020-01-08
JP6457387B2 (ja) 2019-01-23
EP4273257A3 (en) 2024-02-28
US10604761B2 (en) 2020-03-31
CN104603274A (zh) 2015-05-06
US11214807B2 (en) 2022-01-04
JP7032292B2 (ja) 2022-03-08
ES2954516T3 (es) 2023-11-22
IL276141A (en) 2020-09-30
CA2880285C (en) 2022-11-01

Similar Documents

Publication Publication Date Title
ES2750005T3 (es) Sistema de coexpresión inducible
US11371048B2 (en) Vectors for use in an inducible coexpression system
US20220364104A1 (en) Vectors for use in an inducible coexpression system
BR122024008472A2 (pt) Construto de expressão, kit, célula hospedeira e método de produção de produto genético