ES2906725T3 - Vectores para el uso en un sistema de coexpresión inducible - Google Patents

Vectores para el uso en un sistema de coexpresión inducible Download PDF

Info

Publication number
ES2906725T3
ES2906725T3 ES16812476T ES16812476T ES2906725T3 ES 2906725 T3 ES2906725 T3 ES 2906725T3 ES 16812476 T ES16812476 T ES 16812476T ES 16812476 T ES16812476 T ES 16812476T ES 2906725 T3 ES2906725 T3 ES 2906725T3
Authority
ES
Spain
Prior art keywords
expression
promoter
inducible
gene
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16812476T
Other languages
English (en)
Inventor
Sean Mcclain
Mark Valasek
Philip Barish
Jeremy Minshull
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Absci LLC
Original Assignee
Absci LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Absci LLC filed Critical Absci LLC
Application granted granted Critical
Publication of ES2906725T3 publication Critical patent/ES2906725T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/02Antithrombotic agents; Anticoagulants; Platelet aggregation inhibitors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/24Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against cytokines, lymphokines or interferons
    • C07K16/241Tumor Necrosis Factors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/005Glycopeptides, glycoproteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • C07K2317/24Immunoglobulins specific features characterized by taxonomic origin containing regions, domains or residues from different species, e.g. chimeric, humanized or veneered
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/55Fab or Fab'
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/90Immunoglobulins specific features characterized by (pharmaco)kinetic aspects or by stability of the immunoglobulin
    • C07K2317/92Affinity (KD), association rate (Ka), dissociation rate (Kd) or EC50 value
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/001Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
    • C12N2830/002Vector systems having a special element relevant for transcription controllable enhancer/promoter combination inducible enhancer/promoter combination, e.g. hypoxia, iron, transcription factor

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Public Health (AREA)
  • Diabetes (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Hematology (AREA)
  • Veterinary Medicine (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Preliminary Treatment Of Fibers (AREA)
  • General Factory Administration (AREA)

Abstract

Una construcción de expresión que comprende dos o más promotores inducibles, en donde al menos un promotor inducible es un promotor inducible por propionato y al menos otro promotor inducible es un promotor inducible por L-arabinosa, en donde la construcción de expresión comprende una secuencia de nucleótidos que tiene al menos un 87 % de identidad con los nucleótidos 2818 a 3259 de la SEQ ID NO:15 y una secuencia de nucleótidos que tiene al menos un 90 % de identidad con los nucleótidos 4937 a 5304 de la SEQ ID NO:15; y en donde la construcción de expresión comprende una secuencia de nucleótidos seleccionada del grupo que consiste en: (a) una secuencia de nucleótidos que tiene al menos un 80 % de identidad con al menos 3000 bases contiguas de los nucleótidos 1833 a 5304 de la SEQ ID NO:15; (b) una secuencia de nucleótidos que tiene al menos un 80 % de identidad con al menos 3250 bases contiguas de los nucleótidos 1833 a 5304 de la SEQ ID NO:15; (c) una secuencia de nucleótidos que tiene al menos un 80 % de identidad con al menos 3000 bases contiguas de la SEQ ID NO:15; (d) una secuencia de nucleótidos que tiene al menos un 80 % de identidad con al menos 3250 bases contiguas de la SEQ ID NO:15; (e) una secuencia de nucleótidos que tiene al menos un 80 % de identidad con al menos 3500 bases contiguas de la SEQ ID NO:15; (f) una secuencia de nucleótidos que tiene al menos un 80 % de identidad con al menos 4000 bases contiguas de la SEQ ID NO:15; (g) una secuencia de nucleótidos que tiene al menos un 80 % de identidad con al menos 5000 bases contiguas de la SEQ ID NO:15.

Description

DESCRIPCIÓN
Vectores para el uso en un sistema de coexpresión inducible
Referencia al listado de secuencias
Esta solicitud incluye una lista de secuencias presentada electrónicamente.
Campo de la invención
La presente invención se encuentra en los campos técnicos generales de la biología molecular y la fabricación biotecnológica. Más particularmente, la presente invención se encuentra en el campo técnico de la expresión de proteínas recombinantes.
Antecedentes de la invención
La producción de sustancias biotecnológicas es un proceso complejo, más aún cuando el producto deseado es una combinación de moléculas codificadas por diferentes genes, tal como una proteína multimérica formada a partir de dos o más polipéptidos diferentes. La coexpresión exitosa de múltiples productos génicos requiere superar una serie de desafíos, que se ven agravados por la expresión simultánea de más de un producto génico. Los problemas que deben superarse incluyen la creación de vectores de expresión compatibles cuando se usa más de un tipo de vector; obtener la relación estequiométrica correcta de los productos; producir productos génicos que se pliegan correctamente y en la conformación adecuada con respecto a los compañeros de unión; purificar los productos deseados lejos de las células y proteínas no deseadas, tales como proteínas que se pliegan incorrectamente y/o tienen una conformación incorrecta; y minimizar la formación de cuerpos de inclusión, como un aspecto de maximizar el rendimiento del(los) producto(s) deseado(s). Se han adoptado muchos enfoques diferentes para abordar estos desafíos, pero aún se necesitan mejores métodos de coexpresión.
Se han ideado varios sistemas de expresión de proteínas bacterianas inducibles, que incluyen los plásmidos que contienen los promotores lac y ara para expresar proteínas individuales. Estos sistemas tienen una utilidad limitada en la coexpresión de proteínas difíciles de expresar, ya que no logran inducir la proteína de manera homogénea dentro de toda la población del cultivo de crecimiento de la E. coli de tipo salvaje (Khlebnikov y Keasling, "Effect of lacY expression on homogeneity of induction from the Ptac and Ptrc promoters by natural and synthetic inducers", Biotechnol Prog 2002 mayo-Junio; 18(3): 672-674). Cuando la expresión de las proteínas de transporte para los inductores depende de la presencia del inductor, como es el caso de los sistemas lac y ara de la E. coli del tipo salvaje, la concentración celular del inductor debe alcanzar un nivel de umbral para iniciar la producción de proteínas de transporte, pero una vez que se alcanza ese umbral, puede ocurrir un ciclo de retroalimentación positiva no controlado, con el resultado de un alto nivel de inductor en la célula y correspondientemente altos niveles de expresión de promotores inducibles: el fenómeno de "todo o nada". El aumento de la concentración del inductor en el medio de crecimiento aumenta la proporción de células en la población que están en modo de alta expresión. Aunque este tipo de sistema da como resultado una inducción dependiente de la concentración de la expresión de proteínas a escala de población, no es óptimo para la expresión y producción de proteínas que requieren un control estricto de la expresión, que incluyen aquellas que son tóxicas, tienen poca solubilidad o requieren concentraciones específicas para otras razones.
Se han realizado algunos esfuerzos para abordar el fenómeno de inducción de "todo o nada" en los sistemas de expresión de un solo promotor, al eliminar el transporte del inductor dependiente del inductor. Un ejemplo es tener una mutación nula en el gen de la lactosa permeasa (lacYam) y mediante el uso de un inductor alternativo del promotor lac tal como IPTG (isopropil-tio-p-D-galactósido), que puede atravesar la membrana celular hasta cierto punto en ausencia de un transportador (Jensen y otros, "The use of lac-type promotors in control analysis", Eur J Biochem 15 de enero de 1993; 211 (1-2): 181-191). Otro enfoque es el uso de un promotor inducible por arabinosa en una cepa deficiente en los genes transportadores de arabinosa, pero con una mutación en el gen de la permeasa de lactosa, lacYIM 17C), que le permite transportar arabinosa al interior de la célula (Morgan-Kiss y otros, "Longterm and homogeneous regulation of the Escherichia coli araBAD promoter by use of a lactose transporter of relaxed specificity", Proc Natl Acad Sci U S A 2002 May 28; 99(11): 7373-7377).
Los componentes de los sistemas de expresión de proteínas individuales a menudo son incompatibles, lo que impide su uso en sistemas de coexpresión, ya que pueden verse afectados negativamente por efectos de "diafonía" entre diferentes sistemas inductores-promotores, o requieren modificaciones genómicas mutuamente excluyentes, o estar sujetos a la regulación metabólica general. Un intento de abordar el problema de la 'diafonía' entre los sistemas promotores inducibles lac y ara incluye la evolución dirigida del activador transcripcional AraC para mejorar su capacidad de inducir al promotor araBAD en presencia de IPTG, un inductor del promotor lac (Lee y otros, "Directed evolution of AraC for improved compatibility of arabinose- and lactose-inducible promoters", Appl Environ Microbiol septiembre del 2007; 73(18): 5711-5715; Epub 20 de julio del 2007). Sin embargo, la compatibilidad entre vectores de expresión basados en promotores inducibles ara y lac todavía está limitada debido al requisito de modificaciones genómicas mutuamente excluyentes: una mutación puntual de lacY (lacYIM 17C)) para la inducción homogénea del promotor araBAD por arabinosa, y una nula del gen lacY para la inducción homogénea del promotor lac por IPTG. La regulación metabólica general, por ejemplo, la represión de catabolitos de carbono (CCR), también puede afectar la compatibilidad de los promotores inducibles. La CCR se caracteriza por la represión de genes necesarios para la utilización de un compuesto que contiene carbono cuando está presente un compuesto con mayor preferencia, como se ve en el uso preferencial de la glucosa antes que otros azúcares. En el caso de sistemas promotores inducibles ara y prp, la presencia de arabinosa reduce la capacidad del propionato para inducir la expresión del promotor prpBCDE, un efecto que se cree que implica la CCR (Park y otros, "The mechanism of sugar-mediated catabolite repression of the propionate catabolic genes in Escherichia coli", Gene 1 de agosto del 2012; 504(1): 116-121, Epub 3 de mayo del 2012). Claramente existe la necesidad de un sistema de coexpresión inducible que supere estos problemas.
Resumen de la invención
La presente invención proporciona construcciones de expresión para el uso en sistemas de coexpresión inducibles capaces de controlar la inducción de cada componente del producto génico. La construcción de expresión de la invención se define en las reivindicaciones. También se describe en la presente descripción una construcción de expresión que comprende dos o más promotores inducibles, en donde al menos uno de dichos promotores inducibles responde a un inductor que es diferente al inductor de otro de dichos promotores inducibles, y en donde ninguno de los promotores inducibles es un promotor inducible seleccionado del grupo que consiste en: un promotor inducible por tetraciclina, un promotor inducible por cobre y un promotor inducible por metionina. En algunas modalidades, la construcción de expresión anterior no comprende un promotor inducible por lactosa, y en determinadas modalidades, la construcción de expresión anterior no comprende un promotor inducible por el agotamiento de fosfato. En modalidades adicionales, la construcción de expresión es extracromosómica. También se describen construcciones de expresión que comprenden dos o más promotores inducibles, en donde al menos uno de dichos promotores inducibles responde a un inductor que es diferente al inductor de otro de dichos promotores inducibles, y (A) en donde cada promotor inducible se selecciona del grupo que consiste en un promotor inducible por L-arabinosa, un promotor inducible por propionato, un promotor inducible por ramnosa, un promotor inducible por xilosa, un promotor inducible por lactosa y un promotor inducible por agotamiento de fosfato; o (B) en donde al menos un promotor inducible se selecciona del grupo que consiste en el promotor araBAD, el promotor prpBCDE, el promotor rhaSR, el promotor xlyA, el promotor lacZYA y el promotor phoA; o (C) en donde la construcción de expresión comprende al menos un promotor inducible por propionato, que en algunas modalidades es el promotor prpBCDE, y al menos un promotor inducible seleccionado del grupo que consiste en un promotor inducible por L-arabinosa, un promotor inducible por ramnosa, un promotor inducible por xilosa, un promotor inducible por lactosa y un promotor inducible por agotamiento de fosfato; o (D) en donde la construcción de expresión comprende al menos un promotor inducible por L-arabinosa, que en algunas modalidades es el araBAD promotor, y al menos un promotor inducible seleccionado del grupo que consiste en un promotor inducible por propionato, un promotor inducible por ramnosa, un promotor inducible por xilosa, un promotor inducible por lactosa y un promotor inducible por agotamiento de fosfato; o (E) en donde al menos un promotor inducible es un promotor inducible por propionato y al menos otro promotor inducible es un promotor inducible por L-arabinosa; o (F) en donde la construcción de expresión comprende una secuencia de nucleótidos que tiene al menos un 80 % (o al menos un 90 % o al menos un 95 %) de identidad de secuencia con al menos 50 (o al menos 75 o al menos 100) bases contiguas de nucleótidos 4937 a 5185 de la SEQ ID NO:15; o (G) en donde la construcción de expresión comprende una secuencia de nucleótidos que tiene al menos un 80 % (o al menos un 90 % o al menos un 95 %) de identidad de secuencia con al menos 50 (o al menos 75 o al menos 100) bases contiguas de nucleótidos 2818 a 3151 de la SEQ ID NO:15; o (H) en donde la construcción de expresión comprende una secuencia de nucleótidos que tiene al menos un 80 % (o al menos un 90 % o al menos un 95 %) de identidad de secuencia con al menos 50 (o al menos 75 o al menos 100) bases contiguas de nucleótidos 2818 a 3151 de la SEQ ID NO:15, y al menos 80 % (o al menos 90 %, o al menos 95 %) identidad de secuencia con al menos 50 (o al menos 75, o al menos 100) bases contiguas de nucleótidos 4937 a 5185 de la SEQ ID NO:15; o (I) en donde la construcción de expresión comprende una secuencia de nucleótidos que tiene al menos un 80 % (o al menos un 90 % o al menos un 95 %) de identidad de secuencia con al menos 3000 (o al menos 3250) bases contiguas de los nucleótidos 1833 a 5304 de la SEQ ID NO:15; o (J) en donde la construcción de expresión comprende una secuencia de nucleótidos que tiene al menos un 80 % (o al menos un 90 % o al menos un 95 %) de identidad de secuencia con al menos 3000 (o al menos 3250, o al menos 3500, o al menos 4000, o al menos 5000) bases contiguas de la SEQ ID NO:15; o (K) en donde la construcción de expresión comprende los nucleótidos 1833 a 5304 de la SEQ ID NO:15; o (L) en donde la construcción de expresión comprende la SEQ ID NO:15; o (M) en donde la construcción de expresión comprende además una secuencia polinucleotídica que codifica un regulador transcripcional que se une a un promotor inducible, en donde en algunas modalidades, el regulador transcripcional se selecciona del grupo que consiste en: AraC, PrpR, RhaR y XylR; o (N) en donde la construcción de expresión comprende además al menos una secuencia polinucleotídica que codifica al menos un producto génico a transcribir a partir de un promotor inducible.
También se describe una construcción de expresión que comprende una secuencia de nucleótidos seleccionada del grupo que consiste en: (a) una secuencia de nucleótidos que tiene al menos un 97 % de identidad de secuencia con al menos 225 (o al menos 240) bases contiguas de los nucleótidos 4937 a 5185 de la SEQ ID N°: 15; (b) una secuencia de nucleótidos que tiene al menos un 80 % (o al menos un 90 %, o al menos un 95 %) de identidad de secuencia con al menos 300 (o al menos 350) bases contiguas de los nucleótidos 4937 a 5304 de la SEQ ID NO:15; (c) una secuencia de nucleótidos que tiene al menos un 87 % (o al menos un 90 %, o al menos un 95 %) de identidad de secuencia con al menos 350 (o al menos 375, o al menos 400, o al menos 425) bases contiguas de nucleótidos 2818 a 3259 de la SEQ ID NO:15; (d) una secuencia de nucleótidos que tiene al menos un 90 % (o al menos un 95 %) de identidad de secuencia con al menos 400 (o al menos 450, o al menos 500) bases contiguas de los nucleótidos 10 a 1822 de la SEQ ID NO:2; (e) los nucleótidos 2818 a 3259 de la SEQ ID NO:15; (f) los nucleótidos 4937 a 5185 de la SEQ ID NO:15; (g) los nucleótidos 4937 a 5304 de la SEQ ID NO:15; (h) los nucleótidos 2818 a 3259 de la SEQ ID NO:15 y los nucleótidos 4937 a 5185 de la SEQ ID NO:15; (i) los nucleótidos 2818 a 3259 de la SEQ ID NO:15 y los nucleótidos 4937 a 5304 de la SEQ ID NO:15; (j) los nucleótidos 10 a 1822 de la SEQ ID NO:2; y (k) una secuencia de nucleótidos seleccionada del grupo que consiste en la SEQ ID NO:2, la SEQ ID NO:4, la SEQ ID NO:5, la SEQ ID NO:6, la SEQ ID NO:7, la SEQ ID NO:8, y la SEQ ID NO: 15. La construcción de expresión anterior puede comprender un promotor inducible seleccionado del grupo que consiste en un promotor inducible por L-arabinosa, que en algunas modalidades es el promotor araBAD; un promotor inducible por propionato, que en algunas modalidades es el promotor prpBCDE; un promotor inducible por ramnosa, que en algunas modalidades es el promotor rhaSR; un promotor inducible por xilosa, que en algunas modalidades es el promotor xlyA; un promotor inducible por lactosa, que en algunas modalidades es el promotor lacZYA; y un promotor inducible por agotamiento de fosfato, que en algunas modalidades es el promotor phoA; y en algunas modalidades, la construcción de expresión anterior comprende además al menos una secuencia polinucleotídica que codifica al menos un producto génico a transcribir a partir de un promotor inducible.
De acuerdo con la descripción, se produce una construcción de expresión mediante un método que comprende una etapa de insertar una secuencia polinucleotídica en un plásmido seleccionado del grupo que consiste en: pBAD240, pPRO43, pPRO44, pPRO45, PPRO430, pPRO430CloDF y pSOL.
La presente invención proporciona además una célula huésped que comprende al menos una construcción de expresión de la invención como se define en las reivindicaciones. En algunas modalidades de la invención, esta célula huésped es una célula procariota y, en algunos casos, es una célula de E. coli, que en determinadas modalidades es una célula de E. coli ASE(DGH). En otras modalidades de la invención, la célula huésped es una célula eucariota y, en algunos casos, es una célula de levadura y, en otros casos, es una célula de Saccharomyces cerevisiae. La invención también proporciona una célula huésped que comprende además uno o más de los siguientes: (a) una deleción de los genes araBAD; (b) una función genética modificada de los genes araE y/o araFGH; (c) un gen lacY(A177C); (d) una función génica reducida de los genes prpB y/o prpD; (e) una función génica reducida de los genes sbm/scpA-ygfD/argK-ygf-GH/scpBC; (f) una función génica reducida de los genes Gor y trxB; (g) una función génica reducida del gen AscG; (h) un polinucleótido que codifica una forma de DsbC que carece de un péptido señal; (i) un polinucleótido que codifica Ervlp; y (j) un polinucleótido que codifica una chaperona, tal como la proteína disulfuro isomerasa (PDI). En determinadas modalidades adicionales, (A) la célula huésped tiene una alteración de la función génica de al menos un gen que codifica una proteína transportadora para un inductor de al menos un promotor inducible, y como otro ejemplo, en donde se selecciona el gen que codifica la proteína transportadora del grupo que consiste en araE, araF, araG, araH, rhaT, xylF, xylG, y xylH, o particularmente es araE, o en donde la alteración de la función del gen más particularmente es la expresión de araE de un promotor constitutivo; (B) la célula huésped tiene un nivel reducido de función génica de al menos un gen que codifica una proteína que metaboliza un inductor de al menos un promotor inducible y, como ejemplos adicionales, en donde el gen que codifica una proteína que metaboliza un inductor de al menos uno de dichos promotores inducibles se selecciona del grupo que consiste en araA, araB, araD, prpB, prpD, rhaA, rhaB, rhaD, xylA, y xilB; (C) la célula huésped tiene un nivel reducido de función génica de al menos un gen que codifica una proteína involucrada en la biosíntesis de un inductor de al menos un promotor inducible, cuyo gen en modalidades adicionales se selecciona del grupo que consiste en scpA/sbm, argK/ygfD, scpB/ygfG, scpC/ygfH, rmlA, rmlB, rmIC, y rmID; (D) la célula huésped tiene un nivel reducido de función génica de un gen de la tiorredoxina reductasa, particularmente el trxB; (E) la célula huésped tiene un nivel reducido de función génica de un gen de glutatión reductasa y/o un gen de glutatión sintetasa, cuyos genes en determinadas modalidades son el gen gor de glutatión reductasa y/o uno o más de los genes de la glutatión sintetasa gshA y gshB; (F) la célula huésped expresa al menos una forma mutante de AhpC; (G) la célula huésped comprende una construcción de expresión que comprende al menos un promotor inducible por L-arabinosa y una secuencia polinucleotídica que codifica AraC, en donde la célula huésped tiene una función génica reducida de al menos un gen que codifica una proteína que metaboliza un inductor de al menos uno de dichos promotores inducibles por L-arabinosa, en donde el gen se selecciona del grupo que consiste en araA y araB', y/o (H) la célula huésped comprende una construcción de expresión que comprende al menos un promotor inducible por propionato y una secuencia polinucleotídica que codifica PrpR, en donde la célula huésped tiene una función génica reducida de al menos un gen que codifica una proteína que metaboliza un inductor de al menos uno de dichos promotores inducibles por propionato, en donde el gen se selecciona del grupo que consiste en prpB y prpD.
También se describe una célula huésped que comprende dos o más tipos de construcciones de expresión, en donde la construcción de expresión de cada tipo comprende un promotor inducible, en donde la construcción de expresión de cada tipo comprende un promotor inducible que no es un promotor inducible de la construcción de expresión de cada otro tipo, o en donde la construcción de expresión de cada tipo comprende un origen de replicación que es diferente del origen de replicación de la construcción de expresión de cada otro tipo.
En modalidades adicionales de la invención, al menos una construcción de expresión compuesta por una célula huésped comprende además una secuencia polinucleotídica que codifica un regulador transcripcional que se une a un promotor inducible; en algunas modalidades, la secuencia polinucleotídica que codifica un regulador transcripcional y el promotor inducible al que se une dicho regulador transcripcional están en la misma construcción de expresión; y en otros casos, el regulador transcripcional se selecciona del grupo que consiste en: AraC, PrpR, RhaR y XylR; o en particular es AraC, o es PrpR.
La invención también proporciona una célula huésped que comprende la construcción de expresión definida en las reivindicaciones. También se proporciona una célula huésped, que comprende al menos una construcción de expresión como se describió en los párrafos anteriores, que comprende al menos un promotor inducible, en donde al menos una construcción de expresión comprende además al menos una secuencia polinucleotídica que codifica al menos un producto génico a transcribir a partir de un promotor inducible. Otros ejemplos incluyen una célula huésped que comprende al menos una construcción de expresión que comprende al menos un promotor inducible y al menos una secuencia polinucleotídica que codifica un producto génico a transcribir a partir de un promotor inducible, en donde, en determinadas modalidades, al menos un producto génico es un polipéptido, o es un polipéptido que carece de una secuencia señal, o es un polipéptido que forma al menos uno y menos de veinte enlaces disulfuro, o al menos dos y menos de diecisiete enlaces disulfuro, o al menos dieciocho y menos de cien enlaces disulfuro, o al menos al menos tres y menos de diez enlaces disulfuro, o al menos tres y menos de ocho enlaces disulfuro, o es un polipéptido que forma una serie de enlaces disulfuro seleccionados del grupo que consiste en uno, dos, tres, cuatro, cinco, seis, siete, ocho y nueve, o es una cadena pesada o ligera de inmunoglobulina o un fragmento de esta, o es una cadena pesada o ligera de infliximab o un fragmento de esta.
La invención también proporciona un método para producir un producto génico, comprendiendo el método hacer crecer un cultivo de una célula huésped de la invención, en donde la célula huésped comprende una construcción de expresión de la invención que comprende al menos una secuencia polinucleotídica que codifica al menos un producto génico a transcribir a partir de cada promotor inducible y añadir al cultivo un inductor para cada uno de dichos promotores inducibles; y en modalidades adicionales, purificar un producto génico del cultivo. En aspectos particulares de la invención, el producto génico producido por el método anterior es un polipéptido que forma al menos un enlace disulfuro, o forma al menos dos y menos de diecisiete enlaces disulfuro, o forma al menos dos y menos de diez enlaces disulfuro, o forma una serie de enlaces disulfuro seleccionados del grupo que consiste en de uno, dos, tres, cuatro, cinco, seis, siete, ocho y nueve, o es una cadena pesada o ligera de inmunoglobulina o un fragmento de esta. La presente invención también proporciona un producto génico producido por el método anterior, en donde el producto génico es un polipéptido que carece de un péptido señal y que, en determinadas modalidades, forma al menos un enlace disulfuro, o al menos dos y menos de diecisiete enlaces disulfuro. o al menos dieciocho y menos de cien enlaces disulfuro, o al menos tres y menos de diez enlaces disulfuro, o al menos tres y menos de ocho enlaces disulfuro, o forma una serie de enlaces disulfuro seleccionados del grupo que consiste en uno, dos, tres, cuatro, cinco, seis, siete, ocho y nueve, o es una cadena pesada o ligera de inmunoglobulina o un fragmento de esta. La invención también proporciona un producto génico producido por este método, y en algunas modalidades es parte de un producto multimérico, que en determinadas modalidades es un anticuerpo, o en casos más particulares, es un anticuerpo aglicosilado, un anticuerpo quimérico o un anticuerpo humano.
También se describen en la presente descripción estuches que comprenden una construcción de expresión como se describe en los párrafos anteriores; estuches que comprenden una célula huésped, comprendiendo la célula huésped al menos una construcción de expresión de la invención como se describió en los párrafos anteriores; y estuches que comprenden un producto génico o un producto multimérico producido mediante el cultivo de una célula huésped de la invención, que en algunas modalidades incluye agregar al menos un inductor al cultivo, donde en algunas modalidades el producto multimérico es un anticuerpo, o en casos más particulares, es un anticuerpo aglicosilado, un anticuerpo quimérico o un anticuerpo humano.
Breve descripción de las Figuras
La Figura 1 es una ilustración esquemática del sistema de coexpresión inducible, que incluye una célula huésped (1) que comprende dos vectores de expresión inducible diferentes (3) y (4), que expresan diferentes productos génicos tras la aplicación de inductores (5), que forma un producto multimérico (6).
La Figura 2 es una ilustración esquemática de un uso particular del sistema de coexpresión inducible, en el que el genoma de la célula huésped de E. coli (2) codifica una forma citoplasmática de la disulfuro isomerasa DsbC que carece de un péptido señal; el vector de expresión pBAD24 (u otro vector de expresión que contiene un promotor inducible por L-arabinosa, como pBAD240) (3) proporciona la expresión inducible por L-arabinosa de una cadena pesada de inmunoglobulina, y el vector de expresión pPRO33 (u otro vector de expresión que contiene un promotor inducible por propionato, como pPRO43, pPRO430, pPRO430(CloDF13), pPRO44 o pPRO45) (4) proporciona la expresión inducible por propionato de una cadena ligera de inmunoglobulina; que forma tras la inducción (5) el producto del anticuerpo multimérico (6).
La Figura 3 es una ilustración esquemática de un sistema de coexpresión inducible, que incluye una célula huésped (1) que comprende un vector de expresión inducible que comprende dos promotores inducibles diferentes (3) y (4), que expresan diferentes productos génicos tras la aplicación de inductores (5), que forma un producto multimérico (6).
La Figura 4 es una ilustración esquemática de un uso particular del sistema de coexpresión inducible, en el que el genoma de la célula huésped E. coli (2) incluye alteraciones genéticas tales como una forma citoplasmática de la disulfuro isomerasa DsbC que carece de un péptido señal; un vector de expresión de múltiples promotores tal como lo proporciona pSOL (3) la expresión inducible por L-arabinosa de una cadena pesada de inmunoglobulina y (4) la expresión inducible por propionato de una cadena ligera de inmunoglobulina; que forma tras la inducción (5) el producto del anticuerpo multimérico (6).
La Figura 5 es una representación esquemática de un vector ("vector dual", también denominado "pSOL") para el uso en un sistema de coexpresión inducible.
La Figura 6 muestra el transcurso del tiempo de la coexpresión de proteínas fluorescentes en células bacterianas; en este gráfico, se muestra, la fluorescencia de una proteína roja fluorescente (RedFP), expresada a partir de un promotor inducible por propionato prpBCDE. 'pSOL': pSOL-YellowFP-RedFP en células de E. coli ASE(DGH). 'pPRO, pBAD': pBAD24-YellowFP/pPRO33-RedFP en células de E. coli ASE(DGH). Las concentraciones de inductor para cada grupo de muestras promediadas se muestran en la leyenda, con la concentración de propionato en primer lugar (0 mM, 5 mM o 20 mM), seguida de la concentración de L-arabinosa (0 micromolar, 6,66 micromolar o 66,61 micromolar).
La Figura 7 muestra el transcurso del tiempo de la coexpresión de proteínas fluorescentes en células bacterianas; en este gráfico, se muestra, la fluorescencia de una proteína fluorescente amarilla (YellowFP), expresada a partir de un promotor araBAD inducible por L-arabinosa. 'pSOL': pSOL-YellowFP-RedFP en células de E. coli ASE(DGH). 'pBAD, pPRO': pBAD24-YellowFP/pPRO33-RedFP en células de E. coli ASE(DGH). Las concentraciones del inductor para cada grupo de muestras promediadas se muestran en la leyenda, con la concentración de L-arabinosa en primer lugar (0 micromolar, 6,66 micromolar o 66,61 micromolar), seguida de la concentración de propionato (0 mM, 5 mM o 20 mM).
Descripción detallada de la invención
El problema de los componentes del sistema de coexpresión incompatible se aborda mediante el desarrollo de sistemas de coexpresión bacteriana coordinados que utilizan sistemas promotores inducibles homogéneamente compatibles ubicados en construcciones de expresión separadas y, en algunas modalidades, activados por diferentes inductores. Las ventajas de la presente invención incluyen, pero no se limitan a: 1) una compatibilidad mejorada de los componentes dentro del sistema de coexpresión inducible; 2) la expresión inducible de los productos génicos que juntos forman multímeros u otras combinaciones de productos génicos (coexpresión de dos o más productos génicos); 3) un control mejorado de la coexpresión del producto génico mediante la inducción valorable independientemente; 4) expresión mejorada de complejos de productos génicos y otros productos que son difíciles de expresar tales como productos multiméricos y productos que forman enlaces disulfuro; 5) optimización simplificada de la coexpresión del producto génico.
Productos génicos coexpresados. Los sistemas de coexpresión inducibles de la invención están diseñados para coexpresar dos o más productos génicos diferentes que contribuyen a un producto deseado. El producto deseado puede ser un multímero, formado a partir de productos génicos coexpresados, o puede usarse la coexpresión para producir una combinación del producto deseado más un producto o productos adicionales que ayudan en la expresión del producto deseado.
Un 'producto multimérico' se refiere a un conjunto de productos génicos que se ensamblan para llevar a cabo la función del producto multimérico, y no se refiere a asociaciones transitorias entre productos génicos y otras moléculas, tales como enzimas modificadoras (cinasas, peptidasas y similares), chaperonas, transportistas, etc. En determinadas modalidades de la invención, los productos multiméricos son heteromultímeros. En muchas modalidades, los productos génicos coexpresados serán polipéptidos que son subunidades de proteínas multiméricas. Sin embargo, también es posible usar los sistemas de coexpresión inducibles de la invención para coexpresar múltiples moléculas de ARN no codificantes diferentes, o una combinación de polipéptidos y productos génicos de ARN no codificantes. Las moléculas de ARN no codificantes, también denominadas ARN no codificante de proteínas (ARNncp), ARN no mensajero (ARNnm) y ARN funcional (ARNf), incluyen muchos tipos diferentes de moléculas de ARN, tales como los microARN que no son ARN mensajeros y, por lo tanto, no son moldes para la formación de polipéptidos a través de la traducción.
Muchos productos biológicamente importantes se forman a partir de combinaciones de diferentes cadenas polipeptídicas. Además de anticuerpos y fragmentos de anticuerpos, otros productos multiméricos que pueden producirse mediante los métodos de coexpresión inducible de la invención incluyen receptores de proteínas acopladas a G y canales iónicos regulados por ligandos, como receptores de acetilcolina nicotínicos, receptores GABAa, receptores de glicina, receptores de serotonina, receptores de glutamato y receptores regulados por ATP como los receptores P2X. La neurotoxina botulínica (a menudo denominada BoTN, BTX, o como una de sus formas disponibles comercialmente, BOTOX® (onabotulinumtoxinA)) está formada por una cadena pesada y una cadena ligera, unidas por un enlace disulfuro (Simpson y otros, "The role of the interchain disulfide bond in governing the pharmacological actions of botulinum toxin", J Pharmacol Exp Ther marzo del 2004; 308(3): 857-864, Epub 14 de noviembre del 2003). Otro ejemplo de un producto formado a partir de diferentes cadenas polipeptídicas es la insulina, que en los eucariotas primero se traduce como una sola cadena polipeptídica, se pliega y luego se escinde finalmente en dos cadenas polipeptídicas que se mantienen unidas por enlaces disulfuro. La producción eficaz de neurotoxina botulínica o de insulina madura en una sola célula huésped son ejemplos de usos de los métodos de coexpresión inducible de la invención.
Los métodos de la invención están diseñados para producir productos génicos que se han plegado y/o ensamblado correctamente en productos funcionales, y que tienen un número deseado de enlaces disulfuro en las ubicaciones deseadas dentro de dichos productos funcionales (lo que puede determinarse mediante métodos tales como el del Ejemplo 11). El número de enlaces disulfuro para un producto génico tal como un polipéptido es el número total de enlaces intramoleculares e intermoleculares formados por ese producto génico cuando está presente en un producto funcional deseado. Por ejemplo, una cadena ligera de un anticuerpo IgG humano típicamente tiene tres enlaces disulfuro (dos enlaces intramoleculares y un enlace intermolecular), y una cadena pesada de un anticuerpo IgG humano típicamente tiene siete enlaces disulfuro (cuatro enlaces intramoleculares y tres enlaces intermoleculares). En algunas modalidades, los productos génicos deseados se coexpresan con otros productos génicos, tales como las chaperonas, que son beneficiosas para la producción del producto génico deseado. Las chaperonas son proteínas que ayudan al plegamiento o despliegue no covalente, y/o al ensamble o desensamble, de otros productos génicos, pero no se encuentran en las estructuras de los productos génicos monoméricos o multiméricos resultantes cuando las estructuras realizan sus funciones biológicas normales (al completarse los procesos de plegado y/o ensamble). Las chaperonas pueden expresarse a partir de un promotor inducible o un promotor constitutivo dentro de una construcción de expresión, o pueden expresarse a partir del cromosoma de la célula huésped; preferentemente, la expresión de la(s) proteína(s) chaperona(s) en la célula huésped está en un nivel suficientemente alto para producir los productos génicos coexpresados que se pliegan y/o ensamblan apropiadamente en el producto deseado. Ejemplos de chaperonas presentes en las células huésped de E. coli son los factores de plegamiento DnaK/DnaJ/GrpE, DsbC/DsbG, GroEL/GroES, IbpA/lbpB, Skp, Tig (factor desencadenante) y FkpA, que se han usado para prevenir la agregación de proteínas citoplasmáticas o periplasmáticas. Los DnaK/DnaJ/GrpE, GroEL/GroES y CIpB pueden funcionar de manera sinérgica para ayudar al plegamiento de proteínas y, por lo tanto, se ha demostrado que la expresión en combinaciones de estas chaperonas es beneficiosa para la expresión de proteínas (Makino y otros, "Strain engineering for Improved expression of recombinant proteins in bacteria", Microb Cell Fact 14 de mayo del 2011; 10: 32). Cuando se expresan proteínas eucarióticas en células huésped procariotas, una proteína chaperona eucariótica, como la proteína disulfuro isomerasa (PDI) de la misma especie eucariótica o de una relacionada, se coexpresa o se coexpresa induciblemente con el producto génico deseado en determinadas modalidades de la invención.
Promotores inducibles. La siguiente es una descripción de promotores inducibles que pueden usarse en construcciones de expresión para la expresión o coexpresión de productos génicos, junto con algunas de las modificaciones genéticas que pueden hacerse en las células huésped que contienen dichas construcciones de expresión. Ejemplos de estos promotores inducibles y genes relacionados son, a menos que se especifique de cualquier otra manera, de la cepa de Escherichia coli (E.coli) MG1655 (depósito de la American Type Culture Collection ATCC 700926), que es una subcepa de la E.coli K-12 (depósito de la Colección Americana de Cultivos Tipo ATCC 10798). La Tabla 1 enumera las ubicaciones genómicas, en la E. coli MG1655, de las secuencias de nucleótidos para estos ejemplos de promotores inducibles y genes relacionados. Secuencias de nucleótidos y otras secuencias genéticas, referenciadas por ubicación genómica como en la Tabla 1. Información adicional sobre los promotores, genes y cepas de E. coli descritos en la presente descripción pueden encontrarse en muchas fuentes públicas, que incluye el recurso en línea EcoliWiki, ubicado en ecoliwiki.net.
Promotor de arabinosa. (Como se usa en la presente, 'arabinosa' significa L-arabinosa.) Varios operones de E. coli involucrados en la utilización de la arabinosa son inducibles por arabinosa - araBAD, araC, araE, y araFGH— pero los términos "promotor de arabinosa" y "promotor ara" se usan típicamente para designar al promotor araBAD. Se han usado varios términos adicionales para indicar el promotor de E. coli araBAD, tales como Para, ParaB, ParaBAü' y Pbad. El uso en la presente descripción de 'promotor ara ' o cualquiera de los términos alternativos dados anteriormente, significa el promotor de E. coli araBAD. Como puede verse por el uso de otro término, 'promotor araC-araBAD', el promotor araBAD se considera parte de un promotor bidireccional, con el promotor araBAD que controla la expresión del operón araBAD en una dirección, y el promotor araC, muy cerca y en la hebra opuesta del promotor araBAD, que controla la expresión de la secuencia codificante araC en la otra dirección. La proteína AraC es un regulador transcripcional positivo y negativo del promotor araBAD. En ausencia de arabinosa, la proteína AraC reprime la transcripción de Pbad, pero en presencia de arabinosa, la proteína AraC, que altera su conformación al unirse a la arabinosa, se convierte en un elemento regulador positivo que permite la transcripción de Pbad. El operón araBAD codifica proteínas que metabolizan la L-arabinosa al convertirla, a través de los intermediarios L-ribulosa y L-ribulosa-fosfato, en D-xilulosa-5-fosfato. Con el fin de maximizar la inducción de la expresión de un promotor inducible por arabinosa, es útil eliminar o reducir la función de AraA, que cataliza la conversión de L-arabinosa en L-ribulosa, y opcionalmente eliminar o reducir también la función de al menos uno de AraB y AraD. Al eliminar o reducir la capacidad de las células huésped para disminuir la concentración efectiva de arabinosa en la célula, al eliminar o reducir la capacidad de la célula para convertir la arabinosa en otros azúcares, permite que haya más arabinosa disponible para la inducción del promotor inducible por arabinosa. Los genes que codifican los transportadores que mueven la arabinosa hacia la célula huésped son araE, que codifica el simportador de protones L-arabinosa de baja afinidad, y el operón araFGH, que codifica las subunidades de un transportador de L-arabinosa de alta afinidad de la superfamilia ABC. Otras proteínas que pueden transportar L-arabinosa al interior de la célula son ciertos mutantes de la lactosa permeasa LacY: las proteínas LacY(A177C) y LacY(A177V), que tienen un aminoácido cisteína o valina en lugar de alanina en la posición 177, respectivamente (Morgan-Kiss y otros, "Longterm and homogeneous regulation of the Escherichia coli araBAD promoter by use of a lactose transporter of relaxed specificity", Proc Natl Acad Sci U S A 28 de mayo de 2002; 99(11): 7373-7377). Con el fin de conseguir una inducción homogénea de un promotor inducible por arabinosa, es útil hacer que el transporte de arabinosa al interior de la célula sea independiente de la regulación por arabinosa. Esto puede lograrse al eliminar o reducir la actividad de las proteínas transportadoras AraFGH y alterar la expresión de araE por lo que sólo se transcribe a partir de un promotor constitutivo. La expresión constitutiva de araE puede lograrse al eliminar o reducir la función del gen nativo araE, e introducir en la célula una construcción de expresión que incluye una secuencia codificante para la proteína AraE expresada a partir de un promotor constitutivo. Alternativamente, en una célula que carece de la función AraFGH, el promotor que controla la expresión del gen cromosómico araE de la célula huésped puede cambiarse de un promotor inducible por arabinosa a un promotor constitutivo. De manera similar, como alternativas adicionales para la inducción homogénea de un promotor inducible por arabinosa, una célula huésped que carece de la función de AraE puede tener cualquier secuencia codificante de AraFGH funcional presente en la célula expresada a partir de un promotor constitutivo. Como otra alternativa, es posible expresar tanto el gen araE y el operón araFGH de los promotores constitutivos, al reemplazar los promotores nativos araE y araFGH con promotores constitutivos en el cromosoma huésped. También es posible eliminar o reducir la actividad de los transportadores de arabinosa tanto de AraE como de AraFGH, y en esa situación usar una mutación en la permeasa de lactosa LacY que permite que esta proteína transporte arabinosa. Dado que la expresión del gen lacY normalmente no está regulada por arabinosa, el uso de un mutante LacY como LacY(A177C) o LacY(A177V), no conducirá al fenómeno de inducción de "todo o nada" cuando el promotor inducible por arabinosa es inducido por la presencia de arabinosa. Debido a que la proteína LacY(A177C) parece ser más eficaz en el transporte de arabinosa al interior de la célula, se prefiere el uso de polinucleótidos que codifican la proteína LacY(A177C) al uso de polinucleótidos que codifican la proteína LacY(A177V).
Promotor de propionato. El 'promotor de propionato' o "promotor prp" es el promotor del operón de la E. coli prpBCDE, y también se llama PprpB. Como el promotor ara, el promotor prp es parte de un promotor bidireccional, que controla la expresión del operón prpBCDE en una dirección, y con el promotor prpR que controla la expresión de la secuencia codificante prpR en la otra dirección. La proteína PrpR es el regulador transcripcional del promotor prp, y activa la transcripción del promotor prp cuando la proteína PrpR se une al 2-metilcitrato ('2-MC'). El propionato (también llamado propanoato) es el ion, CH3CH2COO— , del ácido propiónico (o 'ácido propanoico'), y es el más pequeño de los ácidos 'grasos' que tienen la fórmula general H(CH2)nCOOH que comparte ciertas propiedades de esta clase de moléculas: producir una capa aceitosa cuando se sala fuera del agua y tener una sal de potasio jabonosa. El propionato disponible comercialmente se vende generalmente como una sal catiónica monovalente de ácido propiónico, tal como el propionato de sodio (CH3CH2COONa), o como una sal catiónica divalente, como el propionato de calcio (Ca(CH3CH2COO)2). El propionato es permeable a la membrana y se metaboliza a 2-MC por conversión de propionato a propionil-CoA por PrpE (propionil-CoA sintetasa), y luego conversión de propionil-CoA a 2-MC por PrpC (2-metilcitrato sintasa). Las otras proteínas codificadas por el operón prpBCDE, la PrpD (2-metilcitrato deshidratasa) y la PrpB (2-metilisocitrato liasa), están involucradas en un mayor catabolismo de 2-MC en productos más pequeños como piruvato y succinato. Con el fin de maximizar la inducción de un promotor inducible por propionato mediante el propionato agregado al medio de crecimiento celular, es conveniente tener una célula huésped con actividad PrpC y PrpE, para convertir el propionato en 2-MC, pero que también haya eliminado o reducido la actividad PrpD. y, opcionalmente, también eliminó o redujo la actividad de PrpB, para evitar que se metabolice 2-MC. Otro operón que codifica proteínas involucradas en la biosíntesis de 2-Mc es el operón scpA-argK-scpBC, también llamado sbm-ygfDGHoperón. Estos genes codifican proteínas requeridas para la conversión de succinato en propionil-CoA, que luego puede convertirse en 2-MC por PrpC. La eliminación o reducción de la función de estas proteínas eliminaría una vía paralela para la producción del inductor 2-MC y, por lo tanto, podría reducir los niveles de expresión de fondo de un promotor inducible por propionato y aumentar la sensibilidad del promotor inducible por propionato al propionato suministrado exógenamente. Se ha encontrado que una deleción de sbm-ygfD-ygfG-ygfH-ygfl, introducida en E. coli BL21(DE3) para crear la cepa JSB (Lee y Keasling, "A propionateinducible expression system for enteric bacteria", Appl Environ Microbiol noviembre del 2005; 71 (11): 6856-6862), fue útil para reducir la expresión de fondo en ausencia del inductor suministrado exógenamente, pero esta deleción también redujo la expresión general del promotor prp en la cepa JSB. Sin embargo, cabe señalar que la deleción sbm-ygfD-ygfG-ygfH-ygfl aparentemente también afecta a ygfl, que codifica un supuesto regulador transcripcional de la familia LysR de función desconocida. Los genes sbm-ygfDGH se transcriben como un operón, y ygfl se transcribe de la hebra opuesta. Los extremos 3' de las secuencias codificantes de ygfH e ygfl se superponen en unos pocos pares de bases, por lo que una deleción que elimina todo el operón sbm-yg fDGH aparentemente también elimina la función de codificación de ygfl. Eliminar o reducir la función de un subconjunto de los productos génicos de sbmygfDGH, tal como YgfG (también llamado ScpB, metilmalonil-CoA descarboxilasa), o eliminar la mayoría del operón sbm-ygfDGH (o scpA-argK-scpBC) dejando suficiente del extremo 3' del gen ygfH (o scpC) para que la expresión de ygfl no se vea afectada, podría ser suficiente para reducir la expresión de fondo de un promotor inducible por propionato sin reducir el nivel máximo de expresión inducida.
Promotor de ramnosa. (Como se usa en la presente, 'ramnosa' significa L-ramnosa.) El 'promotor de ramnosa' o 'promotor rha', o PrhaSR, es el promotor del operón rhaSR de E. coli. Como los promotores ara y prp, el promotor rha es parte de un promotor bidireccional, que controla la expresión del operón rhaSR en una dirección, y con el promotor rhaBAD controla la expresión del operón rhaBAD en la otra dirección. El promotor rha, sin embargo, tiene dos reguladores transcripcionales involucrados en la modulación de la expresión: RhaR y RhaS. La proteína RhaR activa la expresión del operón rhaSR en presencia de ramnosa, mientras que la proteína RhaS activa la expresión de los operones catabólicos y de transporte de L-ramnosa, rhaBAD y rhaT, respectivamente (Wickstrum y otros, "The AraC/XylSfamily activator RhaS negatively autoregulates rhaSR expression by preventing cyclic AMP receptor protein activation", J Bacteriol enero del 2010; 192(1):225-232). Aunque la proteína RhaS también puede activar la expresión del operón rhaSR, en efecto RhaS autorregula negativamente esta expresión al interferir con la capacidad de la proteína receptora de AMP cíclico (CRP) para coactivar la expresión con RhaR a un nivel mucho mayor. El operón rhaMAL codifica las proteínas catabólicas de ramnosa RhaA (L-ramnosa isomerasa), que convierte la L-ramnosa en L-ramnulosa; RhaB (ramnuloquinasa), que fosforila la L-ramnulosa para formar L-ramnulosa-1-P; y RhaD (ramnulosa-1-fosfato aldolasa), que convierte la L-ramnulosa-1-P en L-lactaldehído y DHAP (fosfato de dihidroxiacetona). Para maximizar la cantidad de ramnosa en la célula disponible para la inducción de la expresión de un promotor inducible por ramnosa, es conveniente reducir la cantidad de ramnosa que se descompone por catálisis, al eliminar o reducir la función de RhaA, u opcionalmente de RhaA. y al menos uno de RhaB y RhaD. Las células de E. coli también pueden sintetizar L-ramnosa a partir de alfa-D-glucosa-1-P a través de las actividades de las proteínas RmlA, RmlB, RmIC y RmID (también llamadas RfbA, RfbB, RfbC y RfbD, respectivamente) codificadas por el operón rmIBDACX(o rfbBDACX). Para reducir la expresión de fondo de un promotor inducible por ramnosa y para mejorar la sensibilidad de la inducción del promotor inducible por ramnosa mediante ramnosa suministrada exógenamente, podría ser útil eliminar o reducir la función de uno o más de los RmlA, RmlB, RmIC y proteínas RmID. La L-ramnosa es transportada al interior de la célula por RhaT, la permeasa de ramnosa o el simportador L-ramnosa:protón. Como se indicó anteriormente, la expresión de RhaT es activada por el regulador transcripcional RhaS. Para hacer que la expresión de RhaT sea independiente de la inducción por ramnosa (que induce la expresión de RhaS), la célula huésped puede modificarse para que todas las secuencias codificantes de RhaT funcionales en la célula se expresen a partir de promotores constitutivos. Adicionalmente, las secuencias codificantes para RhaS pueden eliminarse o inactivarse, de modo que no se produzca RhaS funcional. Al eliminar o reducir la función de RhaS en la célula, el nivel de expresión del promotor rhaSR aumenta debido a la ausencia de autorregulación negativa por parte de RhaS, y el nivel de expresión del operón catalítico de ramnosa rhaBAD disminuye, lo que aumenta aún más la capacidad de la ramnosa para inducir la expresión del promotor rha.
Promotor de xilosa. (Como se usa en la presente, 'xilosa' significa D-xilosa). El promotor de xilosa, o 'promotor xil', o PxyiA significa el promotor del operón de E. coli xylAB. La región promotora de xilosa es similar en organización a otros promotores inducibles en que el operón xylAB y el operón xylFGHR se expresan a partir de promotores inducibles por xilosa adyacentes en direcciones opuestas en el cromosoma de E. coli (Song y Park, "Organization and regulation of the D-xylose operons in Escherichia coli K-12: XylR acts as a transcriptional activator", J Bacteriol. noviembre de 1997; 179(22): 7025-7032). El regulador transcripcional de los promotores PxyiA y PxyiF es XylR, que activa la expresión de estos promotores en presencia de xilosa. El gen xylR se expresa ya sea como parte del operón xylFGHR o de su propio promotor débil, que no es inducible por xilosa, situado entre secuencias codificantes de proteínas xylH y xylR. La D-xilosa es catabolizada por XylA (D-xilosa isomerasa), que convierte la D-xilosa en D-xilulosa, que luego es fosforilada por XylB (xiluloquinasa) para formar D-xilulosa-5-P. Para maximizar la cantidad de xilosa en la célula disponible para la inducción de la expresión de un promotor inducible por xilosa, es conveniente reducir la cantidad de xilosa que se descompone por catálisis, al eliminar o reducir la función de al menos XylA, u opcionalmente tanto de XylA como de XylB. El operón xylFGHR codifica XylF, XylG y XylH, las subunidades de un transportador de D-xilosa de alta afinidad de la superfamilia ABC. El gen xylE que codifica el simportador xilosaprotón de baja afinidad de E. coli representa un operón separado, cuya expresión también es inducible por la xilosa. Para hacer que la expresión de un transportador de xilosa sea independiente de la inducción por xilosa, la célula huésped puede modificarse de modo que todos los transportadores de xilosa funcionales se expresen a partir de promotores constitutivos. Por ejemplo, el operón xylFGHR podría modificarse para que se eliminen las secuencias codificantes de xylFGH, lo que deja a XylR como la única proteína activa expresada a partir del promotor Pxy|F inducible por xilosa, y con la secuencia codificante de xylE expresada a partir de un promotor constitutivo en lugar de su promotor nativo. Como otro ejemplo, la secuencia codificante de xylR se expresa a partir del promotor PxyiA o pxy en una construcción de expresión, mientras que el operón xylFGHR se elimina y xylE se expresa constitutivamente, o alternativamente un operón xylFGH (sin secuencia codificante xylR ya que está presente en una construcción de expresión) se expresa a partir de un promotor constitutivo y la secuencia codificante xylE se elimina o modifica para que no produzca una proteína activa.
Promotor de lactosa. El término "promotor de lactosa" se refiere al promotor inducible por lactosa para el operón lacZYA, un promotor que también se denomina lacZpl; este promotor de lactosa se encuentra en ca. 365603 -365568 (hebra negativa, con el sitio de unión a la ARN polimerasa ('-35') en ca. 365603-365598, la caja de Pribnow ('-1 O') en 365579-365573 y un sitio de iniciación de la transcripción en 365567) en la secuencia genómica de la subcepa MG1655 de E. coli K-12 (secuencia de referencia NCBI NC_000913.2, 11 de enero del 2012). En algunas modalidades, los sistemas de coexpresión inducibles de la invención pueden comprender un promotor inducible por lactosa tal como el promotor lacZYA. En otras modalidades, los sistemas de coexpresión inducibles de la invención comprenden uno o más promotores inducibles que no son promotores inducibles por lactosa.
Promotor de fosfatasa alcalina. Los términos "promotor de la fosfatasa alcalina" y 'promotor phoA' se refieren al promotor del operón phoApsiF, un promotor que se induce en condiciones de falta de fosfato. La región promotora phoA se encuentra en ca. 401647 - 401746 (hebra positiva, con la caja de Pribnow ('-10') en 401695 - 401701 (Kikuchi y otros, "The nucleotide sequence of the promoter and the amino-terminal region of alkaline phosphatase structural gene (phoA) of Escherichia coli", Nucleic Acids Res noviembre 11 de 1981; 9(21): 5671-5678)) en la secuencia genómica de la subcepa MG1655 de E coli K-12 (secuencia de referencia NCBI NC_000913.3,16 de diciembre del 2014). El activador transcripcional del promotor phoA es PhoB, un regulador transcripcional que, junto con la proteína sensora PhoR, forma un sistema de transducción de señales de dos componentes en E. coli. La PhoB y la PhoR se transcriben del operón phoBR, ubicado en ca. 417050 - 419300 (hebra positiva, con la secuencia codificante de PhoB en 417,142 - 417,831 y la secuencia codificante de PhoR en 417,889 - 419,184) en la secuencia genómica de la subcepa MG1655 de la E. coli K-12 (secuencia de referencia NCBI NC_000913.3, 16 de diciembre del 2014). El promotor phoA difiere de los promotores inducibles descritos anteriormente en que es inducido por la falta de una sustancia - fosfato intracelular - más que por la adición de un inductor. Por esta razón el promotor phoA se usa generalmente para dirigir la transcripción de productos génicos que se van a producir en una etapa en la que las células huésped se agotan en fosfato, tales como las últimas etapas de la fermentación. En algunas modalidades, los sistemas de coexpresión inducibles de la invención pueden comprender un promotor phoA. En otras modalidades, los sistemas de coexpresión inducibles de la invención comprenden uno o más promotores inducibles que no son promotores phoA.
Figure imgf000010_0001
Figure imgf000011_0001
Figure imgf000012_0001
Construcciones de expresión. Las construcciones de expresión son polinucleótidos diseñados para la expresión de uno o más productos génicos de interés y, por lo tanto, no son moléculas de origen natural. Las construcciones de expresión pueden integrarse en un cromosoma de la célula huésped o mantenerse dentro de la célula huésped como moléculas de polinucleótidos que se replican independientemente del cromosoma de la célula huésped, como plásmidos o cromosomas artificiales. Un ejemplo de una construcción de expresión es un polinucleótido que resulta de la inserción de una o más secuencias polinucleotídicas en el cromosoma de una célula huésped, donde las secuencias polinucleotídicas insertadas modifican la expresión de las secuencias codificantes cromosómicas. Un vector de expresión es una construcción de expresión de plásmido usada específicamente para la expresión de uno o más productos génicos. Uno o más construcciones de expresión pueden integrarse en un cromosoma de una célula huésped o mantenerse en un polinucleótido extracromosómico tal como un plásmido o un cromosoma artificial. Las siguientes son descripciones de tipos particulares de secuencias polinucleotídicas que pueden usarse en construcciones de expresión para la expresión o coexpresión de productos génicos.
Orígenes de la replicación. Las construcciones de expresión deben comprender un origen de replicación, también denominado replicón, con el fin de que se mantengan dentro de la célula huésped como polinucleótidos que se replican independientemente. Los diferentes replicones que usan el mismo mecanismo de replicación no pueden mantenerse juntos en una sola célula huésped a través de divisiones celulares repetidas. Como resultado, los plásmidos pueden clasificarse en grupos de incompatibilidad en dependencia del origen de replicación que contienen, como se muestra en la Tabla 2.
Figure imgf000013_0001
____
Los orígenes de la replicación pueden seleccionarse para el uso en construcciones de expresión sobre la base del grupo de incompatibilidad, el número de copias y/o el rango de hospedantes, entre otros criterios. Como se describe anteriormente, si se van a usar dos o más construcciones de expresión diferentes en la misma célula huésped para la coexpresión de múltiples productos génicos, es mejor si las diferentes construcciones de expresión contienen orígenes de replicación de diferentes grupos de incompatibilidad: un replicón pMB1 en una construcción de expresión y un replicón p15A en otra, por ejemplo. El número promedio de copias de una construcción de expresión en la célula, con relación al número de moléculas del cromosoma huésped, se determina por el origen de replicación contenido en esa construcción de expresión. El número de copias puede variar desde unas pocas copias por celda hasta varios cientos (Tabla 2). En una modalidad de la invención, se usan diferentes construcciones de expresión que comprenden promotores inducibles que son activados por el mismo inductor, pero que tienen diferentes orígenes de replicación. Al seleccionar los orígenes de replicación que mantienen cada construcción de expresión diferente en un cierto número aproximado de copias en la célula, es posible ajustar los niveles de producción general de un producto génico expresado a partir de una construcción de expresión, con relación a otro producto génico expresado a partir de una construcción de expresión diferente. Por ejemplo, para coexpresar las subunidades A y B de una proteína multimérica, se crea una construcción de expresión que comprende el replicón colE1, el promotor ara, y una secuencia codificante para la subunidad A expresada a partir del promotor ara: 'colE1-Para-A'. Se crea otra construcción de expresión que comprende el replicón p15A, el promotor ara y una secuencia codificante para la subunidad B: 'p15A-Para-B'. Estas dos construcciones de expresión pueden mantenerse juntas en las mismas células huésped, y la expresión de ambas subunidades A y B se induce mediante la adición de un inductor, arabinosa, al medio de crecimiento. Si el nivel de expresión de la subunidad A necesita aumentar significativamente con relación al nivel de expresión de la subunidad B, con el fin de acercar la relación estequiométrica de las cantidades expresadas de las dos subunidades a la relación deseada, por ejemplo, se podría crear una nueva construcción de expresión para la subunidad A, que tuviera un replicón pMB1 modificado como se encuentra en el origen de replicación del plásmido pUC9 ('pUC9ori'): pUC9ori-Para-A. La expresión de la subunidad A partir de una construcción de expresión con un número elevado de copias, como pUC9ori-Para-A debería aumentar la cantidad de subunidad A producida con relación a la expresión de la subunidad B de p15A-Para-B. De manera similar, el uso de un origen de replicación que mantiene las construcciones de expresión en un número de copias más bajo, tal como pSC101, podría reducir el nivel general de un producto génico expresado a partir de esa construcción. La selección de un origen de replicación también puede determinar qué células huésped pueden mantener una construcción de expresión que comprende ese replicón. Por ejemplo, las construcciones de expresión que comprenden el origen de replicación colE1 tienen un intervalo relativamente estrecho de huéspedes disponibles, especies dentro de la familia Enterobacteriaceae, mientras que las construcciones de expresión que comprenden el replicón RK2 pueden mantenerse en E. coli, Pseudomonas aeruginosa, Pseudomonas putida, Azotobacter vinelandii, y Alcaligenes eutrophus, y si una construcción de expresión comprende el replicón RK2 y algunos genes reguladores del plásmido RK2, puede mantenerse en células huésped tan diversas como Sinorhizobium meliloti, Agrobacterium tumefaciens, Caulobacter crescentus, Acinetobacter calcoaceticus, y Rhodobacter sphaeroides (Kues y Stahl, "Replication of plasmids in gram-negative bacteria", Microbiol Rev diciembre del 1989; 53(4): 491-516).
Pueden emplearse consideraciones similares para crear construcciones de expresión para expresión inducible o coexpresión en células eucariotas. Por ejemplo, el plásmido circular de 2 micras de Saccharomyces cerevisiae es compatible con plásmidos de otras cepas de levadura, tales como pSR1 (números de depósito ATCC 48233 y 66069; Araki y otros, "Molecular and funcional organization of yeast plasmid pSR1", J Mol Biol 20 de marzo del1985; 182(2): 191-203) y pKD1 (número de depósito ATCC 37519; Chen y otros, "Sequence organization of the circular plasmid pKD1 from the yeast Kluyveromyces drosophilarum", Nucleic Acids Res 11 de junio del 1986; 14(11): 4471­ 4481).
Marcadores seleccionables. Las construcciones de expresión generalmente comprenden un gen de selección, también denominado marcador seleccionable, que codifica una proteína necesaria para la supervivencia o el crecimiento de las células huésped en un medio de cultivo selectivo. Las células huésped que no contienen la construcción de expresión que comprende el gen de selección no sobrevivirán en el medio de cultivo. Los genes de selección típicos codifican proteínas que confieren resistencia a los antibióticos u otras toxinas, o que complementan las deficiencias auxotróficas de la célula huésped. Un ejemplo de un esquema de selección utiliza un fármaco como un antibiótico para detener el crecimiento de una célula huésped. Aquellas células que contienen una construcción de expresión que comprende el marcador seleccionable producen una proteína que confiere resistencia al fármaco y sobreviven al régimen de selección. Algunos ejemplos de antibióticos que se usan comúnmente para la selección de marcadores seleccionables (y abreviaturas que indican genes que proporcionan fenotipos de resistencia a los antibióticos) son: ampicilina (AmpR), cloranfenicol (CmlRoCmR), kanamicina (KanR), espectinomicina (SpcR), estreptomicina (StrR) y tetraciclina (TetR). Muchos de los plásmidos representativos de la Tabla 2 comprenden marcadores seleccionables, como pBR322 (AmpR, TetR); pMOB45 (cmR, TetR); pACYC177 (AmpR, kanR); y pGBM1 (Spc.R, StrR). La región promotora nativa para un gen de selección generalmente se incluye, junto con la secuencia codificante de su producto génico, como parte de una porción del marcador seleccionable de una construcción de expresión. Alternativamente, la secuencia codificante del gen de selección puede expresarse a partir de un promotor constitutivo.
Promotor inducible. Como se describe en la presente descripción, hay varios promotores inducibles diferentes que pueden incluirse en construcciones de expresión como parte de los sistemas de coexpresión inducibles de la invención. Los promotores inducibles preferidos comparten al menos un 80 % de identidad de secuencia polinucleotídica (con mayor preferencia, al menos un 90 % de identidad y con la máxima preferencia, al menos un 95 % de identidad) a al menos 30 (con mayor preferencia, al menos 40 y con la máxima preferencia, al menos 50) bases contiguas de una secuencia polinucleotídica promotor como se define en la Tabla 1 por referencia a la secuencia genómica de la subcepa MG1655 de la E. coli K-12, donde el porcentaje de identidad de la secuencia polinucleotídica se determina mediante el uso de los métodos del Ejemplo 11. Bajo condiciones de inducción 'estándar' (ver Ejemplo 5), los promotores inducibles preferidos tienen al menos el 75 % (con mayor preferencia, al menos el 100 %, y con la máxima preferencia, al menos el 110 %) de la fuerza del correspondiente promotor inducible de 'tipo salvaje' de la subcepa MG1655E. coli K-12, determinada mediante el uso del método de PCR cuantitativo de De Mey y otros. (Ejemplo 6). Dentro de la construcción de expresión, un promotor inducible se coloca 5' (o 'aguas arriba) de la secuencia codificante del producto génico que se va a expresar de forma inducible, de modo que la presencia del promotor inducible dirigirá la transcripción de la secuencia codificante del producto génico. en una dirección de 5' a 3' con relación a la hebra codificante del polinucleótido que codifica el producto génico.
Sitio de unión al ribosoma. Para productos génicos polipeptídicos, la secuencia de nucleótidos de la región entre el sitio de inicio de la transcripción y el codón de inicio de la secuencia codificante del producto génico que se va a expresar de forma inducible corresponde a la región 5' no traducida ('UTR') del ARNm para el producto del gen del polipéptido. Preferentemente, la región de la construcción de expresión que corresponde a la UTR 5' comprende una secuencia polinucleotídica similar al sitio de unión al ribosoma consenso (RBS, también denominada secuencia Shine-Dalgarno) que se encuentra en la especie de la célula huésped. En procariotas (arqueas y bacterias), la secuencia consenso RBS es GGAGG o GGAGGU, y en bacterias como E. coli, la secuencia consenso de RBS es AGGAGG o AGGAGGU. El RBS típicamente está separado del codón de iniciación por 5 a 10 nucleótidos intermedios. En construcciones de expresión, la secuencia RBS es preferentemente al menos 55 % idéntica a la secuencia consenso AGGAGGU, con mayor preferencia al menos 70 % idéntica y con la máxima preferencia al menos 85 % idéntica, y está separada del codón de iniciación por 5 a 10 nucleótidos intermedios, con mayor preferencia por 6 a 9 nucleótidos intermedios, y con la máxima preferencia por 6 o 7 nucleótidos intermedios. La capacidad de un RBS dado para producir una tasa de iniciación de traducción conveniente puede calcularse en el sitio web salis.psu.edu/software/RBSLibraryCalculator-SearchMode, mediante el uso de la calculadora RBS; la misma herramienta puede usarse para optimizar un RBS sintético para una tasa de traducción en un rango de más de 100000 veces (Salis, "The ribosome binding site calculator", Methods Enzymol 2011; 498: 19-42). [0036]
Sitio de clonación múltiple. Un sitio de clonación múltiple (MCS), también llamado polienlazador, es un polinucleótido que contiene múltiples sitios de restricción muy próximos o superpuestos entre sí. Los sitios de restricción en el MCS típicamente ocurren una vez dentro de la secuencia del MCS, y preferentemente no ocurren dentro del resto del plásmido u otra construcción polinucleotídica, lo que permite que las enzimas de restricción corten la construcción del plásmido u otro polinucleótido solo dentro del MCS. Ejemplos de secuencias MCS son aquellas de la serie pBAD de vectores de expresión, que incluyen pBAD18, pBAD18-Cm, pBAD18-Kan, pBAD24, pBAD28, pBAD30 y pBAD33 (Guzman y otros, "Tight regulation, modulation, and high-level expression by vectors containing the arabinose PBAD promoter", J Bacteriol julio del 1995; 177(14): 4121-4130); o aquellas de la serie pPRO de vectores de expresión derivados de los vectores pBAD, tales como pPRO18, pPRO18-Cm, pPRO18-Kan, pPRO24, pPRO30 y pPRO33 (patente de los Estados Unidos No. 8178338 B2; 15 de mayo de 2012; Keasling, Jay). Puede usarse un sitio de clonación múltiple en la creación de una construcción de expresión: al colocar un sitio de clonación múltiple en 3' (o aguas abajo) de una secuencia promotora, el MCS puede usarse para insertar la secuencia codificante para que se exprese o coexprese un producto génico en la construcción, en la ubicación adecuada con relación al promotor para que se produzca la transcripción de la secuencia codificante. En dependencia de qué enzimas de restricción se usan para cortar dentro del MCS, puede quedar alguna parte de la secuencia MCS dentro de la construcción de expresión después de insertar la secuencia codificante u otra secuencia polinucleotídica en la construcción de expresión. Cualquier secuencia MCS restante puede ser aguas arriba o aguas abajo o en ambos lados de la secuencia insertada. Un sitio de unión al ribosoma puede colocarse aguas arriba del MCS, preferentemente inmediatamente adyacente o separado del MCS por solo unos pocos nucleótidos, en cuyo caso el RBS estaría aguas arriba de cualquier secuencia codificante insertada en el MCS. Otra alternativa es incluir un sitio de unión al ribosoma dentro del MCS, en cuyo caso la elección de las enzimas de restricción usadas para cortar dentro del MCS determinarán si el RBS se conserva y en qué relación con las secuencias insertadas. Otra alternativa es incluir un RBS dentro de la secuencia polinucleotídica que se va a insertar en la construcción de expresión en el MCS, preferentemente en la relación apropiada con cualquier secuencia codificante para estimular el inicio de la traducción del ARN mensajero transcrito.
Expresión de promotores constitutivos. Las construcciones de expresión de la invención comprenden además secuencias codificantes que se expresan a partir de promotores constitutivos. A diferencia de los promotores inducibles, los promotores constitutivos inician la producción continua de productos génicos en la mayoría de las condiciones de crecimiento. Un ejemplo de un promotor constitutivo es el del gen Tn3 bla, que codifica la betalactamasa y es responsable del fenotipo de resistencia a la ampicilina (AmpR) conferido a la célula huésped por muchos plásmidos, que incluyen pBR322 (ATCC 31344), pACYC177 (ATCC 37031) y pBAD24 (ATCC 87399). Otro promotor constitutivo que puede usarse en construcciones de expresión es el promotor del gen Ipp de la lipoproteína de E. coli, que se encuentra en las posiciones 1755731-1755406 (hebra positiva) en la subcepa MG1655 de la E. coli K-12 (Inouye e Inouye, “Up-promoter mutaciones en el gen Ipp de Escherichia coli”, Nucleic Acids Res 10 de mayo de 1985; 13(9): 3101-3110). Otro ejemplo de un promotor constitutivo que se ha usado para la expresión de genes heterólogos en E. coli es el promotor trpLEDCBA, ubicado en las posiciones 1321169-1321133 (hebra negativa) en la subcepa MG1655 de la E. coli/'K-12 (Windass y otros, "The construction of a synthetic Escherichia coli trp promoter and its use in the expression of a synthetic interferon gene", Nucleic Acids Res 11 de noviembre del 1982; 10(21): 6639-6657). Los promotores constitutivos pueden usarse en construcciones de expresión para la expresión de marcadores seleccionables, como se describe en la presente descripción, y también para la expresión constitutiva de otros productos génicos útiles para la coexpresión del producto deseado. Por ejemplo, los reguladores transcripcionales de los promotores inducibles, tales como AraC, PrpR, RhaR y XylR, si no se expresan a partir de un promotor inducible bidireccional, pueden expresarse alternativamente a partir de un promotor constitutivo, ya sea en la misma construcción de expresión que el promotor inducible que regulan, o en una construcción de expresión diferente. De manera similar, los productos génicos útiles para la producción o el transporte del inductor, tales como PrpEC, AraE o Rha, o proteínas que modifican el entorno de oxidación-reducción de la célula, como algunos ejemplos, puede expresarse a partir de un promotor constitutivo dentro de una construcción de expresión. Los productos génicos útiles para la producción de productos génicos coexpresados, y el producto deseado resultante, también incluyen proteínas chaperonas, transportadores de cofactores, etc.
Péptidos de señal. Los productos génicos polipeptídicos expresados o coexpresados por los métodos de la invención puede contener péptidos señal o carecer de ellos, en dependencia de si es conveniente que dichos productos génicos se exporten desde el citoplasma de la célula huésped al periplasma, o que se retengan en el citoplasma, respectivamente. Los péptidos señal (también denominados secuencias señal, secuencias líder o péptidos líderes) se caracterizan estructuralmente por un tramo de aminoácidos hidrofóbicos, de aproximadamente cinco a veinte aminoácidos de largo y, a menudo, alrededor de diez a quince aminoácidos de longitud, que tiene una tendencia a formar una sola hélice alfa. Este tramo hidrofóbico a menudo es inmediatamente precedido por un tramo más corto enriquecido en aminoácidos cargados positivamente (particularmente lisina). Los péptidos señal que se van a escindir del polipéptido maduro típicamente terminan en un tramo de aminoácidos que es reconocido y escindido por la peptidasa señal. Los péptidos señal pueden caracterizarse funcionalmente por la capacidad de dirigir el transporte de un polipéptido, ya sea cotraduccional o postraduccionalmente, a través de la membrana plasmática de los procariotas (o la membrana interna de bacterias gram negativas como E. coli), o en el retículo endoplásmico de las células eucariotas. El grado en que un péptido señal permite que un polipéptido sea transportado al espacio periplasmático de una célula huésped como E. coli, por ejemplo, puede determinarse al separar las proteínas periplasmáticas de las proteínas retenidas en el citoplasma, mediante el uso de un método tal como el proporcionado en el Ejemplo 12.
Células huésped. Los sistemas de coexpresión inducibles de la invención están diseñados para expresar múltiples productos génicos; en determinadas modalidades de la invención, los productos génicos se coexpresan en una célula huésped. Se proporcionan ejemplos de células huésped que permiten la coexpresión inducible eficiente y rentable de componentes de productos multiméricos. Las células huésped pueden incluir, además de células aisladas en cultivo, células que forman parte de un organismo multicelular o células cultivadas dentro de un organismo o sistema de organismos diferente. Además, las construcciones de expresión de los sistemas de coexpresión inducible de la invención pueden usarse en sistemas sin células, tales como aquellos basados en extractos de germen de trigo o en extractos de células bacterianas, tal como un sistema de síntesis de proteínas sin células de intercambio continuo (CECF) mediante el uso de extractos de E. coli y un aparato de incubación tal como el RTS ProteoMaster (Roche Diagnostics GmbH; Mannheim, Alemania) (Jun y otros, "Continuous-exchange cell-free protein synthesis using PCR-generated DNA and an RNase E-deficient extract", Bio-techniques marzo del 2008; 44(3): 387-391).
Células huésped procariotas. En algunas modalidades de la invención, las construcciones de expresión diseñadas para la coexpresión de productos génicos se proporcionan en células huésped, preferentemente células huésped procariotas. Las células huésped procariotas pueden incluir arqueas (tales como Haloferax volcanii, Sulfolobus solfataricus), bacterias Gram-positivas (tales como Bacillus subtilis, Bacillus licheniformis, Brevibacillus choshinensis, Lactobacillus brevis, Lactobacillus buchneri, Lactococcus lactis, y Streptomyces lividans), o bacterias Gramnegativas, que incluyen Alphaproteobacteria (Agrobacterium tumefaciens, Caulobacter crescentus, Rhodobacter sphaeroides, y Sinorhizobium meliloti), Betaproteobacteria (Alcaligenes eutrophus), y Gammaproteobacteria (Acinetobacter calcoaceticus, Azotobacter vinelandii, Escherichia coli, Pseudomonas aeruginosa, y Pseudomonas putida). Las células huésped preferidas incluyen Gammaproteobacteria de la familia Enterobacteriaceae, tales como Enterobacter, Erwinia, Escherichia (que incluye E. coli), Klebsiella, Proteus, Salmonella (que incluye Salmonella typhimurium), Serratia (que incluye Serratia marcescans), y Shigela.
Células huésped eucariotas. Pueden usarse muchos tipos adicionales de células huésped para los sistemas de coexpresión inducible de la invención, que incluyen las células eucariotas como la levadura. (Candida shehatae, Kluyveromyces lactis, Kluyveromyces fragilis, otras especies de Kluyveromyces, Pichia pastoris, Saccharomyces cerevisiae, Saccharomyces pastorianus también conocido como Saccharomyces carlsbergensis, Schizosaccharomyces pombe, especies de Dekkera/Brettanomyces, y Yarrowia lipolytica)', otros hongos (Aspergillus nidulans, Aspergillus niger, Neurospora crassa, Penicillium, Tolypocladium, Trichoderma reesia)', líneas celulares de insectos (células Schneider 2 de Drosophila melanogaster y células Sf9 de Spodoptera frugiperda); y líneas celulares de mamíferos que incluyen líneas celulares inmortalizadas (células de ovario de hámster chino (CHO), células HeLa, células de riñón de hámster bebé (BHK), células de riñón de mono (COS), células de riñón embrionario humano (HEK, 293 o HEK-293), y células de carcinoma hepatocelular humano (Hep G2)). Las células huésped anteriores están disponibles en la Colección Americana de Cultivos Tipo.
Alteraciones de las funciones genéticas de la célula huésped. Pueden hacerse determinadas alteraciones en las funciones génicas de las células huésped que comprenden construcciones de expresión inducibles, para promover la inducción eficiente y homogénea de la población de células huésped mediante un inductor. Preferentemente, la combinación de las construcciones de expresión, el genotipo de la célula huésped y las condiciones de inducción da como resultado que al menos el 75 % (con mayor preferencia al menos el 85 % y con la máxima preferencia al menos el 95 %) de las células en el cultivo expresan el producto génico de cada promotor inducido, según lo medido por el método de Khlebnikov y otros descrito en el Ejemplo 6. Para las células huésped distintas de E. coli, estas alteraciones pueden involucrar la función de genes que son estructuralmente similares a un gen de E. coli, o genes que llevan a cabo una función dentro de la célula huésped similar a la del gen de E. coli. Las alteraciones de las funciones del gen de la célula huésped incluyen la eliminación o reducción de la función del gen mediante la deleción de la secuencia codificante de la proteína del gen en su totalidad, o la deleción de una porción lo suficientemente grande del gen, la inserción de la secuencia en el gen o la alteración de cualquier otra manera de la secuencia del gen para que se reduzca el nivel del producto del gen funcional que se hace a partir de ese gen. Las alteraciones de las funciones del gen de la célula huésped también incluyen el aumento de la función del gen, por ejemplo, al alterar el promotor nativo para crear un promotor más fuerte que dirija un mayor nivel de transcripción del gen, o introducir una mutación de sentido erróneo en la secuencia codificante de la proteína que resulta en un producto génico más altamente activo. Las alteraciones de las funciones del gen de la célula huésped incluyen la alteración de la función del gen de cualquier forma, que incluye, por ejemplo, la alteración de un promotor inducible nativo para crear un promotor que se active constitutivamente. Además de las alteraciones en las funciones de los genes para el transporte y el metabolismo de los inductores, como se describe en la presente descripción con relación a los promotores inducibles, y una expresión modificada de las proteínas chaperonas, también es posible alterar el sistema regulador de la represión de catabolitos de carbono (CCR) y/o el entorno de oxidación-reducción de la célula huésped.
Represión de catabolitos de carbono (CCR). La presencia de un sistema regulador de CCR activo dentro de un huésped puede afectar la capacidad de un inductor para activar la transcripción de un promotor inducible. Por ejemplo, cuando una célula huésped tal como E. coli se cultiva en un medio que contiene glucosa, los genes necesarios para la utilización de otras fuentes de carbono, como los operones araBAD y prpBCDE, se expresan en un nivel bajo, si es que lo hacen, incluso si el inductor de arabinosa o propionato también está presente en el medio de cultivo. También existe una jerarquía de utilización de las fuentes de carbono distintas de la glucosa: como en el caso de los sistemas promotores inducibles ara y prp, donde la presencia de arabinosa reduce la capacidad del propionato para inducir la expresión del promotor de prpBCDE (Park y otros, "The mechanism of sugar-mediated catabolite repression of the propionate catabolic genes in Escherichia coli", Gene 1 de agosto del 2012; 504(1):116-121; Epub 3 de mayo del 2012). Por lo tanto, el mecanismo CCR de la célula dificulta el uso de dos o más inductores de fuente de carbono en un sistema de coexpresión inducible, ya que la presencia del inductor que es la fuente de carbono preferida inhibirá la inducción por fuentes de carbono menos preferidas. The Park y otros. autores intentaron aliviar la represión del promotor prp por arabinosa, mediante el uso un mutante del gen crp que produce una proteína receptora de cAMP alterada que puede funcionar independientemente de cAMP, o una deleción de los genes PTS (sistema de fosfotransferasa) implicados en la regulación de CCR; ambos enfoques fueron en gran parte infructuosos.
Sin embargo, la cepa con desactivación génica de PTS usada por Park y otros autores se basa en la cepa TP2811 que es una deleción del operón ptsH lc/r de E. coli (Hernández-Montalvo y otros, "Characterization of sugar mixtures utilization by an Escherichia coli mutant devoid of the phosphotransferase system", Appl Microbiol Biotechnol octubre del 2001, 57(1-2): 186-191). Se ha encontrado que la deleción del operón ptsH lc/r completo afecta la síntesis de AMPc total de manera más significativa que la deleción del gen c/r solo (Levy y otros, "Cyclic AMP synthesis in Escherichia coli strains bearing known deletions in the pts phosphotransferase operon", Gene 31 de enero del 1990; 86(1): 27-33). Un enfoque diferente es eliminar o reducir la función del gen ptsG en la célula huésped, que codifica Ell A específico de glucosa (Ell A9|c), un elemento clave para la RCC en E. coli (Kim y otros, "Simultaneous consumption of pentose and hexose sugars: an optimal microbial phenotype for efficient fermentation of lignocellulosic biomass", Appl Microbiol Biotechnol noviembre del 2010; 88(5): 1077-1085, Epub 14 de septiembre del 2010). Otra alteración en el genoma de una célula huésped tal como E. coli, que conduce a un aumento de la transcripción del promotor prp, es eliminar o reducir la función génica del gen ascG, que codifica para AscG. El AscG es el represor del operón ascFB de utilización del beta-D-glucósido bajo condiciones normales de crecimiento, y también reprime la transcripción del promotor prp; se ha demostrado que la interrupción de la secuencia codificante de AscG aumenta la transcripción del promotor prp (Ishida y otros, "Participation of regulator AscG of the betaglucoside utilization operon in regulation of the propionate catabolism operon", J Bacteriol octubre del 2009; 191 (19): 6136-6144; Epub 24 de julio del 2009). Otra alternativa es aumentar la expresión del regulador transcripcional de los promotores inducibles por el inductor de fuente de carbono menos preferida, mediante su colocación bajo el control de un promotor constitutivo fuerte o bajo el control del inductor de fuente de carbono más preferida. Por ejemplo, para aumentar la inducción de los genes necesarios para la utilización de la fuente de carbono menos preferida xilosa en presencia de la arabinosa más preferida, la secuencia codificante para XyIR se coloca en el operón araBAD de la E. coli (Groff y otros, "Supplementation of intracellular XylR leads to coutilization of hemicellulose sugars", Appl Environ Microbiol abril del 2012; 78(7): 2221-2229, Epub 27 de enero del 2012). Por lo tanto, las células huésped que comprenden construcciones de coexpresión inducibles incluyen preferentemente un mayor nivel de función génica para reguladores transcripcionales de promotores inducibles por el o los inductores de fuente de carbono menos preferidas, y una función génica reducida o eliminada para los genes involucrados en el sistema CCR, tales como err y/o ptsG y/o ascG.
Las células huésped de la invención que han sido modificadas genéticamente, de modo que carecen de la capacidad de metabolizar un inductor en otro compuesto, no muestran necesariamente CCR por ese inductor en los promotores regulados por fuentes de carbono menos preferidas. Esta ausencia de un efecto CCR significativo se observa cuando se usan concentraciones muy bajas del inductor no metabolizado; sorprendentemente, esas concentraciones muy bajas también son las más efectivas para producir rendimientos óptimos de productos génicos. Por ejemplo, la coexpresión de productos génicos puede llevarse a cabo mediante la expresión de un componente de producto génico a partir del promotor araBAD inducible por la L-arabinosa y el otro componente de producto génico del promotor prpBCDE inducible por propionato. En células huésped como las células EB0001 y EB0002 de E. coli (descritas en el Ejemplo 1 más abajo), la coexpresión típicamente produce los mejores rendimientos del producto génico multimérico a concentraciones del inductor L-arabinosa de menos de 100 micromolar (0,0015 %) por unidad de OD de células, y a estas concentraciones de L-arabinosa se observa muy poca o ninguna CCR mediada por L-arabinosa del promotor prpBCDE.
Transporte celular de cofactores. Cuando se usan los sistemas de coexpresión inducibles de la invención para producir enzimas que requieren cofactores para funcionar, es útil usar una célula huésped capaz de sintetizar el cofactor a partir de los precursores disponibles o tomarlo del medio ambiente. Los cofactores comunes incluyen ATP, coenzima A, dinucleótido de flavina y adenina (FAD), NAD+/NADH y hemo.
Entorno de reducción-oxidación de la célula huésped. Muchos productos de genes multiméricos, tales como los anticuerpos, contienen enlaces disulfuro. El citoplasma de la E. coli y muchas otras células se mantienen normalmente en un estado reducido por la tiorredoxina y los sistemas enzimáticos glutarredoxina/glutatión. Esto impide la formación de enlaces disulfuro en el citoplasma, y las proteínas que necesitan enlaces disulfuro se exportan al periplasma, donde la isomerización y la formación de enlaces disulfuro son catalizadas por el sistema Dsb, que comprende DsbABCD y DsbG. El aumento de la expresión de la cisteína oxidasa DsbA, la disulfuro isomerasa DsbC o combinaciones de las proteínas Dsb, que normalmente se transportan al periplasma, se utilizan en la expresión de proteínas heterólogas que requieren enlaces disulfuro (Makino y otros, "Strain engineering for improved expression of recombinant proteins in bacteria", Microb Cell Fact 14 de mayo del 2011; 10: 32). También es posible expresar formas citoplasmáticas de estas proteínas Dsb, como una versión citoplasmática de la DsbC ('cDsbC'), que carece de un péptido señal y, por lo tanto, no se transporta al periplasma. Las proteínas Dsb citoplasmáticas tales como cDsbC son útiles para hacer que el citoplasma de la célula huésped sea más oxidante y, por lo tanto, más propicio para la formación de enlaces disulfuro en proteínas heterólogas producidas en el citoplasma. El citoplasma de la célula huésped también puede hacerse más oxidante al alterar directamente los sistemas enzimáticos de la tiorredoxina y la glutarredoxina/glutatión: las cepas mutantes defectuosas en la glutatión reductasa (gor) o la glutatión sintetasa (gshB), junto con la tiorredoxina reductasa (trxB), vuelven al citoplasma oxidante. Estas cepas no pueden reducir los ribonucleótidos y, por lo tanto, no pueden crecer en ausencia de un reductor exógeno, como el ditiotreitol (DTT). Las mutaciones supresoras (ahpC*) en el gen ahpC, que codifica la peroxirredoxina AhpC, la convierte en una disulfuro reductasa que genera glutatión reducido, lo que permite la canalización de electrones hacia la enzima ribonucleótido reductasa y permite a las células defectuosas en gor y trxb, o defectuosas en gshB y trxb, crecer en ausencia de DTT. Una clase diferente de formas mutadas de AhpC puede permitir a las cepas defectuosas en la actividad de la gamma-glutamilcisteína sintetasa. (gshA) y defectuosas en trxb, crecer en ausencia de DTT; estas incluyen AhpC V164G, AhpC S71F, AhpC E173/S71F, AhpC E171Ter y AhpC dup162-169 (Faulkner y otros, "Functional plasticity of a peroxidase allows evolution of diverse disulfidereducing pathways", Proc Natl Acad Sci U S A 6 de mayo del 2008; 105(18): 6735-6740, Epub 2 de mayo del 2008). En tales cepas con citoplasma oxidante, las cisteínas proteicas expuestas se oxidan fácilmente en un proceso que es catalizado por tiorredoxinas, en una inversión de su función fisiológica, lo que resulta en la formación de enlaces disulfuro.
Otra alteración que puede hacerse a las células huésped es expresar la sulfhidrilo oxidasa Ervlp del espacio de la membrana interna de las mitocondrias de levadura en el citoplasma de la célula huésped, que se ha demostrado que aumenta la producción de una variedad de proteínas complejas unidas por disulfuro de origen eucariotas en el citoplasma de E. coli, incluso en ausencia de mutaciones en gor o trxB (Nguyen y otros, "Pre-expression of a sulfhydryl oxidase significantly increases the yields of eukaryotic disulfide bond containing proteins expressed in the cytoplasm of E. coli" Microb Cell Fact 7 de enero del 2011; 10:1). Las células huésped que comprenden construcciones de coexpresión inducibles preferentemente también expresan cDsbC y/o Ervlp, son deficientes en la función del gen trxB, también son deficientes en la función de cualquiera de los genes agor, gshB, o gshA, y expresan al menos una forma mutante apropiada de AhpC para que las células huésped puedan crecer en ausencia de DTT.
Glicosilación de productos génicos polipeptídicos. Las células huésped pueden tener alteraciones en su capacidad para glicosilar polipéptidos. Por ejemplo, las células huésped eucarióticas pueden haber eliminado o reducido la función génica en genes de la glicosiltransferasa y/u la oligosacariltransferasa, al afectar la glicosilación eucariótica normal de polipéptidos para formar glicoproteínas. Las células huésped procariotas tales como E. coli, que normalmente no glicosilan polipéptidos, pueden alterarse para expresar un conjunto de genes eucariotas y procariotas que proporcionan una función de glicosilación (DeLisa y otros, "Glycosylated protein expression in prokaryotes", documento WO2009089154A2, 16 de julio del 2009).
Cepas de células huésped disponibles con funciones genéticas modificadas. Para crear cepas preferidas de células huésped para usar en los sistemas y métodos de coexpresión inducibles de la invención, es útil comenzar con una cepa que ya comprenda las alteraciones genéticas deseadas (Tabla 3).
Tabla 3. Ce as de células hués ed
Figure imgf000018_0001
Métodos para alterar las funciones del gen de la célula huésped. Hay muchos métodos conocidos en la técnica para realizar alteraciones en los genes de la célula huésped con el fin de eliminar, reducir o cambiar la función del gen. Los métodos para hacer alteraciones específicas de genes en células huésped como E. coli y otros procariotas (Muyrers y otros, "Rapid modification of bacterial artificial chromosomes by ET-recombination", Nucleic Acids Res 15 de marzo del 1999; 27(6): 1555-1557; Datsenko y Wanner, "One-step inactivation of chromosomal genes in Escherichia coli K-12 using PCR products", Proc Natl Acad Sci U S A 6 de junio del 2000; 97(12): 6640-6645), y estuches para usar métodos de recombinación Red/ET similares están disponibles comercialmente (por ejemplo, el estuche Quick & Easy E. coli Gene Deletion Kit de Gene Bridges GmbH, Heidelberg, Alemania). En una modalidad de la invención, la función de uno o más genes de las células huésped se elimina o reduce mediante la identificación de una secuencia de nucleótidos dentro de la secuencia codificante del gen que se va a alterar, tal como uno de la subcepa MG1655 de E. coli K-12 que codifica secuencias en la ubicación genómica de la secuencia, y más específicamente al seleccionar dos tramos adyacentes de 50 nucleótidos cada uno dentro de esa secuencia codificante. El estuche Quick & Easy E. coli Gene Deletion Kit se usa luego de acuerdo con las instrucciones del fabricante para insertar una construcción de polinucleótidos que contiene un marcador seleccionable entre los tramos adyacentes seleccionados de la secuencia codificante, para eliminar o reducir la función normal del gen. Los métodos de recombinación Red/ET también pueden usarse para reemplazar una secuencia promotora con la de un promotor diferente, tal como un promotor constitutivo o un promotor artificial que se predice que promoverá un cierto nivel de transcripción (De Mey y otros, "Promoter knock-in: a novel rational method for the fine tuning of genes", BMC Biotechnol 24 de marzo del 2010; 10: 26). La función de los genes de la célula huésped también puede eliminarse o reducirse mediante métodos de silenciamiento de ARN (Man y otros, "Artificial trans-encoded small non-coding RNAs specifically silence the selected gene expression in bacteria", Nucleic Acids Res abril del 2011; 39(8): e50, Epub 3 de febrero del 2011). Además, las mutaciones conocidas que alteran la función del gen de la célula huésped pueden introducirse en las células huésped a través de métodos genéticos tradicionales.
Sistemas de coexpresión inducibles de la invención
Los sistemas de coexpresión inducible de la invención pueden implicar células huésped que comprenden dos o más construcciones de expresión, donde las construcciones de expresión comprenden promotores inducibles que dirigen la expresión de productos génicos, y las células huésped tienen funciones genéticas modificadas que permiten una expresión inducible homogénea de los productos génicos. La Figura 1 muestra una representación esquemática de un sistema de coexpresión inducible de la divulgación, con los siguientes componentes:
(1) célula huésped, (2) genoma huésped (que incluyen las alteraciones genéticas), (3) un vector de expresión 'X' que comprende un promotor inducible que dirige la expresión de un producto génico, (4) un vector de expresión diferente 'Y' que comprende un promotor inducible que dirige la expresión de otro producto génico, (5) inductores químicos de la expresión y (6) el producto de coexpresión multimérico. La Figura 3 muestra una representación esquemática similar a la mostrada en la Figura 1, con los promotores inducibles ((3) y (4)) y las secuencias codificantes para los productos expresados por los promotores inducibles presentes en el mismo vector de expresión.
La Figura 2 muestra una representación esquemática de un ejemplo particular de un sistema de coexpresión inducible, mediante el uso del promotor araBAD en un vector de expresión pBAD24 (o pBAD240) en combinación con un promotor inducible por propionato (promotor prpBCDE) en un vector de expresión pPRO33 (Patente de los Estados Unidos No. 8178338 B2; 15 de mayo de 2012; Keasling, Jay) (o pPRO43, pPR0430, pPR0430(CloDF13), pPRO44 o pPRO45) en una célula huésped de E. coli que alberga las alteraciones genómicas apropiadas que permiten una expresión homogéneamente inducible. De esta manera, puede lograrse un control estricto y la optimización de la expresión de cada componente de un producto multimérico para el uso en varias aplicaciones de coexpresión. En esta modalidad, la célula huésped (1) es la bacteria Gram-negativa Escherichia coli, comúnmente usado en la técnica para la expresión de proteínas. El genoma huésped (2) es el genoma del organismo de la célula huésped con mutaciones u otras alteraciones que facilitan la coexpresión de proteínas inducible de manera homogénea, que incluye la expresión de una forma citoplasmática de la disulfuro isomerasa DsbC que carece de un péptido señal. En una modalidad, las alteraciones genómicas incluyen tanto una mutación de desactivación génica del operón araBAD, y cualquier expresión de los promotores constitutivos araE y araFGH, o una mutación puntual en el gen lacY (A117C) en un fondo deficiente en araEFGH, para facilitar la inducción homogénea de promotores ara basados en plásmidos con L-arabinosa aplicada exógenamente, y también un gen del metabolismo del propionato inactivado, el prpD, para facilitar la inducción homogénea de promotores de propionato basados en plásmidos con propionato aplicado de forma exógena, que se convierte en 2-metilcitrato en vivo. Otras alteraciones genómicas que son útiles para el sistema de coexpresión inducible y que pueden introducirse en la célula huésped incluyen, pero no se limitan a: la inactivación dirigida del operón scpA-argK-scpBC, para reducir la expresión de fondo del promotor prpBCDE; la expresión del regulador transcripcional (prpR) para la fuente de carbono menos preferida (propionato) de un promotor inducible por L-arabinosa como el promotor araBAD, y/o una función génica eliminada o reducida para los genes implicados en el sistema CCR, tales como err y/o ptsG, para evitar la supresión por el sistema CCR de la inducción por propionato en presencia de L-arabinosa; las reducciones en el nivel de función del gen para la glutatión reductasa (gor) o glutatión sintetasa (gshB), junto con la tiorredoxina reductasa (trxB), y/o la expresión de la sulfhidrilo oxidasa mitocondrial de levadura Ervlp en el citoplasma de la célula huésped, para proporcionar un entorno reductor menos fuerte en el citoplasma de la célula huésped y promover la formación de enlaces disulfuro; los niveles aumentados de expresión, como por ejemplo de un promotor constitutivo fuerte, de proteínas chaperonas tales como DnaK/DnaJ/GrpE, DsbC/DsbG, GroEL/GroES, IbpA/lbpB, Skp, Tig (factor desencadenante) y/o FkpA; y otras mutaciones para reducir la actividad de la proteasa endógena (como la de las proteasas Lon y OmpT) y las actividades de la recombinasa.
Como se muestra en la Figura 2, se mantienen dos vectores de expresión compatibles (3, 4) en la célula huésped para permitir la expresión simultánea (coexpresión) de dos productos génicos diferentes. En esta modalidad, un vector de expresión ("vector de expresión inducido por L-arabinosa") contiene un promotor inducido por L-arabinosa y es similar o idéntico a pBAD o plásmidos relacionados en los que el promotor araBAD dirige la expresión de una secuencia de expresión insertada clonada en el sitio de clonación múltiple (MCS). El vector de expresión inducido por L-arabinosa también contiene una secuencia codificante para un gen de resistencia a antibióticos (tal como el gen Tn3 bla que codifica beta-lactamasa y confiere resistencia a la ampicilina, o un gen que codifica aminoglucósido 3'-fosfotransferasa y confiere resistencia a la kanamicina) para facilitar la selección de las células huésped (colonias bacterianas) que contienen un vector de expresión intacto. Se requiere un origen de replicación (ORI) para la propagación del plásmido dentro de las células huésped bacterianas. El plásmido de expresión inducida por L-arabinosa también contiene una secuencia polinucleotídica que codifica araC, un regulador transcripcional que permite la inducción por L-arabinosa del promotor araBAD y a través de la represión transcripcional reduce la expresión de fondo 'permeable' en el estado no inducido. El otro vector de expresión ("vector de expresión inducido por propionato") es similar o idéntico a pPRO o plásmidos relacionados, en los que un promotor inducido por propionato dirige la expresión de una secuencia de expresión insertada clonada en el sitio de clonación múltiple (MCS). El plásmido también contiene una secuencia codificante para un gen de resistencia a los antibióticos (como el gen cat, que codifica la cloranfenicol acetiltransferasa, que confiere resistencia al cloranfenicol) para facilitar la selección de las células huésped que contienen un vector de expresión intacto. Se requiere un origen de replicación (ORI) para la propagación del plásmido dentro de las células huésped bacterianas. Además, el vector de expresión inducido por propionato contiene una secuencia polinucleotídica que codifica prpR, un regulador transcripcional que permite la inducción por propionato (2-metilcitrato) del promotor prpBCDE y reduce la expresión de fondo 'permeable' en el estado no inducido. Para facilitar la valoración separada de la inducción, la compatibilidad de los plásmidos y la copropagación de los vectores de expresión, es útil que los vectores de expresión contengan promotores que respondan a diferentes inductores, orígenes de replicación compatibles y diferentes marcadores de resistencia a antibióticos. El pBAD24 (pMB1 o 'pBR322' ORI, AmpR) o un vector de expresión relacionado tal como pBAD240 (pMB1 ORI, KanR) que contiene un promotor araBAD /nducible por L-arabinosa puede combinarse en una célula huésped con pPRO33, pPRO43, pPRO430 o un vector de expresión relacionado (p15A ORI, CmR) que contiene un promotor prpBCDE inducible por propionato.
Los vectores de expresión compatibles que contienen un promotor prpBCDE inducible por propionato como pPRO430 (CloDF13), pPRO44 (RSF1030 OrI) o pPRO45 (CloDF13) también pueden usarse en combinación con los vectores de expresión que contienen el promotor ara-BAD (pMB1 ORI). Los vectores de expresión se propagan conjuntamente y se mantienen mediante el uso de un medio de crecimiento suplementado con los antibióticos apropiados: ampicilina, cloranfenicol y/o kanamicina. En una modalidad, un vector de expresión comprende una secuencia polinucleotídica que codifica la cadena pesada de un anticuerpo de longitud completa, y el otro vector de expresión comprende una secuencia polinucleotídica que codifica la cadena ligera de un anticuerpo de longitud completa, cada secuencia codificante clonada en marco en el MCS del respectivo vector de expresión. Para la producción de ciertos productos génicos, tales como los anticuerpos, la optimización de la secuencia codificante para el organismo huésped (que incluye el ajuste del sesgo de codones y el contenido de GC, entre otras consideraciones) determinará las secuencias codificantes que se insertarán en las construcciones de expresión del sistema de coexpresión.
De vuelta a Figura 2, la coexpresión de productos génicos se induce mediante metabolitos químicos económicos aplicados exógenamente, L-arabinosa y propionato (5). El nivel de inducción de la expresión de cada producto génico se valora independientemente con su propio inductor químico, lo que facilita de esta manera la optimización de la coexpresión de proteínas. Esto es útil para la expresión de complejos de proteínas y proteínas que requieren un compañero de unión para la estabilización, y puede facilitar la expresión de proteínas que de cualquier otra manera serían difíciles de expresar, como aquellas con baja solubilidad o toxicidad celular. En este ejemplo, tras la inducción, las cadenas pesada y corta del anticuerpo se expresan por separado, luego las proteínas se unen y forman puentes disulfuro entre cadenas (dentro del citoplasma del huésped bacteriano) lo que permite la formación y estabilización del anticuerpo de longitud completa compuesto de las cadenas pesadas y ligeras. Las proteínas pueden dirigirse a varios compartimentos del organismo huésped. Por ejemplo, en E. col/ la proteína puede expresarse en el citoplasma, la membrana celular, el periplasma o secretarse en el medio. Después de un tiempo de incubación apropiado, se recolectan las células y los medios, y se extrae la proteína total, que incluye los productos génicos coexpresados (6). Después de la extracción, el producto deseado puede purificarse mediante el uso de varios métodos bien conocidos en la técnica en dependencia de la naturaleza de los productos génicos producidos en el sistema de coexpresión (por ejemplo, cromatografía líquida). En el ejemplo que se muestra en la Figura 2, el producto multimérico (anticuerpo de longitud completa) se extrae y purifica mediante el uso de métodos cromatográficos. El anticuerpo intacto purificado se visualiza en un gel no desnaturalizante mediante el uso de técnicas estándar, que incluyen colorantes de unión a proteínas o inmunohistoquímica. El producto del anticuerpo de longitud completa puede usarse luego para una serie de aplicaciones de investigación, diagnóstico u otras.
La Figura 4 muestra una representación esquemática similar a la que se muestra en la Figura 2, con un promotor inducible por arabinosa (3), un promotor inducible por propionato (4) y secuencias codificantes para las cadenas ligera y pesada del anticuerpo presentes en el mismo vector de expresión. También es posible expresar la cadena pesada del anticuerpo del promotor inducible por propionato y la cadena ligera del anticuerpo del promotor inducible por arabinosa.
Productos Fabricados por los Métodos de la Invención
Existe una amplia versatilidad en la utilización de los sistemas de coexpresión inducibles de la presente invención en numerosas aplicaciones de coexpresión y en las propiedades de los productos.
Glicosilación. Los productos génicos coexpresados por los métodos de la invención pueden estar glicosilados o no glicosilados. En una modalidad de la invención, los productos génicos coexpresados son polipéptidos. Los polipéptidos glicosilados son polipéptidos que comprenden un grupo glucosilo unido covalentemente e incluyen polipéptidos que comprenden todos los grupos glucosilo normalmente unidos a residuos particulares de ese polipéptido (polipéptidos completamente glicosilados), polipéptidos parcialmente glicosilados, polipéptidos con glicosilación en uno o más residuos donde la glicosilación no ocurren normalmente (glucosilación modificada) y polipéptidos glicosilados con al menos un grupo glucosilo que difiere en estructura del grupo glucosilo normalmente unido a uno o más residuos específicos (glucosilación modificada). Un ejemplo de glicosilación modificada es la producción de polipéptidos "desfucosilados" o "deficientes en fucosa", polipéptidos que carecen de fragmentos fucosilados en los grupos glicosilo unidos a ellos, mediante la expresión de polipéptidos en células huésped que carecen de la capacidad de fucosilar polipéptidos. Los polipéptidos no glicosilados son polipéptidos que no comprenden un grupo glucosilo unido covalentemente. Un polipéptido no glicosilado puede ser el resultado de la desglicosilación de un polipéptido o de la producción de un polipéptido aglicosilado. Los polipéptidos desglicosilados pueden obtenerse mediante la desglicosilación enzimática de polipéptidos glicosilados, mientras que los polipéptidos aglicosilados pueden producirse mediante la expresión de polipéptidos en células huésped que no tienen la capacidad de glicosilar polipéptidos, como las células procariotas o las células en las que la función de al menos una enzima de la glicosilación ha sido eliminada o reducida. En una modalidad particular, los polipéptidos coexpresados se aglicosilan, y en una modalidad más específica, los polipéptidos aglicosilados se coexpresan en células procariotas tales como E. coli.
Otras modificaciones de productos génicos. Los productos génicos coexpresados por los métodos de la invención pueden unirse covalentemente a otros tipos de moléculas. Los ejemplos de moléculas que pueden unirse covalentemente a productos génicos coexpresados, sin limitar el alcance de la invención, incluyen polipéptidos (tales como receptores, ligandos, citoquinas, factores de crecimiento, hormonas polipeptídicas, dominios de unión a ADN, dominios de interacción de proteínas tales como dominios PDZ, dominios de quinasa, anticuerpos y fragmentos de cualquiera de dichos polipéptidos); polímeros solubles en agua (como polietilenglicol (PEG), carboximetilcelulosa, dextrano, alcohol polivinílico, polioles polioxietilados (como glicerol), polietilenglicol pro-ionaldehído y compuestos similares, derivados o mezclas de los mismos); y agentes citotóxicos (tales como agentes quimioterapéuticos, agentes inhibidores del crecimiento, toxinas (tales como toxinas enzimáticamente activas de origen bacteriano, fúngico, vegetal o animal, o fragmentos de las mismas) e isótopos radiactivos).
Además, los productos génicos que se coexpresarán mediante los métodos de la invención pueden diseñarse para incluir fragmentos moleculares que ayuden en la purificación y/o detección de los productos génicos. Muchos de estos fragmentos se conocen en la técnica; como ejemplo, puede diseñarse un producto génico polipeptídico para incluir una secuencia "marcadora" de polihistidina - una secuencia de seis o más histidinas, preferentemente de seis a diez residuos de histidina, y con la máxima preferencia seis histidinas - en su extremo N o C. La presencia de una secuencia de polihistidina en el extremo de un polipéptido permite que se una a un medio de afinidad basado en cobalto o níquel y se separe de otros polipéptidos. La secuencia marcadora de polihistidina puede eliminarse mediante exopeptidasas. Como otro ejemplo, las secuencias de proteínas fluorescentes pueden expresarse como parte de un producto génico polipeptídico, con la secuencia de aminoácidos para la proteína fluorescente añadida preferentemente en el extremo N o C terminal de la secuencia de aminoácidos del producto génico polipeptídico. La proteína de fusión resultante emite fluorescencia cuando se expone a la luz de ciertas longitudes de onda, lo que permite detectar visualmente la presencia de la proteína de fusión. Una proteína fluorescente bien conocida es el proteína verde fluorescente de Aequorea victoria, y muchas otras proteínas fluorescentes están disponibles comercialmente, junto con las secuencias de nucleótidos que las codifican.
Anticuerpos. En una modalidad de la invención, los productos génicos coexpresados son anticuerpos. El término 'anticuerpo' se usa en el sentido más amplio e incluye específicamente anticuerpos 'nativos', anticuerpos totalmente humanos, anticuerpos humanizados, anticuerpos quiméricos, anticuerpos multiespecíficos (como los anticuerpos biespecíficos), anticuerpos monoclonales, anticuerpos policlonales, fragmentos de anticuerpos y otros polipéptidos derivados de anticuerpos que son capaces de unirse al antígeno. A menos que se indique de cualquier otra manera en la presente descripción, la numeración de los residuos en una cadena pesada de inmunoglobulina ('numeración EU') es la del índice EU (la numeración de residuos del anticuerpo EU lgG1 humano) como en Kabat y otros, Sequences of Proteins of Immunological Interest, quinta edición, 1991, Instituto Nacional de Salud, Bethesda, Maryland.
Los anticuerpos "nativos" son generalmente glicoproteínas heterotetraméricas de aproximadamente 150000 daltons, compuestas por dos cadenas ligeras (L) idénticas y dos cadenas pesadas (H) idénticas. Cada cadena ligera está unida a una cadena pesada por un enlace disulfuro covalente, mientras que el número de enlaces disulfuro entre cadenas varía entre las cadenas pesadas de diferentes isotipos de inmunoglobulina. Cada cadena pesada y ligera también tiene puentes disulfuro intracatenarios regularmente espaciados. Cada cadena pesada tiene en su extremo N-terminal un dominio variable (Vh) seguido de una serie de dominios constantes. Cada cadena ligera tiene un dominio variable en su extremo N-terminal (Vl) y un dominio constante en su extremo C-terminal; el dominio constante de la cadena ligera se alinea con el primer dominio constante de la cadena pesada y el dominio variable de la cadena ligera se alinea con el dominio variable de la cadena pesada. El término "variable" se refiere al hecho de que ciertas porciones de los dominios variables difieren ampliamente en la secuencia entre los anticuerpos y se usan en la unión y especificidad de cada anticuerpo particular por un antígeno. Sin embargo, la variabilidad no se distribuye uniformemente en los dominios variables de los anticuerpos. Se concentra en tres segmentos denominados regiones hipervariables (HVR), tanto en los dominios variables de cadena ligera como de cadena pesada. Las porciones más altamente conservadas de los dominios variables se denominan regiones marco (FR). Los dominios variables de las cadenas pesada y ligera nativas comprenden cada uno cuatro regiones FR, conectadas por tres HVR, y con las HVR de la otra cadena, contribuyen a la formación del sitio de unión al antígeno de los anticuerpos.
El término "región Fc" se refiere a una región C-terminal de una cadena pesada de inmunoglobulina e incluye regiones Fc nativas y regiones Fc variantes. Aunque los límites de la región Fc de una cadena pesada de inmunoglobulina pueden variar, la región Fc de la cadena pesada de IgG humana puede definirse para que se extienda desde un residuo de aminoácido en la posición Cys226, o desde Pro230, hasta el extremo carboxilo terminal del mismo. Alternativamente, la región Fc puede definirse para que se extienda desde el residuo N-terminal (Ala231) del dominio de inmunoglobulina Ch2 conservado al extremo C-terminal, y puede incluir múltiples dominios conservados como Ch2, Ch3 y Ch4. La lisina C-terminal (residuo 447 de acuerdo con el sistema de numeración de la UE) de la región Fc nativa puede eliminarse, por ejemplo, durante la producción o purificación del anticuerpo, o mediante ingeniería recombinante del ácido nucleico que codifica una cadena pesada del anticuerpo. En consecuencia, una composición de anticuerpos intactos puede comprender poblaciones de anticuerpos con todos los residuos de K447 eliminados, poblaciones de anticuerpos sin residuos de K447 eliminados y poblaciones de anticuerpos que tienen una mezcla de anticuerpos con y sin el residuo de K447. La región Fc de un anticuerpo es crucial para el reclutamiento de células inmunológicas y la citotoxicidad dependiente de anticuerpos (ADCC). En particular, la naturaleza de la respuesta ADCC provocada por los anticuerpos depende de la interacción de la región Fc con los receptores (FcR) ubicados en la superficie de muchos tipos de células. Los seres humanos contienen al menos cinco clases diferentes de receptores Fc. La unión de un anticuerpo a los FcR determina su capacidad para reclutar otras células inmunológicas y el tipo de célula reclutada. Por tanto, la capacidad de diseñar anticuerpos con regiones Fc modificadas que pueden reclutar solo ciertos tipos de células puede ser de importancia crítica para la terapia (solicitud de patente de los Estados Unidos No. 20090136936 A1, 28-05-2009, Georgiou, George). Los anticuerpos nativos producidos por células de mamífero típicamente comprenden un oligosacárido biantenario ramificado que generalmente se une mediante un enlace N a Asn297 del dominio CH2 de la región Fc. En determinadas modalidades, los anticuerpos producidos por los métodos de la invención no están glicosilados o están aglucosilados, por ejemplo, debido a una sustitución en el residuo 297 de la región Fc, o a la expresión en una célula huésped que no tiene la capacidad de glicosilar polipéptidos. Debido a las respuestas ADCC modificadas, los anticuerpos no glicosilados pueden estimular un nivel más bajo de respuestas inflamatorias, tales como la neuroinflamación. Además, dado que un anticuerpo que tiene una región Fc aglicosilada tiene una afinidad de unión muy baja por los receptores Fc, dichos anticuerpos no se unirían al gran número de células inmunitarias que portan estos receptores. Esta es una ventaja significativa ya que reduce la unión no específica y también aumenta la vida media del anticuerpo in vivo, lo que hace que este atributo sea muy beneficioso en la terapéutica.
Los términos 'anticuerpo de longitud completa', 'anticuerpo intacto' y 'anticuerpo completo' se usan indistintamente para referirse a un anticuerpo en su forma 'nativa' sustancialmente intacta, no a fragmentos de anticuerpo como se define más abajo. Los términos se refieren particularmente a un anticuerpo con cadenas pesadas que comprenden cada una un dominio variable y una región Fc. Los 'fragmentos de anticuerpo' comprenden una porción de un anticuerpo intacto, que comprende preferentemente la región de unión al antígeno del mismo. Los ejemplos de fragmentos de anticuerpos incluyen Fab, Fab', F (ab')2, Fc, Fd y Fv; diacuerpos; anticuerpos lineales; moléculas de anticuerpos de cadena sencilla tales como scFv; y anticuerpos multiespecíficos formados a partir de fragmentos de anticuerpos.
Un 'anticuerpo humano' es aquel que posee una secuencia de aminoácidos correspondiente a la de un anticuerpo producido por un ser humano. Un anticuerpo 'quimérico' es aquel en el que una porción de la cadena pesada y/o ligera es idéntica o comparte un cierto grado de identidad de secuencia de aminoácidos con las secuencias correspondientes en anticuerpos derivados de una especie en particular o que pertenecen a una clase o subclase particular de anticuerpo, mientras que el resto de la(s) cadena(s) es idéntica o comparte un cierto grado de identidad de secuencia de aminoácidos con las secuencias correspondientes en anticuerpos derivados de otra especie o que pertenecen a otra clase o subclase de anticuerpos, así como también fragmentos de tales anticuerpos. Un anticuerpo 'humanizado' es un anticuerpo quimérico que contiene residuos de aminoácidos mínimos derivados de moléculas de inmunoglobulina no humana. En una modalidad, un anticuerpo humanizado es una inmunoglobulina humana (anticuerpo receptor) en la que los residuos de HVR del anticuerpo receptor se reemplazan por residuos de una inmunoglobulina HVR de una especie no humana (anticuerpo donante) como ratón, rata, conejo o primate no humano. En algunos casos, los residuos de FR del anticuerpo receptor humano se reemplazan por residuos no humanos correspondientes. Además, los anticuerpos humanizados pueden comprender residuos que no se encuentran en el anticuerpo del receptor o en el anticuerpo del donante. El término "anticuerpo monoclonal" se refiere a un anticuerpo obtenido a partir de una población de anticuerpos sustancialmente homogéneos, en el sentido de que los anticuerpos individuales que comprende la población son idénticos excepto por posibles mutaciones, tales como mutaciones naturales, que pueden estar presentes en cantidades menores. Por lo tanto, el modificador 'monoclonal' indica que el carácter del anticuerpo no es una mezcla de anticuerpos discretos. Por el contrario de las preparaciones de anticuerpos policlonales, que típicamente incluyen diferentes anticuerpos dirigidos contra diferentes determinantes (epítopos), cada anticuerpo monoclonal de una preparación de anticuerpos monoclonales está dirigido contra el mismo determinante único en un antígeno. Además de su especificidad, las preparaciones de anticuerpos monoclonales son ventajosas porque típicamente no están contaminadas por otras inmunoglobulinas.
La "afinidad de unión" de una molécula tal como un anticuerpo generalmente se refiere a la fuerza de la suma total de interacciones no covalentes entre un solo sitio de unión de una molécula y su compañero de unión (tal como un anticuerpo y el antígeno al que se une). A menos que se indique de cualquier otra manera, "afinidad de unión" se refiere a la afinidad de unión intrínseca que refleja una interacción 1:1 entre miembros de un par de unión (como anticuerpo y antígeno). La afinidad de una molécula X por su pareja Y puede representarse generalmente por la constante de disociación (Kd). Los anticuerpos de baja afinidad (Kd más alta) generalmente se unen al antígeno lentamente y tienden a disociarse fácilmente, mientras que los anticuerpos de alta afinidad (Kd más baja) generalmente se unen al antígeno más rápido y tienden a permanecer unidos por más tiempo. Se conocen en la técnica una variedad de formas de medir la afinidad de unión, cualquiera de las cuales puede usarse para los fines de la presente invención. En el Ejemplo 8 se describen métodos ilustrativos específicos para medir la afinidad de unión. Los anticuerpos y fragmentos de anticuerpos producidos y/o usados en los métodos de la invención tienen preferentemente afinidades de unión de menos de 100 nM, con mayor preferencia tienen afinidades de unión de menos de 10 nM y con la máxima preferencia tienen afinidades de unión de menos de 2 nM, según lo medido por un ensayo de resonancia de plasmón de superficie como se describe en el Ejemplo 8.
Anticuerpos (secundarios) que reconocen anticuerpos aglicosilados. La producción de anticuerpos en sistemas de expresión basados en E. coli u otros procariotas sin enzimas de glicosilación producirá generalmente anticuerpos aglucosilados, que pueden usarse como anticuerpos primarios. Además de usar los sistemas de coexpresión inducibles de la invención para producir anticuerpos primarios aglicosilados, los sistemas de coexpresión inducibles de la invención también pueden usarse para producir eficazmente anticuerpos secundarios que reconozcan específicamente anticuerpos primarios aglicosilados. Se describe en la presente un sistema de anticuerpos secundarios capaz de detectar un anticuerpo primario no glicosilado o aglucosilado con fines de investigación, analíticos, de diagnóstico o terapéuticos. Como ejemplo, se proporciona un sistema de anticuerpos secundarios con los siguientes componentes: epítopo, anticuerpo primario, anticuerpo secundario y sistema de detección. El epítopo es una porción de un antígeno (generalmente una proteína) que es el determinante antigénico que produce una respuesta inmunológica cuando se introduce en un animal vivo o es reconocible de cualquier otra manera por un anticuerpo. En la práctica, el epítopo de interés puede estar presente dentro de una mezcla o un tejido. En una modalidad, el epítopo es una proteína expresada en células de carcinoma en tejido humano. El anticuerpo primario es un fragmento de anticuerpo, un solo anticuerpo de longitud completa (monoclonal) o una mezcla de diferentes anticuerpos de longitud completa (policlonal), que reconoce y se une al epítopo, y preferentemente se une específicamente al epítopo. Un anticuerpo de longitud completa en este ejemplo comprende dos cadenas polipeptídicas pesadas y dos cadenas polipeptídicas ligeras unidas por puentes disulfuro. Cada una de las cadenas comprende una región constante (Fc) y una región variable (Fv). Hay dos sitios de unión al antígeno en el anticuerpo de longitud completa. El anticuerpo primario puede ser un anticuerpo aglicosilado de longitud completa (tal como el que se produce en un sistema de expresión basado en E. coli) que reconoce y se une a un epítopo de interés. El anticuerpo secundario es un fragmento de anticuerpo, un único anticuerpo de longitud completa (monoclonal) o una mezcla de diferentes anticuerpos de longitud completa (policlonal), que reconoce y se une al anticuerpo primario aglucosilado y, preferentemente, se une específicamente al anticuerpo primario aglucosilado. El anticuerpo secundario puede ser un anticuerpo de longitud completa que reconozca y se una a la porción Fc aglicosilada de un anticuerpo primario de longitud completa. En este caso, los sitios de unión del anticuerpo se seleccionan y/o modifican genéticamente para reconocer específicamente la porción Fc del anticuerpo primario aglicosilado, con o sin el residuo de lisina C-terminal. En otras modalidades, el anticuerpo secundario podría modificarse genéticamente para reconocer regiones adicionales (epítopos) del anticuerpo primario aglicosilado, o epítopos modificados genéticamente adicionales que incluyen, pero no se limitan a, secuencias polipeptídicas unidas covalentemente al anticuerpo primario. El anticuerpo secundario puede dirigirse a sitios únicos o múltiples (epítopos) presentes en moléculas de anticuerpos aglicosilados de longitud completa (que incluyen varias clases de inmunoglobulinas como IgG, IgA, etc.) o fragmentos de anticuerpos como Fc o Fab. Por lo tanto, algunos anticuerpos secundarios generados de esta manera tendrían una amplia especificidad por cualquier anticuerpo de longitud completa aglicosilado. Los anticuerpos primarios y secundarios también pueden incluir aquellos producidos por métodos tradicionales (producción de anticuerpos policlonales mediante el uso de conejos inmunizados o producción de anticuerpos monoclonales mediante el uso de hibridomas de ratón) y tecnología de ADN recombinante tal como los métodos de presentación en fagos para identificar polipéptidos de unión a antígeno.
Los sistemas de detección generalmente comprenden un agente que está unido o que se une al anticuerpo secundario, lo que permite la detección, visualización y/o cuantificación del anticuerpo secundario. En la técnica se conocen bien varios sistemas de detección que incluyen, pero no se limitan a, colorantes fluorescentes, enzimas, isótopos radiactivos o metales pesados. Estos pueden implicar o no la unión física directa de polipéptidos adicionales al anticuerpo secundario. Las aplicaciones de este sistema de anticuerpos secundarios incluyen, pero no se limitan a, inmunohistoquímica, transferencia Western y ensayo inmunoabsorbente ligado a enzimas (ELISA). Por ejemplo, en una modalidad para el uso en inmunohistoquímica, el epítopo de interés estaría presente en una sección delgada de tejido, luego se aplicaría al tejido un anticuerpo primario aglicosilado y se permitiría que se uniera al epítopo. El anticuerpo primario no unido se eliminaría y luego se aplicaría al tejido un anticuerpo secundario capaz de unirse específicamente al anticuerpo primario aglicosilado y se permitiría que se una al anticuerpo primario. El anticuerpo secundario no unido se eliminaría y luego se aplicarían los reactivos del sistema de detección. Por ejemplo, si el anticuerpo secundario estuviera unido a una enzima, entonces se aplicarían sustratos enzimáticos colorigénicos al tejido y se dejaría que reaccionaran. A continuación, podría realizarse una visualización microscópica o fluoroscópica directa de los sustratos enzimáticos reactivos. Otros métodos de detección se conocen bien en la técnica. Las ventajas de un sistema mediante el uso de anticuerpos secundarios que reconocen anticuerpos aglicosilados incluyen, pero no se limitan a, las siguientes: 1) una mayor especificidad en la inmunohistoquímica porque el anticuerpo secundario está diseñado para unirse a la porción Fc aglicosilada del anticuerpo primario que de cualquier otra manera no estaría presente en los tejidos eucariotas; 2) la disminución de la tinción de fondo debido a una mayor especificidad por el anticuerpo primario; 3) la disminución del costo de producción del sistema de anticuerpos secundarios porque los anticuerpos primarios y/o secundarios pueden generarse en procariotas tales como E. coli', y 4) evitar la utilización innecesaria de mamíferos, que incluyen ratones y conejos, porque todo el proceso de desarrollo de anticuerpos puede realizarse en procariotas tales como E. coli.
Enzimas usadas en aplicaciones industriales. Muchos procesos industriales utilizan enzimas que pueden producirse mediante los métodos de la invención. Estos procesos incluyen el tratamiento de aguas residuales y otros procesos de biorremediación y/o desintoxicación; blanqueo de materiales en las industrias papelera y textil; y la degradación de la biomasa en material que puede fermentarse eficientemente en biocombustibles. En muchos casos sería conveniente producir enzimas para estas aplicaciones en células huésped microbianas o preferentemente en células huésped bacterianas, pero la enzima activa es difícil de expresar en grandes cantidades debido a problemas con el plegamiento de la enzima y/o la necesidad de un cofactor. En determinadas modalidades de la invención, los métodos de coexpresión inducible de la invención se usan para producir enzimas con aplicaciones industriales, tales como enzimas que utilizan arabinosa y xilosa (por ejemplo, xilosa isomerasa (EC 5.3.1.5)) o peroxidasas que degradan la lignina (por ejemplo, peroxidasa de lignina (EC 1.11.1.14), peroxidasa de manganeso (EC 1.11.1.13), peroxidasa versátil (EC 1.11.1.16) o lacasa (EC 1.10.3.2)).
Ejemplo 1
Introducción de alteraciones genómicas en las células huésped para facilitar la coexpresión
Como se describió anteriormente, ciertos cambios en la expresión génica de la célula huésped pueden mejorar la coexpresión del o de los productos génicos deseados. Ciertas células huésped, las células E. coli ASE(dGh ), se derivaron de las células E. coli SHuffle® Express y su genotipo pueden expresarse como: E. coli SHuffle® Express AaraBAD Asbm-ygfDGH AaraEp:.J23104. Las células ASE(DGH) de E. coli se produjeron de la siguiente manera: se realizaron deleciones y alteraciones en el genoma de la célula huésped E. coli SHuffle® Express mediante el uso del método de recombinación Gene Bridges GmbH (Heidelberg, Alemania), descrito como deleción por contraselección, que elimina sin problemas las secuencias genómicas. Se realizó una deleción del operón araBAD de la célula huésped para reducir el catabolismo de arabinosa por parte de la célula huésped, de modo que más inductor de arabinosa esté disponible para la inducción de un producto génico coexpresado a partir de una construcción de expresión que comprende el promotor araBAD. Esta deleción elimina 4269 pares de bases del operón araBAD, correspondientes a la posición 70,135 a 65,867 (hebra negativa) del genoma de la E. coli (las posiciones dentro de las secuencias de nucleótidos genómicos se dan como en la Tabla 1), de modo que la mayoría del promotor nativo araBAD se elimina a través de todos menos unos pocos codones de la región codificante de AraD. La secuencia de nucleótidos (hebra negativa) alrededor de la unión de deleción (posición 70,136 | posición 65,866) es: TTAT | TACG. Se hizo otra deleción dentro del operón sbm-ygfDGH (también llamado scpA-argK-scpBC), al eliminar la función de los genes involucrados en la biosíntesis de 2-metilcitrato, para aumentar la sensibilidad de la promoción inducible por propionato de la célula huésped al propionato suministrado exógenamente. La deleción del sbm-ygfDGH elimina 5542 pares de bases (posición 3,058,754 a 3,064,295 del genoma de la E. coli), al sacar al promotor sbm- ygfDGH y a todo el operón excepto el último codón de la secuencia codificante de ygfH, dejando la secuencia adyacente al ygfl codificante y codón de terminación intactos. La secuencia de nucleótidos (hebra positiva) alrededor de la unión de deleción (posición 3,058,753 | posición 3,064,296) es: ACAA | GGGT. Además de estas deleciones hechas en el genoma de la célula huésped E. coli SHuffle® Express, el Gene Bridges GmbH introdujo una mutación puntual en la secuencia codificante del gen rpsL del genoma, que se extiende en la hebra negativa desde la posición 3,472,574 hasta la 3,472,200, que cambia la A en la posición 3,472,447 por una G, con la alteración del codón para Lys43 a un codón para Arg, lo que da como resultado un fenotipo resistente a la estreptomicina cuando se expresa el gen mutante rpsL-Arg43. Otra alteración del genoma de la célula huésped, que permite una expresión inducible más estrictamente controlada como se describió anteriormente, es hacer que el promotor araE sea constitutivo en lugar de sensible a la arabinosa. La mayor parte del promotor araE nativo, que incluyen los sitios de unión de CRP-cAMP y AraC, se eliminó al eliminar 97 pares de bases (posición 2,980,335 a 2,980,239 (hebra negativa)) y reemplazar esa secuencia con la secuencia de 35 pares de bases del promotor constitutivo J23104 (SEQ ID NO:1; la secuencia de nucleótidos de J23104 se obtuvo del sitio web partsregistry.org, parts.igem.org/Main_Page). Las secuencias resultantes del sitio de unión dentro del promotor araE alterado son: TGAA | TTGA... TAGC | TTCA.
El genotipo de E.coli ASE (DGH), una cepa que también se llama EB0001, puede expresarse como: AaraBAD fhuA2 [Ion] ompT ahpCA gal Aatt::pNEB3-rl-cDsbC (Spec, locl) AtrxB sulA11 R(mcr-73’. :miniTn10-Tets)2 [dcm] R(zgb-210::Tn10--Tets) AaraEp::J23104 AscpA-argK-scpBC endAI rpsL-Arg43 Agor A (mcrC-mrr)114:: IS10
La cepa EB0002 tiene un genotipo que puede expresarse como EB0001 prpd, o como:
AaraBAD fhuA2 AprpD [Ion] ompT ahpCA gal Aatt::pNEB3-r1-cDsbC (Spec, lacl) AtrxB sulA11 R(mcr-73::miniTn10--Tets)2 [dcm] R(zgb-2l0::Tn10--Tets) AaraEp::J23l04 AscpA-argK-scpBC endA1 rpsL-Arg43 Agor A(mcrC- mrr) 114::IS10
Una célula huésped de E. coli, tal como la célula huésped E. coli SHuffle® Express o una célula EB0001 o una célula EB0002, con cualquiera de estas alteraciones genómicas, o cualquier combinación de ellas, pueden emplearse en la coexpresión inducible de productos génicos.
Ejemplo 2
Vectores de expresión que comprenden un promotor inducible
A. Vector de expresión pPRO43
El vector de expresión pPRO43 (SEQ ID NO:2) se usa para expresar productos génicos de interés del promotor prpBCDE inducible del propionato, y se construyó con referencia a la secuencia de nucleótidos del vector de expresión pPRO33. La secuencia de nucleótidos de pPRO33 se compiló a partir de las secuencias del vector pBAD18 (número de acceso de GenBank X81838.1), la secuencia genómica de la región del prpR-PprpB de E. coli, y el vector pBAD33, como se describe en Guzman y otros, "Tight regulation, modulation, and high-level expression by vectors containing the arabinose PBAD promoter", J Bacteriol julio de 1995; 177(14): 4121-4130, y en la Patente de Estados unidos No. 8178338 B2; 15 de mayo de 2012; Keasling, Jay. La secuencia de nucleótidos de pPRO33 se confirmó mediante secuenciación y se proporciona en la SEQ ID NO:3.
En el pPRO43, la secuencia de nucleótidos que codifica el activador transcripcional prpR se ha optimizado para su expresión en E. coli por DNA2.0 (Menlo Park, CA) mediante el uso de métodos como los descritos en Welch y otros, "Design parameters to control synthetic gene expression in Escherichia coli", PLoS One 14 de septiembre del 2009; 4(9): e7002; doi: 10.1371 /journal.pone.0007002. Las secuencias de prpR optimizadas en pPRO43 incluyen RBS y otras secuencias aguas arriba de la secuencia codificante de prpR, que son los nucleótidos 1593 a 7 de la SEQ iD NO:2, en la hebra opuesta a la que se muestra. El vector pPRO43 también tiene solo un sitio de restricción para HindlII, que se encuentra en el sitio de clonación múltiple (MCS), por el contrario del pPRO33 que tiene dos sitios para HindlII, uno en el MCS y un segundo en la secuencia codificante de prpR.
B. Vectores de expresión pPRO430 y pPRO430(CloDF13)
El vector de expresión pPRO430 (SEQ ID NO:4) fue sintetizado por DNA2.0, basado en la secuencia de nucleótidos del pPRO43 (SeQ ID NO:2). El vector pPRO430 es similar a pPRO43 en que ambos contienen el origen de replicación p15, un gen que confiere resistencia al cloranfenicol (CmR), la secuencia codificante de prpR optimizada para la expresión en E. coli descrito anteriormente, y un sitio de clonación aguas abajo del promotor prpBCDE inducible por propionato en el que puede insertarse una secuencia codificante. El vector de expresión pPRO430 difiere del ppRo43 en que tiene una secuencia RBS optimizada -AGGAGGAAAACATA (nucleótidos 3566 - 3579 de la SEQ ID NO:4) - aguas arriba del sitio de clonación. El vector de expresión pPRO430 también se ha simplificado con relación al pPRO43 mediante la eliminación de algunas secuencias de nucleótidos y el uso de terminadores más cortos, con el resultado de que la secuencia de nucleótidos de pPRO430 (SEQ ID NO:4) tiene solo 3698 bases, en comparación con la secuencia de nucleótidos del pPRO43 (SEQ ID NO:2) en 5883 bases. El vector de expresión pPRO430(CloDF13) (SEQ ID NO:5) es idéntico al pPRo430 excepto que el origen de replicación p15 en el pPRO430, flanqueado por sitios de restricción BfuAI, se reemplaza por el origen de replicación CloDF13 con mayor número de copias en el pPRO430(CloDF13).
C. Vector de expresión pBAD240
El vector de expresión pBAD240 (SEQ ID NO:6) fue sintetizado por DNA2.0, basado en la secuencia de nucleótidos de pBAD24 (número de acceso de la base de datos del GenBank X81837.1 (25 de octubre del 1995)). El vector de expresión pBAD240 difiere de pBAD24 en que tiene una secuencia RBS optimizada -AGGAGGTAAAAA (nucleótidos 3125 - 3136 de la SEQ ID NO:6) - aguas arriba del sitio de clonación en el que puede insertarse una secuencia codificante. La secuencia de nucleótidos del pBAD240 también se simplificó en relación con pBAD24 mediante la eliminación de algunas secuencias de nucleótidos y el uso de terminadores más cortos, con el resultado de que la secuencia de nucleótidos de pBAD240 (SEQ ID nO:C) tiene solo 3255 bases, en comparación con la secuencia de nucleótidos del pBAD24 en 4542 bases. El vector de expresión pBAD240 también incluye un gen que confiere resistencia a la kanamicina (KanR), en lugar del gen de resistencia a la ampicilina que se encuentra en el pBAD24. D. Vectores de expresión pPRO44 y pPRO45
Los vectores de expresión pPRO44 (SEQ ID NO:7) y pPRO45 (SEQ ID NO:8) se crearon en base a la secuencia de nucleótidos del pPRO43 (SEQ ID NO:2), con diferentes orígenes de replicación para ser usados en los vectores de expresión pPRO44 (RSF1030) y pPRO45 (CloDFI 3). Los cebadores se diseñaron para pPRO43, el origen de replicación RSF1030 y el origen de replicación CloDF13, con el fin de agregar un sitio de restricción Spel aguas arriba y un sitio de restricción Aatll aguas abajo de cada secuencia de origen de replicación. Las secuencias de nucleótidos de pPRO43 y RSF1030 se amplificaron mediante el uso de esos cebadores (SEQ ID No. 9 y 10, y SEQ ID No. 11 y 12, respectivamente), los productos amplificados se digirieron con Spel y Aatll, y los fragmentos de restricción deseados se purificaron en gel y se ligaron juntos para crear pPRO44 (SEQ ID NO:7). El vector de expresión pPRO44 resultante se secuenció para confirmar que no se introdujeron mutaciones a través de la amplificación por PCR. Para crear pPRO45, la secuencia de nucleótidos de CloDF13 se amplificó mediante el uso de los cebadores (SEQ ID Nos 13 y 14) para agregar sitios Spel y Aatll, el producto de amplificación de CloDF13 y pPRO44 se digirieron con enzimas de restricción Spel y Aatll y los fragmentos deseados se purificaron en gel y ligaron juntos para formar pPRO45 (SEQ ID NO:8). La porción CloDF13 de pPRO45 se secuenció para confirmar que no se introdujeron mutaciones a través de la amplificación por PCR.
Ejemplo 3
Uso del vector pSOL de doble promotor para la coexpresión inducible de proteínas fluorescentes en células bacterianas
A. Construcción del vector de expresión pSOL de doble promotor.
En la Figura 5 se muestra esquemáticamente un vector de expresión que comprende dos promotores inducibles diferentes, denominados "vector dual" o "pSOL". Este vector fue sintetizado por DNA2.0 (Menlo Park, CA) y contiene varias secuencias polinucleotídicas, o "elementos", optimizados para la expresión en células huésped de E. coli. En la Tabla 4, más abajo, se proporciona una descripción de los elementos polinucleotídicos utilizados en pSOL; la secuencia de nucleótidos de pSOL se proporciona como la SEQ ID NO:15.
Figure imgf000027_0001
En particular, el vector de expresión pSOL comprende dos promotores inducibles diferentes que pueden usarse para la coexpresión inducible de proteínas de interés: un promotor araBAD inducible por arabinosa y un promotor prpBCDE inducible por propionato. Las variantes de pSOL también pueden usarse para la coexpresión inducible de proteínas de interés, tal como un vector de expresión basado en pSOL en el que las posiciones del promotor araBAD y el promotor prpBCDE se cambian con relación al origen de la replicación. Otras variantes útiles de los vectores de expresión pSOL incluyen aquellas en las que la secuencia codificante del activador transcripcional AraC y/o la secuencia codificante del activador transcripcional PrpR no están presentes en el vector de expresión, sino que se expresan a partir de un polinucleótido separado tal como un elemento extracromosómico diferente, o el genoma del huésped. Las variantes adicionales de los vectores de expresión de pSOL son aquellas que comprenden un tercer promotor inducible insertado, por ejemplo, entre las posiciones de nucleótido pSOL 5304 y 29 de la SEQ ID NO:15, de modo que el tercer promotor inducible estaría aguas abajo del promotor prpB y sus sitios de clonación y terminador asociados, y orientado en la misma dirección que el promotor prpB. El tercer promotor inducible en tales variantes de vectores de expresión de pSOL podría ser, por ejemplo, un promotor inducible por ramnosa tal como el promotor rhaSR, un promotor inducible por xilosa tal como el promotor xylAB, o un promotor inducible por agotamiento de fosfato tal como el promotor phoA.
B. Coexpresión inducible de proteínas fluorescentes.
Para comparar los niveles de coexpresión del vector pSOL de doble promotor con la coexpresión de una combinación de vectores de expresión pBAD24 y pPRO33, se usaron los vectores pBAD24 y pPRO33 para expresar una proteína fluorescente amarilla (YellowFP) y una proteína fluorescente roja (RedFP), respectivamente. El promotor araBAD inducible por L-arabinosa en pSOL se usó para expresar YellowFP, y el promotor prpBCDE inducible por propionato se usó para expresar RedFP. El YellowFP tiene una emisión máxima a 528 nm - 530 nm con excitación a 515 nm (Nagai y otros, "A variant of yellow fluorescent protein with fast and efficient maturation for cell-biological applications", Nat Biotechnol enero del 2002; 20(1): 87-90), y el RedFP tiene una emisión máxima a 610 nm con excitación a 587 nm (Shaner y otros, "Improved monomeric red, orange and yellow fluorescent proteins derived from Discosoma sp. red fluorescent protein", Nat Biotechnol diciembre del 2004; 22(12): 1567-1572; Epub 21 de noviembre del 2004).
Para construir los plásmidos pBAD24-YellowFP y pPRO33-RedFP, las secuencias codificantes para YellowFP y RedFP se optimizaron para expresión en E. coli por ADN 2.0. Las secuencias codificantes optimizadas para YellowFP y RedFP se digirieron tanto con Nhel como con Sail, y los insertos digeridos se ligaron en pBAD24 y pPRO33 cortados con Nhel/Sall, respectivamente. En el caso de pSOL, DNA2.0 usó el sistema de clonación Electra basado en amplificación para insertar las secuencias codificantes optimizadas para YellowFP y RedFP en el vector de expresión pSOL aguas abajo de los sitios de unión de ribosomas optimizados en las regiones promotoras araBAD y prpBCDE, respectivamente. Las construcciones de expresión pBAD24-YellowFP y pPRO33-RedFP se cotransformaron en células E. coli ASE(DGH) (las células E. coli ASE(dGh ) se describen en el Ejemplo 1), y las construcciones de expresión pSOL-YellowFP-RedFP también se transformaron por separado en células E. coli ASE(DGH).
Los cultivos de pBAD24-YellowFP/pPRO33-RedFP en ASE(DGH) ('pBAD, pPRO') y pSOL-YellowFP-RedFP en ASE(DGH) ('pSOL') se cultivaron durante la noche a 37 grados C con agitación a 275 RPM en el medio LB que contiene cloranfenicol más ampicilina o que contiene kanamicina, respectivamente. A una OD600 de 0,7, las células se diluyeron en 2 x 6 mL de medio LB más antibióticos a una OD600 de 0,01 y se cultivaron a 30 grados C con agitación a 275 RPM hasta alcanzar una OD600 de 0,75. Las células se sedimentaron a 3800 x g durante 7 minutos a 30 grados C y se resuspendieron en medio M9 más antibióticos sin fuente de carbono adicional hasta una OD600 de 0,7. Las células resuspendidas se sembraron en una placa de múltiples pocillos a 200 microlitros por pocillo de la siguiente manera:
Filas A, B: pBAD24-YellowFP/pPRO33-RedFP en ASE(DGH) colonia 1
Filas C, D: pBAD24-YellowFP/pPRO33-RedFP en ASE(DGH) colonia 2
Filas E, F: pSOL-YellowFP-RedFP en ASE (DGH) colonia 1
Fila G, H: pSOL-YellowFP-RedFP en ASE (DGH) colonia 2
Las células se indujeron mediante la adición de concentraciones variables de propionato (a mano) y L-arabinosa (por dispensador digital), con concentraciones de propionato de 0 mM, 1 mM, 2,5 mM, 5 mM y 20 mM y concentraciones de L-arabinosa de 0 micromolar, 0,67 micromolar, 3,33 micromolar, 6,66 micromolar y 66,61 micromolar.
Las placas se incubaron en un lector de microplacas Biotek Synergy™ 4 (BioTek Instruments Inc., Winooski, Vermont) a 30 grados C mediante el uso de la velocidad de agitación "Fast" y se controló la fluorescencia cada 15 minutos durante 8 horas. Los valores de fluorescencia se promediaron para las muestras cultivadas en las mismas concentraciones de inductor y la fluorescencia se graficó con el tiempo como se muestra en las Figuras 6 y 7. La Figura 6 muestra los niveles de fluorescencia de RedFP en el tiempo, expresados a partir de un promotor prpBCDE inducible por propionato. Las concentraciones de inductor para cada grupo de muestras promediadas se muestran en la leyenda, con la concentración de propionato en primer lugar, seguida por la concentración de L-arabinosa. La Figura 7 muestra los niveles de fluorescencia de YellowFP en el tiempo, expresados a partir de un promotor araBAD inducible por L-arabinosa. Las concentraciones de inductor para cada grupo de muestras promediadas se muestran en la leyenda, con la concentración de L-arabinosa en primer lugar, seguida por la concentración de propionato. Para cada combinación de concentraciones de inductor, la expresión de la proteína fluorescente que se estaba midiendo, según lo indicado por el nivel de fluorescencia observado, fue mayor en el promotor inducible presente en el vector de expresión pSOL de doble promotor que en el promotor inducible correspondiente presente en la combinación pBAD24- YellowFP/pPRO33-RedFP. Este mayor nivel de expresión de proteína fluorescente de pSOL con relación a pBAD24 y pPRO33 se observó no solo para las combinaciones de concentraciones de inductor que se muestran en las Figuras 6 y 7, sino también para las combinaciones de concentraciones de inductor que se omitieron de los gráficos en aras de la claridad.
C. Coexpresión inducible de preproinsulina con la proteína disulfuro isomerasa.
Las cantidades de preproinsulina producidas por coexpresión de preproinsulina con la proteína disulfuro isomerasa (PDI) mediante el uso el vector pSOL de doble promotor se compararon con las cantidades de preproinsulina producidas por coexpresión mediante el uso de una combinación de los vectores de expresión pBAD240 (SEQ ID NO:6) y pPRO430 (SEQ ID NO:4) (ver Ejemplo 2 para la construcción de estos vectores).
Los vectores pBAD240 y pPRO430 se usaron para expresar preproinsulina y proteína disulfuro isomerasa (PDI), respectivamente. El promotor araBAD inducible por L-arabinosa en pSOL se usó para expresar preproinsulina, y el promotor prpBCDE inducible por propionato se usó para expresar PDI. Las células EB0001 (también llamadas E. coli ASE(DGH); véase el Ejemplo 1), que se volvieron competentes para la transformación mediante tratamiento con cloruro de calcio, se añadieron a una solución que contienen los vectores pBAD240-preproinsulina y pPRO430-PDI, luego se sometieron a un choque térmico a 42 grados C durante 20 segundos y se dejaron reposar en hielo. por cinco minutos. Las células cotransformadas se recuperaron en 900 microlitros de medio de crecimiento SOC (Número de catálogo de New England Biolabs B9020S) a 37 grados C durante una hora con agitación a 275 RPM antes de sembrarlas en placas de agar que contenían 25 microgramos/mL de kanamicina y 12 microgramos/mL de cloranfenicol. Se usaron concentraciones de antibiótico de 50 microgramos/mL de kanamicina y 12 microgramos/mL de cloranfenicol para el crecimiento de células que contenían pPRO430 en condiciones de cultivo líquido. Las células EB0001 se transformaron con el vector único pSOL-preproinsulina-PDI de manera similar, pero se sembraron en placas de agar y luego se cultivaron en cultivo líquido, que contenía solo 50 microgramos/mL de kanamicina. Se recolectaron colonias individuales de cada transformación y se cultivaron en medio LB más el(los) antibiótico(s) apropiado(s) a 30 grados C con agitación a 275 RPM durante la noche hasta alcanzar la fase estacionaria; estos cultivos se usaron para establecer stocks de glicerol de pBAD240-preproinsulina/pPR0430-PDI en la cepa EB0001 y pSOL-preproinsulina-PDI en la cepa EB0001.
Para hacer crecer las células para la inducción, se realizó una inoculación directa de cada stock de glicerol en 100 mL de medio LB con el o los antibióticos apropiados y se cultivó durante la noche a 30 grados C con agitación de 275 RPM. Después de diluir en 100 mL de medio LB fresco con el o los antibióticos apropiados para alcanzar una OD600 de 0,2, las células se cultivaron nuevamente a 30 grados C con agitación de 275 RPM hasta que la OD600 alcanzó 0,6 - 0,8. En este momento, se sedimentó el volumen apropiado (3800 x g, 10 minutos) de modo que la resuspensión en 80 mL de medio de inducción (M9 más antibiótico(s) apropiado(s)) dio una OD600 de 0,7-0,75.
Las células resuspendidas en medio de inducción se sembraron en placas de cultivo de pocillos profundos de 24 pocillos para la inducción a 3 mL/pocillo. A continuación, los cultivos se indujeron en la placa y se añadieron 10 microlitros de solución madre de inductor 300X para cada condición de inductor, y se incubaron durante seis horas a 27 grados C con agitación a 275 RPM. La OD600 del cultivo en cada pozo se midió después de la incubación de seis horas al agregar 100 microlitros de cultivo a 100 microlitros de agua bidestilada y mediante el uso del lector de placas Epoch (BioTek, Winooski, Vermont) mediante el uso del siguiente ajuste de curva para convertir a cubeta OD: OD600_cubeta =(OD600_placa*1,9796) - 0,07. A continuación, se recogieron las células de cada pocillo mediante sedimentación a 3800 x g durante 7 minutos a temperatura ambiente. El sobrenadante se aspiró del sedimento y las muestras de sedimentos celulares se almacenaron a -80 grados C.
La cantidad de preproinsulina en cada sedimento celular se determinó mediante el uso de una transferencia Western de electroforesis capilar, realizada en un sistema WES (ProteinSimple, San José, California), de acuerdo con las instrucciones del fabricante. Los sedimentos celulares almacenados se descongelaron en hielo durante 10 minutos, luego se lisaron en tampón de lisis (fosfato de potasio pH 8, octilglucósido al 1 %; i Inhibidores de la proteasa 1X; ¡sEpj 2 U benzonasa (EMD# 70746, EMD Millipore, Billerica, Massachusetts) por mL de cultivo; y 2,25 kU de rLisozima (EMD n.° 71110, EMD Millipore, Billerica, Massachusetts) por mL de cultivo) a una concentración de células 2 veces mayor que la concentración de cultivo en la recolección después de la inducción. La lisis se realizó incubando en hielo durante 10 minutos, luego las muestras se clarificaron por centrifugación a 20 000 x g durante 15 minutos a 4 grados C. En preparación para el análisis WES, los lisados se diluyeron en tampón WES 0,1X, llevándolos a una concentración final de 0,02X. Para cada muestra, se añadieron 5 microlitros de muestra diluida a 1,25 microlitros de tampón de muestra 5X reductor (con estándares fluorescentes y la adición de DTT a una concentración final de 200 mM). Antes de cargarlas en el sistema WES, las muestras se calentaron a 95 grados C durante 10 minutos. El anticuerpo primario para la detección de preproinsulina fue un anticuerpo anti-insulina de ratón, y el anticuerpo secundario fue un anticuerpo anti-ratón de cabra marcado con peroxidasa de rábano picante (HRP). Los resultados del análisis WES se muestran en las Tablas 5 y 6.
Tabla 5. Cantidades (microgramos/mL/OD) de preproinsulina producida cuando se coexpresa con PDI mediante el
uso de dos vectores se arados
Figure imgf000030_0001
Table 6. Cantidades (microgramos/mL/OD) de preproinsulina producida cuando se coexpresa con PDI mediante el
Figure imgf000030_0002
La comparación de los resultados en las Tablas 5 y 6 indica que a concentraciones de inductor comparables, el vector pSOL produce cantidades de preproinsulina de 2 a 8 veces mayores que el sistema de coexpresión de dos vectores.
Ejemplo 4
Coexpresión inducible de infliximab
El infliximab es un anticuerpo monoclonal quimérico que se une al TNF-alfa, una citocina inflamatoria, y se usa en el tratamiento de afecciones que involucran al TNF-alfa, tales como enfermedades autoinmunes (enfermedad de Crohn, artritis reumatoide, psoriasis, etc.). El infliximab se forma a partir de una cadena pesada (secuencia de aminoácidos que se muestra como la SEQ ID NO:16) y una cadena ligera (secuencia de aminoácidos que se muestra como la SEQ ID NO:17); cada una de estas cadenas tiene una secuencia de dominio variable derivada de anticuerpos anti-TNF-alfa de ratón y un dominio constante humano. La optimización de codones para la expresión en E. coli y la síntesis de polinucleótidos que codifican las SEQ ID NO 16 y 17 fue realizada por DNA2.0 (Menlo Park, CA).
El método de clonación DNA2.0 Electra (www.dna20.com/products/expression-vectors/electra-system) se usa para crear las construcciones de expresión de infliximab. La construcción de expresión formada mediante la inserción de la secuencia codificante optimizada para la cadena pesada de infliximab en el sitio de clonación Electra del vector de expresión pBAD240 es pBAD240-lnfliximab HC, que tiene la secuencia de nucleótidos que se muestra como la SEQ
ID NO:18. La construcción de expresión formada al insertar la secuencia codificante optimizada para la cadena ligera de infliximab en el sitio de clonación de Electra del vector de expresión pPRO430 es pPRO430- lnfliximab_LC, que tiene la secuencia de nucleótidos que se muestra como la SEQ ID NO:19. Las secuencias codificantes de cadena pesada y ligera de infliximab optimizadas se clonaron en el vector de expresión pSOL (SEQ ID NO:15) de manera similar, con la cadena pesada expresada a partir del promotor araBAD, y la cadena ligera del promotor prpBCDE. El vector de expresión pSOL-Infliximab resultante tiene la secuencia de nucleótidos que se muestra en la s Eq ID NO:20. Las construcciones de expresión pBAD240-lnfliximab_HC y pPR0430-lnfliximab_LC se usan para cotransformar células E. coli ASE(DGH) a través de un choque térmico a 42 grados C, seguido de crecimiento a 37 grados C durante la noche, y la construcción de expresión de pSOL-Infliximab se transforma de manera similar en células E. coli ASE(DGH), creando células ASE(DGH)(pBAD240-lnfliximab_HC/pPR0430-lnfliximab_LC) y células ASE(DGH)(pSOL-lnfliximab).
Estas células se cultivan generalmente como se describió en el Ejemplo 3, que incluye la adición de compuestos selectivos como kanamicina y/o cloranfenicol según sea necesario, y para la inducción de la expresión de anticuerpos, las células se resuspenden en medio M9 sin fuente de carbono adicional a una OD600 de aproximadamente 0,7 (0,6-1,0). A continuación, las células se inducen mediante la adición de arabinosa (inicialmente en concentraciones que incluyen 0,1 %) y propionato (inicialmente en concentraciones que incluyen
50 mM). El ajuste de la las concentraciones de arabinosa y propionato pueden hacerse como se describió en el Ejemplo 5. Después de la inducción, las células huésped en las que se han producido los anticuerpos se rompen mediante lisis química mediante el uso de enzimas como la lisozima, o mediante métodos de ruptura mecánica tales como sonicación o microfluidización mediante el uso de un microfluidizador modelo M-110Y de Microfluidics (Microfluidics International Corp., Westwood, Massachusetts). Se usa la centrifugación a 20 000 x g durante 15 minutos a temperatura ambiente para separar la fracción insoluble y se recolecta el sobrenadante que contiene la proteína soluble, que incluye los anticuerpos expresados.
Los anticuerpos contra infliximab se detectan y cuantifican mediante el uso de una transferencia Western de electroforesis capilar, realizada en un sistema WES (ProteinSimple, San José, California), de acuerdo con las instrucciones del fabricante (véase también el Ejemplo 3). Los extractos de proteínas solubles se cargan en el conjunto de capilares, las proteínas se separan electroforéticamente por tamaño y luego los anticuerpos en las muestras se detectan con una etapa de bloqueo (en lugar del uso de un anticuerpo primario) y la incubación con un anticuerpo secundario antihumano de cabra conjugado con HRP que reconoce cadenas pesadas y ligeras de anticuerpos humanos. La detección de anticuerpos se logra mediante la adición del sustrato quimioluminiscente al capilar y la captura directa de la luz emitida durante la reacción catalizada por enzimas. Las estimaciones de peso molecular se calculan mediante el uso de una curva estándar generada mediante el uso de seis proteínas biotiniladas que van desde 12 k a 230 kDa para cada ejecución. Los estándares fluorescentes se incluyen en el tampón de carga de muestras, lo que proporciona a cada muestra un estándar interno que se usa para alinear la muestra con el estándar de peso molecular.
Para determinar la cantidad de proteína presente en un peso molecular dado, se pasan cantidades conocidas de un estándar de proteína en algunos de los capilares. En este caso, se preparan diluciones en serie de infliximab comercialmente disponible que tiene una concentración de proteína conocida, comenzando por ejemplo en 10 microgramos/mL y diluyéndose hasta 1,0 nanogramos/mL. Se usan aproximadamente cinco capilares del sistema WES para ejecutar la dilución en serie. Para cada banda de proteína de infliximab en los capilares de dilución experimental y en serie, el software del sistema WES genera una curva que representa la intensidad de quimioluminiscencia de la banda de proteína, y se evalúa el área bajo cada curva, con una curva estándar de estas áreas graficada para las bandas de proteína de infliximab en los capilares de dilución en serie de infliximab. Para determinar la concentración de las muestras experimentales, el área bajo cada curva que representa la intensidad de quimioluminiscencia de una muestra experimental de infliximab puede compararse con la curva estándar generada para las muestras de concentración conocida de infliximab.
Los anticuerpos contra infliximab pueden purificarse adicionalmente como se describe en el Ejemplo 7, y la caracterización adicional de los anticuerpos contra infliximab se describe en el Ejemplo 8 (medición de la afinidad de unión del anticuerpo) y el Ejemplo 9 (caracterización de los enlaces disulfuro presentes en los productos de coexpresión).
Ejemplo 5
Valoración de la coexpresión mediante la variación de la concentración del inductor
Para optimizar la producción de un producto multimérico mediante el uso de los sistemas de expresión de la invención, es posible ajustar o valorar las concentraciones de los inductores independientemente. Las células huésped que contienen construcciones de expresión que comprenden promotores inducibles, tal como los promotores inducibles por L-arabinosa, inducibles por propionato, inducibles por L-ramnosa o inducibles por D-xilosa, se cultivan hasta la densidad deseada (tal como un OD600 de aproximadamente 0,5) en medio mínimo M9 que contiene los antibióticos apropiados, luego las células se dividen en alícuotas en pequeños volúmenes de medio mínimo M9, preparado opcionalmente sin fuente de carbono como glicerol, y con los antibióticos apropiados y concentraciones variables de cada inductor. Las valoraciones de volúmenes pequeños pueden realizarse en matraces de agitación de 200 a 500 mL. La concentración de L-arabinosa, L-ramnosa o D-xilosa necesaria para inducir la expresión es típicamente menor (y a menudo es sustancialmente menor) del 0,02 % por unidad de OD de células. En un experimento de valoración, las concentraciones probadas de L-arabinosa pueden oscilar entre 2 % y 1,5 %, 1 %, 0,5 %, 0,2 %, 0,1 %, 0,05 %, 0,04 %, 0,03 %, 0,02 %, 0,01 %, 0,005 %, 0,002 %, 0,001 %, 0,0005 %, 0,0002 %, 0,0001 %, 0,00005 %, 0,00002 %, 0,00001 %, 0,000005 %, 0,000002 %, 0,000001 %, 0,0000005 %, 0,0000002 %, 0,0000001 %, 0,00000005 %, 0,00000002 %, y 0,00000001 %, todo por unidad de OD de células. Una concentración de 66,61 micromolar de L-arabinosa corresponde a 0,001 % de L-arabinosa. Un experimento de valoración alternativo para L-arabinosa, L-ramnosa o D-xilosa sería probar las siguientes concentraciones, expresadas en términos de molaridad: 250 mM, 100 mM, 50 mM, 25 mM, 10 mM, 5 mM, 2,5 mM, 1,0 mM, 500 micromolar, 250 micromolar, 100 micromolar, 75 micromolar, 50 micromolar, 25 micromolar, 10 micromolar, 5.0 micromolar, 2,5 micromolar, 1,0 micromolar, 500 nM, 250 nM, 100 nM, 50 nM, 25 nM, 10 nM, 5,0 nM, 2,5 nM, 1.0 nM, 500 pM, 250 pM, 100 pM, 50 pM, 25 pM, 10 pM, 5,0 pM, 2,5 pM y 1,0 pM, todo por unidad de OD de células. Para el propionato, las concentraciones a probar pueden variar de 1 M a 750 mM, 500 mM, 250 mM, 100 mM, 75 mM, 50 mM, 25 mM, 10 mM, 5 mM, 1 mM, 750 micromolar, 500 micromolar, 250 micromolar, 100 micromolar, 50 micromolar, 25 micromolar, 10 micromolar, 5,0 micromolar, 2,5 micromolar, 1,0 micromolar, 500 nM, 250 nM, 100 nM, 50 nM, 25 nM, 10 nM, 5,0 nM, 2,5 nM y 1,0 nM todo por unidad de OD de células.
Para cada concentración 'x' de L-arabinosa (o L-ramnosa o D-xilosa) que se prueba, la concentración de un inductor diferente como el propionato, añadido a cada uno de los tubos que contienen concentración 'x' del primer inductor, es variada en cada serie de muestras. Alternativamente, los experimentos de valoración pueden comenzar con una combinación "estándar" de concentraciones de inductor, que para las células huésped que tienen un nivel reducido de función génica de al menos un gen que codifica una proteína que metaboliza el inductor es 0,0015 % (100 micromolar) de cualquiera de L -arabinosa, L-ramnosa o D-xilosa por unidad OD de células, y/o 100 micromolar (o una concentración entre 50 micromolar y 250 micromolar) de propionato por unidad de OD de células. Para las células huésped en las que las proteínas que metabolizan el inductor son funcionales, la combinación "estándar" de concentraciones de inductor es 0,2 % (13 mM) de L-arabinosa, L-ramnosa o D-xilosa por unidad de OD de células.
y/o 83 mM (o una concentración entre 50 mM y 100 mM) de propionato por unidad de DO de células. Se prueban combinaciones adicionales de concentraciones de inductor que varían de la combinación 'estándar'; en una serie de experimentos de valoración, los resultados de los experimentos iniciales pueden usarse para "afinar" las concentraciones del inductor usadas en experimentos posteriores. Pueden realizarse experimentos de valoración similares con cualquier combinación de inductores usados en un sistema de coexpresión inducible de la invención, que incluyen, pero no se limitan a, L-arabinosa, propionato, L-ramnosa y D-xilosa. Después del crecimiento en presencia de inductores durante 6 horas, las células se sedimentan, el producto deseado se extrae de las células y el rendimiento del producto por valor de masa de células se determina mediante un ensayo inmunológico cuantitativo tal como ELISA o mediante purificación. del producto y cuantificación por absorbancia UV a 280 nm. También es posible valorar las concentraciones del inductor mediante el uso de un ensayo de alto rendimiento, en el que las proteínas que se expresarán se modifican genéticamente para incluir un resto de proteína fluorescente, como el proporcionado por la proteína fluorescente roja mKate2 (Evrogen, Moscú, Rusia), o las proteínas fluorescentes verdes mejoradas de Aequorea victoria y Bacillus cereus. Otro enfoque para determinar la cantidad y la actividad de los productos génicos producidos por diferentes concentraciones de inductores en un experimento de valoración de alto rendimiento consiste en usar un sensor capaz de medir las interacciones de unión biomolecular, tal como un sensor que detecta la resonancia de plasmón de superficie o un sensor que emplea interferometría de biocapa (BLI) (por ejemplo, un sistema Octet® QK de forteBIO, Menlo Park, CA). Si hay un anticuerpo disponible que se une con suficiente especificidad al producto génico que se expresa, el producto génico puede detectarse y cuantificarse mediante el uso de una transferencia Western de electroforesis capilar, tal como la que se ejecuta en un sistema WES como se describió en el Ejemplo 3 anterior.
Ejemplo 6
Medición de la fuerza de los promotores y la homogeneidad de la expresión inducible
La fuerza de un promotor se mide como la cantidad de transcripción de un producto génico iniciado en ese promotor, con relación a un control adecuado. Para los promotores constitutivos que dirigen la expresión de un producto génico en una construcción de expresión, un control adecuado podría usar la misma construcción de expresión, excepto que la versión de "tipo salvaje" del promotor, o un promotor de un gen "constitutivo", se usa en lugar del promotor a ensayar. Para promotores inducibles, la expresión del producto génico del promotor puede compararse en condiciones inductoras y no inductoras.
A. Medición de la fuerza del promotor mediante el uso de PCR cuantitativa para determinar los niveles de ARN transcritos del promotor
El método de De Mey y otros ("Promotor knock-in: a novel rational method for the fine tuning of genes", BMC Biotechnol 24 de marzo del 2010; 10: 26) se usa para determinar la fuerza relativa de los promotores en las células huésped que pueden crecer en cultivo. Las células huésped que contienen una construcción de expresión con el promotor a ensayar, y las células huésped de control que contienen una construcción de expresión de control, se cultivan por triplicado. Las muestras one-mi se recolectan en OD600 = 1,0 para el ARNm y la recogida de proteínas. La extracción de ARN total se realiza mediante el uso de un mini kit RNeasy (QIAGEN, Países Bajos). La pureza del ARN se verifica en un gel de agarosa FA según lo recomendado por QIAGEN y la concentración de ARN se determina mediante la medición de la absorbancia a 260 nm. Se usan dos microgramos de ARN para sintetizar ADNc mediante el uso un cebador aleatorio y transcriptasa inversa RevertAid H Minus M-MulV (Fermentas, Glen Burnie, Maryland). La fuerza del promotor se determina mediante RT-qPCR realizada en un iCycler IQ® (Bio-Rad, Eke, Bélgica) mediante el uso de cebadores directos e inversos diseñados para amplificar el ADNc correspondiente a la transcripción producida a partir del promotor. (Para este propósito, De Mey y otros autores usaron los cebadores Fw-ppc-qPCR y Rv-ppc-qPCR, y los cebadores Fw-rpoB-qPCR y Rv-rpoB-qPCR del gen constitutivo de control rpoB.) La supermezcla SYBR GreenER qPCR (Life Technologies, Grand Island, Nueva York) se usa para realizar una breve incubación con UDG (uracilo ADN glicosilasa) (50 °C durante 2 min) seguida inmediatamente de amplificación por PCR (95 °C durante 8,5 min; 40 ciclos de 95 °C por 15 s y 60 °C por 1 min) y análisis de la curva de fusión (95 °C por 1 min, 55 °C por 1 min y 80 ciclos de 55 °C 0,5 °C/ciclos por 10 s) para identificar la presencia de dímeros de cebadores y analizar la especificidad de la reacción. Esta etapa de incubación de UDG antes del ciclo de PCR destruye cualquier producto contaminante que contiene dU de reacciones anteriores. A continuación, la UDG se inactiva por las altas temperaturas durante el ciclo de PCR normal, lo que permite de esta manera la amplificación de las secuencias diana genuinas. Cada muestra se realiza por triplicado. Las relaciones de expresión relativa se calculan mediante el uso del "método Delta-delta ct" de PE Applied Biosystems (PerkinElmer, Forster City, California).
B. Medición de la fuerza del promotor inducible y la homogeneidad de la inducción mediante el uso de un gen informador fluorescente
Estos experimentos se realizan mediante el uso de los métodos de Khlebnikov y otros ("Regulatable arabinoseinducible gene expression system with consistent control in all cells of a culture", J Bacteriol diciembre del 2000; 182(24): 7029-7034). Los experimentos que miden la inducción de un promotor inducible se realizan en medio C suplementado con 3,4 % de glicerol como fuente de carbono (Helmstetter, "DNA synthesis during the división cycle of rapidly growing Escherichia coli B/r", J Mol Biol 14 de febrero del 1968; 31(3): 507-518). Las cepas de E. coli que contienen construcciones de expresión que comprenden al menos un promotor inducible que controla la expresión de un gen informador fluorescente se cultivan a 37 °C bajo selección con antibióticos hasta una densidad óptica a 600 nm (OD600) de 0,6 a 0,8. Las células se recolectan por centrifugación (15 000 x g), se lavan en medio C sin fuente de carbono, se resuspenden en medio C fresco que contiene antibióticos, glicerol y/o inductor (para la inducción de la expresión génica) hasta una DO600 de 0,1 a 0,2, e incubado durante 6 horas. Las muestras se toman de forma rutinaria durante el período de crecimiento para su análisis. La fluorescencia del cultivo se mide en un fluorómetro Versafluor (Bio-Rad Inc., Hercules, California) con excitación de longitud de onda de 360/40 nm y filtros de emisión de longitud de onda de 520/10 nm. La fuerza de la expresión de un promotor inducible tras la inducción puede expresarse como la relación de la fluorescencia promedio de la población máxima (relación fluorescencia/OD) de las células inducidas con relación a la de las células de control (tales como las no inducidas). Para determinar la homogeneidad de la inducción dentro de la población celular, se realiza la citometría de flujo en un citómetro de flujo Beckman-Coulter EPICS XL (Beckman Instruments Inc., Palo Alto, California) equipado con un láser de argón (emisión a una longitud de onda de 488 nm y 15 mW) y un filtro de paso de banda de 525 nm de longitud de onda. Antes del análisis, las células muestreadas se lavan con solución salina tamponada con fosfato que se ha filtrado (tamaño de los poros del filtro, 0,22 micrómetros), se diluye hasta una OD600 de 0,05 y se coloca en hielo. Para cada muestra, se recolectan 30 000 eventos a una velocidad de entre 500 y 1000 eventos/s. El porcentaje de células inducidas (fluorescentes) en cada muestra puede calcularse a partir de los datos de citometría de flujo.
Ejemplo 7
Purificación de anticuerpos
Los anticuerpos producidos por los sistemas de coexpresión inducibles de la invención se purifican mediante la centrifugación de las muestras de células huésped lisadas a 10000 x g durante 10 minutos para eliminar las células y los restos. El sobrenadante se filtra a través de un filtro de 0,45 micrómetros. Se configura una columna de Proteína G Recombinante - Sepharose®4B de 1 mL (Life Technologies, Grand Island, Nueva York) para lograr regímenes de flujo de 1 mL/min, y se usa con los siguientes tampones: tampón de unión: fosfato de sodio 0,02 M, pH 7,0; tampón de elución: glicina-HCl 0,1 M, pH 2,7; y tampón de neutralización: Tris-HCl 1 M, pH 9,0. La columna se equilibra con 5 volúmenes de columna (5 mL) de tampón de unión y luego se aplica la muestra a la columna. La columna se lava con 5-10 volúmenes de columna del tampón de unión para eliminar las impurezas y el material no unido, continuando hasta que no se detecte proteína en el eluyente (determinado por absorbancia UV a 280 nm). A continuación, la columna se eluye con 5 volúmenes de columna de tampón de elución y la columna se vuelve a equilibrar inmediatamente con 5-10 volúmenes de columna de tampón de unión.
Ejemplo 8
Medición de la afinidad de unión de anticuerpos
La afinidad de unión del anticuerpo, expresada como "Kd" o "valor de Kd", se mide mediante un ensayo de unión a antígeno radiomarcado (RIA) realizado con la versión Fab de un anticuerpo de interés y su antígeno como se describe en el siguiente ensayo. La producción de la versión Fab de un anticuerpo de longitud completa se conoce bien en la técnica. La afinidad de unión a la solución de Fab por el antígeno se mide al equilibrar Fab con una concentración mínima de antígeno marcado (125I) en presencia de una serie de valoraciones de antígeno no marcado, luego al capturar el antígeno unido con una placa recubierta de anticuerpo anti-Fab (ver, por ejemplo, Chen y otros, "Selection and analysis of an optimized anti-VEGF antibody: crystal structure of an affinity-matured Fab in complex with antigen", J Mol Biol 5 de noviembre del 1999 5; 293(4): 865-881). Para establecer las condiciones para el ensayo, las placas de microtitulación (DYNEX Technologies, Inc., Chantilly, Virginia) se recubren durante la noche con 5 microgramos/mL de un anticuerpo anti-Fab de captura (Cappel Labs, West Chester, Pensilvania) en carbonato de sodio 50 mM (pH 9,6), y subsecuentemente se bloqueó con albúmina de suero bovino al 2 % (w/v) en PBS durante dos a cinco horas a temperatura ambiente (aproximadamente 23 °C). En una placa no adsorbente (Nunc #269620; Thermo Scientific, Rochester, Nueva York), 100 pM o 26 pM de antígeno[125I] se mezclan con diluciones en serie de un Fab de interés (por ejemplo, de acuerdo con la evaluación del anticuerpo anti-VEGF, Fab-12, en Presta y otros,"Humanization of an anti-vascular endothelial growth factor monoclonal antibody for the therapy of solid tumors and other disorders", Cancer Res 15 de octubre del 1997; 57(20): 4593-4599). Luego, el Fab de interés se incuba durante la noche; sin embargo, la incubación puede continuar durante un período más largo (por ejemplo, unas 65 horas) para garantizar que se alcance el equilibrio. Posteriormente, las mezclas se transfieren a la placa de captura para su incubación a temperatura ambiente (por ejemplo, durante una hora). A continuación, se elimina la solución y se lava la placa ocho veces con el surfactante tWe EN-20™ al 0,1 % en PBS. Cuando las placas se han secado, se añaden 150 microlitros/pocillo de centelleante (MICROSCINT-20™; PerkinElmer, Waltham, Massachusetts) y las placas se cuentan en un contador gamma TOPCOUNT™ (PerkinElmer) durante diez minutos. Las concentraciones de cada Fab que dan menos o igual al 20 % de unión máxima se eligen para el uso en ensayos de unión competitiva.
Alternativamente, el valor de Kd o Kd se mide mediante el uso de ensayos de resonancia de plasmón de superficie mediante el uso de un instrumento BIACORE®-2000 o BIACORE®-3000 (BIAcore, Inc., Piscataway, New Jersey) a 25 °C con chips de antígeno CM5 inmovilizados a ~10 unidades de respuesta (RU). Brevemente, los chips biosensores de dextrano metilado con carboxi (CM5, BIAcore Inc.) se activan con clorhidrato de N-etil-N'-(3-dimetilaminopropil)-carbodiimida (EDC) y N-hidroxisuccinimida (NHS) de acuerdo con las instrucciones del proveedor. El antígeno se diluye con acetato de sodio 10 mM, pH 4,8, a 5 microgramos/mL (~0,2 micromolar) antes de la inyección a un régimen de flujo de 5 microlitros/minuto para lograr aproximadamente 10 RU de proteína acoplada. Después de la inyección de antígeno, se inyecta etanolamina 1 M para bloquear los grupos que no han reaccionado. Para las mediciones cinéticas, se inyectan diluciones en serie dobles de Fab (0,78 nM a 500 nM) en PBS con surfactante TWEEN 20™ al 0,05 % (PBST) a 25 °C a un régimen de flujo de aproximadamente 25 microlitros/min. Las tasas de asociación (kon) y las tasas de disociación (koff) se calculan mediante el uso de un modelo de unión de Langmuir uno a uno simple (BIAcore® Evaluation Software versión 3.2) ajustando simultáneamente los sensogramas de asociación y disociación. La constante de disociación de equilibrio (Kd) se calcula como la relación kf/kon. Si la tasa de activación supera los 106 M-1s-1 mediante el ensayo de resonancia de plasmón de superficie anterior, la tasa de activación puede determinarse mediante el uso de una técnica de extinción fluorescente que mide el aumento o la disminución de la intensidad de emisión de fluorescencia (excitación = 295 nm; emisión = 340 nm, paso de banda de 16 nm) a 25 °C de un anticuerpo antiantígeno 20 nM (forma Fab) en PBS, pH 7,2, en presencia de concentraciones crecientes de antígeno medidas en un espectrómetro, tal como un espectrofotómetro equipado con parada de flujo (Aviv Instruments) o un espectrofotómetro SLM-AMINCO™ de la serie 8000 (ThermoSpec- tronic) con una cubeta agitada.
Otro método para determinar la constante de disociación de equilibrio (Kd) para la unión antígeno-anticuerpo usa el sistema Octet Red (ForteBio, Pall Corporation, Port Washington, Nueva York) (www.fortebio.com/octet-RED96.html). La etapa de medición inicial determina la línea de base, seguida de la carga del antígeno marcado con His a una concentración de 25 nM en biosensores Ni-NTA durante 10 minutos en tampón IX KB+ (BSA al 0,01 %, Tween-20 al 0,002 % en PBS, pH 7,4), seguido de otra etapa de medición de referencia (búfer 1X KB+ solo durante 2 minutos). Luego, el sensor se sumerge en un pocillo que contiene anticuerpo (la etapa de asociación) durante 10 minutos, seguido de un lavado de 20 minutos en tampón IX KB+ para medir la disociación. La constante de disociación de equilibrio (Kd) se calcula como la relación de IWkon, con el software Octet al determinar las tasas kon y koff.
Ejemplo 9
Caracterización de los enlaces disulfuro presentes en los productos de expresión
El número y la ubicación de los enlaces disulfuro en los productos de expresión de proteínas pueden determinarse mediante la digestión de la proteína con una proteasa, tal como la tripsina, en condiciones no reductoras y al someter los fragmentos peptídicos resultantes a espectrometría de masas (MS) que combina la disociación de transferencia de electrones secuenciales (ETD) y la disociación inducida por colisión (CID) etapas de MS (MS2, MS3) (Nili y otros, "Defining the disulfide bonds of insulin-like growth factor-binding protein-5 by tandem mass spectrometry with electron transfer dissociation and collision-induced dissociation", J Biol Chem 6 de enero del 2012; 287(2): 1510-1519; Epub 22 de noviembre 2011).
Digestión de proteína coexpresada. Para evitar reordenamientos de enlaces disulfuro, cualquier residuo de cisteína libre se bloquea primero mediante alquilación: la proteína expresada se incuba protegida de la luz con el agente alquilante yodoacetamida (5 mM) con agitación durante 30 minutos a 20 °C en tampón con urea 4 M. Alternativamente y preferentemente, se usa NEM como reactivo alquilante, con proteólisis de tripsina en combinación con reducción/alquilación realizada en condiciones desnaturalizantes (6M GuaHCl). Después de la alquilación, la proteína coexpresada se separa mediante SDS-PAGE no reductora mediante el uso de geles prefabricados. Alternativamente, la proteína coexpresada se incuba en el gel después de la electroforesis con yodoacetamida o NEM, o sin ella como control. Las bandas de proteína se tiñen, se destiñen con agua doblemente desionizada, se cortan y se incuban dos veces en 500 microlitros de bicarbonato de amonio 50 mM, acetonitrilo al 50 % (v/v) mientras se agita durante 30 minutos a 20 °C. Las muestras de proteínas se deshidratan en acetonitrilo al 100 % durante 2 minutos, se secan mediante centrifugación al vacío y se rehidratan con 10 mg/mL de tripsina o quimotripsina en tampón que contiene bicarbonato de amonio 50 mM y cloruro de calcio 5 mM durante 15 minutos en hielo. Se elimina el exceso de tampón y se reemplaza con 50 microlitros del mismo tampón sin enzima, seguido de incubación durante 16 horas a 37 °Co 20 °C, para tripsina y quimotripsina, respectivamente, con agitación. Las digestiones se detienen mediante la adición de 3 microlitros de ácido fórmico al 88 % y, después de un breve vórtex, se elimina el sobrenadante y se almacena a -20 °C hasta el análisis. Se usan métodos alternativos de fragmentación de proteínas (LysC, Glu-C o CNBr) si la tripsinólisis proporciona una cobertura de secuencia insuficiente (< 75 %). El uso del agente reductor TCEP (tris(2-carboxietil)fosfina) en condiciones ácidas en presencia de NEM proporciona acceso a fragmentos con enlaces disulfuro parcialmente intactos. El mapa de digestión intacto con disulfuro se compara con el mapa de digestión reducido (DTT o TCEP).
Localización de enlaces disulfuro por espectrometría de masas. Los péptidos se inyectan en una columna trampa de 1 mm x 8 mm (Michrom BioResources, Inc., Auburn, CA) a 20 microlitros/minuto en una fase móvil que contiene ácido fórmico al 0,1 %. Luego, el cartucho trampa se coloca en línea con una columna de 0,5 mm x 250 mm que contiene una fase estacionaria Zorbax SB-C18 de 5 mm (Agilent Technologies, Santa Clara, CA) y péptidos separados por un gradiente de acetonitrilo de 2-30 % durante 90 minutos a 10 microlitros/minuto con una HPLC capilar serie 1100 (Agilent Technologies); alternativamente, se usa una columna C18 adecuada para UPLC. Los péptidos se analizan mediante el uso de una trampa de iones lineal LTQ Velos con una fuente ETD (Thermo Fisher Scientific Inc., Waltham, Massachusetts). La ionización por electropulverización se realiza mediante el uso de una fuente de pulverización cautiva (Michrom Bioresources, Inc.) o, preferentemente, un emisor de sílice fundida estirada sin revestimiento (New Objective Inc., Woburn, Massachuetts) a 3,0 kV. Alternativamente, el análisis de fragmentos proteolíticos de tamaño mediano se realiza mediante el uso de un instrumento Thermo LTQ-FT MS (7 Tesla) o un espectrómetro de masas de tiempo de vuelo (ToF) de movilidad de iones de onda viajera Synapt G2-Si (Waters Corp., Milford, Massachusetts). Preferentemente, los péptidos se analizan mediante el uso de un espectrómetro de masas Orbitrap Fusion™ Tribrid™ (Thermo Fisher Scientific). Los péptidos unidos por enlaces disulfuro tienen estados de carga de 4 o más después de la tripsinización debido a la presencia de dos extremos N y dos residuos básicos (arginina o lisina) en los extremos carboxi. Estos péptidos con enlaces disulfuro se aíslan preferentemente con el instrumento Orbitrap Fusion™ para que los enlaces disulfuro puedan romperse mediante el uso de la fragmentación ETD. Los escaneos Survey Ms son seguidos por siete escaneos dependientes de datos que consisten de escaneos CID y ETD MS2 en el ion más intenso en el escaneo de encuesta, seguidos de cinco escaneos MS3 CID en los iones más intensos del primero al quinto en el escaneo ETD MS2. Los escaneos CID usan una energía de colisión normalizada de 35 y los escaneos ETD usan un tiempo de activación de 100 ms con la activación suplementaria habilitada. Las señales mínimas para iniciar exploraciones CID y ETD de MS2 son 10000, las señales mínimas para iniciar exploraciones CID de MS3 son 1000 y los anchos de aislamiento para todas las exploraciones MS2 y MS3 son 3,0 m/z. La función de exclusión dinámica del software está habilitada con un conteo repetido de 1, un tamaño de lista de exclusión de 100 y una duración de exclusión de 30 segundos. Se usan listas de inclusión para apuntar a especies entrecruzadas específicas para la recopilación de escaneos ETD MS2. El Bioworks 3.3 (Thermo Fisher Scientific) crea archivos de datos separados para escaneos MS2 y MS3 mediante el uso del análisis de estado de carga ZSA. La coincidencia de las exploraciones de MS2 y MS3 con las secuencias de péptidos se realiza por Sequest (V27, Rev 12, Thermo Fisher Scientific). El análisis se realiza sin especificidad de enzima, una tolerancia de masa de iones originales de 2,5, tolerancia de masa de fragmentos de 1,0 y una masa variable de 16 para residuos de metionina oxidada. A continuación, los resultados se analizan mediante el uso del programa Scaffold (V3_00_08, Proteome Software, Portland, OR) con probabilidades mínimas de péptido y proteína de 95 y 99 %. Las herramientas de software para la interpretación de datos también incluyen Proteome Discoverer™ 2.0 con el nodo Disulfinator (Thermo Fisher Scientific). Los péptidos de los resultados de MS3 se clasifican por número de escaneo, y los péptidos que contienen cisteína se identifican a partir de grupos de escaneos de MS3 producidos a partir de los cinco iones más intensos observados en los escaneos de ETD MS2. Las identidades de los péptidos de cisteína que participan en las especies unidas por disulfuro se confirman además mediante el examen manual de las masas de iones originales observadas en el escaneo de encuesta y el escaneo ETD MS2.
Ejemplo10
Aislamiento de productos de expresión del periplasma de células bacterianas, de esferoplastos y de células enteras
El sistema de expresión inducible de la invención puede usarse para expresar productos génicos que se acumulan en diferentes compartimentos de la célula, como el citoplasma o el periplasma. Las células huésped tal como E. coli o S. cerevisias tienen una membrana celular externa o pared celular y pueden formar esferoplastos cuando se elimina la membrana o pared externa. Las proteínas expresadas hechas en dichos huéspedes pueden purificarse específicamente del periplasma, de los esferoplastos o de las células enteras, mediante el uso el siguiente método (Schoenfeld, "Convenient, rapid enrichment of periplasmic and spheroplasmic protein fractions using the new PeriPreps™ Periplasting Kit", Epicenter Forum 1998 5(1): 5; ver www.epibio.com/newsletter/f5_1/f5_1 pp.asp). Este método, mediante el uso del PeriPreps™ Periplasting Kit (Epicentre® Biotechnologies, Madison Wl; protocolo disponible en www.epibio.com/pdftechlit/107pl0612.pdf), está diseñado para E. coli y otras bacterias gram negativas, pero el enfoque general puede modificarse para otras células huésped como S. cerevisiae.
1. El cultivo de células huésped bacterianas se cultiva solo hasta la fase logarítmica tardía, ya que los cultivos celulares más antiguos en fase estacionaria suelen demostrar cierta resistencia al tratamiento con lisozima. Si la expresión de la proteína recombinante es excesiva, las células pueden sufrir una lisis prematura; por lo tanto, los cultivos celulares no se cultivan en un medio rico o a temperaturas de crecimiento más altas que puedan inducir una síntesis excesiva de proteínas. Luego se induce la expresión de la proteína; las células deben estar en fase logarítmica o fase estacionaria temprana.
2. El cultivo celular se sedimenta por centrifugación a un mínimo de 1000 x g durante 10 minutos a temperatura ambiente. Nota: las células deben ser frescas, no congeladas. El peso húmedo del sedimento celular se determina con el fin de calcular la cantidad de reactivos necesarios para este protocolo.
3. Las células se resuspenden completamente en un mínimo de 2 mL de tampón Periplasting PeriPreps (Tris-HCI 200 mM, pH 7,5, sacarosa al 20 %, EDTA 1 mM y 30 U/microlitro de Lisozima Ready-Lyse) por cada gramo de células, ya sea mediante mezclado en vórtex o al pipetear hasta que la suspensión celular sea homogénea. Nota: la agitación excesiva puede provocar la lisis prematura de los esferoplastos, lo que da como resultado la contaminación de la fracción periplasmática con proteínas citoplasmáticas.
4. Incubar durante cinco minutos a temperatura ambiente. La Lisozima Ready-Lyse es óptimamente activa a temperatura ambiente. La lisis a temperaturas más bajas (0 °C - 4 °C) requiere un tiempo de incubación adicional; a tales temperaturas, los tiempos de incubación se prolongan de 2 a 4 veces.
5. Añadir 3 mL de agua purificada a 4 °C por cada gramo de peso del sedimento celular original (Etapa 2) y mezclar por inversión.
6. Incubar durante 10 minutos en hielo.
7. Las células lisadas se precipitan por centrifugación a un mínimo de 4000 x g durante 15 minutos a temperatura ambiente.
8. El sobrenadante que contiene la fracción periplasmática se transfiere a un tubo limpio.
9. Para degradar los ácidos nucleicos contaminantes, se añade opcionalmente endonucleasa OmniCleave al tampón de lisis PeriPreps. La inclusión de una nucleasa generalmente mejorará el rendimiento de la proteína y la facilidad de manejo de los lisados, pero la adición de una nucleasa no es conveniente en algunos casos: por ejemplo, se debe evitar el uso de una nucleasa si la actividad residual de la nucleasa o la exposición transitoria al cofactor de magnesio interferirá con los ensayos o usos posteriores de la proteína purificada. La adición de EDTA al lisado para inactivar endonucleasa OmniCleave, igualmente, puede interferir con el ensayo posterior o el uso de la proteína purificada. Si se va a añadir nucleasa, se diluyen 2 microlitros de endonucleasa OmniCleave y 10 microlitros de 1,0 M MgCh hasta 1 mL con tampón de lisis PeriPreps (Tris-HCl 10 mM pH 7,5, KCI 50 mM, EDTA 1 mM y desoxicolato al 0,1 %) por cada mililitro de tampón de lisis necesario en la etapa 10.
10. El sedimento se resuspende en 5 mL de tampón de lisis PeriPreps por cada gramo de peso del sedimento celular original.
11. El sedimento se incuba a temperatura ambiente durante 10 minutos (si se incluye, la actividad de la endonucleasa OmniCleave provocará una disminución significativa de la viscosidad; la incubación continúa hasta que la suspensión celular tenga la consistencia del agua).
12. Los restos celulares se sedimentan mediante centrifugación a un mínimo de 4000 x g durante 15 minutos a 4 °C.
13. El sobrenadante que contiene la fracción de esferoplastos se transfiere a un tubo limpio.
14. Si se agregó endonucleasa OmniCleave al tampón de lisis PeriPreps, se añaden 20 microlitros de EDTA 500 mM por cada mililitro de fracción esferoplástica resultante, para quelar el magnesio (la concentración final de EDTA en el lisado es 10 mM). Después de la hidrólisis de los ácidos nucleicos con endonucleasa OmniCleave, los lisados pueden contener cantidades sustanciales de mono u oligonucleótidos. La presencia de estos productos de degradación puede afectar el procesamiento posterior del lisado: por ejemplo, los nucleótidos pueden disminuir la capacidad de unión de las resinas de intercambio aniónico al interactuar con la resina.
El protocolo anterior puede usarse para preparar la proteína celular total con las siguientes modificaciones. Las células sedimentadas en el la etapa 2 pueden ser frescas o congeladas; en la etapa 4, las células se incuban durante 15 minutos; Se omiten las etapas 5 a 8; en la etapa 10, se añaden 3 mL de tampón de lisis PeriPreps por cada gramo de peso del sedimento celular original.
Después de la preparación de muestras de proteínas periplasmáticas, esferoplásticas o de células enteras, las muestras pueden analizarse mediante cualquiera de varios métodos de caracterización y/o cuantificación de proteínas. En un ejemplo, el fraccionamiento exitoso de proteínas periplasmáticas y esferoplásticas se confirma mediante el análisis de una alícuota de las fracciones periplasmática y esferoplástica por SDS-PAGE (dos microlitros de cada fracción son generalmente suficientes para la visualización mediante tinción con azul de Coomassie). La presencia de proteínas únicas o el enriquecimiento de proteínas específicas en una fracción dada indica un fraccionamiento exitoso. Por ejemplo, si la célula huésped contiene un plásmido de alto número de copias con el marcador de resistencia a la ampicilina, entonces la presencia de p-lactamasa (31,5 kDa) principalmente en la fracción periplasmática indica un fraccionamiento exitoso. Otras proteínas de E. coli que se encuentran en el espacio periplasmático incluyen la fosfatasa alcalina (50 kDa) y el factor de elongación Tu (43 kDa). La cantidad de proteína que se encuentra en una fracción dada puede cuantificarse mediante el uso de cualquiera de varios métodos (tales como SDS-PAGE y análisis de densitometría de bandas de proteína teñidas o marcadas, conteo de centelleo de proteínas radiomarcadas, ensayo inmunoabsorbente ligado a enzimas (ELISA), o ensayo de proximidad de centelleo, entre otros métodos). La comparación de las cantidades de una proteína encontrada en la fracción periplasmática con la fracción esferoplástica indica el grado en que la proteína se ha exportado desde el citoplasma al periplasma.
Ejemplo 11
Determinación de la similitud de la secuencia de aminoácidos o polinucleótidos
El porcentaje de identidad de la secuencia polinucleotídica o de la secuencia de aminoácidos se define como el número de símbolos alineados, es decir, nucleótidos o aminoácidos, que son idénticos en ambas secuencias alineadas, dividido por el número total de símbolos en el alineamiento de las dos secuencias, que incluyen los huecos. El grado de similitud (porcentaje de identidad) entre dos secuencias puede determinarse mediante el alineamiento de las secuencias mediante el uso del método de alineación global de Needleman y Wunsch (J. Mol. Biol. 48:443, 1970), implementado por el Centro Nacional de Información Biotecnológica. (NCBI) en la herramienta de alineación de secuencia global de Needleman-Wunsch, disponible a través del sitio web blast.ncbi.nlm.nih.gov/Blast.cgi. En una modalidad, los parámetros de alineación de Needleman y Wunsch se establecen en los valores predeterminados (puntuaciones de coincidencia/desigualdad de 2 y -3, respectivamente, y costos de hueco para existencia y extensión de 5 y 2, respectivamente). También pueden usarse otros programas usados por los expertos en la técnica de la comparación de secuencias para alinear secuencias, como, por ejemplo, la herramienta de búsqueda de alineación local básica o el programa BLAST® (Altschul y otros, "Basic local alignment search tool", J Mol Biol 5 de octubre del 1990; 215(3): 403-410), tal como lo implementó el NCBI, mediante el uso de la configuración de parámetros predeterminada descrita en el sitio web blast.nc-bi.nlm.nih.gov/Blast.cgi. El algoritmo BLAST tiene múltiples parámetros opcionales, que incluyen dos que pueden usarse de la siguiente manera: (A) inclusión de un filtro para enmascarar segmentos de la secuencia de consulta que tienen una baja complejidad de composición o segmentos que consisten de repeticiones internas de periodicidad corta, que preferentemente no se utilizan o establecido en 'apagado, y (B) un umbral de significación estadística para informar coincidencias con secuencias de bases de datos, denominado 'Esperado' o puntuación E (la probabilidad esperada de coincidencias que se encuentran simplemente por casualidad; si la significación estadística atribuida a una coincidencia es mayor que este umbral de puntuación E, no se informará la coincidencia). Si este valor 'Esperado' o puntuación E se ajusta desde el valor predeterminado (10), los valores de umbral preferidos son 0,5 o, en orden de preferencia creciente, 0,25, 0,1, 0,05, 0,01, 0,001, 0,0001, 0,00001 y 0,000001.
En la práctica de la presente invención, se usan opcionalmente muchas técnicas convencionales en biología molecular, microbiología y tecnología de ADN recombinante. Tales técnicas convencionales se relacionan con vectores, células huésped y métodos recombinantes. Estas técnicas son bien conocidas y se explican, por ejemplo, en Berger y Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology volumen 152 Academic Press, Me, San Diego, CA; Sambrook y otros, Molecular Cloning - A Laboratory Manual (3ra edición), volumen 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, Nueva York, 2000; y Current Protocols in Molecular Biology, FM Ausubel y otros, editores, Current Protocols, a joint venture between Greene Publishing Associates, Inc. y John Wiley & Sons, Inc., (complementado hasta 2006). Otras referencias útiles, por ejemplo para el aislamiento y cultivo de células y para el posterior aislamiento de proteínas o ácidos nucleicos, incluyen Freshney (1994) Culture of Animal Cells, a Manual of Basic Technique, tercera edición, Wiley-Liss, Nueva York y las referencias allí citadas; Payne y otros (1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. New York, NY; Gamborg y Phillips (Editores) (1995) Plant Cell, Tissue and Organ Culture; Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlín, Heidelberg, Nueva York); y Atlas y Parks (Editores.) The Handbook of Microbiological Media (1993) CRC Press, Boca Raton, FL. Los métodos para producir ácidos nucleicos (por ejemplo, por amplificación in vitro, purificación a partir de células o síntesis química), métodos para manipular ácidos nucleicos (por ejemplo, mediante mutagénesis de sitio dirigida, digestión con enzimas de restricción, ligadura, etc.), y varios vectores, líneas celulares y similares útiles para manipular y la producción de ácidos nucleicos se describe en las referencias anteriores. Además, esencialmente cualquier polinucleótido (que incluyen los polinucleótidos marcados o biotinilados) puede solicitarse de forma personalizada o estándar a cualquiera de una variedad de fuentes comerciales.

Claims (15)

REIVINDICACIONES
1. Una construcción de expresión que comprende dos o más promotores inducibles,
en donde al menos un promotor inducible es un promotor inducible por propionato y al menos otro promotor inducible es un promotor inducible por L-arabinosa,
en donde la construcción de expresión comprende una secuencia de nucleótidos que tiene al menos un 87 % de identidad con los nucleótidos 2818 a 3259 de la SEQ ID NO:15 y una secuencia de nucleótidos que tiene al menos un 90 % de identidad con los nucleótidos 4937 a 5304 de la SEQ ID NO:15;
y en donde la construcción de expresión comprende una secuencia de nucleótidos seleccionada del grupo que consiste en:
(a) una secuencia de nucleótidos que tiene al menos un 80 % de identidad con al menos 3000 bases contiguas de los nucleótidos 1833 a 5304 de la SEQ ID NO:15;
(b) una secuencia de nucleótidos que tiene al menos un 80 % de identidad con al menos 3250 bases contiguas de los nucleótidos 1833 a 5304 de la SEQ ID NO:15;
(c) una secuencia de nucleótidos que tiene al menos un 80 % de identidad con al menos 3000 bases contiguas de la SEQ ID NO:15;
(d) una secuencia de nucleótidos que tiene al menos un 80 % de identidad con al menos 3250 bases contiguas de la SEQ ID NO:15;
(e) una secuencia de nucleótidos que tiene al menos un 80 % de identidad con al menos 3500 bases contiguas de la SEQ ID NO:15;
(f) una secuencia de nucleótidos que tiene al menos un 80 % de identidad con al menos 4000 bases contiguas de la SEQ ID NO:15;
(g) una secuencia de nucleótidos que tiene al menos un 80 % de identidad con al menos 5000 bases contiguas de la SEQ ID NO:15.
2. Construcción de expresión de acuerdo con la reivindicación 1, en donde la construcción de expresión comprende al menos una secuencia de nucleótidos seleccionada del grupo que consiste en:
(a) una secuencia de nucleótidos que tiene al menos un 90 % de identidad con al menos 400 bases contiguas de los nucleótidos 2818 a 3259 de la SEQ ID NO:15;
(b) una secuencia de nucleótidos que tiene al menos un 95 % de identidad con al menos 350 bases contiguas de los nucleótidos 2818 a 3259 de la SEQ ID NO:15;
(c) una secuencia de nucleótidos que tiene al menos un 90 % de identidad con los nucleótidos 2818 a 3259 de la SEQ ID NO:15;
(d) una secuencia de nucleótidos que tiene al menos un 95 % de identidad con los nucleótidos 2818 a 3259 de la SEQ ID NO:15;
(e) una secuencia de nucleótidos que tiene al menos un 95 % de identidad con los nucleótidos 4937 a 5304 de la SEQ ID NO:15.
3. La construcción de expresión de cualquier reivindicación anterior, en donde la construcción de expresión comprende la SEQ ID No :15.
4. La construcción de expresión de cualquier reivindicación anterior, en donde la construcción de expresión es extracromosómica.
5. La construcción de expresión de cualquier reivindicación anterior, que comprende además al menos un promotor inducible seleccionado del grupo que consiste en un promotor inducible por ramnosa, un promotor inducible por xilosa, un promotor inducible por lactosa y un promotor inducible por agotamiento de fosfato.
6. La construcción de expresión de cualquier reivindicación anterior, que comprende además al menos una secuencia polinucleotídica que codifica un regulador transcripcional que se une a un promotor inducible.
7. La construcción de expresión de cualquier reivindicación anterior, que comprende además al menos una secuencia polinucleotídica que codifica al menos un producto génico a transcribir a partir de un promotor inducible.
8. Una célula huésped que comprende la construcción de expresión de cualquier reivindicación anterior.
9. La célula huésped de acuerdo con la reivindicación 8, en donde la célula huésped es una célula procariota.
10. La célula huésped de acuerdo con la reivindicación 9, en donde la célula huésped es E. coli.
11. La célula huésped de cualquiera de las reivindicaciones 8-10, en donde la célula huésped tiene una alteración de la función génica de al menos un gen que codifica una proteína transportadora para un inductor de al menos un promotor inducible.
12. La célula huésped de cualquiera de las reivindicaciones 8-11, en donde la célula huésped tiene un nivel reducido de función génica de al menos un gen que codifica una proteína que metaboliza un inductor de al menos un promotor inducible.
13. La célula huésped de cualquiera de las reivindicaciones 8-12, en donde la célula huésped tiene un nivel reducido de función génica de un gen de la tiorredoxina reductasa.
14. La célula huésped de cualquiera de las reivindicaciones 8-13, en donde la célula huésped expresa al menos una forma mutante de AhpC.
15. Un método para producir un producto génico, el método comprende hacer crecer un cultivo de la célula huésped de cualquiera de las reivindicaciones 8-14, en donde la célula huésped comprende al menos una de dichas construcciones de expresión que comprende al menos una secuencia polinucleotídica que codifica al menos un producto génico a transcribir a partir de cada promotor inducible, y añadir un inductor para cada uno de dichos promotores inducibles al cultivo.
ES16812476T 2015-06-16 2016-06-16 Vectores para el uso en un sistema de coexpresión inducible Active ES2906725T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/740,475 US20150353940A1 (en) 2013-08-05 2015-06-16 Vectors for use in an inducible coexpression system
PCT/US2016/037942 WO2016205570A1 (en) 2015-06-16 2016-06-16 Vectors for use in an inducible coexpression system

Publications (1)

Publication Number Publication Date
ES2906725T3 true ES2906725T3 (es) 2022-04-20

Family

ID=54769087

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16812476T Active ES2906725T3 (es) 2015-06-16 2016-06-16 Vectores para el uso en un sistema de coexpresión inducible

Country Status (13)

Country Link
US (2) US20150353940A1 (es)
EP (2) EP3310919B1 (es)
JP (2) JP6976860B2 (es)
KR (1) KR20180020213A (es)
CN (1) CN107849572A (es)
AU (2) AU2016278242B2 (es)
CA (1) CA2986443A1 (es)
DK (1) DK3310919T3 (es)
ES (1) ES2906725T3 (es)
HK (1) HK1253045A1 (es)
IL (2) IL307555A (es)
MX (1) MX2017016400A (es)
WO (1) WO2016205570A1 (es)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017106583A1 (en) * 2015-12-15 2017-06-22 Absci, Llc Cytoplasmic expression system
CA3114395A1 (en) 2018-09-25 2020-04-02 Absci, Llc Protein purification methods
JP2022506156A (ja) 2018-11-05 2022-01-17 ジェネンテック, インコーポレイテッド 原核宿主細胞における2鎖タンパク質の産生方法
CN111269294B (zh) * 2018-12-05 2023-03-28 广州中国科学院先进技术研究所 纤维寡糖转运蛋白LacY的突变位点、突变转运蛋白LacY及其制备方法和应用
CN111979206B (zh) * 2019-05-24 2021-08-17 深圳瑞德林生物技术有限公司 固定化融合酶及用其制备谷胱甘肽的方法
CN113528410A (zh) * 2021-06-23 2021-10-22 云舟生物科技(广州)有限公司 一种用于快速高效诱导表达外源蛋白的大肠杆菌工程菌及其制备方法与应用
WO2023114905A1 (en) 2021-12-16 2023-06-22 Absci Corporation Membrane-associated fusion proteins to increase the competency of cells
WO2023114452A1 (en) 2021-12-17 2023-06-22 Absci Corporation Solid-phase screening for high-performing bacterial strains
WO2023122567A1 (en) 2021-12-21 2023-06-29 Absci Corporation Fola selection assay to identify strains with increased soluble target protein expression
CA3240314A1 (en) 2021-12-23 2023-06-29 Absci Corporation Products and methods for heterologous expression of proteins in a host cell
WO2023129881A1 (en) * 2021-12-30 2023-07-06 Absci Corporation Knockout of ptsp gene elevates active gene expression
US20230268026A1 (en) 2022-01-07 2023-08-24 Absci Corporation Designing biomolecule sequence variants with pre-specified attributes
WO2024006269A1 (en) 2022-06-29 2024-01-04 Absci Corporation Affinity screening method
WO2024040020A1 (en) 2022-08-15 2024-02-22 Absci Corporation Quantitative affinity activity specific cell enrichment

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3344618B2 (ja) 1997-06-20 2002-11-11 株式会社エイチ・エス・ピー研究所 シャペロン発現プラスミド
DE69815384T2 (de) * 1997-12-05 2003-12-04 Europ Lab Molekularbiolog Neue methode zur klonierung dns unter anwendung des e. coli rece/rect rekombinationssystems
US6780405B1 (en) 2000-04-28 2004-08-24 Avant Immunotherapeutics, Inc. Regulated antigen delivery system (RADS)
ATE405650T1 (de) * 2000-12-14 2008-09-15 Genentech Inc Produktion von ganzen antikörpern in prokaryontischen zellen
US6979556B2 (en) * 2000-12-14 2005-12-27 Genentech, Inc. Separate-cistron contructs for secretion of aglycosylated antibodies from prokaryotes
WO2003018771A2 (en) * 2001-08-27 2003-03-06 Genentech, Inc. A system for antibody expression and assembly
WO2005040388A2 (en) * 2003-08-22 2005-05-06 Nucleonics Inc. Eukariotic expression systems for expression of inhibitory rna in multiple intracellular compartments
US8227241B2 (en) * 2004-03-12 2012-07-24 Unigene Laboratories, Inc. Bacterial host cell for the direct expression of peptides
DE102004061846A1 (de) * 2004-12-22 2006-07-13 Basf Ag Mehrfachpromotoren
BRPI0611112A2 (pt) 2005-06-06 2010-08-10 Dow Global Technologies Inc sistemas promotores induzidos por manitol em células hospedeiras bacterianas
US8178338B2 (en) 2005-07-01 2012-05-15 The Regents Of The University Of California Inducible expression vectors and methods of use thereof
US8629245B2 (en) 2007-05-01 2014-01-14 Research Development Foundation Immunoglobulin Fc libraries
US8999668B2 (en) 2008-01-03 2015-04-07 Cornell Research Foundation, Inc. Glycosylated protein expression in prokaryotes
KR100958096B1 (ko) * 2008-02-11 2010-05-14 한국과학기술원 염색체 특정 부위 제거용 재조합 벡터 및 이를 이용한미생물 내 염색체 특정 부위의 제거방법
WO2010075956A1 (de) * 2008-12-16 2010-07-08 C-Lecta Gmbh Expressionsvektor
EP2406383A4 (en) * 2009-03-10 2012-12-26 Athena Biotechnologies Inc REDUCTION IN CARBON DIOXIDE PRODUCTION AND INCREASE IN ETHANOL YIELD DURING MICROBIAL FERMENTATION OF ETHANOL
US8623652B2 (en) * 2009-04-06 2014-01-07 Lucigen Corporation Host-vector system for cloning and expressing genes
DK2501406T3 (en) * 2009-11-19 2018-02-26 Glaxosmithkline Biologicals Sa BIOSYNTHESE SYSTEM PRODUCING IMMUNOGENIC POLYSACCHARIDES IN PROCARYOTIC CELLS
US8603797B2 (en) * 2010-03-17 2013-12-10 Cornell University Methods and compositions for targeted mutagenesis in bacteria
EP2386641A1 (en) 2010-05-11 2011-11-16 Université Catholique De Louvain Method for extracellular production of recombinant biomolecules in a microorganism
WO2015020690A1 (en) * 2013-08-05 2015-02-12 Aronora, Inc. Coordinated coexpression of thrombin
EP3187586B1 (en) * 2012-08-05 2019-09-25 Absci, LLC Inducible coexpression system

Also Published As

Publication number Publication date
IL256094B2 (en) 2024-03-01
WO2016205570A1 (en) 2016-12-22
JP2021153600A (ja) 2021-10-07
EP4039810A1 (en) 2022-08-10
CA2986443A1 (en) 2016-12-22
IL256094B1 (en) 2023-11-01
MX2017016400A (es) 2018-03-02
KR20180020213A (ko) 2018-02-27
DK3310919T3 (da) 2022-02-14
JP6976860B2 (ja) 2021-12-08
EP3310919A4 (en) 2019-01-09
AU2016278242A1 (en) 2018-01-18
IL307555A (en) 2023-12-01
US11371048B2 (en) 2022-06-28
US20160376602A1 (en) 2016-12-29
HK1253045A1 (zh) 2019-06-06
EP3310919B1 (en) 2021-12-15
AU2016278242B2 (en) 2022-06-09
EP3310919A1 (en) 2018-04-25
IL256094A (en) 2018-02-28
AU2022228166A1 (en) 2022-09-29
JP2018518957A (ja) 2018-07-19
US20150353940A1 (en) 2015-12-10
CN107849572A (zh) 2018-03-27

Similar Documents

Publication Publication Date Title
ES2906725T3 (es) Vectores para el uso en un sistema de coexpresión inducible
US11447781B2 (en) Host cells for use in an inducible coexpression system
WO2017106583A1 (en) Cytoplasmic expression system
US20200270338A1 (en) Expression constructs, host cells, and methods for producing insulin
US20220364104A1 (en) Vectors for use in an inducible coexpression system