WO2023067380A1 - Sistema genético para la biosíntesis de leupeptina y su uso en sistemas heterólogos de producción - Google Patents

Sistema genético para la biosíntesis de leupeptina y su uso en sistemas heterólogos de producción Download PDF

Info

Publication number
WO2023067380A1
WO2023067380A1 PCT/IB2021/062510 IB2021062510W WO2023067380A1 WO 2023067380 A1 WO2023067380 A1 WO 2023067380A1 IB 2021062510 W IB2021062510 W IB 2021062510W WO 2023067380 A1 WO2023067380 A1 WO 2023067380A1
Authority
WO
WIPO (PCT)
Prior art keywords
domain
leupeptin
adenylation
thioesterase
followed
Prior art date
Application number
PCT/IB2021/062510
Other languages
English (en)
French (fr)
Inventor
César Augusto AGUILAR MARTÍNEZ
Hilda Eréndira RAMOS ABOITES
Cuauhtémoc LICONA CASSANI
Marco Antonio MORALES ESCALANTE
Karina VERDEL ARANDA
Francisco BARONA GÓMEZ
Original Assignee
Centro De Investigación Y De Estudios Avanzados Del Instituto Politécnico Nacional
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Centro De Investigación Y De Estudios Avanzados Del Instituto Politécnico Nacional filed Critical Centro De Investigación Y De Estudios Avanzados Del Instituto Politécnico Nacional
Publication of WO2023067380A1 publication Critical patent/WO2023067380A1/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K5/00Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof
    • C07K5/04Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof containing only normal peptide links
    • C07K5/08Tripeptides
    • C07K5/0802Tripeptides with the first amino acid being neutral
    • C07K5/0804Tripeptides with the first amino acid being neutral and aliphatic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/76Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Actinomyces; for Streptomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)

Definitions

  • NPs have been simplified for their study into: i) terpenoids and spheroids (for example, taxol); ii) alkaloids (for example morphine); iii) substances derived from fatty acids (for example prostaglandin Ei which is an eicosanoid); iv) polyketides (such as erythromycin); v) non-ribosomal peptides (such as penicillin) or small aldehyde peptides (such as leupeptin) and vi) enzyme cofactors (such as cobaamine).
  • NPs are metabolites that are generally derived from specialized metabolism, also known as secondary metabolism, the production of which is not essential for cell maintenance, but rather for its adaptation and survival.
  • NPs neuropeptides
  • the evolutionary implications of NPs reveal complex relationships in the different niches, since the chemical and structural characteristics of these metabolites can act at very particular levels of interaction between species, which affects their distribution, since this type of metabolites can not be conserved even among members of the same species, and be specific at the level of strains or variants of the same species.
  • the evolutionary nature of these molecules also implies that they are produced under specific conditions that can hardly be recreated in the laboratory.
  • the aldehydic end interacts with the active sites of the proteases, forming hemiacetal or hemithioacetal complexes with the catalytic residues, frequently serines or cisternae, preventing their operation (figure 1) [Brayer, 1979; Wlodawer, 2001 ; Bullock, 1996; Hines, 2008],
  • ureido group acts as an adapter that changes the order of the peptide, from N-terminal to C-terminal to C-terminal to C-terminal, resulting in peptides with chemical characteristics and biologics other than traditional ribosomal peptides ( Figure 1).
  • the size of the peptide chain can range from two to six residues, while acyl groups can range from two to nine carbon atoms.
  • the present invention provides all the necessary genetic bases for leupeptin biosynthesis, as well as the heterologous expression of biosynthetic genes to obtain it in the culture medium.
  • FIG. 1 The chemical structures and theoretical masses of leupeptin (N-acetyl-leucyl-N- ⁇ (5-[(diaminomethylidene)amino]-1-oxopentane-2-yl ⁇ -leucinamide) and other related molecules are shown.
  • the basic structural features of two groups of SPA's are shown.
  • the acetyl protecting group characteristic of group I is shown in green.
  • the ureido group and its antisense amino acid characteristic of group II are shown in green and blue respectively.
  • FIG. 4 Genomic mining with EvoMining for the identification of leupeptin BGC is shown.
  • the phylogenetic tree produced by EvoMining using an ASL enzyme from the central metabolism of Actinobacteria is shown.
  • the cyade in which the ASL2 of S. roseus ATCC 31245 is found is highlighted in a frame.
  • Other divergent ASLs involved in the synthesis of eight known NPs appear to be phylogenetically close within that subclade.
  • roseus ATCC 31245 were compared to authentic standards obtained from commercial suppliers. Fractions from fermentations, whose retention times coincided with those of the standards, were collected and analyzed using MS and inhibition assays ( Figure 3). In this way, it was possible to confirm that S. roseus ATCC 31245 produces leupeptin.
  • Leupeptin is synthesized by an NRPS system similar to that of flavopeptin, so this assembly line must have an acyl transferase domain at the N-terminus, three adenylation domains, two fusion domains, a reductase domain at the the C-terminus and three peptide-carry domains (PCPs).
  • ASL condenses succinate and arginine through an amide bond in the guanidine group of arginine in a reversible reaction during arginine biosynthesis (Sampaleanu et al. 2001).
  • EvoMining provided a phylogenetic tree with paralogous ASL enzymes from central metabolism and the version of the putative enzyme belonging to specialized metabolism in different and well-defined branches (Figure 4).
  • the topology of this tree is canonical, placing the central enzymes in the core of the tree and the divergent enzymes in the outer branches.
  • roseus ATCC 31245 genome was identified as having two ASLs, and it was proposed that one of them was dedicated to arginine biosynthesis; while the second copy, ASL2, being in the penultimate branch and presenting a characteristic genomic context of secondary metabolite biosynthetic genes, was proposed as recruited by a BGC of seven genes that has not been linked to any natural product to date.
  • the cyad to which ASL2 belongs is a well-defined cyad and includes several homologues involved in the synthesis of known natural products, including kirromycin (Weber et al. 2008), malacidin (Lam and Crawford 2018), totopensamide (Chen et al. .2017), lobophorin (L ⁇ et al.
  • the method further involves inducing the expression and biosynthesis of leupeptin by culturing said microbial strain transformed with said expression vector which may be the pESAC_810 vector, wherein the method further involves culturing the microbial strain transformed with said vector and then recover the leupeptin fraction and purify it by conventional methods known in the technical field of the present invention.
  • the method of the invention also involves expressing this cluster heterologously in a strain of E. coli transformed with the vector containing said cluster, for example the vector pESAC_810, to induce leupeptin biosynthesis in cultures of fermentation and purify it by conventional methods known in the technical field of the present invention.
  • Genomic DNA of S. roseus ATCC 31245 was obtained by phenol-chloroform extractions, using widely known methods. Genomic DNA was used to obtain pair-end libraries with inserts between 1000 and 1600 nucleotides. These libraries were sequenced on a MiSeq equipment at the Langebio genomic sequencing unit (Irapuato, Mexico). Reads were quality analyzed using FastQC (http://www.bioinformatics.bbsrc.ac.uk/projects/fastqc) and reads were filtered using trimmomatic [Bolger, 2014] with a quality cutoff of 28 or more and a minimum size of 200 for those with 250 bases.
  • FastQC http://www.bioinformatics.bbsrc.ac.uk/projects/fastqc

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

La presente invención describe el descubrimiento de los genes que dirigen la ruta biosintética de la leupeptina, un potente inhibidor de proteasas del tipo péptido aldehídico pequeño (SPA por sus siglas en ingles). La predicción de los genes que dirigen la biosíntesis de leupeptina se llevó a cabo gracias a EvoMining, una tubería bioinformática para minería genómica de productos naturales basada en parámetros evolutivos, y fue confirmado mediante el uso de técnicas de biología molecular como mutagénesis insercional y comparación de perfiles metabolómicos entre cepas silvestre (productora de leupeptina) y muíante (no productora de leupeptina). Los genes biosintéticos contenidos en el clúster aislado conforme a la presente invención codificantes para leupeptina, se expresaron heterólogamente en E. coli, logrando así la producción de leupeptina.

Description

Sistema genético para la biosíntesis de leupeptina y su uso en sistemas heterólogos de producción
Campo de la invención:
La presente invención pertenece al campo de la ingeniería genética y se refiere a la identificación del sistema genético y caracterización de la ruta biosintética del inhibidor de proteasas leupeptina, para ser utilizado en sistemas biológicos heterólogos de producción (p. ej., Escherichia coli, Bacillus subtilis o Saccharomyces cerevisiae entre otros) a escala industrial de forma independiente o como auxiliar en un sistema de expresión de proteínas de interés industrial.
Antecedentes de la invención:
Los productos naturales (NPs) son moléculas orgánicas de diverso peso molecular que representan una familia muy amplia y heterogénea de entidades químicas con múltiples funciones biológicas. Estas moléculas pueden ser producidas por bacterias, hongos, plantas y animales. Los NPs son una fuente consistente de fármacos, de los cuales se conocen alrededor de 20,000 de origen microbiano y se estima que existen alrededor de 300,000. Históricamente, los NP se han simplificado para su estudio en: i) terpenoides y esferoides (por ejemplo, el taxol); ¡i) alcaloides (por ejemplo la morfina); iii) sustancias derivadas de ácidos grasos (por ejemplo la prostaglandina Ei que es un eicosanoide); iv) policétidos (como la eritromicina); v) péptidos no ribosomales (como la penicilina) o péptidos aldehidos pequeños (como la leupeptina) y vi) cofactores enzimáticos (como la cobaíamina). En bacterias y hongos, los NPs son metabolites que por lo general se derivan del metabolismo especializado, también conocido como metabolismo secundario, cuya producción no es esencial para el mantenimiento celular, pero sí para su adaptación y sobrevivencia.
Las implicaciones evolutivas de los NPs, revelan relaciones complejas en los distintos nichos, ya que las características químicas y estructurales de estos metabolites pueden actuar a niveles muy particulares de interacción entre especies, lo que repercute en su distribución, ya que este tipo de metabolites pueden no estar conservados incluso entre miembros de una misma especie, y ser específicos a nivel de cepas o variantes de la misma especie. Así mismo, el carácter evolutivo de estas moléculas también implica que se producen bajo condiciones específicas que difícilmente pueden ser recreadas en laboratorio.
El advenimiento de las tecnologías de secuenciación masiva ha dado la oportunidad de conocer el genoma de cientos de miles de genomas de bacterias, donde para su estudio, se originó el campo de la minería genómica. La minería genómica se define como el análisis computational de datos de secuencias nucleotídicas basado en la comparación y reconocimiento de patrones conservados. Bajo esta definición, cualquier método computational que implique la búsqueda y predicción de propiedades fisiológicas o metabólicas se considera minería genómica. El enfoque de minería genómica a NPs, se refiere específicamente a la identificación de clústeres de genes biosintéticos de NPs. Este repertorio puede incluir compuestos cuyas estructuras sean conocidas, o compuestos putativos cuya presencia es inferida solo en base al repertorio genético. La minería genómica además puede ayudar a entender las reacciones enzimáticas responsables en la síntesis de estas moléculas; así como predecir los sustratos y productos cuando se trate de enzimas no caracterizadas. En conjunto, la minería genómica puede apoyarse en disciplinas como la ingeniería metabólica para mudar de sistema biológico estos sistemas genéticos, y producir estos metabolites de manera eficiente y a bajo costo; crear estrategias o métodos para evaluar su bioactividad contra patógenos y elucidar si los nuevos metabolites tienen alguna relevancia para la biotecnología o la medicina, y/o modificarlos para mejorar su eficiencia.
En ese sentido, un tipo específico de inhibidores de proteasas conocidos como péptidos aldehídicos pequeños (SPA), como por ejemplo la leupeptina, la antipaína y la quimostatina, han cobrado una gran relevancia desde hace más de una década, pues son utilizados en la industria y laboratorios de investigación científica como parte del proceso de purificación de proteínas, en donde la proteólisis es un proceso no deseado. La inhibición de proteasas en la industria y laboratorios representa el mercado más grande para estos compuestos, encabezados por leupeptina y antipaína. Si bien no se cuenta con datos específicos al respecto, prácticamente todo proceso de producción de proteínas heterólogas, algunas de altísimo valor agregado como las vacunas de última generación, involucra el uso de leupeptina o de alguno de sus análogos.
Adicionalmente a su importancia en este rubro, debido a que las proteasas forman parte fundamental en procesos de señalización celular, han sido históricamente consideradas blancos prometedores para el desarrollo de terapias para enfermedades donde la proteólisis es relevante. En este contexto, los inhibidores de proteasas, entre ellos los pertenecientes a la amplia familia de los péptidos pequeños aldehídicos (SPAs), como la leupeptina, están siendo utilizados extensivamente para su desarrollo como agentes terapéuticos [Hines, 2008; Kisselev, 2012], La mayoría de estas enfermedades están asociadas a defectos en el funcionamiento del proteosoma, un complejo proteico dedicado a la degradación de proteínas endógenas. Otras enfermedades están relacionadas a defectos en el funcionamiento de las calpaínas (proteasas hiperactivas en condiciones como la enfermedad de Alzheimer y la formación de cataratas); y las catepsinas, estás últimas han sido ligadas al cáncer y enfermedades inflamatorias [Hines, 2008; Kisselev, 2012], Las proteasas son además de vital importancia para diversos agentes patogénicos durante los procesos infecciosos, por lo que se ha explorado el uso de inhibidores de proteasas para combatir el virus de inmunodeficiencia humana, citomegalovirus, y muy recientemente, el SARS-CoV-2 [Kaspari, 2008; Stefanelli, 1995], Los SPAs, en consecuencia, son comercializados y se obtienen a través de fermentaciones bacterianas del género Streptomyces, siendo estos productos mucho más ampliamente usados y de mayor valor que las pocas variantes sintéticas que se han podido obtener. Los primeros productos naturales con actividad antiproteolítica pertenecientes a la familia de péptidos pequeños aldehídicos fueron descubiertos en 1969, en extractos fermentativos de bacterias pertenecientes al género Streptomyces, que a su vez perteneciente al phylum Actinobacteria. Su descubrimiento fue el resultado del uso de métodos tradicionales de screening o tamizado por actividad, seguido de aislamiento, purificación y caracterización química [Aoyagi, 1969], Compuestos pertenecientes a esta familia también se han detectado en otros miembros de las Actinobacterias, así como en otras bacterias Gram positivas de los géneros Bacillus y Staphylococcus, cianobacterias y en hongos del grupo Ascomycota. Además de su naturaleza peptídica y su bajo peso molecular, el cual ronda entre los 300 y 900 Daltones, los SPAs comparten otras características químicas, como son: (i) la falta de grupos N terminal, debido a que se encuentran “protegidos” con grupos acilo, de uno o más carbonos o con grupos ureido-aminoácido, dando lugar a un extremo acilado o aminoacilado el cual presenta un grupo carboxílico terminal; y (¡i) la presencia de un grupo aldehídico terminal derivado de la modificación del carboxilo terminal de la cadena peptídica, mediante un proceso reductivo, el cual es responsable de la actividad biológica de la molécula. El extremo aldehídico interactúa con los sitios activos de las proteasas formado complejos hemiacetales o hemitioacetales con los residuos catalíticos, frecuentemente serinas o cisternas, impidiendo su funcionamiento (figura 1) [Brayer, 1979; Wlodawer, 2001 ; Bullock, 1996; Hines, 2008],
Con base en las características de sus grupos funcionales, los SPAs pueden dividirse en dos subclases: (i) aquellos con un grupo terminal protegido por un grupo acilo, dentro de los que se encuentran flavopeptina, tirostatina, tiropeptina, nerfilina, estrepina, leupeptina, bacitrocina, tiolestatina y acetil-leucina-arginal; y (¡i) aquellos en los que el grupo N-terminal se une a un grupo ureido que a su vez está unido a un aminoácido por medio de un enlace amídico, tales como por ejemplo quimostatina (o chimostatina), MAPI, GE20372, antipaína y elastatinal. Esta configuración permite alterar el orden de la cadena peptídica, donde el grupo ureido actúa como un adaptador que cambia el orden del péptido, de N-terminal hacia C-terminal por C-terminal hacia C-terminal, dando como resultado péptidos con características químicas y biológicas distintas a los péptidos ribosomales tradicionales (Figura 1). De igual manera, el tamaño de la cadena peptídica puede variar de dos a seis residuos, mientras que los grupos acilo pueden ir de dos hasta nueve átomos de carbono. Partiendo de los SPAs cuyas estructuras han sido experimentalmente determinadas, se reconocen a los residuos o aminoácidos arginina, fenilalanina, tirosina, leucina, isoleucina, valina y glutamina, formando las cadenas peptídicas. En la mayoría de los SPAs el grupo aldehídico se deriva del grupo carboxílico de fenilalaninas, tirosinas o argininas, mientras que el aminoácido siguiente es comúnmente alguno del grupo de los de cadena ramificada, ya sea isoleucina, leucina o valina.
Fuera de esta clasificación, se han reportado algunas excepciones, por ejemplo el caso de elastatina, el cual está formado por ¡sovaleril-ureido-arginina-glutamina-alanilal; así como dos de los SPAs más pequeños que se conocen a la fecha, las bacitrocinas y la tiolestatina, ambos inhibidores de cisteína/serina proteasas, producidas por bacterias del género Bacillus [Kamiyama, 1994; Murao, 1985],
Como antes se mencionó, probablemente la leupeptina sea el inhibidor de proteasas con más alto valor comercial en la actualidad. La leupeptina, es un SPA cuya molécula se compone de tres aminoácidos y una cadena acil que puede ser un grupo acetil (Leupeptina I o leupeptina PR-LL) o propionil (Leupeptina II o leupeptina Ac-LL) unido al residuo N-terminal (Leu). En el extremo C- terminal de la molécula, el grupo C-terminal es químicamente diferente al de la mayoría de los péptidos y proteínas ya que tiene un grupo aldehido en lugar de un grupo carboxilo (Figura 1). En principio, la leupeptina se ha purificado de cultivos de varias cepas de Streptomyces basándose en su actividad antiplasmina, donde a partir de estos extractos se determinaron las estructuras de las dos variantes conocidas. A pesar de que la variante PR-LL es activa como inhibidor de proteasas y está disponible comercialmente, la variante Ac-LL es la más usada. Sus análogos son usualmente aquellos en los que uno o ambos residuos de leucina se reemplazan por residuos isoleucina o valina. Ya se han sintetizado químicamente análogos de leupeptina R-L-leucil-L-leucil-L-argininal con sustituyentes variables en n-terminal, usando N-alfa-tert-butil-oxicarbonil-NG-benziloxicarbonil-L- arginina-delta-lactam como el material de inicio.
La leupeptina, posee gran relevancia no solo a sus blancos de acción, sino también gracias a su mecanismo de acción, ya que actúa como inhibidor competitivo de proteasas, y es reversible. Entre sus blancos mayormente caracterizados se encuentran las catepsinas B, H, L y S; calpaína [Kieran & Greensmith, 2004], calikreína, papaína, plasmina, tripsina y a proteasas similares a tripsina. En general, las serin-proteasas, cisteín-proteasas y treonin-proteasas son sus moléculas blanco. No tiene efecto o es muy bajo sobre la catepsina A y D y sobre la quimotripsina. Las soluciones stock de leupeptina son estables a +4°C, máximo por 7 días, y por 6 meses si se almacenan a -20°C. Las soluciones de trabajo son estables solo algunas horas.
De forma concreta, la leupeptina se usa o se ha usado:
- Como agente terapéutico para modular la reperfusión intestinal que ocurre en casos de choque por quemadura en la mucosa intestinal y que compromete su integridad, evitando también que las bacterias entéricas crucen la pared luminal del intestino y lleguen a infectar otras partes del organismo [Xia ZF, 1995],
- La leupeptina puede inhibir á la endoproteasa de la acrosina del espermatozoide de mamíferos, por lo que se puede utilizar como anticonceptivo, aunque también se ha encontrado que 2 derivados de la leupeptina (R = trifluoroacetil, R = tert-butiloxicarbonil) pueden ser más potentes [Borin G, 1981],
- La leupeptina también ha mostrado prevenir la disfunción contráctil del diafragma, que puede ocurrir cuando se aplica la ventilación mecánica controlada ya que ocurre elevada proteólisis y atrofia [Maes K, 2007],
- Otra de las aplicaciones más comunes de la leupeptina es durante experimentos enzimáticos in vitro en laboratorios de ciencia básica y aplicada de todo el mundo. Como parte de diversos protocolos experimentales, la lisis celular provoca la liberación de proteasas que, de no ser inactivadas, destruirían cualquier producto de la reacción en estudio, lo cual puede impedir la correcta interpretación del experimento.
Desde el descubrimiento de la leupeptina a finales de los 60's [Aoyagi, 1969; Kondo, 1969], un gran número de estudios han descrito el aislamiento de nuevos SPAs, así como la identificación taxonómica de los microorganismos que los producen, sus métodos de fermentación y purificación, sus estructuras químicas y su actividad biológica (Tabla 1). Sin embargo, a pesar de la enorme importancia de estos compuestos, se sabe muy poco sobre su biosíntesis.
Los primeros esfuerzos de caracterización de la biosíntesis de leupeptina se basaron en el fraccionamiento y purificación de extractos proteicos de Streptomyces roseus, el organismo productor de leupeptina, y el uso de estos extractos para ensayos enzimáticos in vitro. Estos estudios sugirieron que una sintasa de péptidos no ribosomales, ahora conocidas como NRPSs, así como una reductasa, estarían involucradas en la síntesis de este compuesto. Estos estudios determinaron la posible incorporación de L-Leucina, D-Leucina y acetil-CoA como precursores [Suzukake, 1980], También se reportó el uso de ATP, así como que el intermediario acil-Leu-Leu era liberado de la presunta sintetasa, responsable de su formación, lo cual es inusual durante el proceso de ensamblado de un péptido por las NRPS. Recientemente, la vía de síntesis de la flavopeptina, un péptido aldehídico con actividad inhibitoria de proteasas ha sido descrita [Chen, 2013], La flavopeptina es sintetizada por una NRPS cuyos dominios están organizados de manera colíneal, es decir de acuerdo con el orden en el que los precursores son incorporados en la estructura final. La sintetasa de la flavopeptina incluye un dominio de transferencia de grupos acilo que es responsable de la incorporación de la acilación del sexto aminoácido del péptido (N-acil terminal). La sintetasa incluye además dominios de adenilación, proteínas acarreadoras de peptidiles, dominios de condensación (para la sucesiva incorporación de seis aminoácidos precursores, lle-GIn-lle-GIn-Val/Leu-Phe), un dominio de epimerización y finalmente un dominio de reductasa (figura 2).
Como se ha mencionado anteriormente, la mayoría de los inhibidores de proteasas en el mercado son productos naturales de origen microbiano, específicamente SPAs producidos por especies del género Streptomyces. Por ejemplo, la leupeptina se obtiene de S. roseus, la antipaína de S. mauvecolory la quimostatina de S. nigrescens, aunque la identidad específica de las cepas usadas por la industria no está claramente definida. En general, el uso de estos compuestos consiste en su adición durante el proceso de extracción proteica, lo cual implica que el compuesto debe ser producido por fermentación y purificado para su posterior uso. Tabla 1 : SPAs y algunas de sus características
Figure imgf000006_0001
Más aún, se sabe que los productos obtenidos por fermentación suelen ser mezclas de especies moleculares relacionadas, y que éstas muestran una mejor eficiencia biológica que productos sintéticos 100% puros. Una alternativa económicamente favorable para la realización de este proceso es la producción de inhibidores de proteasas simultáneamente a la producción de proteínas de valor agregado. Esto es logrado a través de la expresión heteróloga de la vía biosintética de un inhibidor de proteasas en un organismo que a su vez produzca la proteína de interés. Sin embargo, esto no ha sido reportado a la fecha, debido muy probablemente al desconocimiento de las bases genéticas que dirigen la síntesis de la mayoría de los SPAs, así como a las dificultades encontradas en la expresión heteróloga de NRPS codificadas por grandes regiones genéticas (> 20 Kbp a juzgar por la estructura química de tres o más aminoácidos). Para el desarrollo de un sistema con esas características es por lo tanto necesario conocerlas bases genéticas de la biosíntesis del inhibidor que se pretende expresar y la construcción de sistemas genéticos que permitan la expresión heteróloga, de manera controlada, de dichos genes al interior de la línea celular usada para fines biotecnológicos.
De lo anterior se derivan los siguientes problemas que impiden dicho desarrollo: (i) el desconocimiento prácticamente total de las bases genéticas de la biosíntesis de los inhibidores de proteasas del tipo SPAs, incluyendo leupeptina, antipaína y quimostatina, y (¡i) la expresión de sistemas biosintéticos de gran tamaño (>20 Kb).
Entre las patentes que se refieren a obtención y usos de leupeptina podemos mencionar la patente europea EP1318198, que describe un proceso para producir un péptido recombinante al medio de cultivo celular ia cual involucra la adición de un inhibidor de quimotripsina.
Por su parte, la patente US4066507 describe un proceso para producir L-leupeptinas, que consiste en el cultivo de una cepa de Streptomyces en un medio con condiciones de pH de 5.0 a 7.0, observándose un incremento cuando se adiciona al medio de 0.5 a 1 .25% (p/v) de L-leucina y de L- arginina (como hidrocloruro) y glicina, y luego se incrementa cuando se adiciona al medio de 0.05 a 0.3% (p/v) de un extracto de levadura, caseína hidrolizada y ácidos ribonucleicos, además de los mencionados aminoácidos. Para la separación eficiente de la L-leupeptina y quedar con una pureza aceptable, se requiere del uso de una resina adsorbente y condiciones controladas.
La solicitud de patente US20110183915 describe tratamientos contra células cancerosas utilizando una molécula pequeña (leupeptina) que causan necrosis en estas pero que no afectan a las normales. La patente JPS5350393 se refiere a un método para obtener L-leupeptina con actividad antiplasmina mediante el cultivo de Streptomyces sp. en un medio acídico con nutrientes específicos, seguido por la extracción del medio con una resina porosa no iónica.
Finalmente, la patente US3867364 describe el proceso para sintetizar químicamente a la leupeptina y sus análogos.
Con base en lo anterior, y como una forma de superar los problemas expuestos en el estado de la técnica, la presente invención aporta todas las bases genéticas necesarias para la biosíntesis de leupeptina, así como la expresión heteróloga de los genes biosintéticos para obtenerla en el medio de cultivo.
Breve descripción de las figuras.
Figura 1. Se muestran las estructuras químicas y masas teóricas de la leupeptina (N-acetil-leucil-N- {(5-[(diaminometilideno)amino]-1-oxopentano-2-il}-leucinamida) y otras moléculas relacionadas. Se muestran las características estructurales básicas de dos grupos de SPA's. El grupo acetilo protector característico del grupo I se muestra en verde. El grupo ureido y su aminoácido en contrasentido característicos del grupo II se muestran en verde y azul respectivamente.
Figura 2. Se muestra la organización del clústerde genes que dirigen la síntesis de flavopeptina y su estructura química.
Figura 3. Se muestran análisis de HPLC-MS que confirman la producción de leupeptina por la cepa S. roseus ATCC 31245.
Figura 4. Se muestra la minería genómica con EvoMining para la identificación del BGC de leupeptina. Se muestra el árbol filogenético que arroja EvoMining utilizando una enzima ASL del metabolismo central de Actinobacterias. El ciado en el que se encuentra la ASL2 de S. roseus ATCC 31245 se resalta en un marco. Otras ASL divergentes involucradas en la síntesis de ocho NP conocidas aparecen como filogenéticamente cercanas dentro de ese subclado.
Figura 5. Se muestra el BGC de Leupeptina propuesto por EvoMining y CORASON.
Figura 6. Se muestran BGC's de Actinobacterias relacionadas evolutivamente con el BGC de leupeptina de S. roseus ATCC 31245. El análisis CORASON se realizó utilizando los genes argininosuccinato liasa, cisteína sintasa y treonina quinasa que se especula están implicados en la biosíntesis de DABA. Entre los BGC's identificados con estas tres enzimas se encuentran los siguientes: A) loboforina, B) leupeptina, C) friulimicina, D) pacidamicina y E) napsamicina.
Figura 7. Se muestra la vía biosintética general propuesta de leupeptina.
Figura 8. Se muestra el análisis de HPLC-MS de leupeptina producida por E. cotí DHLeup que expresa la construcción pESAC_810 de la presente invención. Se observa la comparación del perfil cromatográfico de leupeptina producida por E. cotí DHLeup y su análisis MS/MS del pico que eluye alrededor de los 28.5 min a TA. El metabolito aislado, muestra una masa de 427 (m/z), y fragmentos MS/MS derivados de 367 y 409 (m/z), que concuerdan con el estándar de leupeptina.
Descripción detallada de la invención.
La presente invención se refiere a la identificación de genes que dirigen la biosíntesis del SPA leupeptina; así mismo comprende proveer un sistema heterólogo capaz de dirigir la biosíntesis del SPA leupeptina con actividad inhibitoria sobre proteasas.
Como se ha mencionado, los primeros esfuerzos de caracterización de la biosíntesis de leupeptina se basaron en la identificación de fracciones con capacidad de inhibir la actividad de proteasas. Dichas fracciones fueron obtenidas mediante el fraccionamiento de sobrenadantes provenientes del cultivo de la cepa Streptomyces roseus ATCC 31245 mediante el uso de HPLC. Estos estudios sugirieron que una sintasa de péptidos no ribosomales (NRPS, por sus siglas en inglés), así como una reductasa, estarían involucradas en la vía de síntesis de este compuesto. Estos estudios determinaron la incorporación de L-Leucina, D-Leucina y acetil-CoA como precursores [Suzukake, 1980], También se reportó que el intermediario acil-Leu-Leu era liberado de la presunta sintetasa, responsable de su formación, lo cual es inusual durante el proceso de ensamblado de un péptido por las NRPS.
La caracterización biosintética de la leupeptina se realizó mediante estudios de minería genómica utilizando como base el conocimiento previamente obtenido sobre la síntesis del SPA livipeptina, una molécula con características biocinéticas similares. A través de una revisión de la literatura referente al descubrimiento y estudios iniciales de organismos productores de SPAs, identificamos y adquirimos la cepa productora de leupeptina S. roseus ATCC 31245. Con base en los reportes originales del descubrimiento de los SPAs, diseñamos distintos medios de producción que facilitaran la biosíntesis de SPAs para posteriormente cultivar la cepa S. roseus ATCC 31245. Los sobrenadantes de estos cultivos fueron concentrados y la fracción acuosa de estos extractos fue analizada por HPLC. Los perfiles de HPLC de las fermentaciones con S. roseus ATCC 31245 fueron comparados con estándares auténticos obtenidos de proveedores comerciales. Las fracciones provenientes de fermentaciones, cuyos tiempos de retención coincidieron con los de los estándares, fueron colectadas y analizadas utilizando MS y ensayos de inhibición (Figura 3). De este modo se logró confirmar que S. roseus ATCC 31245 produce leupeptina.
Una vez que la producción de leupeptina fue demostrada, el genoma de S. roseus ATCC 31245 fue secuenciado utilizando la plataforma MiSEQ de ¡Ilumina (pair end 2 X 250 y 2 X 300). El genoma obtenido fue ensamblado y anotado para su posterior análisis según procedimientos internos del laboratorio. Las características generales del genoma se muestran en la Tabla 2.
Tabla 2. Secuenciación del genoma
Figure imgf000008_0001
Para la identificación de los genes que dirigen la síntesis de leupeptina, la minería genómica se enfocó en la búsqueda de secuencias proteicas homologas a las de las enzimas que participan en las vías biosintéticas de livipeptina y flavopeptina, así como datos bioquímicos obtenidos durante la temprana caracterización de la vía biosintética de leupeptina. Cabe mencionar que estos últimos estudios fueron realizados cuando las herramientas de análisis genético (secuenciación y clonación de DNA) aun no eran de uso común.
Estos estudios revelaron cuatro datos clave:
(i) Entre los precursores de la biosíntesis de leupeptina están leucina, arginina y acetato,
(ii) Una sintetasa dependiente de ATP es responsable de la síntesis de acetil-leucina-leucina;
(iii) Este intermediario es liberado de la sintetasa antes de la condensación con el grupo arginal, y finalmente,
(iv) El complejo responsable de la formación del ácido leupeptídico (leupeptina con un grupo carboxílico en lugar de uno aldehídico) tiene una masa de 320 KDa [Suzukake, 1979, 1980 y 1981],
Con base en estos datos se postularon tres hipótesis: A. La leupeptina es producida por un sistema que incluía una L/F transferasa (LFT), como en el caso de la síntesis de livipeptina en S. lividans 66.
B. La leupeptina es sintetizada por un sistema de NRPS similar al de flavopeptina por lo que esta línea de ensamblado debe contar con un dominio acil transferasa en el extremo N-terminal, tres dominios de adenilación, dos de condensación, un dominio de reductasa en el extremo C- terminal y tres dominios de acarreo de péptidos (PCP).
C. De acuerdo con los experimentos reportados anteriormente por Suzukake y colaboradores, la leupeptina debe ser sintetizada por un grupo de genes que incluye una NRPS con un dominio de acetilación, dos dominios de adenilación, dos de acarreamiento de péptidos, uno de condensación y uno de tioesterasa acompañados de un gen que codifica alguna enzima que sea capaz de procesar un dipéptido con una arginina con la posibilidad de formar un tripéptido acilado. Finalmente, este clúster de genes debe incluir una reductasa que modifique la arginina C terminal para formar el grupo aldehido.
Para determinar si alguna de estas hipótesis era correcta, se minó el genoma de S. roseus ATCC 31245 (número de acceso al genoma NZ_LFML01000000), utilizando el software EvoMining (Sélem- Mojica et al. 2019), el cual complementa el análisis, con BGCs muy bien anotados y caracterizados experimentalmente de la base de datos de MiBig (Satria A Kautsar et al. 2020). Estos análisis identificaron un evento de expansión y reclutamiento de la enzima argininosuccinato liasa (ASL), enzima que inmediatamente se relacionó con la capacidad de procesar un dipéptido con arginina, que se propuso como una actividad enzimática clave durante el ensamblaje molecular de la leupeptina en la hipótesis C. La ASL condensa succinato y arginina a través de un enlace amídico en el grupo guanidina de la arginina en una reacción reversible durante la biosíntesis de arginina (Sampaleanu et al. 2001). Como resultado, EvoMining proporcionó un árbol filogenético con enzimas parálogas de ASL del metabolismo central y la versión de la presunta enzima perteneciente al metabolismo especializado en ramas diferentes y bien definidas (Figura 4). La topología de este árbol es canónica, ubicando las enzimas centrales en el núcleo del árbol y las enzimas divergentes en las ramas externas. Se identificó que el genoma de S. roseus ATCC 31245 posee dos ASL, y se propuso que una de ellas estaba dedicada a la biosíntesis de arginina; mientras que la segunda copia, ASL2, al encontrarse en la penúltima rama y presentar un contexto genómico característico de genes biosintéticos de metabolites secundarios, se propuso como reclutado por un BGC de siete genes que no ha sido vinculado a ningún producto natural hasta el momento. El ciado al que pertenece la ASL2, es un ciado bien definido e incluye varios homólogos involucrados en la síntesis de productos naturales conocidos, incluida la kirromicina (Weber et al.2008), malacidina (Lam y Crawford 2018), totopensamida (Chen et al.2017), loboforina (L¡ et al.2013), kasumigamida (Ishida y Murakami 2000), vanchrobactina (Balado et al. 2006), luminaolida (Kitamura et al. 2009) y escitoficina (Paterson et al. 1997). Con base en estas observaciones se postuló que este locus es responsable de la síntesis de leupeptina. Es interesante notar que la rama divergente se divide se divide a su vez en dos, donde la más grande incluye la mayoría de los hits de MiBIG (de color azul), y la más pequeña incluye a la ASL2 de S. roseus ATCC 31245. Es sumamente interesante notar entonces que la ASL es una enzima muy versátil, que ha sido reclutada en muchos sistemas bioquímicos relacionados con la síntesis de metabolites secundarios.
Después de una revisión exhaustiva de la vecindad de este gen ASL, conforme a la presente invención identificamos varios genes NRPS (leuP1 , leuP6, 7, 8, 9: Sro1471 , Sro1476-79), así como genes que codifican una treonina quinasa (leuP3, Sro1473), una cisteína sintasa (leuP4, Sro1474) y una proteína MbtH (leuP5, Sro1475). Por lo tanto, definimos estos elementos como presunto BGC para la síntesis de leupeptina. La NRPS1 (LeuP1) contiene un dominio de condensación N-terminal (C1), seguido de un dominio de adenilación, que se predice reconoce una L-treonina (A1); un dominio acarreador de peptidilos (PCP1); un segundo dominio de condensación (C2); un segundo dominio de adenilación que se predice une una L-serina (A2); un segundo dominio acarreador de peptidilos (PCP2); y un dominio de tioesterasa (TE). El NRPS2 (LeuP6) solo incluye un dominio de condensación N-terminal (C) (Figura 5). NRPS3 y NRPS4 (LeuP7 y LeuP8) codifican la misma conformación: un dominio de condensación N-terminal (C); seguido de un dominio de adenilación (A); y un dominio de tioesterasa (TE). Si bien está claro que el dominio de adenilación de LeuP7 y LeuP9 pueden unirse a L-isoleucina y ornitina respectivamente, no es posible predecir adecuadamente la especificidad del dominio A para LeuP8 (Figura 5).
Este BGC también se exploró utilizando el software CORASON (Navarro-Muñoz et al. 2020). Con este análisis se identificaron varias vecindades genómicas de BGCs relacionados, en las que se conservan el casete de genes biosintéticos de S. roseus ATCC 31245. Para este análisis, concatenamos las secuencias de aminoácidos de tres enzimas conservadas: argininosuccinato liasa, treonin cinasa y cisteína sintasa, lo que arrojó como resultado más de 200 BGC con estas mismas enzimas, entre los que se encuentran los BGCs responsables de la síntesis de la loboforina, napsamicina, pacidamicina y friulimicina, aunque muestran diferencias más allá de estos genes (Figura 6). Interesantemente, se ha demostrado que los homólogos de argininosuccinato liasa y cisteína sintasa son esenciales para la síntesis de ácido N-metil 2,3-diaminobutírico (DABA), durante el ensamblaje de pacidamicina y friulimicina (Müller et al. 2007; Zhang et al. 2011). Aunque el papel del homólogo de la treonin cinasa no está claro, estos tres genes podrían considerarse como un subcluster dentro de este BGC que proporciona DABA como precursor para la síntesis de leupeptina (Figura 7). Adicionalmente, como resultado de este análisis, también fue posible identificar genomas que poseen el BGC de leupeptina y que no habían sido asociados a ningún metabolite, lo que abre una oportunidad para encontrar congéneres químicos (Figura 6).
Para confirmar que el clúster de longitud de 22.4 Kb y 9 genes (Sro1471-75) está directamente involucrado en la biosíntesis de leupeptina, optamos por una estrategia de mutagénesis de inserción transitoria, utilizando un plásmido suicida con un fragmento de 640 pb homólogo al gen leuP1 y seleccionando una cepa deficiente en este gen, mediante su resistencia a Kanamicina. Después del análisis de los extractos de fermentación de S. roseus ATCC 31245 y la cepa mutante seleccionada, se identificó por HPLC un compuesto diferencial en el RT de 28.5 min (ausente en la cepa mutante). La identidad de este compuesto se confirmó como leupeptina, utilizando el estándar auténtico y mediante espectrometría de masas, que arrojó una masa de 427.3 (m/z). Adicionalmente, se comprobó por análisis MS/MS el patrón de fragmentación de leupeptina, identificando como fragmentos principales MS2 de 367.3 y 409.3 (m/z). Para establecer aún más un vínculo entre la biosíntesis de leupeptina y el locus postulado que incluye los genes leuP1-9 (Sro1471-75), se construyó una biblioteca genómica utilizando el cósmido pESAC-13A (Tocchetti et al. 2018) y el genoma de S. roseus ATCC 31245. La construcción pESAC_810 de la invención que lleva los genes leuP1-9, denominada DHLeup, se expresó y utilizó para experimentos de fermentación comparativos. El análisis mediante LC-MS de los cultivos de E. cali DH10B expresando el pESAC_810 de la invención también reveló una masa de 427.3 (m/z) en el mismo tiempo de retención y con el mismo patrón de fragmentación que el estándar de leupeptina (Figura 8).
Actualmente se necesitan más experimentos para demostrar cuantas NRPS's están involucrados en la biosíntesis de leupeptina, y si en dicha síntesis son necesarios bloques de DABA. No obstante, la identificación del clúster biosintético de leupeptina conforme a la presente invención, permite su expresión heteróloga en diferentes sistemas de expresión, ya sea para la producción del metabolite o para el desarrollo de hospederos para la expresión de proteínas en las que la leupeptina se produzca in situ bajo el control de un inductor manipuladle. El objeto principal de la invención es proveer de los elementos de la ruta biosintética para leupeptina para lograr su expresión heteróloga. La presente invención provee del método para la biosíntesis heteróloga del SPA leupeptina que concretamente implica la obtención de una cepa microbiana transformada con un vector de expresión que posee una secuencia de DNA (SEQ.ID.No. 1) que codifica para: a) Una NRPS1 (LeuP1) que contiene: un dominio de condensación N-terminal (C1), seguido de un dominio de adenilación, que se predice reconoce una L-treonina (A1); un dominio acarreador de peptidilos (PCP1); un segundo dominio de condensación (C2); un segundo dominio de adenilación que se predice une una L-serina (A2); un segundo dominio acarreador de peptidilos (PCP2); y un dominio de tioesterasa (TE), b) Una NRPS2 (LeuP6) que contiene un dominio de condensación N-terminal (C), c) Una NRPS3 (LeuP7) que contiene un dominio de condensación N-terminal (C); seguido de un dominio de adenilación (A) que se presume reconoce una L-isoleucina; y un dominio de tioesterasa (TE), d) Una NRPS4 (LeuP8) que contiene un dominio de condensación N-terminal (C); seguido de un dominio de adenilación con afinidad desconocida (A); y un dominio de tioesterasa (TE), e) Una NRPS5 (LeuP9) que contiene un dominio de condensación N-terminal (C); seguido de un dominio de adenilación (A) que se presume reconoce una ornitina; y un dominio de tioesterasa (TE), f) Una enzima argininosuccinato liasa divergente (Leup2), g) Una enzima treonin cinasa (Leup3), h) Una enzima sintasa de cisteína (Leup4), y i) Una proteína MbtH (Leup5).
El método además implica inducir la expresión y la biosíntesis de leupeptina mediante el cultivo de dicha cepa microbiana transformada con dicho vector de expresión que puede ser el vector pESAC_810, donde el método además implica cultivar la cepa microbiana transformada con dicho vector y luego recuperar la fracción de leupeptina y purificarla por métodos convencionales conocidos en el campo técnico de la presente invención. En una de sus modalidades, el método de la invención además implica expresar este clúster de forma heteróloga en una cepa de E. coli transformada con el vector que contiene dicho clúster, por ejemplo el vector pESAC_810, para inducir la biosíntesis de leupeptina en cultivos de fermentación y purificarla por métodos convencionales conocidos en el campo técnico de la presente invención.
Una modalidad de la presente invención comprende un método en donde además de la expresión de leupeptina se exprese simultáneamente alguna otra proteína de interés, donde la leupeptina ejerza una actividad antiproteolítica que favorezca la expresión de la proteína de interés. El sistema biológico para llevar a cabo lo anterior pueden ser microorganismos del género Streptomyces, incluyendo S. roseus, además de otros sistemas de expresión como son Escherichia coli, Saccharomyces cerevisiae o Pichia pastoris.
Los siguientes ejemplos son ilustrativos del desarrollo de la presente invención y también proveen de los medios para reproducirla y probar su efectividad, por lo que en dichos ejemplos se pueden considerar variaciones adaptables por personas con conocimientos en este campo, sin que por ello implique abarcar más allá del alcance del espíritu de la invención.
Ejemplo 1. Construcción de mutantes en S. roseus ATCC 31245. La mutante de S. roseus ATCC 31245 en el gen leupA se construyó siguiendo una estrategia de mutagénesis de inserción. Para ello, se amplificó mediante PCR un fragmento de 640 pb correspondiente al primer dominio de adenilación (Fragmento A1) utilizando los siguientes primers:
LeupA_F (CGGCACCACCGGCACCCGGGC) (SEQ.ID.No. 2) y
LeupA_R1 (ACGCAGGTCCGGGATGGGCAC) (SEQ.ID.No. 3).
Este fragmento se clonó en el vector pCR2.1-TOPO (resistencia a ampicilina/kanamicina) utilizando un kit de clonación TA de Invitrogen (Carlsbad, EE. U Ú .), generando el plásmido suicida pLEUPI que no puede replicarse en S. roseus. Este plásmido se introdujo en S. roseus ATCC 31245 mediante la generación de protoplastos siguiendo protocolos estándar [Kieser et al. 2000], Los transformantes se seleccionaron usando kanamicina (50 pg/mL) y el genotipo de los mutantes insercionales se confirmó mediante PCR.
Ejemplo 2. Métodos microbiológicos y medios de cultivo. Los Streptomyces fueron adquiridos de la American Type Culture Collection (ATCC). Para la producción de leupeptina en S. roseus ATCC 31245, se utilizó un medio de producción el cual contenía glucosa 3 g, NH4NO3 0.5g, MgSO4(7H2O) 0.5 g, KCI 0.05 g, L-leucina 0.75 g, L-arginina 0.75 g, glicina 0.75 g, casaminoácidos 0.1 g, extracto de levadura 0.4 g/L. Estos cultivos se dispusieron en matraces agitados con resortes metálicos durante 48 horas a 30°C. Para la producción heteróloga de leupeptina, se cultivaron transformantes de E. coli DH10B que expresaban el vector pESAC_810 en medio mínimo M9 suplementado (Glc 4 g/L + Casaminoácidos 2 g/L) en matraces bafleados con 50 pg/mL de apramicina a 30°C y con agitación de 200 rpm durante 48 horas.
Ejemplo 3. Secuenciación y minería de genomas. El DNA genómico de S. roseus ATCC 31245 se obtuvo mediante extracciones con fenol-cloroformo, usando métodos ampliamente conocidos. El DNA genómico se usó para obtener librerías pair-end con insertos de entre 1000 y 1600 nucleótidos. Estas librerías fueron secuenciadas en un quipo MiSeq en la unidad de secuenciación genómica de Langebio (Irapuato, México). La calidad de las lecturas fue analizada utilizando FastQC (http://www.bioinformatics.bbsrc.ac.uk/projects/fastqc) y las lecturas fueron filtradas utilizando trimmomatic [Bolger, 2014] con un corte de calidad de 28 o más y un tamaño mínimo de 200 para aquellas de 250 bases. Las lecturas que pasaron los filtros de calidad fueron ensambladas de novo utilizando Velvet [Zerbino, 2008] con un rango de Kmers de 30 a 120. Se seleccionaron aquellos ensamblados con el menor número de contigs, el mayor número de bases y la mejor cobertura. Estos ensamblados fueron anotados usando RAST [Aziz, 2008], Los genomas anotados fueron minados utilizando AntiSMASH, EvoMining y CORASON.
Ejemplo 4. Análisis metabólico: obtención de extractos, métodos cromatográficos y de espectrometría de masas (HPLC-MS). Todos los datos reportados obtenidos mediante HPLC-MS se realizaron de la siguiente manera: los cultivos obtenidos en las fermentaciones se centrifugaron y sus sobrenadantes se liofilizaron para ser concentrados 10X. Los extractos crudos se analizaron/purificaron utilizando una columna de 5um ZORBAX Eclipse XDB-C18 Analytical 4.6 x 150 mm, con un gradiente de 0-25% B [A: TFA 0.1% y B: Acetonitrilo 100%] y una matriz de diodos (DAD) a A=210 y 230 nm. Se utilizó como referencia el estándar auténtico de leupeptina (L2884, Sigma- Aldrich, St Louis, EUA) Posteriormente se recogieron los picos con tiempos de retención equivalentes de los extractos para el análisis de MS realizado en un equipo LTQVELOS trampa de iones en modo positivo (Thermo Scientific, Waltham, USA) en la Unidad de EM de Unidad Irapuato Cinvestav-IPN (Irapuato, México).
Referencias.
Altschul SF, et.al. 1990. Journal of Molecular Biology 215, 403-410.
Aoyagi T, et.al. 1969. J Antibiot (Tokyo). 22(6):283-6.
Aziz RK, et al, 2008. BMC Genomics. 9:75.
Bolger AM, et.al. 2014. Bioinformatics. 30(15):2114-20.
Borin G, et.al. 1981 . Hoppe Seylers Z Physiol Chem., 362(11): 1435-1445.
Brayer GD, et.al. 1979. Proc Natl Acad Sci USA. 76(1):96-100.
Bullock TL, et.al. 1996. J Mol Biol. 255(5):714-25.
Carver T, et.al. 2012. Bioinformatics. 28(4):464-9.
Chen Y, et.al. 2013. J Am Chem Soc. 135(28): 10449-56.
Demain AL. Med Res Rev. 2009 Nov;29(6):821-42.
Hines J, et.al. 2008. Chem Biol. 15(5):501 -12.
Hirao T, et.al. 1995. J Antibiot (Tokyo).48(12): 1494-6.
Kamiyama T., et.al. 1994. The Journal of antibiotics, 47(9), 959-968.
Kaspari M, et.al. 2008. FEBS Lett. 582(5):666-72.
Kieran & Greensmith. 2004. Neuroscience; 125(2):427-39.
Kieser, T, et.al. 2000. Practical Streptomyces genetics. Norwich, UK: John Innes Foundation.
Kisselev AF, at.al. 2012. Chem Biol. 19(1):99-115.
Kondo SI, et.al. 1969. Chem Pharm Bull (Tokyo). 17(9):1896-901 .
Maes K, et.al. 2007. American Journal of Respiratory and Critical Care Medicine, 175:1134-1138.
Momose, I., et.al. 2001. The Journal of antibiotics, 54(12), 1004-1012.
Morishima H, et.al. 1970. J Antibiot (Tokyo). 23(5):263-5.
Murao, S., et.al. 1977. Chem. 41 (7), 1313-1314.
Murao, S., et.al. 1985. Agricultural and biological chemistry, 49(3), 895-897.
Ning MC, et.al. 1986. Int J Biochem;18(9):813-20.
Nishikiori T, et.al. 1984. J Antibiot (Tokyo). 37(6):680-1.
Oda, K., et.al. 1989. Agricultural and biological chemistry, 53(2), 405-415.
Ogura, K., et.al. 1985. Agricultural and biological chemistry, 49(3), 799-805.
Okura A, et.al. 1975. J Antibiot (Tokyo). 28(4):337-9.
Saito, M., et.al. 1987. Agricultural and biological chemistry, 51 (3), 861-868.
Shigemori H., et.al. 1991. Tetrahedron 47 (40):8529-8534.
Stefanelli S, et.al. 1995. J Antibiot (Tokyo). 48(4):332-4.
Sosio M, et.al. 2000. Nat Biotechnol.18(3):343-5.
Suda H, et.al. 1972. J Antibiot (Tokyo). 25(4):263-6.
Suzukake K, et.al. 1979. J Antibiot (Tokyo). 32(5):523-30.
Suzukake K, et.al. 1980. J Antibiot (Tokyo). 33(8):857-62.
Suzukake K, et.al. 1981. Biochim Biophys Acta. 661 (2):175-81.
Tatsuta K, et.al. 1973. J Antibiot (Tokyo). 26(11):625-46.
Umezawa H, et.al. 1970. J Antibiot (Tokyo). 23(8):425-7.
Umezawa H, et.al. 1973. J Antibiot (Tokyo). 26(12):787-9.
Umezawa S, et.al. 1972. J Antibiot (Tokyo). 25(4):267-70.
Van Lanen y Shen, 2006. Current opinion in microbiology 9 (3), 252-260.
Watanabe, T., et.al. 1979. Tetrahedron Letters, 20(7), 625-628.
WIodawer A, et.al. 2001. Biochemistry. 40(51):15602-11.
Xia ZF, et.al. 1995. J Burn Care Rehabil., 16:111-117.
Zerbino DR, et.al. 2008. Genome Res. 18(5):821-9.
Satria A Kautsar et al. 2020. Nucleic Acids Research, 48(D1):454-458.

Claims

Reivindicaciones.
1. Un método para la biosíntesis heteróloga del SPA leupeptina, caracterizado porque comprende los pasos de: a) Obtener una cepa microbiana transformada con un vector de expresión que comprende una secuencia de DNA que codifica para: i. Una NRPS1 (LeuP1) que contiene: un dominio de condensación N-terminal (C1), seguido de un dominio de adenilación, que se predice reconoce una L-treonina (A1); un dominio acarreador de peptidilos (PCP1); un segundo dominio de condensación (C2); un segundo dominio de adenilación que se predice une una L-serina (A2); un segundo dominio acarreador de peptidilos (PCP2); y un dominio de tioesterasa (TE),
¡i. Una NRPS2 (LeuP6) que contiene un dominio de condensación N-terminal (C), iii. Una NRPS3 (LeuP7) que contiene un dominio de condensación N-terminal (C); seguido de un dominio de adenilación (A) que se presume reconoce una L-isoleucina; y un dominio de tioesterasa (TE), iv. Una NRPS4 (LeuP8) que contiene un dominio de condensación N-terminal (C); seguido de un dominio de adenilación con afinidad desconocida (A); y un dominio de tioesterasa (TE), v. Una NRPS5 (LeuP9) que contiene un dominio de condensación N-terminal (C); seguido de un dominio de adenilación (A) que se presume reconoce una ornitina; y un dominio de tioesterasa (TE), vi. Una enzima argininosuccinato liasa divergente (Leup2), vii. Una enzima treonin cinasa (Leup3), viii. Una enzima sintasa de cisteína (Leup4), y ix. Una proteína MbtH (Leup5), b) Inducir la expresión y la biosíntesis de leupeptina mediante el cultivo de dicha cepa microbiana transformada con dicho vector de expresión, y c) Recuperar la fracción de leupeptina y purificarla.
2. El método para la biosíntesis heteróloga del SPA leupeptina de la reivindicación 1 , caracterizado porque durante el cultivo de la cepa microbiana transformada se adicionan concentraciones adecuadas de al menos un metal, tanto de transición como metaloides, o sales de los mismos, incluyendo Na, Mg, K, Ca, Mn, Fe, Co, Ni, Cu, Zn o As, o mezclas de los mismos.
3. El método de la reivindicación 1 o 2, caracterizado porque además de la expresión de leupeptina se expresa una proteína de interés, y en donde la leupeptina ejerce una actividad antiproteolítica que favorece la expresión de dicha proteína de interés.
4. El método de la reivindicación 1 a 3, caracterizado porque la cepa de expresión heteróloga pertenece al género Streptomyces, incluyendo S. roseus.
5. El método de la reivindicación 1 a 4, caracterizado porque el vector de expresión es pESAC_810.
6. El método de la reivindicación 1 a 5, caracterizado porque la secuencia de DNA tiene la secuencia mostrada en SEQ.ID.No. 1.
7. Una secuencia de ácidos nucleicos que codifica para leupeptina, caracterizada porque comprende: a) Una NRPS1 (LeuP1) que contiene: un dominio de condensación N-terminal (C1), seguido de un dominio de adenilación, que se predice reconoce una L-treonina (A1); un dominio acarreador de peptidilos (PCP1); un segundo dominio de condensación (C2); un segundo dominio de adenilación que se predice une una L-serina (A2); un segundo dominio acarreador de peptidilos (PCP2); y un dominio de tioesterasa (TE), b) Una NRPS2 (LeuP6) que contiene un dominio de condensación N-terminal (C), c) Una NRPS3 (LeuP7) que contiene un dominio de condensación N-terminal (C); seguido de un dominio de adenilación (A) que se presume reconoce una L-isoleucina; y un dominio de tioesterasa (TE), d) Una NRPS4 (LeuP8) que contiene un dominio de condensación N-terminal (C); seguido de un dominio de adenilación con afinidad desconocida (A); y un dominio de tioesterasa (TE), e) Una NRPS5 (LeuP9) que contiene un dominio de condensación N-terminal (C); seguido de un dominio de adenilación (A) que se presume reconoce una ornitina; y un dominio de tioesterasa (TE), f) Una enzima argininosuccinato liasa divergente (Leup2), g) Una enzima treonin cinasa (Leup3), h) Una enzima sintasa de cisteína (Leup4), y i) Una proteína MbtH (Leup5),
8. La secuencia de ácidos nucleicos que codifica para leupeptina de la reivindicación 7, caracterizada porque tiene la secuencia mostrada en SEQ.ID.No. 1.
9. Un vector para la producción de leupeptina, caracterizado porque comprende la secuencia de ácidos nucleicos de la reivindicación 7.
10. Un vector para la producción de leupeptina, caracterizado porque comprende la secuencia de ácidos nucleicos de la reivindicación 8.
11 . El vector para la producción de leupeptina de las reivindicaciones 9 o 10, caracterizado porque el vector es el vector de expresión pESAC_810.
12. Una célula huésped para la producción de leupeptina, caracterizada porque comprende el vector de la reivindicación 9, o 10 u 11.
13. La célula huésped para la producción de leupeptina de la reivindicación 12, caracterizada porque es Escherichia col i.
14. La célula huésped para la producción de leupeptina de la reivindicación 13, caracterizada porque es Escherichia col i DH10B.
PCT/IB2021/062510 2021-10-22 2021-12-31 Sistema genético para la biosíntesis de leupeptina y su uso en sistemas heterólogos de producción WO2023067380A1 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
MXMX/A/2021/012945 2021-10-22
MX2021012945A MX2021012945A (es) 2021-10-22 2021-10-22 Sistema genetico para la biosintesis de leupeptina y su uso en sistemas heterologos de produccion.

Publications (1)

Publication Number Publication Date
WO2023067380A1 true WO2023067380A1 (es) 2023-04-27

Family

ID=86058827

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/IB2021/062510 WO2023067380A1 (es) 2021-10-22 2021-12-31 Sistema genético para la biosíntesis de leupeptina y su uso en sistemas heterólogos de producción

Country Status (2)

Country Link
MX (1) MX2021012945A (es)
WO (1) WO2023067380A1 (es)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016097957A2 (en) * 2014-12-16 2016-06-23 Centro De Investigación Y De Estudios Avanzados Del Instituto Politécnico Nacional Genetic system for producing a proteases inhibitor of a small peptide aldehyde type
WO2016193954A2 (en) * 2015-06-05 2016-12-08 Centro De Investigación Y De Estudios Avanzados Del Instituto Politécnico Nacional Genetic system for the production of leupeptin and its use for heterologous protein production

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016097957A2 (en) * 2014-12-16 2016-06-23 Centro De Investigación Y De Estudios Avanzados Del Instituto Politécnico Nacional Genetic system for producing a proteases inhibitor of a small peptide aldehyde type
WO2016193954A2 (en) * 2015-06-05 2016-12-08 Centro De Investigación Y De Estudios Avanzados Del Instituto Politécnico Nacional Genetic system for the production of leupeptin and its use for heterologous protein production

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
AGUILAR, C.: "Convergent evolution of Streptomyces protease inhibitors involving a tRNA-mediated condensation-minus NRPS", BIORXIV, 28 October 2020 (2020-10-28), pages 1 - 37, XP093062562 *
CRUZ-MORALES, P., JOHANNES FLORIAN KOPP, CHRISTIAN MARTINEZ-GUERRERO, LUIS ALFONSO YAN EZ-GUERRA, NELLY SELEM-MOJICA, HILDA RAMOS-: "Phylogenomic analysis of natural products biosynthetic gene clusters allows discovery of arseno-organic metabolites in model streptomycetes", GENOME BIOLOGY AND EVOLUTION, 1 January 2016 (2016-01-01), XP093062570 *
JHE‐HAO LI; JOONSEOK OH; SABINE KIENESBERGER; NAM YOON KIM; DAVID J. CLARKE; ELLEN L. ZECHNER; JASON M. CRAWFORD: "Making and Breaking Leupeptin Protease Inhibitors in Pathogenic Gammaproteobacteria", ANGEWANDTE CHEMIE INTERNATIONAL EDITION, VERLAG CHEMIE, HOBOKEN, USA, vol. 59, no. 41, 13 August 2020 (2020-08-13), Hoboken, USA, pages 17872 - 17880, XP072105333, ISSN: 1433-7851, DOI: 10.1002/anie.202005506 *

Also Published As

Publication number Publication date
MX2021012945A (es) 2023-04-24

Similar Documents

Publication Publication Date Title
Pantel et al. Odilorhabdins, antibacterial agents that cause miscoding by binding at a new ribosomal site
Maksimov et al. Lasso peptides: structure, function, biosynthesis, and engineering
Zafrir-Ilan et al. Eight novel serine proteases inhibitors from a water bloom of the cyanobacterium Microcystis sp.
Rowe et al. The role of chemical synthesis in developing RiPP antibiotics
Thomy et al. The ADEP biosynthetic gene cluster in Streptomyces hawaiiensis NRRL 15010 reveals an accessory clpP gene as a novel antibiotic resistance factor
JP6020706B2 (ja) ジペプチド合成酵素(バリアント)をコードするdna、エシェリヒア属に属する細菌、およびそれらを用いるジペププドの生産方法
Lima et al. Genetic organization of anabaenopeptin and spumigin biosynthetic gene clusters in the cyanobacterium Sphaerospermopsis torques-reginae ITEP-024
Ogasawara et al. Biosynthesis of oligopeptides using ATP‐grasp enzymes
US7811790B2 (en) Polymyxin synthetase and gene cluster thereof
Unno et al. Heterologous expression of cryptic biosynthetic gene cluster from Streptomyces prunicolor yields novel bicyclic peptide prunipeptin
Cheung-Lee et al. Pandonodin: a proteobacterial lasso peptide with an exceptionally long C-terminal tail
Adiv et al. New aeruginazoles, a group of thiazole-containing cyclic peptides from Microcystis aeruginosa blooms
Ouyang et al. Direct pathway cloning and expression of the radiosumin biosynthetic gene cluster
US20140178353A1 (en) Bacterial anti-phage defense systems
Hegemann et al. A bifunctional leader peptidase/ABC transporter protein is involved in the maturation of the lasso peptide cochonodin I from Streptococcus suis
WO2016193954A2 (en) Genetic system for the production of leupeptin and its use for heterologous protein production
WO2023067380A1 (es) Sistema genético para la biosíntesis de leupeptina y su uso en sistemas heterólogos de producción
Wang et al. Genome Mining of Myxopeptins Reveals a Class of Lanthipeptide-Derived Linear Dehydroamino Acid-Containing Peptides from Myxococcus sp. MCy9171
JP6637904B2 (ja) コリスチンシンセターゼ及び対応する遺伝子のクラスター
Wai S. Fung et al. The molecular basis for the post-translational addition of amino acids by L/F transferase in the N-end rule pathway
Usuki et al. Peptide bond formation by aminolysin-A catalysis: a simple approach to enzymatic synthesis of diverse short oligopeptides and biologically active puromycins
Li-Yuan et al. H1-A, a compound isolated from Fusarium oxysporum inhibits hepatitis C virus (HCV) NS3 serine protease
US10414796B2 (en) Genetic system for producing a proteases inhibitor of a small peptide aldehyde type
Kim Structural Principles of Substrate Recognition and Unfolding by the ClpAP and ClpXP AAA+ Proteases
Morgan Expanding the Ramoplanin Family of Antimicrobial Peptides

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21961291

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21961291

Country of ref document: EP

Kind code of ref document: A1