ES2809727T3 - Biotensioactivos glicolipopeptídicos - Google Patents

Biotensioactivos glicolipopeptídicos Download PDF

Info

Publication number
ES2809727T3
ES2809727T3 ES17719188T ES17719188T ES2809727T3 ES 2809727 T3 ES2809727 T3 ES 2809727T3 ES 17719188 T ES17719188 T ES 17719188T ES 17719188 T ES17719188 T ES 17719188T ES 2809727 T3 ES2809727 T3 ES 2809727T3
Authority
ES
Spain
Prior art keywords
biosurfactant
lipid component
glycolipopeptide
purified
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES17719188T
Other languages
English (en)
Inventor
Russell Greig Kerr
Bradley Arnold Haltli
Douglas Hubert Marchbank
Fabrice Berrue
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Croda International PLC
Original Assignee
Croda International PLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Croda International PLC filed Critical Croda International PLC
Application granted granted Critical
Publication of ES2809727T3 publication Critical patent/ES2809727T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H15/00Compounds containing hydrocarbon or substituted hydrocarbon radicals directly attached to hetero atoms of saccharide radicals
    • C07H15/02Acyclic radicals, not substituted by cyclic structures
    • C07H15/04Acyclic radicals, not substituted by cyclic structures attached to an oxygen atom of the saccharide radical
    • CCHEMISTRY; METALLURGY
    • C02TREATMENT OF WATER, WASTE WATER, SEWAGE, OR SLUDGE
    • C02FTREATMENT OF WATER, WASTE WATER, SEWAGE, OR SLUDGE
    • C02F3/00Biological treatment of water, waste water, or sewage
    • C02F3/34Biological treatment of water, waste water, or sewage characterised by the microorganisms used
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H1/00Processes for the preparation of sugar derivatives
    • C07H1/06Separation; Purification
    • C07H1/08Separation; Purification from natural products
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11DDETERGENT COMPOSITIONS; USE OF SINGLE SUBSTANCES AS DETERGENTS; SOAP OR SOAP-MAKING; RESIN SOAPS; RECOVERY OF GLYCEROL
    • C11D1/00Detergent compositions based essentially on surface-active compounds; Use of these compounds as a detergent
    • C11D1/008Polymeric surface-active agents
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11DDETERGENT COMPOSITIONS; USE OF SINGLE SUBSTANCES AS DETERGENTS; SOAP OR SOAP-MAKING; RESIN SOAPS; RECOVERY OF GLYCEROL
    • C11D1/00Detergent compositions based essentially on surface-active compounds; Use of these compounds as a detergent
    • C11D1/66Non-ionic compounds
    • C11D1/662Carbohydrates or derivatives
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11DDETERGENT COMPOSITIONS; USE OF SINGLE SUBSTANCES AS DETERGENTS; SOAP OR SOAP-MAKING; RESIN SOAPS; RECOVERY OF GLYCEROL
    • C11D3/00Other compounding ingredients of detergent compositions covered in group C11D1/00
    • C11D3/16Organic compounds
    • C11D3/38Products with no well-defined composition, e.g. natural products
    • C11D3/381Microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • C12N1/205Bacterial isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11DDETERGENT COMPOSITIONS; USE OF SINGLE SUBSTANCES AS DETERGENTS; SOAP OR SOAP-MAKING; RESIN SOAPS; RECOVERY OF GLYCEROL
    • C11D1/00Detergent compositions based essentially on surface-active compounds; Use of these compounds as a detergent
    • C11D1/02Anionic compounds
    • C11D1/04Carboxylic acids or salts thereof
    • C11D1/10Amino carboxylic acids; Imino carboxylic acids; Fatty acid condensates thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Hydrology & Water Resources (AREA)
  • Environmental & Geological Engineering (AREA)
  • Water Supply & Treatment (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

Un biotensioactivo purificado que comprende un componente lipídico hidrófobo que comprende un extremo carboxilo y un extremo hidroxilo, en donde el componente lipídico está unido covalentemente a (i) una cadena de péptido o semejante a péptido en el extremo carboxilo del componente lipídico y (ii) un resto de carbohidrato en el extremo hidroxilo del componente lipídico a través de una unión glicosídica, en donde el resto de carbohidrato incluye uno, dos o tres residuos de ramnosa.

Description

DESCRIPCIÓN
Biotensioactivos glicolipopeptídicos
Campo de la invención
Esta invención se refiere generalmente a los campos de la química de tensioactivos, bioquímica, y microbiología. Más específicamente, la invención se refiere a biotensioactivos que tienen un oligómero lipídico hidrófobo unido covalentemente a una cadena de péptido o semejante a péptido (p. ej., aminoácido no proteinogénico o aminoácido único) y un resto de carbohidrato, varias secuencias de aminoácidos y ácidos nucleicos que codifican componentes de rutas biosintéticas para estos biotensioactivos, y métodos para preparar y usar estos biotensioactivos.
Antecedentes
Los tensioactivos son compuestos químicos anfifílicos que poseen restos tanto hidrófobos como hidrófilos que les permiten interaccionar con sistemas polares y no polares. Los tensioactivos ejercen su actividad en interfaces entre diferentes fases (gas, líquido, sólido) y, como resultado, presentan un intervalo de funciones que incluyen, pero no se limitan a, la capacidad de actuar como detergentes, emulsionantes, agentes humectantes y agentes espumantes. La mayor parte de los tensioactivos químicos son sulfatos o sulfonatos de alquilo derivados de fuentes petro u oleoquímicas. El uso de estos productos ha crecido de forma constante con un consumo mundial estimado de 13 millones de toneladas en 2008 y un valor de mercado estimado de 27 billones de dólares (USD) en 2012. En respuesta a preocupaciones medioambientales y de sostenibilidad, muchas empresas que utilizan tensioactivos químicos en sus productos han explorado alternativas responsables con el medioambiente como reemplazos parciales o totales de los tensioactivos químicos. Una alternativa a los tensioactivos químicos son los biotensioactivos, que son moléculas activas en superficie que se originan a partir de microorganismos. Estos tensioactivos ofrecen ventajas sobre los tensioactivos químicos tales como la producción a partir de productos base producidos de forma sostenible, biodegradabilidad y menor toxicidad.
US 2013/0331466 describe soforolípidos modificados como agentes solubilizantes de aceite.
US 2013/0085067 describe soforolípidos modificados para la inhibición de patógenos de plantas.
Sumario
Se descubrió que la bacteria Variovorax paradoxus RKNM-096, depositada el 10 de abril, 2015 como número de acceso NRRL B-67038 bajo los términos del Tratado de Budapest con la Agricultural Research Service Culture Collection (NRRL, 1818 North University Street, Peoria, Illinois, 61064) produce una clase previamente desconocida de biotensioactivos denominados "glicolipopéptidos". A diferencia de los biotensioactivos conocidos, los glicolipopéptidos típicamente contienen un oligómero lipídico hidrófobo unido covalentemente a una cadena peptídica y un resto de carbohidrato.
El depósito de NRRL B-67038 en apoyo de esta solicitud lo hizo Nautilus Bioscience Canada Inc., 550 Unv. Ave., Charlottetown, PE, Canadá, C1A4P3. Nautilus Bioscience Canada Inc. autoriza al solicitante a hacer referencia al material biológico depositado en esta solicitud y proporciona su consentimiento sin reservas e irrevocable de que los materiales estén disponibles para el público según las leyes nacionales apropiadas que gobiernan el depósito de estos materiales, tales como la Norma 31 y 33 EPC. La solución de expertos bajo la Norma 32 EPC también se solicita por la presente.
En la presente memoria se describen biotensioactivos purificados que incluyen un componente lipídico hidrófobo que incluye un extremo carboxilo y un extremo hidroxilo, en donde el componente lipídico está unido covalentemente a (i) una cadena de péptido o semejante a péptido en el extremo carboxilo del componente lipídico y (ii) un resto de carbohidrato en el extremo hidroxilo del componente lipídico a través de una unión glicosídica. La cadena de péptido o semejante a péptido puede incluir un dipéptido serina-leucinol, el componente lipídico puede incluir tres restos de ácido p-hidroxialcanoico (p. ej., en donde la longitud de cada cadena acilo del componente lipídico es C6, Cs, C10, o C12), y el resto de carbohidrato puede incluir un resto de ramnosa unido al componente lipídico a través de una unión glicosídica. En determinadas realizaciones, el resto de carbohidrato puede incluir dos restos de ramnosa y/o un grupo acetilo. Los análogos y derivados de estos glicolipopéptidos pueden prepararse por métodos convencionales.
Los glicolipopéptidos pueden tener la estructura:
Figure imgf000002_0001
en donde Ría es H, OH, OCH3 , SH, S(CH3), NH2 , NH(CH3), N(CH3)2, o un péptido o estructura semejante a péptido que tiene la estructura:
Figure imgf000003_0001
en donde R1b, R1c, y R1d, son H, OH, OCH3 , SH, S(CH3), NH2 , NH(CH3), o N(CH3)2; R2a, R2b, R2c, y R2d son cada uno independientemente una cadena lateral de aminoácido; X1a, X1b, X1c, y X1d son cada uno independientemente un átomo de oxígeno o dos átomos de hidrógeno; X2a, X2b, X2c, y X2d son cada uno independientemente NH, N(CH3), u O; R3a es una porción de carbohidrato o un monómero lipídico que tiene la estructura:
Figure imgf000003_0002
o un oligómero lipídico que tiene la estructura de:
Figure imgf000003_0003
en donde X3a, X3b, X3c, y X3d son cada uno independientemente NH, N(CH3
Figure imgf000003_0004
u O; R3a, R3b, R3c, porción de carbohidrato que incluye un monómero que tiene la estructura:
Figure imgf000003_0005
en donde Rsa, R6a, R7a, y R8a son cada uno independientemente un átomo de hidrógeno, metilo, acetilo, o un carbohidrato; y R4a, R4b, R4c, y R4d son cada uno independientemente un átomo de hidrógeno, metilo, o un grupo hidrocarburo C2 a C19 saturado o insaturado de cadena lineal, ramificada, cíclico, o aromático. Los glicolipopéptidos naturales incluyen aquellos que tienen las siguientes estructuras:
Figure imgf000004_0001
En la presente memoria también se describen composiciones emulsionadas (p. ej., emulsiones de aceite en agua o agua en aceite) que incluyen: un componente polar, un componente no polar, y uno o más de los biotensioactivos descritos anteriormente; y un método para preparar una emulsión de agua en aceite o aceite en agua mezclando conjuntamente un componente polar, un componente no polar, y uno o más de los biotensioactivos descritos anteriormente. En la presente memoria se describe además un método para preparar uno de los biotensioactivos descritos anteriormente
(a) aislando un microorganismo que incluye el biotensioactivo,
(b) poniendo el microorganismo en un cultivo en condiciones que promuevan a síntesis del biotensioactivo, y
(c) aislando el biotensioactivo del cultivo; y un microorganismo aislado preparado por ingeniería para producir uno de los biotensioactivos descritos anteriormente, en donde un conjunto de genes heterólogos implicados en la biosíntesis del biotensioactivo se ha introducido en el microorganismo.
A no ser que se defina otra cosa, todos los términos técnicos usados en la presente memoria tienen el mismo significado que el entendido comúnmente por un experto en la técnica a la que pertenece esta invención. Las definiciones entendidas comúnmente de términos químicos y biológicos pueden encontrarse en Rieger et al., Glossary of Genetics: Classical and Molecular, 5a edición, Springer- Verlag: Nueva York, 1991; y A Dictionary of Chemistry, Ed. J. Daintith, 7a Ed., Oxford University Press, 2016.
Tal y como se usa en la presente memoria, cuando se hace referencia a un compuesto químico o a una molécula, el término "purificado" significa separado de componentes con los que aparece en la naturaleza o en una mezcla producida artificialmente. Típicamente, una molécula está purificada cuando carece de al menos aproximadamente el 10% (p. ej., al menos el 9%, 10%, 20%, 30% 40%, 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99%, 99,9%, y 100%), en peso (excluyendo el disolvente), de los componentes con los que aparece en la naturaleza o en una mezcla producida artificialmente. La pureza puede medirse por cualquier método apropiado, p. ej., cromatografía en columna, electroforesis en gel de poliacrilamida, o análisis por HPLC.
Por "identidad de secuencia" se quiere decir la relación entre dos secuencias de aminoácidos o entre dos secuencias de nucleótidos. En la presente memoria, el grado de identidad entre dos secuencias de aminoácidos o dos secuencias de desoxirribonucleótidos se determina usando el algoritmo de Needleman-Wunsch (Needleman y Wunsch, 1970, J. Mol. Biol. 48: 443-453) como se implementa en el programa Needle del paquete EMBOSS (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends in Genetics 16: 276-277; http://emboss.org), preferiblemente la versión 3.0.0 o posterior. Los parámetros opcionales usados son penalización por apertura de hueco de 10, penalización por extensión de hueco de 0,5, y la matriz de sustitución EBLOSUM62 (EMBOSS versión de BLOSUM62) para secuencias de aminoácidos o la matriz de sustitución EDNAFULL (EMBOSS versión de NCBI NUC4.4) para secuencias de nucleótidos. El resultado de Needle marcado "identidad más larga" (obtenido usando la opción -nobrief) se usa como el porcentaje de identidad y se calcula como sigue:
(Residuos de Aminoácidos o Nucleótidos Idénticos x 100)/(Longitud del Alineamiento - Número Total de Huecos en el Alineamiento)
Aunque pueden usarse métodos y materiales similares o equivalentes a los descritos en la presente memoria en la práctica o ensayo de la presente invención, a continuación, se describen métodos y materiales adecuados. En el caso de conflicto, prevalecerá la presente memoria descriptiva, incluyendo las definiciones.
Además, las realizaciones particulares que se discuten a continuación son solo ilustrativas y no se pretende que sean limitantes.
Breve descripción de los dibujos
La FIG. 1 es una ilustración de correlaciones HMBC (1H ^ 13C) y COSY seleccionadas (enlaces en negrita) de NB-RLP1006 y iones de fragmentos asignados de disociación inducida por colisión MS/MS de los glicolipopéptidos. La FIG. 2 es un gel de poliacrilamida desnaturalizante que muestra R1 pE etiquetado con His purificado (A) y el análisis por UPLC-HRMS de reacciones enzimáticas en las que la enzima se incubó con NB-RLP860 y dTDP-L-ramnosa. La FIG. 3 es una comparación esquemática de la agrupación génica del glicolipopéptido de V. paradoxus RKNM-096 con agrupaciones génicas homólogas identificadas en I. limosus DSM 16000 y J. agaricidamnosum DSM9628. Los genes que codifican proteínas homólogas a proteínas de la agrupación génica de V. paradoxus se indican con patrones de flechas rellenas. La identidad y similitud con las proteínas de V. paradoxus se indican bajo las flechas (% de identidad/% de similitud). La organización del dominio NRPS se indica bajo flechas que representan genes que codifican sintetasas peptídicas no ribosomales (NRPS). Dominios: C -condensación, A - adenilación, T -tiolación/proteína portadora de peptidilo, R - reductasa. La notación con subíndice indica un sustrato de dominio A posible. Los marcadores por encima de las flechas en las agrupaciones génicas de I. limosus y J agaricidamnosum indican las ID de las proteínas.
La FIG.4 es la secuencia de ácido nucleico SEQ ID NO:1.
La FIG.5 es la secuencia de ácido nucleico SEQ ID NO:2.
La FIG.6 es la secuencia de ácido nucleico SEQ ID NO:3.
La FIG.7 es la secuencia de ácido nucleico SEQ ID NO:5.
La FIG.8 es la secuencia de ácido nucleico SEQ ID NO:7.
La FIG.9 es la secuencia de ácido nucleico SEQ ID NO:9.
La FIG.10 es la secuencia de ácido nucleico SEQ ID NO: 11.
La FIG. 11 es la secuencia de ácido nucleico SEQ ID NO: 13.
La FIG.12 es la secuencia de ácido nucleico SEQ ID NO: 15.
La FIG.13 es la secuencia de ácido nucleico SEQ ID NO: 17.
La FIG.14 es la secuencia de ácido nucleico SEQ ID NO: 19.
La FIG.15 es la secuencia de ácido nucleico SEQ ID NO:21.
La FIG.16 es la secuencia de aminoácidos SEQ ID NO:4.
La FIG.17 es la secuencia de aminoácidos SEQ ID NO:6.
La FIG.18 es la secuencia de aminoácidos SEQ ID N0:8.
La FIG.19 es la secuencia de aminoácidos SEQ ID NO:10.
La FIG.20 es la secuencia de aminoácidos SEQ ID NO:12.
La FIG.21 es la secuencia de aminoácidos SEQ ID NO:14.
La FIG.22 es la secuencia de aminoácidos SEQ ID N0:16.
La FIG.23 es la secuencia de aminoácidos SEQ ID N0:18.
La FIG.24 es la secuencia de aminoácidos SEQ ID NO:20.
La FIG.25 es la secuencia de aminoácidos SEQ ID NO:22.
La FIG.26 es la secuencia de aminoácidos SEQ ID NO:23.
La FIG.27 es la secuencia de aminoácidos SEQ ID NO:24.
Descripción detallada
La invención es como se define en las reivindicaciones adjuntas. En la presente memoria se describen composiciones de tensioactivos glicolipopeptídicos, métodos para preparar y usar dichos biotensioactivos, y bacterias y cultivos bacterianos que producen glicolipopéptidos. Las realizaciones preferidas descritas más adelante ilustran la adaptación de estas composiciones y métodos. Sin embargo, a partir de la descripción de estas realizaciones, pueden realizarse y/o llevarse a la práctica otros aspectos de la invención sobre la base de la descripción proporcionada más adelante.
Metodología general
En la presente memoria se describen métodos que implican química orgánica, bioquímica, microbiología, y biología molecular convencionales. Dichos métodos se describen, p. ej., en Clayden et al., Organic Chemistry, Oxford University Press, 1a edición (2000); Molecular Cloning: A Laboratory Manual, 2a ed., vol. 1-3, Sambrook et al., ed.,
Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 2001 ; Current Protocols in Molecular Biology, Ausubel et al., ed., Greene Publishing and Wiley-Interscience, Nueva York; y en los distintos volúmenes de Methods in Microbiology y Methods in Biochemistry and Molecular Biology ambos publicados por Elsevier.
Glicolipopéptidos
Los glicolipopéptidos naturales y los análogos y derivados sintéticos de los mismos incluyen típicamente un componente lipídico hidrófobo que incluye un extremo carboxilo y un extremo hidroxilo, en donde el componente lipídico está unido covalentemente a (i) una cadena de péptido o semejante a péptido en el extremo carboxilo del componente lipídico y (ii) un resto de carbohidrato en el extremo hidroxilo del componente lipídico a través de una unión glicosídica.
La cadena peptídica puede comprender en el intervalo de entre 2 y 10 aminoácidos, preferiblemente 2 a 8, más preferiblemente 2 a 4 aminoácidos. La cadena peptídica puede comprender lo más preferiblemente 2 aminoácidos. La cadena de péptido o semejante a péptido puede comprender y/o consistir en un dipéptido serina-leucinol.
El componente lipídico puede comprender en el intervalo de entre 1 y 6 restos de ácido alcanoico, preferiblemente 2 a 4, y más preferiblemente 3. Lo más preferiblemente el componente lipídico puede incluir tres restos de ácido phidroxialcanoico. La longitud de cada cadena acilo del componente lipídico puede estar en el intervalo de entre C4 a
C20, preferiblemente C6 a C16, más preferiblemente C8 a C14. Lo más preferiblemente, la longitud de cada cadena acilo puede seleccionarse de C8, C10, o C12.
El resto de carbohidrato puede seleccionarse de sacáridos incluyendo glucosa, fructosa, galactosa, manosa, ribosa, o variantes desoxisacárido incluyendo desoxirribosa, fucosa, o ramnosa. Preferiblemente, el resto de carbohidrato es ramnosa. En particular, un resto de ramnosa unido al componente lipídico a través de una unión glicosídica. En determinadas realizaciones, el resto de carbohidrato puede incluir uno, dos, o tres restos de ramnosa y/o un grupo acetilo. Preferiblemente, el resto de carbohidrato incluye dos.
Los glicolipopéptidos pueden incluir la estructura:
Figure imgf000006_0001
en donde R1a es H, OH, OCH3 , SH, S(CH3), NH2 , NH(CH3), N(CH3)2, o un péptido o estructura semejante a péptido que tiene la estructura:
Figure imgf000006_0002
en donde R1b, R1c, y R1d, son H, OH, OCH3 , SH, S(CH3), NH2 , NH(CH3), o N(CH3)2; R2a, R2b, R2c, independientemente una cadena lateral de aminoácido; X1a, X1b, X1c, y X1d son cada uno independientemente un átomo de oxígeno o dos átomos de hidrógeno; X2a, X2b, X2c, y X2d son cada uno independientemente NH, N(CH3), u O; R3a es una porción de carbohidrato o un monómero lipídico que tiene la estructura:
Figure imgf000007_0001
o un oligómero lipídico que tiene la estructura de:
Figure imgf000007_0002
en donde X3a, X3b, X3c, y X3d son cada uno independientemente NH, N(CH3), u O; R3a, R3b, R3c, y R3d incluye una porción de carbohidrato que incluye un monómero que tiene la estructura:
Figure imgf000007_0003
en donde R5a, R6a, R7a, y R8a son cada uno independientemente un átomo de hidrógeno, metilo, acetilo, o un carbohidrato; y R4a, R4b, R4c, y R4d son cada uno independientemente un átomo de hidrógeno, metilo, o un grupo hidrocarburo C2 a C19 saturado o insaturado, de cadena lineal o ramificada, cíclico, o aromático.
En lo anterior, al menos uno de R6a, R7a, y R8a puede incluir un monómero de carbohidrato que tiene la estructura:
Figure imgf000007_0004
en donde R5b, R6b, R7b, y R8b son cada uno independientemente un átomo de hidrógeno, metilo, acetilo, o un carbohidrato.
En determinadas realizaciones, el péptido o porción semejante a péptido incluye al menos una prolina o monómero semejante a prolina que tiene la estructura:
Figure imgf000007_0005
en donde X4 es un átomo de oxígeno o dos átomos de hidrógeno, o una única prolina o monómero semejante a prolina o una prolina o monómero semejante a prolina terminal que tiene la estructura:
Figure imgf000007_0006
en donde R9 es H, OH, OCH3 , SH, S(CH3), NH2 , NH(CH3), o N(CH3)2; y X4 es un átomo de oxígeno o dos átomos de hidrógeno.
Los glicolipopéptidos pueden tener las siguientes estructuras:
Figure imgf000008_0001
en donde R5a, Rea, R7a, Río, y R11 son cada uno independientemente un átomo de hidrógeno o acetilo; y ni, n2 , y n3 son números enteros que varían cada uno independientemente de 1 a 7;
Figure imgf000008_0002
en donde R5a, R5b, Reb, R7a, R7b, Río, y Rii son cada uno independientemente un átomo de hidrógeno o acetilo; y ni, n2 , y n3 son números enteros que varían cada uno independientemente de 1 a 7;
Figure imgf000009_0001
Un experto en la técnica puede preparar derivados, análogos, y otras variantes de los glicolipopéptidos anteriores. Por ejemplo, la composición de aminoácidos y la longitud de la cadena peptídica podrían modificarse de una manera combinatoria, introduciendo aminoácidos proteinogénicos o no naturales para modular la solubilidad, equilibrio hidrófilo-lipófilo (HLB), y otras características de tensioactivo de los glicolipopéptidos. La porción peptídica también puede contener aminoácidos con grupos funcionales cargados, que pueden dar lugar a tensioactivos catiónicos, aniónicos, o zwiteriónicos con aplicaciones de tensioactivo únicas. La funcionalidad ácido carboxílico en la posición C-terminal del péptido también puede reducirse a un grupo hidroxilo primario. De forma similar, la porción lipídica puede contener diversos números (p. ej., 1, 2, 3, 4 o más) de unidades p-hidroxialcanoato, que en sí mismas pueden estar comprendidas por grupos hidrocarburo C2 a C19 saturados o insaturados, de cadena lineal o ramificada, cíclicos, o aromáticos. Los restos de ramnosa podrían estar unidos entre sí a través de uniones glicosídicas 1,2, 1,3, o 1,4, que pueden poseer bien la configuración a o p. Además de la ramnosa, la porción de carbohidrato también puede estar compuesta por glucosa u otras unidades de monosacárido.
Podrían preparase variantes de los biotensioactivos glicolipopeptídicos de Variovorax paradoxus RKNM-096 que tienen propiedades alteradas. Las propiedades alteradas de dichas variantes pueden incluir, pero no se limitan a, alteraciones en las propiedades de emulsificación, espumación y reducción de la tensión superficial presentadas bajo diferentes condiciones físico-químicas tales como, pero no limitadas a, temperatura, pH, y salinidad.
Las variovaricinas descritas en la presente memoria pueden estar al menos un 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 95, 99, 99,5, 99,9, o 99,99 por ciento purificadas (en peso). Pueden estar en forma cristalina o no cristalina (amorfa), y en algunos casos también pueden obtenerse como sales derivadas de ácidos orgánicos e inorgánicos tales como: acético, trifluoroacético, láctico, cítrico, tartárico, formato, succínico, maleico, malónico, glucónico, clorhídrico, bromhídrico, fosfórico, nítrico, sulfúrico, metanosulfónico y ácidos conocidos similares. Las sales pueden prepararse adatando procedimientos conocidos comúnmente.
En algunas realizaciones, la composición incluye compuestos adicionales tales como vehículos, otros tensioactivos (p. ej., tensioactivos no glicolipopeptídicos), o compuestos biológicamente activos (tensioactivos no glicolipopeptídicos, tales como agentes farmacéuticos u otros agentes antimicrobianos no glicolipopeptídicos). La adición de los agentes mencionados anteriormente a tensioactivos glicolipopeptídicos puede seleccionarse por un experto en la técnica sobre la base de la aplicación elegida.
La composición puede incluir un vehículo, tal como vehículos farmacéuticamente aceptables convencionales como se describe en Remington: The Science and Practice o f Pharmacy, The University of the Sciences in Philadelphia, Editores, Lippincott, Williams, & Wilkins, Filadelfia, Pa., 21a Edición (2005).
Los vehículos farmacéuticamente aceptables varían dependiendo del modo de administración. Las formulaciones fluidas usadas para inyección parenteral pueden incluir fluidos tales como agua, disolución salina fisiológica, dextrosa acuosa o glicerol. Las formulaciones sólidas pueden incluir vehículos sólidos altamente purificados tales como estearato de magnesio, almidón, o lactosa. Las composiciones farmacéuticas también pueden contener cantidades menores de sustancias auxiliares no tóxicas, tales como tampones y conservantes.
En algunas realizaciones, las composiciones incluyen un tensioactivo no glicolipopeptídico. Los ejemplos incluyen tensioactivos no iónicos, catiónicos, aniónicos y anfóteros. Los ejemplos representativos de tensioactivos aniónicos incluyen carboxilatos, sulfonatos, sulfonatos de petróleo, sulfonatos de alquilbenceno, sulfonato de naftaleno, sulfonatos de olefina, sulfatos de alquilo, sulfatos, aceites y grasas naturales sulfatadas, ésteres sulfatados, alcanolamidas sulfatadas, alquilfenoles, alquilfenoles etoxilados y sulfatados y ramnolípidos. Los ejemplos de tensioactivos catiónicos incluyen sales de amonio cuaternario, etilendiamnas sustituidas con N, N, N', N' tetraquis y 2-alquil-1 -hidroxetil-2-imidazolinas. Los ejemplos de tensioactivos no iónicos incluyen alcoholes alifáticos etioxilados, tensioactivos de polioxietileno, ésteres carboxílicos, ésteres de polietilen glicol, éster de anhidrosorbitol y derivados etoxilados, glicol ésteres de ácidos grasos, amidas carboxílicas, condensados de monoalcanolamina y amidas de polioxietileno ácido graso. Los ejemplos de tensioactivos anfóteros incluyen sales de sodio del ácido N-coco-3-aminopropiónico, N-tallow-3-iminodipropionato y N-cocoamidetil-N-hidroxietilglicina, así como hidróxido de N-carboximetil-N-dimetil-N-(9-octadecenil) amonio. En realizaciones adicionales, la composición incluye uno o más alimentos o aditivos alimentarios, agentes cosméticos o farmacéuticos o agentes antimicrobianos (tales como un agente antibacteriano o antifúngico).
Métodos para preparar glicolipopéptidos
Los glicolipopéptidos descritos en la presente memoria pueden prepararse por aislamiento o purificación a partir de cepas bacterianas que los producen, tales como Variovorax paradoxus RKNM-096. Como se describe en la sección de Ejemplos más adelante, las bacterias que producen uno o más glicolipopéptidos pueden aislarse de hábitats naturales u obtenerse a partir de fuentes accesibles públicamente. Puede determinarse que las bacterias producen glicolipopéptidos por los métodos descritos en los Ejemplos. La bacteria productora de glicolipopéptido puede ponerse en un biorreactor (recipiente) que contiene medio de cultivo adecuado, e incubarse entonces en condiciones que promueven la replicación bacteriana y la producción de uno o más glicolipopéptidos. El o los glicolipopéptidos producidos pueden purificarse o aislarse de la mezcla de cultivo por técnicas convencionales tales como extracción seguida de separación cromatográfica (p. ej., usando cromatografía líquida de ultra alta resolución). Pueden realizarse análisis químicos (determinación del peso molecular, punto de fusión, RMN, espectroscopía IS, etc.) para confirmar la estructura y pureza del o de los glicolipopéptidos aislados. Alternativamente, los glicolipopéptidos descritos en la presente memoria pueden prepararse por síntesis total o semisíntesis, p. ej., como se describe en la presente memoria.
Agrupaciones génicas de glicolipopéptidos y métodos de uso
Como se describe en el Ejemplo 7 más adelante, se caracterizaron las agrupaciones génicas biosintéticas de glicolipopéptido y de ramnosa de V. paradoxus RKNM-096. Los polipéptidos codificados en la agrupación génica funcionan de una manera coordinada para sintetizar la serie NB-RLP de biotensioactivos. La secuencia de nucleótidos que codifica estos genes y las secuencias de aminoácidos de los polipéptidos correspondientes se muestran en el listado de secuencias. Otras secuencias de aminoácidos y las secuencias de ácido nucleico que comparten al menos un 70% (p. ej., al menos un 70, 80, 90, 95, 97, 98, o 99%) de identidad de secuencia con las mostradas en el listado de secuencias también podrían usarse en los métodos y composiciones descritas en la presente memoria, particularmente cuando dichas otras secuencias presentan (o codifican una molécula que presenta) al menos un 50% (p. ej., al menos un 50, 60, 70, 80, 90, o 100%) de la actividad enzimática del polipéptido nativo correspondiente. Las secuencias de ácido nucleico que codifican los mismos polipéptidos descritas en la presente memoria, pero que no se incluyen en el listado de secuencias, también podrían usarse.
Los polinucleótidos anteriores podrían usarse en un método para producir enzimas biosintéticas recombinantes. Como un ejemplo, dicho método podría incluir cultivar una célula huésped (p. ej., E. coli u otra célula huésped procariota o eucariota adecuada) que contiene un vector de expresión que tiene una secuencia de ácido nucleico de una o más de SEQ ID NO:1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19 y SEQ ID NO:21 en un medio de cultivo en condiciones adecuadas para la expresión de la proteína recombinante en la célula huésped, y b) aislar la o las proteínas recombinantes de la célula huésped o del medio de cultivo.
También se contempla un método para producir un glicolipopéptido en una célula huésped heteróloga mediante la expresión de la agrupación génica biosintética completa o parcial. Este método podría incluir las etapas de a) cultivar una célula huésped que contiene un vector de expresión que tiene secuencias de ácido nucleico que comprenden SEQ ID NO: 1, SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19 y SEQ ID NO:21 en un medio de cultivo en condiciones adecuadas para la expresión de las proteínas recombinantes en la célula huésped, y b) aislar los glicolipopéptidos producidos del medio de cultivo.
Se contemplan además métodos para usar una molécula de ácido nucleico que hibrida con o incluye una parte de SEQ ID NO:1 , SEQ ID NO:2, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19 o SEQ ID NO:21 como una sonda o cebador de PCR para identificar otros organismos capaces de producir glicolipopéptidos o biotensioactivos estructuralmente similares.
Síntesis
Los compuestos de la presente invención pueden conseguirse usando métodos químicos como se indica en la presente memoria.
La síntesis total de los glicolipopéptidos puede conseguirse usando metodología sintética establecida para ensamblar bloques de construcción disponibles comercialmente. Un análisis retrosintético de NB-RLP1006 (1) demuestra la idoneidad de la síntesis total. Como un ejemplo, un experto en la técnica de la síntesis orgánica puede acoplar el sustituyente dipéptido (4) al ácido tridecanoico (5) y realizar una glicosilación química del intermedio lipopéptido (2) usando el donante de glicosilo 3 como se muestra más adelante. El resto de dipéptido puede prepararse usando métodos de acoplamiento de amida estándar, mientras el ácido tridecanoico puede generarse a partir de trans-2-decenoato de etilo disponible comercialmente. Mientras, el sustituyente diramnosa unido en a-1,3 (3) puede ensamblarse usando el donante de glicosilo 6 y el aceptor de glicosilo 7. Se entiende que esta estrategia general, u otras estrategias similares en las que se ensamblan materiales de partida disponibles comercialmente, podría permitir la síntesis de análogos de glicolipopéptido. Por ejemplo, pueden incorporarse diferentes aminoácidos en la porción de péptido o semejante a péptido, mientras la longitud de la cadena peptídica puede incrementarse o disminuirse. De forma similar, podrían hacerse modificaciones estructurales a las porciones de lípido y carbohidrato de los glicolipopéptidos para producir análogos con características de biotensioactivo potencialmente útiles.
Para generar el sustituyente carbohidrato, diramnosa unida en a-1,3, deben realizarse varias manipulaciones de grupo protector para permitir la glicosilación regioselectiva del azúcar ramnosa en la posición 3-OH (Esquema 2). El pmetoxifenil a-L-ramnopiranósido (8), que sirve como un precursor sintético para ambos restos de ramnosa, puede sintetizarse a partir de L-ramnosa disponible comercialmente en tres etapas. El azúcar ramnosa terminal puede preparase entonces por perbencilación de 8 y eliminación del sustituyente p-metoxifenilo para permitir la síntesis del tricloroacetimidato de ramnosilo (9). Mientras, una secuencia de seis etapas de manipulaciones de grupo protector puede proporcionar p-metoxifenil 2,4-di-O-benciloxiramnopiranósido (10) (Cai, X.; et al. Carbohydr. Res. 2010, 345, 1230), que puede glicosilarse en la posición 3-OH para conseguir la unión glicosídica a-1,3 entre los dos sustituyentes ramnosa. Se espera que el efecto anomérico dirija la formación de una unión a-glicosídica con alta estereoselectividad en esta glicosilación química (Takahashi, O.; et al. Carbohydr. Res. 2007, 342, 1202).
Figure imgf000011_0001
Esquema 2. Síntesis del donante de ramnosilo 9 y del aceptor de glicosilo 10 como bloques de construcción para el ensamblaje del sustituyente diramnosa. Reactivos y condiciones: (a) (i) Ac2O, piridina, 70 °C, 16 h. (ii) p-metoxifenol, BFa-Et2O, CH2Cl2 , 0 ° C ^ 25 °C, 3 h. (iii) NaOCHs, CHaOH. (b) CHaC(OCH3)2CHa, DMF, TsOH^HaO. (c) BnBr, Bu4NI, NaH, DMF, 0 ° C ^ 25 °C, 3 h. (d) CH3CN al 80%, CAN, 35 °C, 30 min. (e) CCI3CN, DBU, CH2CI2 , 25 °C, 30 min. (f) BnBr, BrnNI, NaH, DMF, 0 ° C ^ 25 °C, 3 h. (g) AcOH al 70%, 70 °C, 3 h. (h) AllocCl, piridina, DMF, CH2CI2 , -15 ° C ^ 0 °C, 3 h. (j) BnBr, BmNI, NaH, DMF, 0 °C ^ 25 °C, 3 h.; (k) NaBH4, Pd[P(CsH5)3]4, CH3COONH4 , CHsOH:THF (1:1), -5 °C, < 30 min.
Para ensamblar al sustituyente diramnosa, el donante de glicosilo 9 puede unirse al aceptor de glicosilo 10 a través de la activación del tricloroacetimidato anomérico usando BF3^Et2O o TMSOTf (Esquema 3). El grupo protector pmetoxifenilo anomérico puede reemplazarse entonces por un buen grupo saliente, tal como un tricloroacetimidato, para permitir la glicosilación del resto de ácido decanoico. Alternativamente, puede instalarse un grupo tiofenilo en lugar del grupo p-metoxifenilo durante la reacción A del Esquema 2. Esta estrategia permitiría seguir una glicosilación ortogonal dado el papel dual del grupo tiofenilo anomérico como un grupo protector y saliente (Gampe, CM.; et al. Tetrahedron 201 1,67, 9771; Wu, C.-Y.; Wong, C.-H. Top. Curr. Chem. 2011,301,223). Se sabe que la síntesis total de NB-RLP860 podría conseguirse usando el donante de ramnosilo 9 u otros donantes de ramnosilo adecuados. Además, se reconoce que un químico experto podría modificar el resto de carbohidrato de los glicolipopéptidos mediante el uso de donantes de glicosilo distintos de 9 , 11, o 12.
Figure imgf000012_0001
Esquema 3. Síntesis de 11 y 12 como donantes de glicosilo para la glicosilación del resto de ácido trldecanoico. Reactivos y condiciones: (a) BF3^Et2O (cat.), 9 , CH2CI2 anhidro, tamices moleculares 3Á, -78 °C, 2 h. (b) CH3CN al 80%, CAN, 35 °C, 30 min. (c) CCI3CN, Db U, CH2CI2 , 25 °C, 30 min. (d) BF3^Et2O (cat.), 9 , CH2CI2 anhidro, tamices moleculares 3Á , -78 °C, 2 h.
Para ensamblar el resto de ácido tridecanoico, puede servir el trans-2-decenoato de etilo (13) disponible comercialmente como un precursor para la síntesis de ácido 3-hidroxidecanoico (14) a través de una p-oxidación de cinco etapas establecida (Schneekloth, J.S.; et al. Bioorg. Med. Chem. Lett. 2006, 1 6 , 3855; Pandey, S.K.; Kumar, P. Eur. J. Org. Chem. 2007, 369). Los rendimientos globales reportados en la bibliografía para esta síntesis varían entre el 50-85% (Esquema 4). Aunque el ácido (±)-3-hidroxidecanoico también está disponible comercialmente, este precursor racémico tiene un coste prohibitivo y no representa probablemente una ruta económicamente viable. Después de generar el ácido 3-(fe/'c-butildimetilsilil) decanoico (15), este bloque de construcción puede unirse dos veces a 14 a través de una esterificación de Steglich para generar el ácido di y tridecanoico sililado (16 y 17, respectivamente) de NB-RLP1006 y otros glicolipopéptidos. En esta estrategia, el ácido carboxílico 15 se activa como un éster de W-hidroxisuccinimida antes de la adición de 14, obviando un grupo protector adicional para la funcionalidad ácido carboxílico de 14.
Figure imgf000012_0002
Esquema 4. Síntesis del resto de ácido tridecanoico (17) de NB- RLP1006. Reactivos y condiciones: (a) (DHQD)2 PHAL (1 % en moles), OsO40,1 M (0,5% en moles), K2CO3 , K3Fe(CN)6, CH3SO2NH2 , t-BuOH:H2O (1:1), 0 °C, 24 h. (b) (i) SOCl2 , Et3N, CH2CI2 , 0 °C, 30 min. (ii) RuCl3, NaIO4, CCU:CH3CN:H2O (2:2:3), 0 °C, 1 h. (c) NaBH4, DMAC, 25 °C, 30 min. (d) NaOH, Acetona:H2O (1:1), 25 °C, 16-24 h. (e) (i) TBDMSCl, imidazol, DMF, 25 °C. (ii) NaOH, Acetona:H2O (1:1), 25 °C, 16-24 h. (f) (i) ácido 3-benciloxidecanoico, DIC, NHS, 0 °C ^ 25 °C, 3 h. (ii) ácido 3-hidroxidecanoico, Et3N, DMAP, 25 °C, 3 h. (g) (i) ácido 3-(3-(benciloxi)decanoiloxi) decanoico, DIC, NHS, 0 °C ^ 25 °C, 3 h. (ii) ácido 3-hidroxidecanoico, Et3N, Dm AP, 25 °C, 3 h.
También está disponible una estrategia alternativa en la que el grupo ácido carboxílico de 14 se protege como un éster de bencilo antes de la esterificación (Esquema 5). En esta estrategia, los bloques de construcción 15 y 18 se unen entre sí en una síntesis que requiere etapas adicionales para instalar y eliminar los grupos protectores éter de sililo y éster de bencilo. Se sabe que un químico experto en la técnica de la síntesis orgánica podría utilizar cualquiera de las estrategias para introducir restos de hidrocarburos C2 a C19 saturados o insaturados, de cadena lineal o ramificada, cíclicos, o aromáticos con el fin de modificar la porción lipídica de los glicolipopéptidos. Se anticipa que los análogos generados a través de esta estrategia también pueden presentar propiedades de tensioactivo.
Figure imgf000013_0001
Esquema 5. Ruta alternativa al resto de ácido tridecanoico (17) de NB-RLP1006. Reactivos y condiciones: (a) (i) TBDMSCl, imidazol, DMF, 25 °C. (ii) NaOH, Acetona:H2O (1:1), 25 °C, 16-24 h. (b) (i) DIC, NHS, 0 °C ^ 25 °C, 3 h. (ii) BnOH, Et3N, DMAP, 25 °C, 3 h. (c) Bu4NF, THF, 25 °C, 3 h. (d) (i) ácido 3-(terc-butildimetilsililoxi)decanoico (15), DIC, NHS, 0 °C ^ 25 °C, 3 h. (ii) 3-hidroxidecanoato de bencilo (18), Et3N, DMAP, 25 °C, 3 h. (e) (i) Bu4NF, THF, 25 °C, 3 h. (ii) ácido 3-(terc-butildimetilsililoxi)decanoico (15), DIC, NHS, 0 °C ^ 25 °C, 3 h. (iii) 3-(3-hidroxidecanoiloxi)decanoato de bencilo, Et3N, DMAP, 25 °C, 3 h. (f) Pd/C al 10% (20% en peso), H2, CH2Cl2 , 25 °C, 16 h.
El dipéptido leucinol-serina puede ensamblarse a partir de Boc-leucinol (19) y Fmoc-Ser(Bzl)-OH (20) disponibles comercialmente usando química de acoplamiento de amida bien establecida (Esquema 6) (Valeur, E.; Bradley, M. Chem. Soc. Rev. 2009, 38, 606). La secuencia de reacción de cinco etapas implica proteger el grupo hidroxilo primario de 19 como un éter de bencilo y acoplar los dos aminoácidos antes de eliminar el grupo protector 9-fluorenilmetiloxicarbonilo (Fmoc) para generar el dipéptido leucinol-serina (21) que es estable para acoplamiento de amida al ácido decanoico. Es concebible que pudieran ensamblarse otros aminoácidos disponibles comercialmente, incluyendo, pero no limitado a, D-aminoácidos y p-aminoácidos, de una manera similar para introducir modificaciones estructurales en la porción de péptido del glicolipopéptido. El extremo C del péptido o porción semejante a péptido podría existir como una funcionalidad ácido carboxílico o reducirse a un grupo hidroxilo primario. Otras modificaciones en la posición C-terminal incluyen, pero no se limitan a, alquilación, acilación, glicosilación, fosforilación, y sulfatación. La longitud de la cadena del péptido o porción semejante a péptido podría incrementarse mediante el acoplamiento de monómeros de aminoácidos adicionales al intermedio dipéptido. Alternativamente, podría acoplarse un único monómero de aminoácido al intermedio ácido tridecanoico (17) para disminuir la longitud de la cadena.
Figure imgf000013_0002
Esquema 6. Preparación del residuo de dipéptido leucinol-serina de NB-RLP1006. Reactivos y condiciones: (a) (i) BnBr, Bu4NI, NaH, DMF, 0 °C ^ 25 °C, 3 h. (ii) HCl, CH3OH, 25 °C, 1 h. (b) (i) Fmoc- Serina(Bzl)-OH, DIC, NHS, 0 °C ^ 25 °C, 3 h. (ii) Leucinol(Bzl), Et3N, DMAP, 25 °C, 3 h. (c) Piperidina (20% en vol), DMF, 25 °C, 3 h.
El ácido tridecanoico (17) puede experimentar fácilmente acoplamiento de amida al dipéptido bencilado (21), después de lo cual el grupo protector terc-butildimetil sililo puede eliminarse usando fluoruro de tetrabutilamonio para proporcionar el aceptor de glicosilo 22 (Esquema 7). La glicosilación de 22 bien con 11 o 12, seguida de desprotección global a través de hidrogenólisis de los éteres de bencilo, suministra el glicolipopéptido NB-RLP1006 desprotegido.
Figure imgf000014_0001
Esquema 7. Etapas finales en el ensamblaje del glicolipopéptido NB-RLP1006. Reactivos y condiciones: (a) (i) DIC, NHS, 0 °C ^ 25 °C, 3 h. (ii) Leucinol(Bzl)-Ser(Bzl)NH2 (21), Et3N, DMAP, 25 °C, 3 h. (b) Bu4NF, THF, 25 °C, 3 h. (c) Si el donante de glicosilo 11 (X = CNHCh), BF3^Et2O (cat.), tamices moleculares 3Á, CH2CI2 anhidro, -78 °C, 2 h. (d) Si donante de glicosilo 12 (X = SPh), NIS, TfOH (10% en moles), 1,2-DCE, tamices moleculares 4 Á, (e) Pd/C al 10% (20% en peso), H2 , CH2Cl2 , 25 °C, 16 h.
Aunque la síntesis total de NB-RLP1006 puede requerir entre 14-18 etapas (secuencia lineal más larga, 34-40 etapas en total), la síntesis podría acelerarse utilizando técnicas sintéticas en fase sólida, en las que el residuo de leucinol terminal se inmoviliza en un soporte sólido. Por ejemplo, el Leucinol(Bzl) (19) puede unirse a un grupo p-alcoxibencil hidroxilo unido a poliestireno (resina de Wang) a través de una unión éter de sililo (Esquema 8) (Scott, P.J.H. Linker Strategies in Solid-Phase Synthesis, John Wiley & Sons Ltd: Chichester, Reino Unido, 2009; p 50-51). Siguiendo las metodologías de acoplamiento de amida y esterificación de Steglich descritas previamente (Coin, I.; et al. Nat. Protoc.
2007, 2, 3247.), los residuos remanentes de serina y ácido decanoico pueden unirse entonces en una estrategia por etapas usando Fmoc-Ser(Bzl)-OH (20) y ácido 3-(ferc-butildimetilsilil)decanoico (23). Después de liberar el intermedio lipopéptido, el grupo hidroxilo primario puede protegerse selectivamente como un éter de ferc-butildifenilsililo para proporcionar el aceptor de glicosilo 24. El glicolipopéptido NB-RLP1006 puede sintetizarse entonces por glicosilación química y eliminación de los grupos protectores éter de sililo y bencilo. También pueden producirse análogos de los glicolipopéptidos usando técnicas sintéticas en fase sólida como se describe en la síntesis en fase sólida anterior de NB-RLP1006.
Figure imgf000014_0002
Esquema 8. Síntesis total en fase sólida de NB-RLP1006. Reactivos y condiciones: (a) (i) Leucinol(Bzl) (19), iPr2SiCl2, imidazol, DMF, 25 °C, 1 h. (ii) HCl, CH3OH, 25 °C, 1 h. (b) (i) Fmoc- Serina(Bzl)-OH (20), DIC, NHS, 0 °C ^ 25 °C, 3 h. (ii) Et3N, DMAP, 25 °C, 3 h. (c) (i) PMBCl, NaH, DMF, 0 °C ^ 25 °C, 3 h. (ii) NaOH, Acetona:H2O (3:1), 25 °C, 16­ 24 h. (iii) DIC, NHS, 0 °C ^ 25 °C, 3 h. (d) (i) 23, Et3N, DMAP, 25 °C, 3 h. (ii) CH3CN al 80%, CAN, 35 °C, 30 min. (iii) 23, Et3N, DMAP, 25 °C, 3 h. (iv) CH3CN al 80%, CAN, 35 °C, 30 min. (v) 23, Et3N, DMAP, 25 °C, 3 h. (vi) CH3CN al 80%, CAN, 35 °C, 30 min. (vii) BiuNF, THF, 25 °C, 3 h. (e) TBDPSCI, imidazol, DMAP, DMF, 25 °C, 2 h. (f) B F s ^ O (cat.), CH2Cl2 anhidro, -78 °C, 2 h. (g) (i) BiuNF, THF, 25 °C, 3 h. (ii) Pd/C al 10% (20% en peso), H2 , CH2Cl2 , 25 °C, 16 h.
Semisíntesis de los glicolipopéptidos
Los análogos sintéticos de NB-RLP1006 y otros glicolipopéptidos también pueden ser interesantes para evaluar las relaciones estructura-actividad de esta clase de biotensioactivos. A diferencia de la síntesis total, una semisíntesis podría representar una estrategia rápida para desarrollar varios análogos de glicolipopéptido. Por ejemplo, las estrategias pueden implicar una semisíntesis del ácido tridecanoico (23) por hidrólisis ácida de la mezcla de glicolipopéptidos (Esquema 9). Véase, Miao, S.; et al. J. Agric. Food Chem. 2015, 63, 3367. El ácido tridecanoico (23) podría acoplarse entonces a la porción de péptido y glicosilarse con disacáridos disponibles comercialmente, tales como lactosa o maltosa, para generar nuevos análogos de glicolipopéptido (p. ej., 24). La aglicona de glicolipopéptidos también puede producirse por V. paradoxus RKNM-096 y experimentar una glicosilación química para producir análogos similares. También se sabe que los ramnolípidos podrían utilizarse como un precursor avanzado y unirse a varios dipéptidos (p. ej., 21) a través del grupo funcional ácido carboxílico para producir glicolipopéptidos similares a NB-RLP1006 (Esquema 10). Dada la disponibilidad comercial de los ramnolípidos, concebiblemente un experto en la técnica de la síntesis orgánica también reconocería que las cadenas peptídicas distintas de leucinol-serina podrían introducirse para expandir la diversidad estructural de los análogos de glicolipopéptido accesibles a través de esta estrategia semisintética.
Figure imgf000015_0001
Esquema 9. Ruta semisintética alternativa a análogos de glicolipopéptido a partir del ácido tridecanoico (23) y disacáridos disponibles comercialmente. Reactivos y condiciones: (a) HCl 1M, CH3CN:H2O (1:1), 95 °C, 16 h. (b) (i) DIC, NHS, 0 °C ^ 25 °C, 3 h. (ii) Leucinol(Bzl)-Ser(Bzl)NH2 (21), EtaN, DMAP, 25 °C, 3 h. (c) (i) Ac2O, piridina, 70 °C, 16 h. (ii) p-metoxifenol, BFs^Et20, CH2Cl2 , 0 °C ^ 25 °C, 3 h. (iii) NaOCHs, CH3OH. (d) (i) BnBr, Bu4NI, NaH, DMF, 0 °C ^ 25 °C, 3 h. (ii) CH3CN al 80%, CAN, 35 °C, 30 min. (e) CCI3CN, DBU, CH2Cl2 , 25 °C, 30 min. (f) BF3^Et2O (cat.), CH2Cl2 anhidro, -78 °C, 2 h. (g) Pd/C al 10% (20% en peso), H2 , CH2Cl2 , 25 °C, 16 h.
Esquema 10. Semisíntesis de un análogo de glicolipopéptido (25) a partir de ramnolípidos disponibles comercialmente. Reactivos y condiciones: (a) (i) PyBOP, DMF, 0 °C ^ 25 °C, 2 h. (ii) Leucinol(Bzl)-Ser(Bzl)NH2 (21), Et3N, 0 °C ^ 25 °C, 2 h. (b) Pd/C al 10% (20% en peso), H2 , CH2Cl2 , 25 °C, 16 h.
Concebiblemente, un experto en la técnica de la síntesis orgánica podría aislar glicolipopéptidos naturales a partir de una fermentación microbiana y sintetizar derivados, análogos, y otras variantes estructurales. Por ejemplo, las modificaciones que podrían ocurrir en Rsa, Rsb, R6a, R6b, R7a, R7b, R10, y R11 incluyen, pero no se limitan a, alquilación, acilación, glicosilación, fosforilación, y sulfatación. Los glicolipopéptidos también podrían experimentar una hidrólisis básica para producir compuestos semejantes a ramnolípidos con propiedades de tensioactivo potencialmente útiles. También se sabe que una reacción de hidrólisis básica proporcionaría NB-RLP374.
Métodos de uso
Los glicolipopéptidos descritos en la presente memoria podrían usarse de forma similar a otros tensioactivos. Pueden usarse, por ejemplo, como detergentes, emulsionantes, dispersantes, agentes humectantes, agentes espumantes, o inhibidores/disruptores de biopelículas. Un uso típico sería para la preparación de emulsiones para formulaciones cosméticas o farmacéuticas (p. ej., emulsiones de agua en aceite o aceite en agua), donde uno o más glicolipopéptidos o derivados o análogos de los mismos se mezclan con un componente polar y un componente no polar.
Las propiedades de los tensioactivos de esta invención también les hacen adecuados como emulsionantes, particularmente en emulsiones de aceite en agua o agua en aceite, p. ej., en aplicaciones de cuidado personal. Los productos en emulsión para el cuidado personal pueden tomar la forma de cremas y leches que incluyen de forma deseable y típica emulsionante para ayudar a la formación y estabilidad de la emulsión. Típicamente, los productos en emulsión para el cuidado personal usan emulsionantes (incluyendo estabilizantes de la emulsión) en cantidades de aproximadamente el 3 a aproximadamente el 5% en peso de la emulsión.
La fase de aceite de dichas emulsiones es típicamente aceites emolientes del tipo usado en productos para el cuidado personal o cosméticos, que los materiales grasos que son líquidos a temperatura ambiente o sólidos a temperatura ambiente, siendo a granel habitualmente un sólido ceroso, siempre que sea líquido a una temperatura elevada, típicamente hasta 100 °C, más habitualmente aproximadamente 80 °C, de manera que dichos emolientes sólidos tienen de forma deseable temperaturas de fusión menores de 100 °C, y habitualmente menores de 70 °C, a las cuales pueden incluirse en y emulsionarse en la composición.
La concentración de la fase de aceite puede variar ampliamente y la cantidad de aceite es típicamente del 1 al 90%, habitualmente del 3 al 60%, más habitualmente del 5 al 40%, particularmente del 8 al 20%, y especialmente del 10 al 15% en peso de la emulsión total. La cantidad de agua (o poliol, p. ej., glicerina) presente en la emulsión es típicamente mayor del 5%, habitualmente del 30 al 90%, más habitualmente del 50 al 90%, particularmente del 70 al 85%, y especialmente del 75 al 80% en peso de la composición total. La cantidad de tensioactivo usada en dichas emulsiones puede estar en el intervalo del 0 , 0 0 1 al 1 0 % en peso de la emulsión, preferiblemente del 0 ,0 1 al 6 % en peso, más preferiblemente del 0,1 al 5% en peso, más preferiblemente del 1 al 3% en peso. La cantidad de tensioactivo usada en dichas emulsiones es típicamente del 2 al 5,5%, en peso de la emulsión.
Las formulaciones de uso final de dichas emulsiones incluyen hidratantes, cremas solares, productos postsolares, mantecas corporales, cremas en gel, productos que contienen mucho perfume, cremas perfumadas, productos para el cuidado el bebé, acondicionadores del pelo, productos tonificadores de la piel y para el blanqueamiento de la piel, productos sin agua, productos antiperspirantes y desodorantes, productos bronceadores, limpiadores, emulsiones espumantes 2 en 1 , emulsiones múltiples, productos sin conservantes, productos sin emulsionante, formulaciones suaves, formulaciones exfoliantes, p. ej., que contienen lechos sólidos, formulaciones de silicona en agua, productos que contienen pigmentos, emulsiones pulverizables, cosméticos con color, acondicionares, productos de ducha, emulsiones espumantes, desmaquillante, desmaquillante de ojos, y toallitas. Un tipo de formulación preferida es un protector solar que contiene uno más protectores solares orgánicos y/o protectores solares inorgánicos, tales como óxidos metálicos, pero que incluye de forma deseable al menos un dióxido de titanio y/u óxido de cinc particulado.
Todas las características descritas en la presente memoria pueden combinarse con cualquiera de los aspectos anteriores, en cualquier combinación. Debe entenderse que la invención no está limitada a los detalles de las realizaciones anteriores, que se describen solo como ejemplo. Son posibles muchas variaciones.
Con el fin de que la presente invención pueda entenderse más fácilmente, se hará ahora referencia, como ejemplo, a la siguiente descripción.
Ejemplos
Ejemplo 1: aislamiento de Variovoraxparadoxus RKNM-096.
La cepa bacteriana RKNM-096 se aisló a partir de tierra recogida del área Battle Bluffs al oeste de Kamloops, Columbia Británica. RKNM-096 se aisló como una colonia mucoide con pigmentación amarilla, y se purificó por subcultivo seriado. La bacteria se identificó por análisis génico del ARNr 16S, que indicó que RKNM-096 era una cepa de V. paradoxus.
Ejemplo 2: identificación de Variovoraxparadoxus RKNM-096 como un productor de biotensioactivo.
V. paradoxus RKNM-096 se identificó como un productor de biotensioactivo en un cribado dirigido a identificar productores bacterianos de biotensioactivos con propiedades emulsionantes. El ensayo utilizado para identificar productores bacterianos de biotensioactivos fue el ensayo de actividad de emulsificación. En este ensayo, se crecieron cultivos en 10 mL de medio líquido en tubos de vidrio de 25 mm x 150 mm a 30 °C con agitación a 200 rpm durante 5 días. Después de 5 días, las células se retiraron por centrifugación y se mezclaron 3,5 mL del caldo de cultivo sin células con 3,5 mL de queroseno en un tubo de ensayo de 13 mm x 100 mm con tapa de rosca. Los tubos se agitaron con vórtex durante dos minutes y entonces se dejaron permanecer toda la noche a temperatura ambiente, después de lo cual se midieron la altura de la emulsión (hemuls) y la altura total (htotal) del líquido en el tubo. Se calculó el índice de emulsificación (E24) usando la ecuación E24= hemuls/htotal x 100%. Los caldos de fermentación de V. paradoxus RKNM-096 cultivado en caldo ISP2 (maltosa al 0,4%, extracto de levadura al 0,4%, dextrosa al 1,0%, pH 7,0) presentaron un valor de E24 del 50,7%.
Ejemplo 3: identificación de biotensioactivos glicolipopeptídicos producidos por Variovorax paradoxus RKNM-096.
Para determinar si una molécula pequeña era responsable de la actividad de emulsificación observada, V. paradoxus RKNM-096 se fermentó en caldo ISP2 como se ha descrito anteriormente y el caldo se extrajo dos veces con 10 mL de acetato de etilo (EtOAc). El extracto de EtOAc se lavó entonces dos veces con 10 mL de agua para eliminar cualesquiera componentes del medio polares remanentes del extracto de EtOAc. Para propósitos de comparación, se extrajo un blanco de medio ISP2 de una manera idéntica. Los extractos de EtOAc se evaporaron en vacío y se reconstituyeron en CH3OH a una concentración de 0,5 mg/mL.
Los extractos se separaron por cromatografía líquida de ultra alto rendimiento (UPLC; Accela™, Thermo Fisher Scientific Mississauga, ON, Canadá) y los eluatos se analizaron con un detector de matriz de fotodiodos (200-600 nm) (PDA; Accela™, Thermo Fisher Scientific Mississauga, ON, Canadá), un detector de dispersión de luz evaporativo (ELSD; Sedex, Sedere, Alfortville, Francia) y un espectrómetro de masa de alta resolución que utiliza ionización por electropulverización (HRESIMS) (Orbitrap Exactive; Thermo Fisher Scientific, Mississauga, ON, Canadá) (modo positivo, monitorización m/z 200-2.000). La separación cromatográfica se consiguió con una columna Kinetex 1,7 pm. C18 100 Á 50 x 2,1 mm (Phenomenex, Torrance, CA, EE. UU.) y un gradiente lineal de H2O al 95%/ácido fórmico al 0,1% (FA) (disolvente A) y acetonitrilo al 5% (CH3CN)/FA al 0,1% (disolvente B) a disolvente B al 100% durante 5 min seguido de mantener el disolvente B al 100% durante 3 min con una tasa de flujo de 400 pL/min. El examen del cromatograma ELSD del extracto de V. paradoxus RKNM-096 reveló cinco picos prominentes. El primer pico eluyó a los 0,50 min y estaba presente en el blanco de medio, lo que indica que este pico estaba compuesto por componentes del medio. Los siguientes cuatro picos (1-4) eluyeron a los 3,0 min, 5,04 min, 5,29 min y 5,39 min en el cromatograma ELSD, respectivamente. Estos picos no se observaron en los extractos del blanco de medio, lo que indica que eran productos metabólicos de V. paradoxus RKNM-096. El pico 1 eluyó a los 3,00 min y el examen del espectro de masa del pico correspondiente en el cromatograma iónico total (3,04 min) reveló la presencia de dos iones con relaciones de masa a carga (m/z) de 375,2855 y 397,2673, lo que es consistente con la [M H]+ y [M Na]+ anticipada para un compuesto con una fórmula molecular de C19H38N2O5 y masa de 374,2781. Los espectros de masa de los picos 2 - 4 se examinaron de una manera idéntica y los iones [M H]+ se identificaron como m/z 1007,6628, 1049,6778, y 1049,6734, respectivamente. La diferencia en masa entre los iones [M H]+ asociados con los picos 3 y 4 fue 4,2 ppm, lo que sugiere que estos dos compuestos tenían probablemente una fórmula molecular idéntica, sin embargo, la ligera diferencia en el tiempo de retención indicó que eran probablemente análogos estructurales muy relacionados.
Los compuestos también se elucidaron usando RMN. Los datos de RMN indicaron la presencia de cuatro grupos carbonilo además de dos residuos de azúcar con desplazamientos químicos de carbono anomérico característicos a 5c 101,4 y 5c 103,9. Las correlaciones clave COSY y HMBC permitieron la caracterización química del leucinol derivado de aminoácido, un residuo de serina, y tres ácidos 3-hidroxidecanoicos (Fig. 1). La conectividad entre los diferentes restos se confirmó adicionalmente por espectrometría de masa en tándem. Los dos residuos de desoxihexosa se identificaron por interpretación de las correlaciones COSY 1H-1H y análisis de la constante de acoplamiento. El pequeño acoplamiento J presentado por el protón anomérico H-1' (5h 4,79, d, J = 1,4 Hz) y el protón metino H-2' (5h 3,86, dd, J = 3,2, 1,4 Hz) situó a los protones H-1' y H-2' en la posición ecuatorial, mientras el mayor acoplamiento J para H-4' (5h 3,53 - 3,48, app. t) indicó la relación axial con H-3' y H-5', y por lo tanto sugirió un residuo a-ramnopiranosilo. El pico cruzado de HMBC entre el protón anomérico H-1' y C-3C (5c 76,5) demostró la unión de este azúcar al resto de ácido 3-hidroxidecanoico. El segundo residuo de azúcar también se identificó como una aramnopiranosa sobre la base de los valores de la constante de acoplamiento. El pequeño acoplamiento J para H-1" (5h 5,01, d, J = 1,5 Hz) y H-2" (5h 3,98, dd, J = 3,3, 1,5 Hz) indicó la orientación ecuatorial de estos protones, mientras la mayor constante de acoplamiento para H-4" (5h 3,40, app. t, J = 9,5 Hz) demostró su relación axial con H-3" y H-5". Una correlación HMBC clave entre H-3' y C-1" estableció una unión glicosídica 1,3-a entre los dos restos de ramnopiranosa.
La estructura de NB-RLP1006 es:
Figure imgf000018_0001
Los extractos orgánicos de V. paradoxus RKNM-096 también se fraccionaron por cromatografía en fase normal automatizada, seguido de HPLC en fase inversa, lo que proporcionó NB-RLP1048A y NB-RLP1048B. Sobre la base del análisis de HRESIMS (NB-RLP1048A: HRESIMS m/z 1049,6778 [M H]+; NB-RLP1048B: HRESIMS 1049,6734 [M H]+, calcd para C53H97N2O18, 1049,6731), se determinó que estos compuestos eran análogos monoacetilados de NB-RLP1006. La fórmula molecular aparente de estos compuestos es C53H96N2O18. Sobre la base del análisis de RMN, NB-RLP1048A consistía en una mezcla inseparable de glicolipopéptidos acetilados con la estructura:
Figure imgf000018_0002
donde cualquier grupo R único es un grupo acetilo, mientras todos los demás grupos R son átomos de hidrógeno.
La estructura química de NB-RLP1048B se determinó por técnicas espectroscópicas RMN 1D y 2D, confirmando la localización del grupo acetilo en la posición C-3".
La estructura química de NB-RLP1048B es:
Figure imgf000018_0003
El esquema de fraccionamiento descrito también rindió varios otros análogos de glicolipopéptido producidos por V. paradoxus RKNM-096 en cantidades menores, incluyendo 10,9 mg de NB-RLP978. Los datos de RMN de 1H y 13C fueron casi idénticos a los de NB-RLP1006. La fórmula molecular aparente de NB-RLP978 es C49H90N2O17 (HRESIMS m/z 979,6307 [M H]+, calcd para C49H91N2O17, 979,6312). Sobre la base de la espectrometría de masa en tándem, se determinó que NB-RLP978 era una mezcla inseparable de tres análogos muy relacionados, NB-RLP978A, NB-RLP978B, y NB-RLP978C, que contienen una cadena acilo Cs en una de las posiciones de ácido 3-hidroxialcanoico.
La estructura química de NB-RLP978A-C es:
Figure imgf000019_0001
cualquier cadena acilo única es Os (es decir, ni, n2, o n3 = 3) mientras las cadenas acilo remanentes son Cío (es decir, n = 5). NB-RLP978A: ni= n2 = 5, n3 = 3; NB-RLP978B: ni = n3 = 5, n2 = 3; NB-RLP978O: ni = 3, n2 = n3 = 5.
La purificación por HPLO de fase inversa de NB-RLP1006 y NB-RLP978A-C, también rindió NB-RLP950, una mezcla inseparable de compuestos con una fórmula molecular aparente de C47H86N2O18 (HRESIMS m/z 951,5982 [M H]+, calcd para C47H87N2O18, 951,5999), lo que es consistente con un análogo de NB-RLP1006 que carece de cuatro grupos metileno. El espectro de RMN de 1H de NB-RLP950 fue casi idéntico al de NB-RLP1006 y NB-RLP978. No se obtuvo un espectro de 13C debido a material insuficiente. Sobre la base de la espectrometría de masa en tándem, se determinó que NB-RLP950 era una mezcla de seis análogos muy relacionados: NB-RLP950A, NB-RLP950B, NB-RLP950C, NB-RLP950D, NB-RLP950E, y NB-RLP950F. Estos análogos de glicolipopéptido bien contienen dos cadenas de acilo C8 o una cadena de acilo C6 en las posiciones de ácido 3-hidroxialcanoico.
La estructura química de NB-RLP950A-F es:
Figure imgf000019_0002
donde cualesquiera dos cadenas acilo son C8 (p. ej., m = n2 = 3 y n3 = 5) mientras la cadena acilo remanente es C6 (es decir, n = 1). NB-RLP950A: n1 = 5, n2 = n3 = 3; NB-RLP950B: n2 = 5, n1 = n3 = 3; NB-RLP950C: n3 = 5, n1 = n2 = 3; NB-RLP950D: n1 = n2 = 5, n3 = 1; NB-RLP950E: n1 = n3 = 5, n2 = 1; NB-RLP950F: n2 = n3 = 5, n2 = 1.
La purificación por HPLC de fase inversa de NB-RLP 1048B también rindió NB-RLP1020. Los datos de RMN de 1H y 13C de NB-RLP1020 fueron casi idénticos a los de NB-RLP1048B. La fórmula molecular aparente de NB-RLP1020 es C51H92N2O 18 (HRESIMS m/z 1021,6415 [M H]+, calcd para C51H93N2O18, 1021,6418). Sobre la base de la espectrometría de masa en tándem, se determinó que NB-RLP1020 era una mezcla inseparable de tres análogos muy relacionados, NB-RLP1020A, NB-RLP1020B, y NB-RLP1020C, que comprenden una cadena acilo C8 en una de las posiciones del ácido 3-hidroxialcanoico.
La estructura química de NB-RLP1020A-C es:
Figure imgf000019_0003
donde cualquier cadena acilo única es C8 (es decir, m, n2 , o n3 = 3) mientras las cadenas acilo remanentes son C10 (es decir, n = 5). NB-RLP1020A: n1 = n2 = 5, n3 = 3; NB-RLP1020B: n1 = n3 = 5, n2 = 3; NB-RLP1020C: n1 = 3, n2 = n3 = 5.
El fraccionamiento por HPLC en fase inversa también rindió una mezcla inseparable de compuestos con una fórmula molecular aparente de C51H92N2O 18 (HRESIMS m/z 1021,6477 [M H]+, calcd para C51H93N2O18, 1021,6418). De manera similar a NB-RLP1020A-C, la estructura de estos compuestos es:
Figure imgf000020_0001
donde cualquier grupo R único es un grupo acetilo, mientras todos los demás grupos R son átomos de hidrógeno y donde cualquier cadena acilo única es C8 (es decir, m, n2 , o n3 = 3) mientras las cadenas acilo remanentes son C10 (es decir, n = 5).
El fraccionamiento por HPLC en fase inversa también rindió NB-RLP1076. Los datos de RMN de 1H y 13C fueron casi idénticos a los de NB-RLP1020A-C y NB-RLP1048B. La fórmula molecular aparente de NB-RLP1076 es C55H100N2O18 (HRESIMS m/z 1077,7046 [M H]+, calcd para C55H101N2O18, 1077,7044). Sobre la base de la espectrometría de masa en tándem, se determinó que NB-RLP1076 era una mezcla inseparable de tres análogos muy relacionados, NB-RLP1076A, NB-RLP1076B, y NB-RLP1076C, que comprenden una cadena acilo C12 en una de las posiciones del ácido 3-hidroxialcanoico.
La estructura química de NB-RLP1076 A-C es:
Figure imgf000020_0002
donde cualquier cadena acilo única es C12 (es decir, m, n2 , o n3 = 7) mientras las cadenas acilo remanentes son C10 (es decir, n = 5). NB-RLP1076A: n = n2 = 5, n3 = 7; NB-RLP1076B: n = n3 = 5, n2 = 7; NB-RLP1076C: n = 7, n2 = n3 = 5.
El fraccionamiento por HPLC en fase inversa también rindió una mezcla inseparable de compuestos con una fórmula molecular aparente de C55H100N2O18 (HRESIMS m/z 1077,7098 [M H]+, calcd para C55H101N2O18, 1077,7044). De manera similar a NB-RLP1076 A-C, la estructura de estos compuestos es:
Figure imgf000020_0003
donde cualquier grupo R único es un grupo acetilo, mientras todos los demás grupos R son átomos de hidrógeno y donde cualquier cadena acilo única es C12 (es decir, m, n2 , o n3 = 7) mientras las cadenas acilo remanentes son C10 (es decir, n = 5).
Usando porciones de la agrupación génica biosintética del biotensioactivo glicolipopeptídico de V. paradoxus RKNM-096 como en sondas in silico frente a genomas bacterianos publicados (descrito más adelante), identificamos Janthinobacterium agaricidamnosum DSM 9628 como un productor potencial de biotensioactivos glicolipopeptídicos similares a los aislados a partir de V. paradoxus RKNM-096. J. agaricidamnosum se cultivó y se extrajo como se ha descrito anteriormente para V. paradoxus RKNM-096 y el extracto orgánico resultante (110,4 mg) se sometió a cromatografía en fase inversa automatizada con una columna RediSep C18 usando un gradiente de H2O/CH3OH. Las fracciones que contenían el glicolipopéptido (77,6 mg) se combinaron y una porción de este material se sometió a separación adicional por HPLC en fase inversa, lo que rindió 17,1 mg de NB-RLP860 y 6,4 mg de NB-RLP832. El análisis de NB-RLP8 6 0 por HRESIMS (HRESIMS m/z 861,6033 [M H]+, calcd para C45H85N2O13, 861,6046) indicó una fórmula molecular aparente de C45H84N2O13 y cinco grados de insaturación. Los datos de RMN de 1H y 13C de NB-RLP860 fueron similares a NB-RLP1006, excepto que el espectro de RMN carecía de resonancias pertenecientes al segundo resto de a-ramnopiranosa.
La estructura química de NB-RLP860 se determinó por espectroscopia RMN 1D y 2D. La estructura de NB-RLP860 es:
Figure imgf000021_0001
El análisis de NB-RLP832 por HRESIMS (HRESIMS m/z 833,5734 [M H]+ calcd para C45H81N2O13, 833,5733) indicó una fórmula molecular aparente de C45H80N2O13. Los datos de r Mn de 1H y 13C fueron casi idénticos a los de NB-RLP860. Sobre la base de la espectrometría de masa en tándem, se determinó que NB-RLP832 era una mezcla inseparable de tres análogos muy relacionados, NB-RLP832A, NB-RLP832B, y NB-RLP832C, que comprenden una cadena acilo Cs en una de las posiciones del ácido 3-hidroxialcanoico.
La estructura química de NB-RLP832A-C es
Figure imgf000021_0002
donde cualquier cadena acilo única es C8 (es decir, m, n2 , o n3 = 3) mientras las cadenas acilo remanentes son C10 (es decir, n = 5). NB-RLP832A: n1 = n2 = 5, n3 = 3; NB-RLP832B: n1 = n3 = 5, n2 = n3; NB-RLP832C: n1 = 3, n2 = n3 = 5.
Los glicolipopéptidos NB-RLP860 y NB-RLP832A-C también se detectaron en pequeñas cantidades en extractos orgánicos de V. paradoxus RKNM-096 por análisis de LC-MS. El análisis de los cromatogramas de HRESIMS reveló iones [M H]+ de m/z 861,6073 y m/z 833,5749, que son consistentes con la m/z predicha de los iones [M H]+ para NB-RLP860 (calcd para C45H85N2O13, m/z 861,6046 [M H]+) y NB-RLP832A-C (calcd para C45H81N2O13, m/z 833,5733 [M H]+).
El análisis de extractos orgánicos de V. paradoxus RKNM-096 también reveló tres picos en el cromatograma HRESIMS que presentan iones [M H]+ de m/z 903,6213, lo que es consistente con los iones predichos [M H]+ para un análogo acetilado de NB-RLP860 {m/z 903,6152 [M H]+). Como estos compuestos se produjeron en pequeñas cantidades, los intentos de determinar inequívocamente sus estructuras por espectroscopia RMN fueron prohibitivos. Estos compuestos no se detectaron en extractos orgánicos de J. agaricidamnosum DSM 9628. Dados los iones fragmentos observados de m/z 715,5480 (b) y 598,4310 (bf), estos compuestos se identificaron como glicolipopéptidos acetilados NB-RLP902 con la estructura:
Figure imgf000021_0003
donde cualquier grupo R único es un grupo acetilo, mientras todos los demás grupos R son átomos de hidrógeno.
Las fracciones generadas por cromatografía en fase inversa automatizada de extractos orgánicos de V. paradoxus RKNM-096 se enriquecieron con NB-RLP902. También se detectó en los cromatogramas HRESIMS de estas fracciones un pequeño pico que presentó un ion [M H]+ de m/z 875,5888, que es consistente con un análogo de NB-RLP902 que carece de dos grupos metileno. Este ion [M H]+ no se observó en los extractos orgánicos de J. agaricidamnosum DSM 9628. El ion fragmento observado de 687,5164 (b) indica que este compuesto también es un glicolipopéptido. De manera similar a NB-RLP978A-C, NB-RLP1020A-C, y NB-RLP832A-C, se propone que este pico está comprendido por tres compuestos NB-RLP874A-C con la estructura:
Figure imgf000022_0001
donde cualquier grupo R único es un grupo acetilo, mientras todos los demás grupos R son átomos de hidrógeno y donde cualquier cadena acilo única es Cs (es decir, m, n2 , o n3 = 3) mientras las cadenas acilo remanentes son C10 (es decir, n = 5).
Ejemplo 4: Desacetilación de NB-RLP1048A y otros biotensioactivos glicolipopeptídicos acetilados producidos por Variovoraxparadoxus RKNM-096.
Se sabe que la cantidad relativa de NB-RLP1006 y glicolipopéptidos acetilados (p. ej., NB-RLP1048A) producida por V. paradoxus RKNM-096 puede variar entre lotes usando diferentes medios de cultivo y condiciones de fermentación. Como resultado, las propiedades de tensioactivo del producto de glicolipopéptido extraído también pueden variar. Como la consistencia del producto es importante para ser competitivo en la industria de los biotensioactivos, se desarrolló un método para retirar selectivamente el acetato de R5a, Rsb, R6a, R6b, Rza, Rzb, R10, y R11 para generar un producto de glicolipopéptido consistente comprendido por NB-RLP1006 con una pureza >95% en peso (Esquema 1). El método utiliza NaOH en un intervalo estrecho de concentración para retirar selectivamente los restos de acetato sin inducir una hidrólisis adicional de las uniones amida, éster, o glicosídicas del glicolipopéptido. La concentración de NaOH y el disolvente de la reacción tienen ambos un papel demostrado en el control del grado de hidrólisis y para conseguir selectividad. Las concentraciones óptimas de NaOH son directamente proporcionales a la concentración y composición de los glicolipopéptidos en el medio de reacción. Los disolventes de la reacción con una mayor composición de agua, tal como H2O:acetona (9:1), mostraron una mejor selectividad y minimizaron la hidrólisis de las uniones éster entre los restos de ácido p-hidroxialcanoico.
Figure imgf000022_0002
Esquema 1. Hidrólisis selectiva de restos acetato en una mezcla de biotensioactivos glicolipopeptídicos que contienen análogos acetilados de NB-RLP1006 (p. ej., NB-RLP1048A). Reactivos y condiciones: (a) glicolipopéptido (1,0 mg/mL), NaOH (1,5 mM), H2O:acetona (9:1), 25 °C, 40 h.
Se sabe que la desacetilación de la mezcla de glicolipopéptidos puede conseguirse con variaciones del método descrito en la presente memoria. Es posible que puedan utilizarse bases inorgánicas distintas de NaOH, incluyendo, pero no limitado a, LiOH, KOH, Na2CO3, NH3 , y NH4OH, o bases orgánicas, incluyendo, pero no limitado a, hidróxido de tetrabutilamonio o alquilaminas. La desacetilación selectiva también puede conseguirse enzimáticamente usando esterasas, incluyendo, pero no limitado a, acetilesterasas y lipasas.
Se sabe que la hidrólisis de la mezcla de glicolipopéptidos produce varios productos, incluyendo, pero no limitado a, los lipopéptidos NB-RLP356 (HRESIMS m/z 357,2745 [M H]+, calcd para C19H37N2O4 , 357,2748; m/z 379,2567 [M Na]+, calcd para C19H3sN2O4Na, 379,2565), NB-RLP374 (HRESIMS m/z 375,2851 [M H]+, calcd para C19H39N2O5 , 375,2854), y NB-RLP526 (HRESIMS m/z 527,4054 [M H]+, calcd para C29H55N2O6 , 527,4055), y los glicolípidos NB-RLP480 (HRESIMS m/z 481,2599 [M H]+, calcd para C22H41O11, 481,2643; m/z 503,2465 [m Na]+, calcd para C22H4oOiiNa, 503,2463) y NB-RLP650 (HRESIMS m/z 651,3962 [M H]+, calcd para C32H59O13, 651,3950). Dadas sus estructuras anfifílicas, también se espera que estos compuestos se comporten como agentes tensoactivos y puedan presentar propiedades de tensioactivo que pueden ser únicas o complementarias a los glicolipopéptidos. Se sabe que estos compuestos se forman durante el proceso de desacetilación descrito en la presente memoria y están así presentes en el producto final de glicolipopéptido. Aunque normalmente están presentes en pequeñas cantidades (< 5% en peso), estos compuestos pueden contribuir a las características de tensioactivo del producto de glicolipopéptido. La hidrólisis de los glicolipopéptidos también puede ocurrir espontáneamente, por ejemplo, durante la extracción y purificación, para generar estos compuestos. Por ejemplo, el lipopéptido NB-RLP374 se detecta en el extracto orgánico de V. paradoxus R NM-096 antes de que el material de glicolipopéptido se someta a cualquier modificación aguas abajo.
La estructura química de NB-RLP356 es:
Figure imgf000023_0001
La estructura química de NB-RLP374 es:
Figure imgf000023_0002
La estructura química de NB-RLP526 es:
Figure imgf000023_0003
La estructura química de NB-RLP480 es:
Figure imgf000023_0004
La estructura química de NB-RLP650 es:
Figure imgf000024_0001
Ejemplo 5: actividad en superficie.
Como se resume en la Tabla 1, las concentraciones micelares críticas (CMC) de NB-RLP1006, NB-RLP978, NB-RLP860, y NB-RLP1048B se determinaron por el método Du Nouy utilizando un microtensiómetro multicanal Kibron Delta- 8 (Kibron Inc., Helsinki, Finlandia). Todas las muestras se prepararon en agua desionizada desgasificada (Millipore, Etobicoke, ON, CA) a concentraciones que variaron de 0 a 2,0 mM. Todas las mediciones se registraron entre 24 y 25 °C y se realizaron en duplicado. La concentración micelar crítica tanto de NB-RLP1006 como de NB-RLP978 fue 0,20 mM (0,02% en peso). Las mediciones de tensión superficial indicaron que NB-RLP1006 y NB-RLP978 eran capaces de reducir la tensión superficial del agua de 72 a 35.5 mN/m a sus CMC. Mientras, NB-RLP860 y NB-RLP1048B presentaron valores de CMC de 0,85 mM (0,07 y 0,09% en peso, respectivamente), reduciendo la tensión superficial del agua hasta 36,2 y 36,9 mN/m, respectivamente. La actividad en superficie de NB-RLP1006 se comparó con los ramnolípidos A y B, que se purificaron a partir de una mezcla de ramnolípidos disponible comercialmente (R90; AGAe Technologies, Corvallis, OR, EE. UU.) por HPLC en fase inversa. Los ramnolípidos A y B presentaron ambos una CMC de 0,06 mM (0,003 y 0,004% en peso, respectivamente) en la que la tensión superficial del agua se redujo hasta 28,2 y 39,0 mN/m, respectivamente. Los valores de CMC más altos para NB-RLP860 y NB-RLP1048B pueden deberse a su baja solubilidad acuosa.
Table 1. Propiedades de tensioactivo de glicolipopéptidos aislados en comparación con ramnolípidos. Se muestran la concentración micelar crítica (CMC) y la reducción de la tensión superficial del agua.
Tensión Superficial Mínima
Compuesto CMC
(mM) (mN/m)
NB-RLP1006 0 , 2 0 35,5
NB-RLP1048B 0,85 36,9
NB-RLP860 0,85 36,2
NB-RLP978 0 , 2 0 35,5
Ramnolípido A 0,06 28,2
Ramnolípido B
Figure imgf000024_0002
0,06 39,0
La curvatura característica (Cc) de NB-RLP1006 se determinó usando el modelo de la diferencia hidrófila-lipófilacurvatura neta promedio (HLD-NAC) para calcular el desplazamiento en el potencial químico cuando NB-RLP1006 se transfiere desde la fase de aceite a la acuosa como una función de la salinidad por la siguiente ecuación general:
Figure imgf000024_0003
donde F(S) es una función de la salinidad, k es un coeficiente igual a 0,17, EACN (número de carbonos alcano efectivo) es el número de carbonos en la fase de aceite de alcano, a es un coeficiente dependiente del tipo de tensioactivo (iónico, etoxilatos, etc), y AT es el efecto de la temperatura. Se prepararon cuatro mezclas de NB-RLP1006 y dihexil sulfosuccinato de sodio (SDHS) con una concentración total de tensioactivo de 1,8 mg/mL usando las siguientes relaciones NB-RLP1006/SDHS: 0, 12, 24, y 40% en peso de NB-RLP1006. Se realizó un barrido de electrolitos para cada mezcla variando la concentración de NaCl del 0 al 6,0% (p/v). Cada mezcla se añadió a un volumen igual de tolueno, que constituyó la fase de aceite, y se agitó vigorosamente. La salinidad óptima (S*) se identificó como la concentración de NaCl en la cual se formó una microemulsión de Winsor Tipo III, en donde la fase media separada estaba compuesta por un volumen igual de aceite y agua. Se generó un gráfico de las relaciones molares NB-RLP1006/SDHS frente a S* y se calculó Cc a partir de la línea con mejor ajuste. Se determinó que el valor de Cc para NB-RLP1006 era 5,2, un valor que refleja la naturaleza hidrófoba de este biotensioactivo.
Las propiedades emulsionantes de NB-RLP1006 se determinaron usando el índice de emulsificación como se ha descrito anteriormente. El NB-RLP1006 puro presentó una actividad de emulsificación fuerte con un valor de E24 del 53% a 1 mg/mL en agua desionizada. La emulsificación de NB-RLP1006 depende del pH con valores de E24 del 8, 38, y 31% a pH 3, 6, y 8, respectivamente. El tipo de emulsión formada por NB-RLP1006 (p. ej., aceite en agua o agua en aceite) se determinó usando el ensayo de la dilución de gota. Se formó una emulsión mezclando vigorosamente una disolución de 1 mg/mL de RLP1006 en agua desionizada con un volumen igual de queroseno durante 1 min. Una porción (20 pL) de la emulsión se transfirió a 0,5 mL de agua desionizada y 0,5 mL de queroseno y se monitorizó la dilución de la emulsión en cada líquido. La emulsión formada por NB-RLP1006 se dispersó fácilmente en la fase acuosa, indicando que la fase continua de la emulsión era agua y que se formó una emulsión de aceite en agua (o/w) por NB-RLP1006 en estas condiciones.
Estos resultados establecieron que NB-RLP1006 es un biotensioactivo potente capaz de disminuir la tensión superficial del agua hasta 35,5 mN/m con una CMC comparable con la de otros biotensioactivos bien caracterizados, los ramnolípidos A y B. NB-RLP1006 también presenta una actividad de emulsificación fuerte formando emulsiones de o/w en las condiciones descritas en la presente memoria.
Ejemplo 6: ensayo de citotoxicidad de los glicolipopéptidos.
Para evaluar el perfil de seguridad de los glicolipopéptidos, se realizaron ensayos de citotoxicidad frente a dos líneas celulares humanas normales, células de fibroblastos BJ ATCC CRL-2522 y queratinocitos epidérmicos de adulto (HEKa; Life Technologies, Carlsbad, CA, EE. UU.). Los fibroblastos BJ se crecieron y se mantuvieron en 15 mL de medio esencial mínimo de Eagle suplementado con suero fetal bovino (10% v/v), penicilina (100 pU) y estreptomicina (100 pg/mL). Las células HEKa se crecieron y se mantuvieron en 15 mL de medio EPI life (Life Technologies, Carlsbad, CA, EE. UU.) suplementado con suplemento de crecimiento HKGS (10% v/v; Life Technologies, Carlsbad, CA, EE. UU.) y 50 pg/mL de gentamicina (Sigma-Aldrich, St. Louis, MO, EE. UU.). Las células se cultivaron en matraces de cultivo celular T75cm2 y se incubaron a 37 °C en una atmósfera humidificada de CO2 al 5%. Para los fibroblastos BJ, el medio de cultivo se repuso cada dos a tres días y no se dejó que las células superaran el 80% de confluencia. Para las células HEKa, el medio de crecimiento se repuso cada 2 d hasta que las células alcanzaron el 50% de confluencia y después el medio se repuso cada 24 h hasta que se obtuvo el 80% de confluencia. Al 80% de confluencia, las células se contaron, se diluyeron hasta 10.000 células/pocillo en medio de crecimiento sin antibióticos y se transfirieron 90 pL de suspensión celular a los pocillos de placas de cultivo celular tratadas de 96 pocillos. Las placas se incubaron como antes para permitir que las células se adhirieran a las placas durante 24 h antes del tratamiento. Se usó DMSO como el vehículo a una concentración final del 1%. Todos los compuestos ensayados se volvieron a solubilizar en DMSO y se preparó una serie de dilución para cada línea celular usando el medio de crecimiento de cultivo celular respectivo, de las cuales se añadieron 10 pL a los pocillos de ensayo rindiendo ocho concentraciones finales que variaron de 512 pg/mL a 8 pg/mL por pocillo (volumen final del pocillo de 100 pL). Los fibroblastos y las células HEKa se incubaron como se ha descrito previamente durante 24 h. Todas las muestras se ensayaron en triplicado. Cada placa contenía cuatro blancos de medio sin inocular (medio DMSO al 1%), cuatro controles de crecimiento no tratados (medio DMSO al 1% células), y una columna que contenía un control positivo de piritiona de cinc diluido de forma seriada. Se añadió AlamarBlue (Life Technologies, Carlsbad, CA, EE. UU.) a cada pocillo 24 h después del tratamiento (10% v/v). Se monitorizó la fluorescencia (560/12 excitación, 590 nm emisión) usando un lector de placas Varioskan Flash Multimode tanto al tiempo cero como 4 h después de la adición de alamarBlue. Después de restar la fluorescencia a tiempo cero de las lecturas a 4 h, se calculó el porcentaje de viabilidad celular respecto a los pocillos de control de vehículo. Se mostró una baja actividad citotóxica frente a las líneas celulares HEKa y fibroblastos BJ. Los valores observados de CI50 y MIC90 para los glicolipopéptidos fueron significativamente mayores que el control positivo piritiona de cinc, que sirvió como una referencia de la industria para agentes antimicrobianos tópicos (Tabla 2). Estos resultados indican que los glicolipopéptidos presentan una baja citotoxicidad frente a las células cutáneas humanas y pueden ser así seguros para su uso en aplicaciones que implican el contacto dérmico, tal como productos cosméticos.
Tabla 2. Resultados de los ensayos de citotoxicidad para los glicolipopéptidos. Los valores indican las concentraciones inhibidoras mitad de la máxima (CI50) y la concentración inhibidora mínima que da lugar al 90% de inhibición del crecimiento (MIC90) en pg/mL. El error se reporta como desviación estándar.
Células Eucariotas
Figure imgf000025_0001
NB-RLP1006 15,5 ± 1,7 64 - 128 19,5 ± 2,4 32
NB-RLP1048B 19,3 ± 4,0 64 - 128 18,7 ± 1,6 32
NB-RLP860 15,5 ± 1,6 128 16,3 ± 0,3 32
Piritiona de cinc 0,20 ± 0,001 1 2,2 ± 0,3 4
Ejemplo 7: Secuenciación de las agrupaciones génicas biosintéticas del glicolipopéptido y de ramnosa de V. paradoxus RKNM-096.
Para establecer la base genética para la biosíntesis de los nuevos biotensioactivos glicolipopeptídicos descritos aquí, se secuenció el genoma de V. paradoxus RKNM-096. V. paradoxus RKNM-096 se cultivó en caldo ISP2 y se aisló el ADN genómico usando el Kit de Aislamiento de ADN Microbiano UltraClean® según las recomendaciones del fabricante (Mo Bio, Carlsbad, CA, EE. UU.). El genoma se secuenció en McGill University y Genome Quebec Innovation Centre (Montreal, QC, CA) usando 2 células SMRT en un secuenciador PacBio RSII (Pacific Biosciences, Menlo Park, CA, EE. UU.). Se generaron un total de 140.476 sublecturas brutas con una longitud promedio de 11.269 pb y el ensamblaje del genoma se consiguió usando un proceso de trabajo HGAP (Chin et al. [2013] Nature Methods 10, 563). Brevemente, las sublecturas brutas se generaron a partir de archivos de datos raw .bas.h5 PacBio. Se extrajo un valor de corte de la longitud de la sublectura (30X) de las sublecturas y se usó en la etapa de preensamblaje (BLASR), que consiste en el alineamiento de sublecturas cortas en sublecturas largas (Chaisson y Tesler [2012] BMC Bioinformatics 13, 238). Como los errores en las lecturas de PacBio son aleatorios, el alineamiento de lecturas cortas múltiples en lecturas más largas permite la corrección de los errores de secuenciación en lecturas largas. Estas lecturas largas corregidas se usaron entonces como semillas en un ensamblaje posterior preparado usando el ensamblador Celera (Myers et al. [2000] Science 287, 2196), que genera cóntigos. Estos cóntigos se "pulieron" entonces alineando lecturas brutas en cóntigos (BLASR) que se procesaron entonces a través de un algoritmo de llamada de variantes (Quiver) que genera secuencias consenso de alta calidad usando realineamientos locales y puntuaciones de calidad PacBio (Chin et al. [2013] Nature Methods 10, 563). Se obtuvieron más de 161.717,463 pb de sublecturas largas corregidas y dio lugar al ensamblaje de dos cóntigos. Un cóntigo contenía 7.193.071 pb mientras el otro contenía 1.767 pb. El genoma se anotó usando el servidor RAST (Aziz et al. [2008] BMC Genomics 9, 75; Overbeek et al. [2014] Nucleic Acid Res. 42, D206; Brettin et al. [2015] Sci Rep. 5, 8265). La función de marcos de lectura abiertos (ORF) identificada por la anotación RAST se exploraron adicionalmente por BLASTP (Altscul et al. [1997] Nucleic Acids Res. 25, 3389) y el análisis del dominio conservado (Marchler-Bauer y Bryant [2004] Nucleic Acids Res. 32, W327) de secuencias de aminoácidos deducidas.
Sobre la base de la estructura de NB-RLP1006 se estableció la hipótesis de que su biosíntesis requeriría una NRPS para sintetizar el dipéptido, una o más aciltransferasas para acilar el péptido y generar el resto 3-(3-(3-hidroxidecanoiloxi) decanoiloxi) decanoilo y una o más glicosiltransferasas. El escaneo del genoma para genes que codifican NRPS identificó dos loci. Un locus contenía un único gen que codificaba NRPS seguido de dos glicosiltransferasas, así este locus (12.721 pb) se analizó adicionalmente. Se identificaron seis ORF en este locus, que se predijo que jugaban un papel integral en la biosíntesis de glicolipopéptido (Tabla 3). Los seis genes, designados rlpA a rlpE, están orientados en la misma dirección y forman una región contigua en el genoma de V. paradoxus RKNM-096.
Tabla 3. Funciones deducidas de los Orf identificados en las agrupaciones génicas biosintéticas de glicolipopéptido (Seq. ID:1) y dTDP-L-ramnosa (Seq. ID:2) de V. paradoxus RKNM-096.
Seq. ID. Fuente Nombre Inicio Parada Seq. ID. Tamaño Función Propuesta (ADN) (Proteína) (aa)
3 Seq. rlpA 121 1.035 4 304 Regulador transcripcional ID:1 LysR
5 Seq. rlpB 1.437 8.912 6 2.491 Péptido sintetasa no ID:1 ribosomal
7 Seq. rlpC 8.924 10.243 8 439 dTDP-ramnosil transferasa ID:1
9 Seq. rlpD 10.276 10.488 10 70 Proteína MbtH
ID:1
11 Seq. rlpE 10.497 11.465 12 322 dTDP-ramnosil transferasa ID:1
13 Seq. rlpF 11.462 12.721 14 419 T ransportador M FS
ID:1
15 Seq. rmlB 299 1.378 16 359 dTDP-glucosa 4,6-ID:2 deshidratasa
17 Seq. rmlD 1.375 2.265 18 296 dTDP-4-deshidroramnosa ID:2 reductasa
Seq. ID. Fuente Nombre Inicio Parada Seq. ID. Tamaño Función Propuesta (ADN) (Proteína) (aa)
19 Seq. rmlA 2.298 3.194 20 298 Glucosa-1-fosfato
ID:2 timidililtransferasa
21 Seq. rmlC 3.191 3.736 22 181 dTDP-4-deshidroramnosa ID:2 3,5-epimerasa
Genes implicados en la regulación. El primer gen, rlpA, codifica una proteína que presenta similitud con reguladores transcripcionales que pertenecen a la familia LysR. El análisis de dominios conservados indicó que RlpA contenía un dominio de hélice-giro-hélice amino terminal y un dominio de unión a sustrato LysR carboxi terminal, lo que es consistente con la arquitectura de dominios de los reguladores transcripcionales LysR. Esta familia de reguladores puede funcionar como activadores o represores transcripcionales (Maddocks y Oyston [2009] Microbiology 154, 3609), por lo tanto, es probable que RlpA juegue un papel en la regulación de la biosíntesis de glicolipopéptidos.
Genes implicados en la biosíntesis de péptidos. Después de rlpA hay un gen grande, rlpB, (7.476 pb), que codifica una NRPS. El análisis de dominios (Bachmann y Ravel [2009] Meth. Enzymol. 458, 181) indicó que la NRPS consiste en dos módulos (M1 y M2) con la siguiente organización de dominios (C-A-PCP)m1-(C-A-PCP-R)m2. La estructura dimodular y la organización de dominios sugiere que RlpB genera un dipéptido, lo que es consistente con la estructura de los glicolipopéptidos de V. paradoxus RKNM-096. El primer dominio del primer módulo de RlpB es un dominio de condensación. La presencia de un dominio C al comienzo de un módulo de inicio de NRPS es característica de los péptidos acilados. Los dominios C amino terminales pueden catalizar la formación de enlaces amida entre el primer aminoácido de un péptido y un ácido graso. El ácido graso puede ser presentado al dominio C como un intermedio acil-ACP, como en el caso de la biosíntesis de CDA (Kopp et al. [2008] J. Am. Chem. Soc. 130, 2656), o un intermedio acil-CoA, como en el caso de la biosíntesis de surfactina (Krass et al. [2010] Chem. Biol. 17, 872). Se realizó un análisis filogenético del dominio C del módulo de inicio de RlpB (residuos 12-437) usando el programa NaPDoS (Ziemert et al.
[2012] PLoS One 7, e34064). El dominio RlpB se agrupa cerca de los dominios C de los módulos de inicio que catalizan la condensación de un precursor de ácido graso con un aminoácido. El dominio C más relacionado en la base de datos de referencia NaPDoS fue el módulo de inicio de la NRPS de bacilibactina (38% de identidad), que cataliza la condensación de 2,3-dihidroxibenzoil-ACP con glicina (May et al. [2001] J. Biol. Chem. 278, 7209). Esto sugiere que la biosíntesis de glicolipopéptidos empieza con la condensación de un ácido graso con el primer aminoácido del péptido (serina). Análisis similares del segundo dominio C indicaron que estaba relacionado muy de cerca con el segundo dominio C de la NRPS dimodular de bacilibactina, DhbF (54% de identidad). El análisis filogenético reveló que el dominio C de M2 de RlpB se agrupaba con los dominios C que catalizan la condensación de dos L-aminoácidos (Ziemert et al. [2012] PLoS One 7, e34064), lo que es consistente con la estructura del glicolipopéptido.
Para predecir la especificidad de sustrato de los dominios A de RlpB, se extrajeron códigos de especificidad de sustrato de los sitios activos del dominio A (8 residuos entre los restos A3 y A6) y se compararon con códigos de especificidad de dominios A conocidos usando la herramienta NRPS Predictive Blast (Bachmann y Ravel [2009] Meth. Enzymol.
458, 181). El código de especificidad del dominio A de M1 fue el más similar a los dominios A de las NRPS de nostopeptólido, pioverdina, CDA y enterobactina que activan L-serina (75-87% de identidad, 87-100% de similitud, valor E 0,023-0,039), lo que sugiere que la L-serina se incorpora por M1. Esta observación es consistente con la estructura de los glicolipopéptidos. El código de especificidad del dominio A de M2 mostró una baja homología (50% de identidad, 100% de similitud, valor E 0,98) con un dominio A de NRPS de tirocidina (TycB), que activa L-fenilalanina o L-triptófano (Mootz y Marahiel [1997] J Bacteriol. 179, 6843). Este bajo nivel de similitud impide la predicción de la especificidad de sustrato de este dominio A. Sobre la base de la estructura de los glicolipopéptidos de V. paradoxus RKNM-096, se esperaría que el segundo dominio A activara L-leucina. La comparación del código de especificidad del dominio A del módulo 2 de RlpB con los códigos de especificidad de leucina (Stachelhaus et al. [1999] Chem. Biol. 6, 493) también reveló una baja similitud, así el código de especificidad del dominio A de M2 de RlpB puede representar una nueva variante para leucina, aunque es necesaria una evidencia bioquímica para establecer la especificidad de sustrato de este dominio. También se analizaron los dominios PCP de RlpB y se encontró que ambos contenían el resto del dominio PCP central con una serina invariable que representa el sitio de unión de 4'-fosfopanteteína (Konz y Marahiel [1999] Chem. Biol.6, R39).
El dominio final de RlpB es un dominio R. Los dominios R utilizan NAD(P)H como un cofactor para liberar reductivamente los productos finales unidos a PCP como un aldehído o alcohol (Du y Lou [2010] Nat. Prod. Rep. 27, 255). La presencia de un residuo de leucinol en el extremo carboxi del resto dipéptido del glicolipopéptido es consistente con la liberación de un intermedio dipéptido acilado por un dominio R. Colectivamente, la estructura y organización de los dominios de RlpB, así como la especificidad de sustrato predicha de los dominios individuales, son consistentes con la estructura de los glicolipopéptidos producidos por V. paradoxus RKNM-096.
Se encontró un gene pequeño (rlpD), en 3' de rlpB, que codifica una proteína de 70 aminoácidos que muestra similitud con proteínas semejantes a MbtH. Estas proteínas se encuentran frecuentemente en asociación con NRPS y se ha demostrado que son esenciales para la producción de péptidos no ribosomal. (Baltz [2014] J. Ind. Microbio!. Biotechnol.
41, 357). Recientemente, se ha mostrado que estas proteínas facilitan las reacciones de adenilación a través de la interacción directa con los dominios A (Herbst et al. [2013] J. Biol. Chem. 288, 1991). Así, predecimos que RlpD interacciona con uno o ambos dominios A de RlpB para facilitar la formación de dipéptidos.
Genes implicados en la glicosilación. La glicosilación del dipéptido acilado generado por RlpB está catalizada probablemente por dos ORF (rlpC y E) en 3' rlpB. La secuencia de aminoácidos deducida de rlpC (439 aa) muestra similitud con la familia GT1 de glicosiltransferasas, que utilizan azúcares activados como sustratos para transferir restos de azúcar a un conjunto diverso de moléculas aceptoras (Breton et al. [2006] Glycobiology 16, 29R). La secuencia de aminoácidos deducida de rlpE (322 aa) muestra similitud con dTDP-ramnosiltransferasas. En la biosíntesis de ramnolípidos se utilizan dos glicosiltransferasas para transferir secuencialmente dos unidades de ramnosilo al componente lipídico del ramnolípido (Deziel et al. [2003] Microbiology 149, 2005). RhlB transfiere ramnosa de dTDP-L-ramnosa al grupo (3-hidroxilo libre del ácido 3-(3'-hidroxidecanoiloxi)decanoico (HDD) para generar mono-RL, mientras di-RL se forma por la transferencia de una ramnosa adicional de dTDP-L-ramnosa a mono-RL por RhlC (Abdel-Mawgoud et al. [2011 ] en Biosurfactants, Springer- Verlag, Berlín Heidelberg). La relación entre RlpC y RlpE y los homólogos RhlB y RhlC de P. aeruginosa PAO1, B. thialandensis E264 y B. psuedomallei 1710B se investigó a través de la generación de un árbol filogenético (método de agrupamiento pareado no ponderado con método de la media aritmética). En este análisis, RlpC se agrupó con los ortólogos de RhlB, mientras RlpE se agrupó con los ortólogos de RhlC. Aunque RlpC se agrupó con los ortólogos de RhlB, no se agrupó fuertemente ya que mostró una identidad de secuencia limitada con estas enzimas (18,6-23,1%). Por el contrario, RlpE compartió entre el 39,6-40,7% de identidad con los ortólogos de RhlC. Estos datos sugieren que RlpC y RlpE realizan funciones similares a RhlB y RhlC, respectivamente. Establecimos la hipótesis de que RlpC cataliza la ramnosilación de un intermedio dipéptido acilado utilizando dTDP-L-ramnosa como el donante de carbohidrato. La limitada homología de secuencia entre RlpC y los ortólogos de RhlB puede reflejar la diferencia significativa en los sustratos de glicosilación utilizados por las enzimas. Se predice que RlpE cataliza la segunda reacción de glicosilación, transfiriendo ramnosa de dTDP-L-ramnosa al producto de la reacción de RlpC.
No se encontraron genes que codifican la biosíntesis de dTDP-L-ramnosa muy cerca de la agrupación génica del glicolipopéptido. El escaneo del genoma para homólogos de genes biosintéticos de ramnosa en P. aeruginosa PAO1 (rmlBDAC) identificó cuatro genes que presentaban una fuerte similitud de secuencia con los de P. aeruginosa (identidad/similitud: RmlB - 79%/89%, RmlD - 60%/71%, RmlA - 78%/89%, RmlC - 66%/80%). En el genoma de V. paradoxus RKNM-096 los cuatro genes están agrupados y se encuentran en el mismo orden que en P. aeruginosa (rmlBDAC) (Rahim et al. [2000] Microbiology 146, 2803). Este locus proporciona probablemente los sustratos dTDP-L-ramnosa utilizados por RlpC y RlpE. La modulación de la expresión de uno o más componentes de la ruta biosintética de la dTDP-L-ramnosa por un experto en la técnica puede ser una estrategia efectiva para incrementar los rendimientos de glicolipopéptido.
Genes implicados en el transporte. Directamente en 3' de rlpE hay un ORF (rlpF) que codifica una proteína, que es similar a los transportadores de la familia de facilitador mayor de una variedad de bacterias. RlpF presenta un 38% de identidad y 54% de similitud con PA1131 de P. aeruginosa PAO1, que está inmediatamente en 5' de rhlC (Dubeau [2009] BMC Microbiol 9, 263). RlpF está implicado probablemente en el eflujo de glicolipopéptido.
Genes implicados en la biosíntesis del resto lipídico. En la biosíntesis de ramnolípidos, el resto HDD se produce por RhlA, que condensa dos moléculas de p-hidroxidecanoil-ACP de la biosíntesis de ácidos grasos para rendir ácido 3-(3'-hidroxidecanoiloxi)decanoico. El escaneo del genoma de V. paradoxus RKNM-096 para homólogos de RhlA no identificó ninguna proteína con una similitud significativa con RhlA. Así, la generación del resto lipídico de los glicolipopéptidos de RKNM-096 está dirigida probablemente por un nuevo mecanismo, todavía no identificado.
Genes implicados en la acetilación de glicolipopéptido. Los análogos acetilados de NB-RLP1006 son abundantes en los caldos de fermentación de V. paradoxus RKNM-096. No se identificaron genes que codifican acetiltransferasas en la agrupación génica. Así, es probable que la acetilación esté catalizada por una enzima codificada en otro lugar del genoma de V. paradoxus RKNM-096.
Biosíntesis propuesta. La biosíntesis de glicolipopéptido empieza presumiblemente con la formación del resto 3-(3-(3-hidroxidecanoiloxi)decanoiloxi)decanoilo a través de un mecanismo todavía no identificado. Después de la formación del resto lipídico, este se presenta probablemente al dominio C de M1 de RlpB que condensa el resto lipídico con L-serina. El M2 de RlpB incorpora entonces L-leucina para formar un intermedio dipéptido acilado unido a PCP que se libera de la enzima por el dominio R C-terminal de RlpB, dando lugar a la formación de un residuo de L-leucinol terminal. La dTDP-L-ramnosa, producida por el operón rmlBDAC, se utiliza entonces por las ramnosiltransferasas RlpC y RlpE para glicosilar secuencialmente la aglicona dando lugar a la producción del glicolipopéptido glicosilado final NB-RLP1006. NB-RLP1006 serviría como un sustrato para la acetilación para formar NB-RLP1048A y NB-RLP1048B.
Para demostrar la implicación de la agrupación génica rlpA-rplFen la biosíntesis de glicolipopéptidos en V. paradoxus RKNM-096, se expresó rlpE en E. coli y la actividad de la enzima se demostró usando NB-RPL860 como un sustrato. El análisis por bioinformática indicó que RlpE cataliza la segunda ramnosilación en la biosíntesis de glicolipopéptidos, convirtiendo los glicolipopéptidos mono-ramnosilados (p. ej., NB-RLP832 y NB-RLP860) en glicolipopéptidos diramnosilados (p. ej., NB-RLP978 y NB-RLP1006). El gen rlpE se clonó en pET28a (EMD Millipore, Darmstadt, AL) con una etiqueta de hexa-histidina amino terminal usando técnicas de clonación estándar y la clonación sin mutación se verificó por secuenciación. Debido al alto contenido en GC de rlpE, se eligió E. coli Rossetta DE3 pLysS (EMD Millipore) como el huésped de expresión ya que esta cepa expresa ARNt para codones raros ricos en GC (AGG, CCA, GGA). Se usó una única colonia para inocular 50 mL de LB Miller (EMD Millipore) suplementado con 50 pg/mL de kanamicina (Sigma- Aldrich) y 34 pg/mL de cloranfenicol (Sigma-Aldrich) y el matraz se incubó a 37 °C con agitación a 250 rpm toda la noche. Los cultivos de expresión (50 mL) se realizaron en LB Miller suplementado con kanamicina y cloranfenicol. Estos cultivos se inocularon con 0,5 mL del cultivo de toda la noche y se cultivaron a 37 °C y 250 rpm hasta que la densidad óptica (600 nm) alcanzó 0,5, después de lo cual se añadió IPTG a una concentración final de 1,0 mM para inducir la expresión de proteínas y los cultivos se incubaron a 15 °C durante 24 h. Las células se recogieron por centrifugación (6.000 x g durante 5 min) y se lavaron una vez con Tris-HCl 20 mM (pH 8,0). El sedimento celular se congeló a -80 °C hasta que pudo realizarse la purificación. Para purificar RlpE etiquetado con His, las células se descongelaron, se suspendieron en tampón de lisis (NaCl 500 mM, glicerol al 5%, Triton X-100 al 1%, Tris-HCl 25 mM, pH 8,0) y después se lisaron mediante sonicación. Los restos celulares y la proteína insoluble se eliminaron por centrifugación a 15.000 x g durante 30 min. El sobrenadante se mezcló con 0,5 mL de resina HisPur Ni-NTA (Thermo Fisher Scientific). La resina se lavó seis veces con 1,0 mL de imidazol 75 mM. El RlpE etiquetado con His se eluyó con 1,0 mL de imidazol 250 mM. Se realizaron y combinaron cuatro lotes de elución. El tampón de elución de imidazol se intercambió con tampón de enzima (Tris-HCl 25 mM, glicerol al 10%) y se concentró por filtración centrífuga usando un filtro rotativo Macrosep 3 kDa (Pall). Después de la concentración, la enzima se repartió en partes alícuotas y se almacenó a -80 °C. La pureza de la enzima se analizó por electroforesis en gel de poliacrilamida desnaturalizante (gel al 4-15% Mini-PROTEAN preparado comercialmente, 160 V, 30 min; Bio-Rad). El peso molecular calculado de RlpE etiquetado con His fue 38,2 KDa. El peso molecular aparente de la proteína purificada fue 33,05 kDa, lo que está muy de acuerdo con el peso molecular esperado (Fig. 2A).
La actividad de RlpE se estableció incubando la enzima (0,1 pM) en tampón de reacción (Tris-HCl 25 mM pH 8,0, MgCl22,5 mM) con 1 mM de TDP-L-ramnosa y NB-RLP860 0,5 mM. Las reacciones (200 pL) se incubaron a 30 °C durante
4 h. Una porción (25 pL) de la reacción se retiró a los 15 s, 1 min, 5 min, 20 min, 1 h y 4 h. La reacción se paró por la adición de dos volúmenes de metanol, seguido de congelación ultra rápida. Las reacciones paradas se separaron por UPLC (Accela™, Thermo Fisher Scientific Mississauga, ON, Canadá) y los eluatos se analizaron por HRESIMS (LTQ Orbitrap Velos; Thermo Fisher Scientific) (modo positivo, monitorización m/z 200-2.000). La separación cromatográfica se consiguió con una columna Hypersil Gold 1,9 pm C18 175 Á 50 x 2,1 mm (thermo Fisher Scientific) y un gradiente lineal de H2O al 50%/FA al 0,1% (disolvente A) y acetonitrilo al 50% (CH3CN)/FA al 0,1% (disolvente B) a disolvente B al 100% durante 5 min, seguido de mantener el disolvente B al 100% durante 3 min con una tasa de flujo de 300 pL/min. Las reacciones realizadas con enzima hervida no mostraron conversión de NB-RLP860 a NB-RLP1006. Por el contrario, las reacciones enzimáticas que contenían 6xHis-RlpE intacta dieron lugar a la conversión completa de NB-RLP860 a NB-RLP1006 después de 4 h (Fig. 2B). Estos datos indican que RlpE cataliza la segunda etapa de ramnosilación en la biosíntesis de glicolipopéptido en V. paradoxus RKN-096. Como los genes para la biosíntesis de productos naturales en bacterias están típicamente agrupados, este descubrimiento también proporciona una evidencia fuerte que confirma la agrupación génica propuesta como el locus responsable para la biosíntesis de glicolipopéptidos.
También exploramos la capacidad de 6His-RlpE purificado de añadir iterativamente unidades de ramnosa a NB-RLP860 mediante el escaneo de los datos de HRMS para masas consistentes con los tensioactivos glicolipopeptídicos que contienen tres residuos de ramnosa (calc'd [M+H]+ 1153,7204), cuatro residuos de ramnosa (calc'd [M+H]+ 1299,7783) y cinco residuos de ramnosa (calc'd [M+H]+ 1153,7204). Se obtuvieron masas consistentes con productos de reacción triramnosilados y tetraramnosilados y difirieron de los pesos moleculares esperados en <1,03 partes por millón (ppm) y < 0,6 ppm, respectivamente. De forma interesante, se observaron dos picos para cada masa, lo que sugiere que unidades de ramnosa adicionales están unidas en dos posiciones diferentes de la estructura de NB-RLP1006. Respecto a la producción de NB-RLP1006, los glicolipopéptidos tri-ramnosilados y tetra-ramnosilados constituyeron el 2,99% y 0,14% de los productos de la reacción. No se detectaron glicolipopéptidos pentaramnosilados. Estos datos indican que puede usarse RlpE expresado recombinantemente para generar análogos de glicolipopéptidos con hasta cuatro residuos de ramnosa. Dichas modificaciones pueden alterar las propiedades funcionales del glicolipopéptido. Las propiedades pueden incluir, pero no se limitan a, humectación, espumación, capacidad tensioactiva y emulsificación.
La elucidación de la ruta biosintética para los biotensioactivos glicolipopeptídicos producidos por V. paradoxus RKNM-096 establece el estadio para la modificación racional de la ruta biosintética para generar nuevos análogos o para incrementar los rendimientos. Los análogos pueden generarse por los expertos en la técnica a través de la modificación de las enzimas responsables de la biosíntesis e incorporación de las porciones de lípido, péptido y carbohidrato de la molécula. Los rendimientos pueden incrementarse por los expertos en la técnica mediante la modificación de genes reguladores y/o promotores, mediante la sobreexpresión de enzimas que representan etapas limitantes en la ruta biosintética o mediante la inactivación de enzimas que llevan a cabo reacciones no deseables. El conocimiento de la ruta biosintética también permite la expresión en un huésped heterólogo, lo que puede permitir mejoras en el rendimiento o la generación de análogos de glicolipopéptido.
Ejemplo 8: identificación de biotensioactivos relacionados en otras bacterias.
Se realizó la secuenciación de las agrupaciones génicas biosintéticas de glicolipopéptido y ramnosa de V. paradoxus RKNM-096. Antes del descubrimiento de la serie de glicolipopéptidos de biotensioactivos y la agrupación génica biosintética asociada descrita en la presente memoria, no habría sido posible predecir de manera exacta la producción de biotensioactivos glicolipopeptídicos relacionados sobre la base únicamente del análisis de la secuencia de ADN. La identificación de la agrupación génica biosintética de glicolipopéptidos permite ahora la interrogación dirigida de genomas microbianos para agrupaciones génicas relacionadas, lo que puede tener el potencial de producir nuevos biotensioactivos glicolipopeptídicos. Como rlpC codifica una nueva ramnosiltransferasa, que glicosila un intermedio dipéptido acilado característico de la clase de glicolipopéptidos de biotensioactivos, usamos la secuencia de aminoácidos deducida de este gen para buscar genomas bacterianos disponibles para homólogos. Esta búsqueda identificó homólogos que presentan RlpC a partir de una amplia variedad de bacterias. Investigamos entonces regiones genómicas que flanquean los genes que codifican los homólogos de RlpC para la presencia de homólogos de los otros genes biosintéticos de glicolipopéptidos. Se presentarán dos ejemplos para demostrar la utilidad de usar secuencias de la agrupación génica del glicolipopéptido como sondas para descubrir productores de nuevos biotensioactivos potenciales.
Se identificó una agrupación génica homóloga en el genoma de Janthinobacterium agaricidamnosum DSM 9628 (no. de acceso GenBank NZJHG322949.1) (Fig. 3). J. agaricidamnosum es una beta-proteobacteria como V. paradoxus, pero pertenece a una familia diferente. El homólogo de RlpC en esta cepa (WP_038493268.1) presentó un 68% de identidad con RlpC. El escaneo del genoma alrededor del homólogo de RlpC identificó otros homólogos de genes presentes en la agrupación génica del glicolipopéptido. Directamente en 3' del homólogo de RlpC había una proteína semejante a MtbH (Wp_038493269.1) que compartía el 69% de identidad con RlpD. En 5', se identificó una NRPS dimodular (WP)038499875.1), que mostró un 68% de identidad con RlpB y contenía una organización de dominios idéntica ([C-A-Pc P]m1-[C-A-pCp -R]m2). El análisis de los sitios activos (Bachmann y Ravel [2009] Meth. Enzymol. 458, 181) indicó que la especificidad de sustrato predicha también concordaba con la de RlpB, con el código de especificidad del dominio A de M1 concordando con el de L-serina y el código de especificidad del dominio A de M2 concordando con el del dominio A de M2 de RlpB, indicando que la L-leucina se incorpora por M2 (Fig. 3). También se encontraron un dominio C y dominio R en el extremo amino y carboxi de la NRPS de J. agaricidamnosum, respectivamente. Esto sugiere que la biosíntesis se inicia por condensación de un intermedio acilo con serina, y se termina por la liberación reductora de un dipéptido acilado, similar a lo que se predice para la biosíntesis de glicolipopéptido en V. paradoxus RKNM-096. No se encontró homólogo de RlpE en la agrupación génica de J. agaricidamnosum DSM 9628, lo que indica que el producto de la agrupación contiene probablemente un único residuo de ramnosa. También se detectó una agrupación génica con una organización altamente similar a la de J. agaricidamnosum DSM 9628 en el genoma de V. paradoxus DSM 21786 (no. de acceso GenBank NC 022247.1). Colectivamente, estos datos sugieren que J. agaricidamnosum DSM9628 y V. paradoxus DSM 21786 poseen la capacidad de producir nuevos biotensioactivos con estructuras relacionadas a las producidas por V. paradoxus RKNM-096. Sobre la base del análisis de bioinformática presentado aquí, predecimos que el o los compuestos producidos por estas bacterias serían un dipéptido L-serinil-L-leucinol W-acilado que porta un único residuo de ramnosa.
El escaneo del genoma usando la secuencia de RlpC también identificó una agrupación génica posible de biotensioactivo en la alfa-proteobacteria relacionada de forma más distante Inquilinus limosus DSM 16000 (no. de acceso Genbank NZ_AUHM01000002.1) (Fig. 3). El homólogo de RlpC (WP_026869107.1) en I. limosus compartía un 61% de identidad con la proteína de V. paradoxus RKNM-096. Se identificaron genes que codifican una proteína semejante a MtbH (WP_026869104.1) y una NRPS (WP026869105.1) inmediatamente en 5' del homólogo de RlpC. La proteína semejante a MbtH compartía un 56% de identidad con RlpD. La NRPS era una enzima monomodular con la siguiente organización de dominios: C-A-T-R (Fig. 3). El análisis del sitio activo del dominio A (Bachmann y Ravel [2009] Meth. Enzymol. 458, 181) indicó que la L-serina es el sustrato probable de esta enzima. La presencia de un dominio C en el extremo N y un dominio R en el extremo C sugiere que el producto de la NRPS es un serinol acilado. También se detectó un homólogo de RlpE (WP_034850803.1) en la agrupación génica de I. limosus (41% de identidad), lo que sugiere que el intermedio serinol acilado puede glicosilarse secuencialmente para rendir un producto que porta un resto diramnosilo similar a NB-RLP1006. El producto final puede exportarse fuera de la célula a través de la acción de un exportador MFS (WP_034850806.1) que comparte un 52% de identidad con RlpF.
Para validar nuestra estrategia in silico para identificar productores de biotensioactivos glicolipopeptídicos, obtuvimos J. agaricidamnosum DSM 9628 y V. paradoxus DSM 21786 de la colección de cultivos Deutsche Sammlung von Mikroorganismen und Zellkulturen (DSMZ). Cada cepa se fermentó en una variedad de medios de cultivo para promover la producción de biotensioactivos predichos. Las fermentaciones se extrajeron dos veces con un volumen igual de EtOAc. La capa orgánica se evaporó y los extractos concentrados resultantes se analizaron por UPLC-PDA-ELSD-HRESIMS como se ha descrito anteriormente para NB-RLP1006 (Ejemplo 3). Se observaron tres picos prominentes eluyendo a los 3,07, 5,05 y 5,51 min en los cromatogramas ELSD y HRESIMS de J. agaricidamnosum DSM 9628. El pico a los 3,07 min (HRESIMS m/z 1182,6217 [M H]+, calcd para C56H85N12O16, 1181,6201) podría atribuirse al compuesto conocido jagaracina reportado previamente de esta cepa (Graupner et al. [2012] Angew Chem. Int. Ed. Engl. 51: 13173). La extracción de los espectros de masa para los picos que eluyen a los 5,05 y 5,51 min reveló iones [M H]+ de m/z 833,5741 y m/z 861,6033, respectivamente. Los iones [M H]+ observados mostraron una diferencia de masa de -1,5 y 1,0 ppm de los iones m/z [M H]+ predichos para los glicolipopéptidos monoramnosilo NB-RLP832 (m/z 833,5741 [M H]+) y NB-RLP860 (m/z 861,6033 [M H]+), respectivamente, lo que indica que los

Claims (15)

REIVINDICACIONES
1. Un biotensioactivo purificado que comprende un componente lipídico hidrófobo que comprende un extremo carboxilo y un extremo hidroxilo, en donde el componente lipídico está unido covalentemente a (i) una cadena de péptido o semejante a péptido en el extremo carboxilo del componente lipídico y (ii) un resto de carbohidrato en el extremo hidroxilo del componente lipídico a través de una unión glicosídica, en donde el resto de carbohidrato incluye uno, dos o tres residuos de ramnosa.
2. El biotensioactivo purificado según la reivindicación 1, en donde la cadena peptídica comprende en el intervalo de entre 2 y 10 aminoácidos.
3. El biotensioactivo purificado según la reivindicación 1 o reivindicación 2, en donde el componente lipídico comprende en el intervalo de entre 1 y 6 restos de ácido alcanoico.
4. El biotensioactivo purificado según cualquier reivindicación anterior, en donde el componente lipídico comprende una cadena acilo, y en donde la longitud de dicha cada cadena acilo está en el intervalo de entre C4 a C20.
5. El biotensioactivo purificado según cualquier reivindicación anterior, en donde el resto de carbohidrato puede seleccionarse de sacáridos incluyendo glucosa, fructosa, galactosa, manosa, ribosa, o variantes desoxisacáridos incluyendo desoxirribosa o fucosa.
6. El biotensioactivo purificado según cualquier reivindicación anterior, en donde el componente lipídico comprende tres restos de ácido p-hidroxialcanoico.
7. El biotensioactivo purificado de la reivindicación 4, en donde la longitud de cada cadena acilo del componente lipídico es C10.
8. El biotensioactivo purificado según cualquier reivindicación anterior, en donde el resto de carbohidrato comprende un resto de ramnosa unido al componente lipídico a través de una unión glicosídica.
9. El biotensioactivo purificado según la reivindicación 8, en donde el resto de carbohidrato comprende dos restos de ramnosa.
10. El biotensioactivo purificado según cualquier reivindicación anterior, en donde el componente lipídico comprende tres restos de ácido p-hidroxialcanoico y la longitud de cada cadena acilo del componente lipídico es C10.
11. Un método para preparar el biotensioactivo de cualquiera de las reivindicaciones 1 a 10, el método que comprende las etapas de:
(a) aislar un microorganismo que comprende el biotensioactivo;
(b) poner el microorganismo en un cultivo en condiciones que promueven la síntesis del biotensioactivo; y (c) aislar el biotensioactivo del cultivo.
12. El método según la reivindicación 11, en donde el microorganismo pertenece al género y especie Variovorax paradoxus y es la cepa RKNM-096 según está depositada en el NRRL con el número de acceso B-67038.
13. Una composición emulsionada de aceite en agua o agua en aceite que comprende un componente polar, un componente no polar, y el biotensioactivo como se reivindica en cualquiera de las reivindicaciones 1 a 10.
14. Un microorganismo aislado preparado por ingeniería para producir el biotensioactivo de cualquiera de las reivindicaciones 1 a 10, en donde se ha introducido en el microorganismo un conjunto de genes heterólogos que presenta una similitud de al menos el 70% con las SEQ ID 3, 5, 7, 9, 11 y 13.
15. Un método para modificar tensioactivos glicolipopeptídicos naturales mediante la adición de restos de ramnosa adicionales usando RlpE expresado recombinantemente [SEQ ID 11, 12, 23 y 24].
ES17719188T 2016-04-06 2017-04-06 Biotensioactivos glicolipopeptídicos Active ES2809727T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB201605875 2016-04-06
PCT/EP2017/058296 WO2017174748A2 (en) 2016-04-06 2017-04-06 Glycolipopeptide biosurfactants

Publications (1)

Publication Number Publication Date
ES2809727T3 true ES2809727T3 (es) 2021-03-05

Family

ID=58632356

Family Applications (1)

Application Number Title Priority Date Filing Date
ES17719188T Active ES2809727T3 (es) 2016-04-06 2017-04-06 Biotensioactivos glicolipopeptídicos

Country Status (4)

Country Link
US (3) US20190127411A1 (es)
EP (1) EP3440179B1 (es)
ES (1) ES2809727T3 (es)
WO (1) WO2017174748A2 (es)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10941173B2 (en) * 2016-02-22 2021-03-09 Evonik Operations Gmbh Rhamnolipid amides for hair scent retention
CN112156719B (zh) * 2020-08-26 2022-02-22 夏文杰 一种两性糖脂生物表面活性剂及其制备方法
CN113666975B (zh) * 2021-08-19 2023-03-24 南京工业大学 一种鼠李糖脂醇酰胺衍生物及其制备方法和应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080274959A1 (en) 2004-12-17 2008-11-06 Wyeth Actinomadura Chromoprotein, Apoprotein and Gene Cluster
US20130085067A1 (en) * 2011-10-04 2013-04-04 Polytechnic Institute Of New York University Modified sophorolipids for the inhibition of plant pathogens
US9650405B2 (en) * 2010-04-05 2017-05-16 SyntheZyme, LLC Modified sophorolipids as oil solubilizing agents

Also Published As

Publication number Publication date
EP3440179A2 (en) 2019-02-13
US20200207799A1 (en) 2020-07-02
WO2017174748A2 (en) 2017-10-12
US11608352B2 (en) 2023-03-21
US20230227489A1 (en) 2023-07-20
US20190127411A1 (en) 2019-05-02
WO2017174748A3 (en) 2017-11-23
EP3440179B1 (en) 2020-06-03

Similar Documents

Publication Publication Date Title
US20230227489A1 (en) Glycolipopeptide biosurfactants
Kraas et al. Functional dissection of surfactin synthetase initiation module reveals insights into the mechanism of lipoinitiation
ES2371440T3 (es) Mutantes por deleción de glicosiltransferasas de neisseria para biosíntesis de oligosacáridos y genes que las codifican.
ES2650799T3 (es) Bacteria que produce condroitina y procedimiento de producción de condroitina
US11155843B2 (en) Generation of acyl amino acids
Mishra et al. Lipoarabinomannan biosynthesis in Corynebacterineae: the interplay of two α (1→ 2)‐mannopyranosyltransferases MptC and MptD in mannan branching
US9017692B2 (en) Antimicrobial agent, bacterial strain, biosynthesis, and methods of use
Kim et al. Characterization and structure identification of an antimicrobial peptide, hominicin, produced by Staphylococcus hominis MBBL 2–9
Kalinovskaya et al. Characterization of surfactin-like cyclic depsipeptides synthesized by Bacillus pumilus from ascidian Halocynthia aurantium
Liu et al. Production and characterization of a C15-surfactin-O-methyl ester by a lipopeptide producing strain Bacillus subtilis HSO121
FR3018822A1 (fr) Nouveaux flavonoides o-alpha-glucosyles sur le cycle b, procede d&#39;obtention et utilisations
Szwej et al. The chain length of biologically produced (R)-3-hydroxyalkanoic acid affects biological activity and structure of anti-cancer peptides
EP3000821B1 (en) Pseudofactin derivatives, a method of synthesizing pseudofactin derivatives and their use
KR20150045247A (ko) 레스베라트롤 글루코시드의 제조방법
Zhengjie et al. Research progress of cyclic lipopeptide biosynthesis
US20160090577A1 (en) Heterologous expression of glycine n-acyltransferase proteins
JPWO2019045058A1 (ja) アンブレインの効率的製造方法
WO2021193806A1 (ja) 変異型テトラプレニル-β-クルクメン環化酵素及びそれを用いたアンブレインの製造方法
US20160201099A1 (en) Chimeric non-ribosomal peptide synthetase
KR101960182B1 (ko) p-쿠마로일 Co-A:모노리그놀 전이효소를 이용한 카페익산 페닐에스터 또는 이의 유도체 제조 방법
JP2011256165A (ja) 新規なメチル化テアフラビン及びそれを含む組成物
EP3000822B1 (en) A novel method of pseudofactin synthesis
US20230106760A1 (en) Antibacterial and antifungal polyketides from environmental amycolatopsis spp
KR20230173113A (ko) 장쇄 당지질의 고리화 및 탈고리화 방법
KR20240022893A (ko) 신규 화합물 및 이를 포함하는 항균용 조성물