WO2023067380A1 - Sistema genético para la biosíntesis de leupeptina y su uso en sistemas heterólogos de producción - Google Patents
Sistema genético para la biosíntesis de leupeptina y su uso en sistemas heterólogos de producción Download PDFInfo
- Publication number
- WO2023067380A1 WO2023067380A1 PCT/IB2021/062510 IB2021062510W WO2023067380A1 WO 2023067380 A1 WO2023067380 A1 WO 2023067380A1 IB 2021062510 W IB2021062510 W IB 2021062510W WO 2023067380 A1 WO2023067380 A1 WO 2023067380A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- domain
- leupeptin
- adenylation
- thioesterase
- followed
- Prior art date
Links
- GDBQQVLCIARPGH-UHFFFAOYSA-N Leupeptin Natural products CC(C)CC(NC(C)=O)C(=O)NC(CC(C)C)C(=O)NC(C=O)CCCN=C(N)N GDBQQVLCIARPGH-UHFFFAOYSA-N 0.000 title claims abstract description 98
- 108010052968 leupeptin Proteins 0.000 title claims abstract description 98
- GDBQQVLCIARPGH-ULQDDVLXSA-N leupeptin Chemical compound CC(C)C[C@H](NC(C)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C=O)CCCN=C(N)N GDBQQVLCIARPGH-ULQDDVLXSA-N 0.000 title claims abstract description 97
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 49
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 20
- 230000002068 genetic effect Effects 0.000 title description 11
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 39
- 238000000034 method Methods 0.000 claims description 31
- 102000005488 Thioesterase Human genes 0.000 claims description 29
- 108020002982 thioesterase Proteins 0.000 claims description 29
- 241000933146 Streptomyces roseus Species 0.000 claims description 25
- 230000004927 fusion Effects 0.000 claims description 25
- 230000006154 adenylylation Effects 0.000 claims description 23
- 102000004169 proteins and genes Human genes 0.000 claims description 19
- 235000018102 proteins Nutrition 0.000 claims description 17
- 102000004190 Enzymes Human genes 0.000 claims description 15
- 108090000790 Enzymes Proteins 0.000 claims description 15
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 claims description 12
- 102000009042 Argininosuccinate Lyase Human genes 0.000 claims description 12
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 claims description 11
- 239000013598 vector Substances 0.000 claims description 11
- 241000187747 Streptomyces Species 0.000 claims description 8
- 230000000813 microbial effect Effects 0.000 claims description 8
- 125000001151 peptidyl group Chemical group 0.000 claims description 8
- 101000889837 Aeropyrum pernix (strain ATCC 700893 / DSM 11879 / JCM 9820 / NBRC 100138 / K1) Protein CysO Proteins 0.000 claims description 7
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 7
- 108010009341 Protein Serine-Threonine Kinases Proteins 0.000 claims description 7
- 229960000310 isoleucine Drugs 0.000 claims description 7
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 6
- 102000009516 Protein Serine-Threonine Kinases Human genes 0.000 claims description 6
- 239000013604 expression vector Substances 0.000 claims description 6
- 150000007523 nucleic acids Chemical class 0.000 claims description 5
- 101100351213 Chromobacterium violaceum (strain ATCC 12472 / DSM 30191 / JCM 1249 / NBRC 12614 / NCIMB 9131 / NCTC 9757) pcp gene Proteins 0.000 claims description 4
- 101001098880 Homo sapiens Purkinje cell protein 2 homolog Proteins 0.000 claims description 4
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 claims description 4
- 229930182844 L-isoleucine Natural products 0.000 claims description 4
- 101100126615 Mus musculus Itpr1 gene Proteins 0.000 claims description 4
- 101150036369 NRPS2 gene Proteins 0.000 claims description 4
- 101100517202 Neosartorya fumigata (strain ATCC MYA-4609 / Af293 / CBS 101355 / FGSC A1100) NRPS1 gene Proteins 0.000 claims description 4
- 101100365763 Neosartorya fumigata (strain ATCC MYA-4609 / Af293 / CBS 101355 / FGSC A1100) NRPS3 gene Proteins 0.000 claims description 4
- 101100365761 Neosartorya fumigata (strain ATCC MYA-4609 / Af293 / CBS 101355 / FGSC A1100) NRPS4 gene Proteins 0.000 claims description 4
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 claims description 4
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 claims description 4
- 102100038998 Purkinje cell protein 2 homolog Human genes 0.000 claims description 4
- 238000012258 culturing Methods 0.000 claims description 4
- 229960003104 ornithine Drugs 0.000 claims description 4
- 101150075058 pcp1 gene Proteins 0.000 claims description 4
- 229960001153 serine Drugs 0.000 claims description 4
- 101150022634 NRPS5 gene Proteins 0.000 claims description 3
- 239000004473 Threonine Substances 0.000 claims description 3
- 230000000636 anti-proteolytic effect Effects 0.000 claims description 3
- 229960002898 threonine Drugs 0.000 claims description 3
- 230000001939 inductive effect Effects 0.000 claims description 2
- 239000002184 metal Substances 0.000 claims description 2
- 229910052751 metal Inorganic materials 0.000 claims description 2
- 239000000203 mixture Substances 0.000 claims description 2
- 108020004707 nucleic acids Proteins 0.000 claims description 2
- 102000039446 nucleic acids Human genes 0.000 claims description 2
- 241000588722 Escherichia Species 0.000 claims 2
- 229910052785 arsenic Inorganic materials 0.000 claims 1
- 229910052802 copper Inorganic materials 0.000 claims 1
- 229910052742 iron Inorganic materials 0.000 claims 1
- 229910052748 manganese Inorganic materials 0.000 claims 1
- 229910052752 metalloid Inorganic materials 0.000 claims 1
- 150000002738 metalloids Chemical class 0.000 claims 1
- 229910052759 nickel Inorganic materials 0.000 claims 1
- 150000003839 salts Chemical class 0.000 claims 1
- 230000007704 transition Effects 0.000 claims 1
- 229910052725 zinc Inorganic materials 0.000 claims 1
- 108090000765 processed proteins & peptides Proteins 0.000 abstract description 19
- 229930014626 natural product Natural products 0.000 abstract description 13
- 238000005065 mining Methods 0.000 abstract description 11
- 239000000137 peptide hydrolase inhibitor Substances 0.000 abstract description 10
- 230000001851 biosynthetic effect Effects 0.000 abstract description 8
- 230000006696 biosynthetic metabolic pathway Effects 0.000 abstract description 7
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 abstract description 5
- 241000588724 Escherichia coli Species 0.000 abstract description 4
- 150000001299 aldehydes Chemical class 0.000 abstract description 4
- 238000002743 insertional mutagenesis Methods 0.000 abstract description 2
- 238000002705 metabolomic analysis Methods 0.000 abstract 1
- 230000001431 metabolomic effect Effects 0.000 abstract 1
- 238000001823 molecular biology technique Methods 0.000 abstract 1
- 230000003389 potentiating effect Effects 0.000 abstract 1
- 238000003786 synthesis reaction Methods 0.000 description 20
- 238000002821 scintillation proximity assay Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 13
- 229940088598 enzyme Drugs 0.000 description 13
- 239000004365 Protease Substances 0.000 description 12
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 11
- 102000035195 Peptidases Human genes 0.000 description 11
- 108091005804 Peptidases Proteins 0.000 description 11
- 150000001875 compounds Chemical class 0.000 description 11
- 229940024606 amino acid Drugs 0.000 description 10
- 150000001413 amino acids Chemical class 0.000 description 10
- 235000009697 arginine Nutrition 0.000 description 10
- 238000000855 fermentation Methods 0.000 description 10
- 230000004151 fermentation Effects 0.000 description 10
- 108010000785 non-ribosomal peptide synthase Proteins 0.000 description 10
- 239000000126 substance Substances 0.000 description 10
- 239000004475 Arginine Substances 0.000 description 9
- 235000001014 amino acid Nutrition 0.000 description 9
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 9
- 239000000284 extract Substances 0.000 description 8
- 239000002207 metabolite Substances 0.000 description 8
- 229960003136 leucine Drugs 0.000 description 7
- 102000004196 processed proteins & peptides Human genes 0.000 description 7
- 101710191958 Amino-acid acetyltransferase Proteins 0.000 description 6
- 108090000364 Ligases Proteins 0.000 description 6
- 102000003960 Ligases Human genes 0.000 description 6
- 210000004899 c-terminal region Anatomy 0.000 description 6
- 238000011161 development Methods 0.000 description 6
- 239000002609 medium Substances 0.000 description 6
- 239000002243 precursor Substances 0.000 description 6
- 108010087765 Antipain Proteins 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 5
- 125000002252 acyl group Chemical group 0.000 description 5
- SDNYTAYICBFYFH-TUFLPTIASA-N antipain Chemical compound NC(N)=NCCC[C@@H](C=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SDNYTAYICBFYFH-TUFLPTIASA-N 0.000 description 5
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 239000000047 product Substances 0.000 description 5
- 241000894007 species Species 0.000 description 5
- SXGMVGOVILIERA-UHFFFAOYSA-N (2R,3S)-2,3-diaminobutanoic acid Natural products CC(N)C(N)C(O)=O SXGMVGOVILIERA-UHFFFAOYSA-N 0.000 description 4
- MRXDGVXSWIXTQL-HYHFHBMOSA-N (2s)-2-[[(1s)-1-(2-amino-1,4,5,6-tetrahydropyrimidin-6-yl)-2-[[(2s)-4-methyl-1-oxo-1-[[(2s)-1-oxo-3-phenylpropan-2-yl]amino]pentan-2-yl]amino]-2-oxoethyl]carbamoylamino]-3-phenylpropanoic acid Chemical compound C([C@H](NC(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C=O)C1NC(N)=NCC1)C(O)=O)C1=CC=CC=C1 MRXDGVXSWIXTQL-HYHFHBMOSA-N 0.000 description 4
- 241001156739 Actinobacteria <phylum> Species 0.000 description 4
- OLVPQBGMUGIKIW-UHFFFAOYSA-N Chymostatin Natural products C=1C=CC=CC=1CC(C=O)NC(=O)C(C(C)CC)NC(=O)C(C1NC(N)=NCC1)NC(=O)NC(C(O)=O)CC1=CC=CC=C1 OLVPQBGMUGIKIW-UHFFFAOYSA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 239000004395 L-leucine Substances 0.000 description 4
- 235000019454 L-leucine Nutrition 0.000 description 4
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 4
- 108010060486 acharan sulfate lyase 2 Proteins 0.000 description 4
- 210000004027 cell Anatomy 0.000 description 4
- 238000012512 characterization method Methods 0.000 description 4
- 108010086192 chymostatin Proteins 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 108091008053 gene clusters Proteins 0.000 description 4
- 238000004128 high performance liquid chromatography Methods 0.000 description 4
- 238000000589 high-performance liquid chromatography-mass spectrometry Methods 0.000 description 4
- 238000010348 incorporation Methods 0.000 description 4
- 239000003112 inhibitor Substances 0.000 description 4
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- 101150025804 Asl gene Proteins 0.000 description 3
- 241000233866 Fungi Species 0.000 description 3
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 125000003172 aldehyde group Chemical group 0.000 description 3
- 125000001951 carbamoylamino group Chemical group C(N)(=O)N* 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 230000002401 inhibitory effect Effects 0.000 description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 3
- 235000014705 isoleucine Nutrition 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 235000005772 leucine Nutrition 0.000 description 3
- 230000014759 maintenance of location Effects 0.000 description 3
- 229930191981 pacidamycin Natural products 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 230000017854 proteolysis Effects 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000024053 secondary metabolic process Effects 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 238000004885 tandem mass spectrometry Methods 0.000 description 3
- 108700040193 Adenylosuccinate lyases Proteins 0.000 description 2
- 102100023167 Argininosuccinate lyase Human genes 0.000 description 2
- 108700040066 Argininosuccinate lyases Proteins 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 102000005600 Cathepsins Human genes 0.000 description 2
- 108010084457 Cathepsins Proteins 0.000 description 2
- 108010005843 Cysteine Proteases Proteins 0.000 description 2
- 102000005927 Cysteine Proteases Human genes 0.000 description 2
- ROHFNLRQFUQHCH-RXMQYKEDSA-N D-leucine Chemical compound CC(C)C[C@@H](N)C(O)=O ROHFNLRQFUQHCH-RXMQYKEDSA-N 0.000 description 2
- 229930182819 D-leucine Natural products 0.000 description 2
- 108020004414 DNA Proteins 0.000 description 2
- 108010016626 Dipeptides Proteins 0.000 description 2
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 2
- 229930064664 L-arginine Natural products 0.000 description 2
- 235000014852 L-arginine Nutrition 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N Leu-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- 101710186554 Leucyl/phenylalanyl-tRNA-protein transferase Proteins 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 2
- 108010022999 Serine Proteases Proteins 0.000 description 2
- 102000012479 Serine Proteases Human genes 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 229930195405 lobophorin Natural products 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- BQJCRHHNABKAKU-KBQPJGBKSA-N morphine Chemical compound O([C@H]1[C@H](C=C[C@H]23)O)C4=C5[C@@]12CCN(C)[C@@H]3CC5=CC=C4O BQJCRHHNABKAKU-KBQPJGBKSA-N 0.000 description 2
- 229930194187 napsamycin Natural products 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 235000008729 phenylalanine Nutrition 0.000 description 2
- 230000019525 primary metabolic process Effects 0.000 description 2
- 235000019419 proteases Nutrition 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000011347 resin Substances 0.000 description 2
- 229920005989 resin Polymers 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 229930000044 secondary metabolite Natural products 0.000 description 2
- 229940124597 therapeutic agent Drugs 0.000 description 2
- 235000002374 tyrosine Nutrition 0.000 description 2
- -1 ureido-amino Chemical group 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 229960004295 valine Drugs 0.000 description 2
- 235000014393 valine Nutrition 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- LBYOYNQVZFEGSW-SJEAMFKXSA-N (2S)-2-acetamido-4-methylpentanoic acid (2S)-2-amino-4-methylpentanoic acid Chemical compound CC(C)C[C@H](N)C(O)=O.CC(C)C[C@H](NC(C)=O)C(O)=O LBYOYNQVZFEGSW-SJEAMFKXSA-N 0.000 description 1
- GDBQQVLCIARPGH-BSOSBYQFSA-N (2s)-2-acetamido-n-[(2s)-1-[[5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]-4-methylpentanamide Chemical group CC(C)C[C@H](NC(C)=O)C(=O)N[C@@H](CC(C)C)C(=O)NC(C=O)CCCN=C(N)N GDBQQVLCIARPGH-BSOSBYQFSA-N 0.000 description 1
- BFUKWVVFVGUARP-ULQDDVLXSA-N (2s)-n-[(2s)-1-[[(2s)-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]-4-methyl-2-(propanoylamino)pentanamide Chemical compound CCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C=O)CCCN=C(N)N BFUKWVVFVGUARP-ULQDDVLXSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 108090000107 Acrosin Proteins 0.000 description 1
- 102100026041 Acrosin Human genes 0.000 description 1
- 102000057234 Acyl transferases Human genes 0.000 description 1
- 108700016155 Acyl transferases Proteins 0.000 description 1
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- 241000235349 Ascomycota Species 0.000 description 1
- 206010003694 Atrophy Diseases 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- ROJXDSBIEPYXPR-UHFFFAOYSA-N CNC(C(C)N)C(O)=O Chemical compound CNC(C(C)N)C(O)=O ROJXDSBIEPYXPR-UHFFFAOYSA-N 0.000 description 1
- 108010032088 Calpain Proteins 0.000 description 1
- 102000007590 Calpain Human genes 0.000 description 1
- 208000002177 Cataract Diseases 0.000 description 1
- 102000005572 Cathepsin A Human genes 0.000 description 1
- 108010059081 Cathepsin A Proteins 0.000 description 1
- 102000003908 Cathepsin D Human genes 0.000 description 1
- 108090000258 Cathepsin D Proteins 0.000 description 1
- 108090000317 Chymotrypsin Proteins 0.000 description 1
- 229940122644 Chymotrypsin inhibitor Drugs 0.000 description 1
- 101710137926 Chymotrypsin inhibitor Proteins 0.000 description 1
- 241000494545 Cordyline virus 2 Species 0.000 description 1
- 101000979117 Curvularia clavata Nonribosomal peptide synthetase Proteins 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241001302160 Escherichia coli str. K-12 substr. DH10B Species 0.000 description 1
- 108010088842 Fibrinolysin Proteins 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 241000725303 Human immunodeficiency virus Species 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 1
- 102100027612 Kallikrein-11 Human genes 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- IUPWNLFIRQEDJV-UHFFFAOYSA-N Leupeptin Pr-LL Natural products CCCCC(NC(=O)CC)C(=O)NC(CCCC)C(=O)NC(CCCNC(=N)N)C=O IUPWNLFIRQEDJV-UHFFFAOYSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- BFUKWVVFVGUARP-UHFFFAOYSA-N N-propionyl-L-leucyl-L-leucyl-DL-argininal Natural products CCC(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)NC(C=O)CCCN=C(N)N BFUKWVVFVGUARP-UHFFFAOYSA-N 0.000 description 1
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 1
- 229930012538 Paclitaxel Natural products 0.000 description 1
- 108090000526 Papain Proteins 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 101710118538 Protease Proteins 0.000 description 1
- 102000004245 Proteasome Endopeptidase Complex Human genes 0.000 description 1
- 108090000708 Proteasome Endopeptidase Complex Proteins 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 241000892502 Streptomyces lividans 1326 Species 0.000 description 1
- 241000593949 Streptomyces mauvecolor Species 0.000 description 1
- 241000187414 Streptomyces nigrescens Species 0.000 description 1
- 241000187180 Streptomyces sp. Species 0.000 description 1
- 108091005501 Threonine proteases Proteins 0.000 description 1
- 102000035100 Threonine proteases Human genes 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 101710152431 Trypsin-like protease Proteins 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 239000003463 adsorbent Substances 0.000 description 1
- 229930013930 alkaloid Natural products 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- XZNUGFQTQHRASN-XQENGBIVSA-N apramycin Chemical compound O([C@H]1O[C@@H]2[C@H](O)[C@@H]([C@H](O[C@H]2C[C@H]1N)O[C@@H]1[C@@H]([C@@H](O)[C@H](N)[C@@H](CO)O1)O)NC)[C@@H]1[C@@H](N)C[C@@H](N)[C@H](O)[C@H]1O XZNUGFQTQHRASN-XQENGBIVSA-N 0.000 description 1
- 229950006334 apramycin Drugs 0.000 description 1
- 239000012223 aqueous fraction Substances 0.000 description 1
- 150000001484 arginines Chemical class 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 230000037444 atrophy Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 150000005693 branched-chain amino acids Chemical class 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 239000005018 casein Substances 0.000 description 1
- BECPQYXYKAMYBN-UHFFFAOYSA-N casein, tech. Chemical compound NCCCCC(C(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(CC(C)C)N=C(O)C(CCC(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(C(C)O)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(COP(O)(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(N)CC1=CC=CC=C1 BECPQYXYKAMYBN-UHFFFAOYSA-N 0.000 description 1
- 235000021240 caseins Nutrition 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 230000005754 cellular signaling Effects 0.000 description 1
- 150000005829 chemical entities Chemical class 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 229960002376 chymotrypsin Drugs 0.000 description 1
- 239000003541 chymotrypsin inhibitor Substances 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000010205 computational analysis Methods 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 239000000039 congener Substances 0.000 description 1
- 239000003433 contraceptive agent Substances 0.000 description 1
- 230000002254 contraceptive effect Effects 0.000 description 1
- 230000009091 contractile dysfunction Effects 0.000 description 1
- 239000000287 crude extract Substances 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 150000002066 eicosanoids Chemical class 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007824 enzymatic assay Methods 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 238000006345 epimerization reaction Methods 0.000 description 1
- 229960003276 erythromycin Drugs 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- HVYFVLAUKMGKHL-USKUEUQVSA-N friulimicin Chemical compound O=C1[C@H](C(C)C)NC(=O)[C@@H]([C@@H](C)N)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H]([C@H](C)C(O)=O)NC(=O)[C@H]2CCCCN2C(=O)[C@@H](NC(=O)[C@H](CC(N)=O)NC(=O)C\C=C/CCCCCCCC(C)C)[C@H](C)NC(=O)[C@@H]2CCCN21 HVYFVLAUKMGKHL-USKUEUQVSA-N 0.000 description 1
- 229930188551 friulimicin Natural products 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 235000004554 glutamine Nutrition 0.000 description 1
- ZRALSGWEFCBTJO-UHFFFAOYSA-N guanidine group Chemical group NC(=N)N ZRALSGWEFCBTJO-UHFFFAOYSA-N 0.000 description 1
- 150000002373 hemiacetals Chemical class 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 208000027866 inflammatory disease Diseases 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 210000004347 intestinal mucosa Anatomy 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 238000005040 ion trap Methods 0.000 description 1
- 108010044195 kasumigamide Proteins 0.000 description 1
- WUXSZVRSSSITPJ-UHFFFAOYSA-N kasumigamide Natural products C=1C=CC=CC=1C(O)C(C(O)=O)NC(=O)C(CCCN=C(N)N)NC(=O)CC(O)C(CC=1C2=CC=CC=C2NC=1)NC(=O)CCNC(=O)C(O)CC1=CC=CC=C1 WUXSZVRSSSITPJ-UHFFFAOYSA-N 0.000 description 1
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- PWCRKPGHIKOADB-FMWAKIAMSA-N luminaolide Chemical compound C1C(OC)CC(O)CC(=O)OC(C(C)C(OC)C(C)CCC(=O)C(C)C(OC)C(C)\C=C\N(C)C=O)CC(O)CC(O)C(C)C(OC)CC(O2)CC=CC2CC(OC)CC(O)CC(=O)OC(C(C)C(C(C)CCC(=O)C(C)C(OC)C(C)\C=C\N(C)C=O)OC)CC(O)CC(O)C(C)C(OC)CC2CC=CC1O2 PWCRKPGHIKOADB-FMWAKIAMSA-N 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000005399 mechanical ventilation Methods 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 238000012269 metabolic engineering Methods 0.000 description 1
- 108010041420 microbial alkaline proteinase inhibitor Proteins 0.000 description 1
- 238000013048 microbiological method Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 229960005181 morphine Drugs 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 229960001592 paclitaxel Drugs 0.000 description 1
- 229940055729 papain Drugs 0.000 description 1
- 235000019834 papain Nutrition 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 238000002205 phenol-chloroform extraction Methods 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 150000002994 phenylalanines Chemical class 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 229940012957 plasmin Drugs 0.000 description 1
- 229930001119 polyketide Natural products 0.000 description 1
- 125000000830 polyketide group Chemical group 0.000 description 1
- 229930001118 polyketide hybrid Natural products 0.000 description 1
- 125000003308 polyketide hybrid group Chemical group 0.000 description 1
- 239000013259 porous coordination polymer Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000013587 production medium Substances 0.000 description 1
- 125000001501 propionyl group Chemical group O=C([*])C([H])([H])C([H])([H])[H] 0.000 description 1
- 150000003180 prostaglandins Chemical class 0.000 description 1
- 238000000751 protein extraction Methods 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000010410 reperfusion Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 229930184257 scytophycin Natural products 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 235000004400 serine Nutrition 0.000 description 1
- 150000003355 serines Chemical class 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 238000007873 sieving Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000011550 stock solution Substances 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- RCINICONZNJXQF-MZXODVADSA-N taxol Chemical compound O([C@@H]1[C@@]2(C[C@@H](C(C)=C(C2(C)C)[C@H](C([C@]2(C)[C@@H](O)C[C@H]3OC[C@]3([C@H]21)OC(C)=O)=O)OC(=O)C)OC(=O)[C@H](O)[C@@H](NC(=O)C=1C=CC=CC=1)C=1C=CC=CC=1)O)C(=O)C1=CC=CC=C1 RCINICONZNJXQF-MZXODVADSA-N 0.000 description 1
- 150000003505 terpenes Chemical class 0.000 description 1
- 125000005931 tert-butyloxycarbonyl group Chemical group [H]C([H])([H])C(OC(*)=O)(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 125000004044 trifluoroacetyl group Chemical group FC(C(=O)*)(F)F 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 229960001322 trypsin Drugs 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 150000003668 tyrosines Chemical class 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 108010078564 vanchrobactin Proteins 0.000 description 1
- LXNCWECCTQQXPQ-UHFFFAOYSA-N vanchrobactin Natural products NC(N)=NCCCC(C(=O)NC(CO)C(O)=O)NC(=O)C1=CC=CC(O)=C1O LXNCWECCTQQXPQ-UHFFFAOYSA-N 0.000 description 1
- LXNCWECCTQQXPQ-ZJUUUORDSA-N vanchrobactin Chemical compound NC(=N)NCCC[C@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)C1=CC=CC(O)=C1O LXNCWECCTQQXPQ-ZJUUUORDSA-N 0.000 description 1
- 239000012224 working solution Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K5/00—Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof
- C07K5/04—Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof containing only normal peptide links
- C07K5/08—Tripeptides
- C07K5/0802—Tripeptides with the first amino acid being neutral
- C07K5/0804—Tripeptides with the first amino acid being neutral and aliphatic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/76—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Actinomyces; for Streptomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
Definitions
- NPs have been simplified for their study into: i) terpenoids and spheroids (for example, taxol); ii) alkaloids (for example morphine); iii) substances derived from fatty acids (for example prostaglandin Ei which is an eicosanoid); iv) polyketides (such as erythromycin); v) non-ribosomal peptides (such as penicillin) or small aldehyde peptides (such as leupeptin) and vi) enzyme cofactors (such as cobaamine).
- NPs are metabolites that are generally derived from specialized metabolism, also known as secondary metabolism, the production of which is not essential for cell maintenance, but rather for its adaptation and survival.
- NPs neuropeptides
- the evolutionary implications of NPs reveal complex relationships in the different niches, since the chemical and structural characteristics of these metabolites can act at very particular levels of interaction between species, which affects their distribution, since this type of metabolites can not be conserved even among members of the same species, and be specific at the level of strains or variants of the same species.
- the evolutionary nature of these molecules also implies that they are produced under specific conditions that can hardly be recreated in the laboratory.
- the aldehydic end interacts with the active sites of the proteases, forming hemiacetal or hemithioacetal complexes with the catalytic residues, frequently serines or cisternae, preventing their operation (figure 1) [Brayer, 1979; Wlodawer, 2001 ; Bullock, 1996; Hines, 2008],
- ureido group acts as an adapter that changes the order of the peptide, from N-terminal to C-terminal to C-terminal to C-terminal, resulting in peptides with chemical characteristics and biologics other than traditional ribosomal peptides ( Figure 1).
- the size of the peptide chain can range from two to six residues, while acyl groups can range from two to nine carbon atoms.
- the present invention provides all the necessary genetic bases for leupeptin biosynthesis, as well as the heterologous expression of biosynthetic genes to obtain it in the culture medium.
- FIG. 1 The chemical structures and theoretical masses of leupeptin (N-acetyl-leucyl-N- ⁇ (5-[(diaminomethylidene)amino]-1-oxopentane-2-yl ⁇ -leucinamide) and other related molecules are shown.
- the basic structural features of two groups of SPA's are shown.
- the acetyl protecting group characteristic of group I is shown in green.
- the ureido group and its antisense amino acid characteristic of group II are shown in green and blue respectively.
- FIG. 4 Genomic mining with EvoMining for the identification of leupeptin BGC is shown.
- the phylogenetic tree produced by EvoMining using an ASL enzyme from the central metabolism of Actinobacteria is shown.
- the cyade in which the ASL2 of S. roseus ATCC 31245 is found is highlighted in a frame.
- Other divergent ASLs involved in the synthesis of eight known NPs appear to be phylogenetically close within that subclade.
- roseus ATCC 31245 were compared to authentic standards obtained from commercial suppliers. Fractions from fermentations, whose retention times coincided with those of the standards, were collected and analyzed using MS and inhibition assays ( Figure 3). In this way, it was possible to confirm that S. roseus ATCC 31245 produces leupeptin.
- Leupeptin is synthesized by an NRPS system similar to that of flavopeptin, so this assembly line must have an acyl transferase domain at the N-terminus, three adenylation domains, two fusion domains, a reductase domain at the the C-terminus and three peptide-carry domains (PCPs).
- ASL condenses succinate and arginine through an amide bond in the guanidine group of arginine in a reversible reaction during arginine biosynthesis (Sampaleanu et al. 2001).
- EvoMining provided a phylogenetic tree with paralogous ASL enzymes from central metabolism and the version of the putative enzyme belonging to specialized metabolism in different and well-defined branches (Figure 4).
- the topology of this tree is canonical, placing the central enzymes in the core of the tree and the divergent enzymes in the outer branches.
- roseus ATCC 31245 genome was identified as having two ASLs, and it was proposed that one of them was dedicated to arginine biosynthesis; while the second copy, ASL2, being in the penultimate branch and presenting a characteristic genomic context of secondary metabolite biosynthetic genes, was proposed as recruited by a BGC of seven genes that has not been linked to any natural product to date.
- the cyad to which ASL2 belongs is a well-defined cyad and includes several homologues involved in the synthesis of known natural products, including kirromycin (Weber et al. 2008), malacidin (Lam and Crawford 2018), totopensamide (Chen et al. .2017), lobophorin (L ⁇ et al.
- the method further involves inducing the expression and biosynthesis of leupeptin by culturing said microbial strain transformed with said expression vector which may be the pESAC_810 vector, wherein the method further involves culturing the microbial strain transformed with said vector and then recover the leupeptin fraction and purify it by conventional methods known in the technical field of the present invention.
- the method of the invention also involves expressing this cluster heterologously in a strain of E. coli transformed with the vector containing said cluster, for example the vector pESAC_810, to induce leupeptin biosynthesis in cultures of fermentation and purify it by conventional methods known in the technical field of the present invention.
- Genomic DNA of S. roseus ATCC 31245 was obtained by phenol-chloroform extractions, using widely known methods. Genomic DNA was used to obtain pair-end libraries with inserts between 1000 and 1600 nucleotides. These libraries were sequenced on a MiSeq equipment at the Langebio genomic sequencing unit (Irapuato, Mexico). Reads were quality analyzed using FastQC (http://www.bioinformatics.bbsrc.ac.uk/projects/fastqc) and reads were filtered using trimmomatic [Bolger, 2014] with a quality cutoff of 28 or more and a minimum size of 200 for those with 250 bases.
- FastQC http://www.bioinformatics.bbsrc.ac.uk/projects/fastqc
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
La presente invención describe el descubrimiento de los genes que dirigen la ruta biosintética de la leupeptina, un potente inhibidor de proteasas del tipo péptido aldehídico pequeño (SPA por sus siglas en ingles). La predicción de los genes que dirigen la biosíntesis de leupeptina se llevó a cabo gracias a EvoMining, una tubería bioinformática para minería genómica de productos naturales basada en parámetros evolutivos, y fue confirmado mediante el uso de técnicas de biología molecular como mutagénesis insercional y comparación de perfiles metabolómicos entre cepas silvestre (productora de leupeptina) y muíante (no productora de leupeptina). Los genes biosintéticos contenidos en el clúster aislado conforme a la presente invención codificantes para leupeptina, se expresaron heterólogamente en E. coli, logrando así la producción de leupeptina.
Description
Sistema genético para la biosíntesis de leupeptina y su uso en sistemas heterólogos de producción
Campo de la invención:
La presente invención pertenece al campo de la ingeniería genética y se refiere a la identificación del sistema genético y caracterización de la ruta biosintética del inhibidor de proteasas leupeptina, para ser utilizado en sistemas biológicos heterólogos de producción (p. ej., Escherichia coli, Bacillus subtilis o Saccharomyces cerevisiae entre otros) a escala industrial de forma independiente o como auxiliar en un sistema de expresión de proteínas de interés industrial.
Antecedentes de la invención:
Los productos naturales (NPs) son moléculas orgánicas de diverso peso molecular que representan una familia muy amplia y heterogénea de entidades químicas con múltiples funciones biológicas. Estas moléculas pueden ser producidas por bacterias, hongos, plantas y animales. Los NPs son una fuente consistente de fármacos, de los cuales se conocen alrededor de 20,000 de origen microbiano y se estima que existen alrededor de 300,000. Históricamente, los NP se han simplificado para su estudio en: i) terpenoides y esferoides (por ejemplo, el taxol); ¡i) alcaloides (por ejemplo la morfina); iii) sustancias derivadas de ácidos grasos (por ejemplo la prostaglandina Ei que es un eicosanoide); iv) policétidos (como la eritromicina); v) péptidos no ribosomales (como la penicilina) o péptidos aldehidos pequeños (como la leupeptina) y vi) cofactores enzimáticos (como la cobaíamina). En bacterias y hongos, los NPs son metabolites que por lo general se derivan del metabolismo especializado, también conocido como metabolismo secundario, cuya producción no es esencial para el mantenimiento celular, pero sí para su adaptación y sobrevivencia.
Las implicaciones evolutivas de los NPs, revelan relaciones complejas en los distintos nichos, ya que las características químicas y estructurales de estos metabolites pueden actuar a niveles muy particulares de interacción entre especies, lo que repercute en su distribución, ya que este tipo de metabolites pueden no estar conservados incluso entre miembros de una misma especie, y ser específicos a nivel de cepas o variantes de la misma especie. Así mismo, el carácter evolutivo de estas moléculas también implica que se producen bajo condiciones específicas que difícilmente pueden ser recreadas en laboratorio.
El advenimiento de las tecnologías de secuenciación masiva ha dado la oportunidad de conocer el genoma de cientos de miles de genomas de bacterias, donde para su estudio, se originó el campo de la minería genómica. La minería genómica se define como el análisis computational de datos de secuencias nucleotídicas basado en la comparación y reconocimiento de patrones conservados. Bajo esta definición, cualquier método computational que implique la búsqueda y predicción de propiedades fisiológicas o metabólicas se considera minería genómica. El enfoque de minería genómica a NPs, se refiere específicamente a la identificación de clústeres de genes biosintéticos de NPs. Este repertorio puede incluir compuestos cuyas estructuras sean conocidas, o compuestos putativos cuya presencia es inferida solo en base al repertorio genético. La minería genómica además puede ayudar a entender las reacciones enzimáticas responsables en la síntesis de estas moléculas; así como predecir los sustratos y productos cuando se trate de enzimas no caracterizadas. En conjunto, la minería genómica puede apoyarse en disciplinas como la ingeniería metabólica para mudar de sistema biológico estos sistemas genéticos, y producir estos metabolites de manera eficiente y a bajo costo; crear estrategias o métodos para evaluar su bioactividad contra patógenos y elucidar si los nuevos metabolites tienen alguna relevancia para la biotecnología o la medicina, y/o modificarlos para mejorar su eficiencia.
En ese sentido, un tipo específico de inhibidores de proteasas conocidos como péptidos aldehídicos pequeños (SPA), como por ejemplo la leupeptina, la antipaína y la quimostatina, han cobrado una gran relevancia desde hace más de una década, pues son utilizados en la industria y laboratorios de investigación científica como parte del proceso de purificación de proteínas, en donde la proteólisis es un proceso no deseado. La inhibición de proteasas en la industria y laboratorios representa el mercado más grande para estos compuestos, encabezados por leupeptina y antipaína. Si bien no se cuenta con datos específicos al respecto, prácticamente todo proceso de producción de proteínas heterólogas, algunas de altísimo valor agregado como las vacunas de última generación, involucra el uso de leupeptina o de alguno de sus análogos.
Adicionalmente a su importancia en este rubro, debido a que las proteasas forman parte fundamental en procesos de señalización celular, han sido históricamente consideradas blancos prometedores para el desarrollo de terapias para enfermedades donde la proteólisis es relevante. En este contexto, los inhibidores de proteasas, entre ellos los pertenecientes a la amplia familia de los péptidos
pequeños aldehídicos (SPAs), como la leupeptina, están siendo utilizados extensivamente para su desarrollo como agentes terapéuticos [Hines, 2008; Kisselev, 2012], La mayoría de estas enfermedades están asociadas a defectos en el funcionamiento del proteosoma, un complejo proteico dedicado a la degradación de proteínas endógenas. Otras enfermedades están relacionadas a defectos en el funcionamiento de las calpaínas (proteasas hiperactivas en condiciones como la enfermedad de Alzheimer y la formación de cataratas); y las catepsinas, estás últimas han sido ligadas al cáncer y enfermedades inflamatorias [Hines, 2008; Kisselev, 2012], Las proteasas son además de vital importancia para diversos agentes patogénicos durante los procesos infecciosos, por lo que se ha explorado el uso de inhibidores de proteasas para combatir el virus de inmunodeficiencia humana, citomegalovirus, y muy recientemente, el SARS-CoV-2 [Kaspari, 2008; Stefanelli, 1995], Los SPAs, en consecuencia, son comercializados y se obtienen a través de fermentaciones bacterianas del género Streptomyces, siendo estos productos mucho más ampliamente usados y de mayor valor que las pocas variantes sintéticas que se han podido obtener. Los primeros productos naturales con actividad antiproteolítica pertenecientes a la familia de péptidos pequeños aldehídicos fueron descubiertos en 1969, en extractos fermentativos de bacterias pertenecientes al género Streptomyces, que a su vez perteneciente al phylum Actinobacteria. Su descubrimiento fue el resultado del uso de métodos tradicionales de screening o tamizado por actividad, seguido de aislamiento, purificación y caracterización química [Aoyagi, 1969], Compuestos pertenecientes a esta familia también se han detectado en otros miembros de las Actinobacterias, así como en otras bacterias Gram positivas de los géneros Bacillus y Staphylococcus, cianobacterias y en hongos del grupo Ascomycota. Además de su naturaleza peptídica y su bajo peso molecular, el cual ronda entre los 300 y 900 Daltones, los SPAs comparten otras características químicas, como son: (i) la falta de grupos N terminal, debido a que se encuentran “protegidos” con grupos acilo, de uno o más carbonos o con grupos ureido-aminoácido, dando lugar a un extremo acilado o aminoacilado el cual presenta un grupo carboxílico terminal; y (¡i) la presencia de un grupo aldehídico terminal derivado de la modificación del carboxilo terminal de la cadena peptídica, mediante un proceso reductivo, el cual es responsable de la actividad biológica de la molécula. El extremo aldehídico interactúa con los sitios activos de las proteasas formado complejos hemiacetales o hemitioacetales con los residuos catalíticos, frecuentemente serinas o cisternas, impidiendo su funcionamiento (figura 1) [Brayer, 1979; Wlodawer, 2001 ; Bullock, 1996; Hines, 2008],
Con base en las características de sus grupos funcionales, los SPAs pueden dividirse en dos subclases: (i) aquellos con un grupo terminal protegido por un grupo acilo, dentro de los que se encuentran flavopeptina, tirostatina, tiropeptina, nerfilina, estrepina, leupeptina, bacitrocina, tiolestatina y acetil-leucina-arginal; y (¡i) aquellos en los que el grupo N-terminal se une a un grupo ureido que a su vez está unido a un aminoácido por medio de un enlace amídico, tales como por ejemplo quimostatina (o chimostatina), MAPI, GE20372, antipaína y elastatinal. Esta configuración permite alterar el orden de la cadena peptídica, donde el grupo ureido actúa como un adaptador que cambia el orden del péptido, de N-terminal hacia C-terminal por C-terminal hacia C-terminal, dando como resultado péptidos con características químicas y biológicas distintas a los péptidos ribosomales tradicionales (Figura 1). De igual manera, el tamaño de la cadena peptídica puede variar de dos a seis residuos, mientras que los grupos acilo pueden ir de dos hasta nueve átomos de carbono. Partiendo de los SPAs cuyas estructuras han sido experimentalmente determinadas, se reconocen a los residuos o aminoácidos arginina, fenilalanina, tirosina, leucina, isoleucina, valina y glutamina, formando las cadenas peptídicas. En la mayoría de los SPAs el grupo aldehídico se deriva del grupo carboxílico de fenilalaninas, tirosinas o argininas, mientras que el aminoácido siguiente es comúnmente alguno del grupo de los de cadena ramificada, ya sea isoleucina, leucina o valina.
Fuera de esta clasificación, se han reportado algunas excepciones, por ejemplo el caso de elastatina, el cual está formado por ¡sovaleril-ureido-arginina-glutamina-alanilal; así como dos de los SPAs más pequeños que se conocen a la fecha, las bacitrocinas y la tiolestatina, ambos inhibidores de cisteína/serina proteasas, producidas por bacterias del género Bacillus [Kamiyama, 1994; Murao, 1985],
Como antes se mencionó, probablemente la leupeptina sea el inhibidor de proteasas con más alto valor comercial en la actualidad. La leupeptina, es un SPA cuya molécula se compone de tres aminoácidos y una cadena acil que puede ser un grupo acetil (Leupeptina I o leupeptina PR-LL) o propionil (Leupeptina II o leupeptina Ac-LL) unido al residuo N-terminal (Leu). En el extremo C- terminal de la molécula, el grupo C-terminal es químicamente diferente al de la mayoría de los péptidos y proteínas ya que tiene un grupo aldehido en lugar de un grupo carboxilo (Figura 1). En principio, la leupeptina se ha purificado de cultivos de varias cepas de Streptomyces basándose en su actividad antiplasmina, donde a partir de estos extractos se determinaron las estructuras de las
dos variantes conocidas. A pesar de que la variante PR-LL es activa como inhibidor de proteasas y está disponible comercialmente, la variante Ac-LL es la más usada. Sus análogos son usualmente aquellos en los que uno o ambos residuos de leucina se reemplazan por residuos isoleucina o valina. Ya se han sintetizado químicamente análogos de leupeptina R-L-leucil-L-leucil-L-argininal con sustituyentes variables en n-terminal, usando N-alfa-tert-butil-oxicarbonil-NG-benziloxicarbonil-L- arginina-delta-lactam como el material de inicio.
La leupeptina, posee gran relevancia no solo a sus blancos de acción, sino también gracias a su mecanismo de acción, ya que actúa como inhibidor competitivo de proteasas, y es reversible. Entre sus blancos mayormente caracterizados se encuentran las catepsinas B, H, L y S; calpaína [Kieran & Greensmith, 2004], calikreína, papaína, plasmina, tripsina y a proteasas similares a tripsina. En general, las serin-proteasas, cisteín-proteasas y treonin-proteasas son sus moléculas blanco. No tiene efecto o es muy bajo sobre la catepsina A y D y sobre la quimotripsina. Las soluciones stock de leupeptina son estables a +4°C, máximo por 7 días, y por 6 meses si se almacenan a -20°C. Las soluciones de trabajo son estables solo algunas horas.
De forma concreta, la leupeptina se usa o se ha usado:
- Como agente terapéutico para modular la reperfusión intestinal que ocurre en casos de choque por quemadura en la mucosa intestinal y que compromete su integridad, evitando también que las bacterias entéricas crucen la pared luminal del intestino y lleguen a infectar otras partes del organismo [Xia ZF, 1995],
- La leupeptina puede inhibir á la endoproteasa de la acrosina del espermatozoide de mamíferos, por lo que se puede utilizar como anticonceptivo, aunque también se ha encontrado que 2 derivados de la leupeptina (R = trifluoroacetil, R = tert-butiloxicarbonil) pueden ser más potentes [Borin G, 1981],
- La leupeptina también ha mostrado prevenir la disfunción contráctil del diafragma, que puede ocurrir cuando se aplica la ventilación mecánica controlada ya que ocurre elevada proteólisis y atrofia [Maes K, 2007],
- Otra de las aplicaciones más comunes de la leupeptina es durante experimentos enzimáticos in vitro en laboratorios de ciencia básica y aplicada de todo el mundo. Como parte de diversos protocolos experimentales, la lisis celular provoca la liberación de proteasas que, de no ser inactivadas, destruirían cualquier producto de la reacción en estudio, lo cual puede impedir la correcta interpretación del experimento.
Desde el descubrimiento de la leupeptina a finales de los 60's [Aoyagi, 1969; Kondo, 1969], un gran número de estudios han descrito el aislamiento de nuevos SPAs, así como la identificación taxonómica de los microorganismos que los producen, sus métodos de fermentación y purificación, sus estructuras químicas y su actividad biológica (Tabla 1). Sin embargo, a pesar de la enorme importancia de estos compuestos, se sabe muy poco sobre su biosíntesis.
Los primeros esfuerzos de caracterización de la biosíntesis de leupeptina se basaron en el fraccionamiento y purificación de extractos proteicos de Streptomyces roseus, el organismo productor de leupeptina, y el uso de estos extractos para ensayos enzimáticos in vitro. Estos estudios sugirieron que una sintasa de péptidos no ribosomales, ahora conocidas como NRPSs, así como una reductasa, estarían involucradas en la síntesis de este compuesto. Estos estudios determinaron la posible incorporación de L-Leucina, D-Leucina y acetil-CoA como precursores [Suzukake, 1980], También se reportó el uso de ATP, así como que el intermediario acil-Leu-Leu era liberado de la presunta sintetasa, responsable de su formación, lo cual es inusual durante el proceso de ensamblado de un péptido por las NRPS. Recientemente, la vía de síntesis de la flavopeptina, un péptido aldehídico con actividad inhibitoria de proteasas ha sido descrita [Chen, 2013], La flavopeptina es sintetizada por una NRPS cuyos dominios están organizados de manera colíneal, es decir de acuerdo con el orden en el que los precursores son incorporados en la estructura final. La sintetasa de la flavopeptina incluye un dominio de transferencia de grupos acilo que es responsable de la incorporación de la acilación del sexto aminoácido del péptido (N-acil terminal). La sintetasa incluye además dominios de adenilación, proteínas acarreadoras de peptidiles, dominios de condensación (para la sucesiva incorporación de seis aminoácidos precursores, lle-GIn-lle-GIn-Val/Leu-Phe), un dominio de epimerización y finalmente un dominio de reductasa (figura 2).
Como se ha mencionado anteriormente, la mayoría de los inhibidores de proteasas en el mercado son productos naturales de origen microbiano, específicamente SPAs producidos por especies del género Streptomyces. Por ejemplo, la leupeptina se obtiene de S. roseus, la antipaína de S. mauvecolory la quimostatina de S. nigrescens, aunque la identidad específica de las cepas usadas por la industria no está claramente definida. En general, el uso de estos compuestos consiste en su adición durante el proceso de extracción proteica, lo cual implica que el compuesto debe ser producido por fermentación y purificado para su posterior uso.
Tabla 1 : SPAs y algunas de sus características
Más aún, se sabe que los productos obtenidos por fermentación suelen ser mezclas de especies moleculares relacionadas, y que éstas muestran una mejor eficiencia biológica que productos sintéticos 100% puros. Una alternativa económicamente favorable para la realización de este proceso es la producción de inhibidores de proteasas simultáneamente a la producción de proteínas de valor agregado. Esto es logrado a través de la expresión heteróloga de la vía biosintética de un inhibidor de proteasas en un organismo que a su vez produzca la proteína de interés. Sin embargo, esto no ha
sido reportado a la fecha, debido muy probablemente al desconocimiento de las bases genéticas que dirigen la síntesis de la mayoría de los SPAs, así como a las dificultades encontradas en la expresión heteróloga de NRPS codificadas por grandes regiones genéticas (> 20 Kbp a juzgar por la estructura química de tres o más aminoácidos). Para el desarrollo de un sistema con esas características es por lo tanto necesario conocerlas bases genéticas de la biosíntesis del inhibidor que se pretende expresar y la construcción de sistemas genéticos que permitan la expresión heteróloga, de manera controlada, de dichos genes al interior de la línea celular usada para fines biotecnológicos.
De lo anterior se derivan los siguientes problemas que impiden dicho desarrollo: (i) el desconocimiento prácticamente total de las bases genéticas de la biosíntesis de los inhibidores de proteasas del tipo SPAs, incluyendo leupeptina, antipaína y quimostatina, y (¡i) la expresión de sistemas biosintéticos de gran tamaño (>20 Kb).
Entre las patentes que se refieren a obtención y usos de leupeptina podemos mencionar la patente europea EP1318198, que describe un proceso para producir un péptido recombinante al medio de cultivo celular ia cual involucra la adición de un inhibidor de quimotripsina.
Por su parte, la patente US4066507 describe un proceso para producir L-leupeptinas, que consiste en el cultivo de una cepa de Streptomyces en un medio con condiciones de pH de 5.0 a 7.0, observándose un incremento cuando se adiciona al medio de 0.5 a 1 .25% (p/v) de L-leucina y de L- arginina (como hidrocloruro) y glicina, y luego se incrementa cuando se adiciona al medio de 0.05 a 0.3% (p/v) de un extracto de levadura, caseína hidrolizada y ácidos ribonucleicos, además de los mencionados aminoácidos. Para la separación eficiente de la L-leupeptina y quedar con una pureza aceptable, se requiere del uso de una resina adsorbente y condiciones controladas.
La solicitud de patente US20110183915 describe tratamientos contra células cancerosas utilizando una molécula pequeña (leupeptina) que causan necrosis en estas pero que no afectan a las normales. La patente JPS5350393 se refiere a un método para obtener L-leupeptina con actividad antiplasmina mediante el cultivo de Streptomyces sp. en un medio acídico con nutrientes específicos, seguido por la extracción del medio con una resina porosa no iónica.
Finalmente, la patente US3867364 describe el proceso para sintetizar químicamente a la leupeptina y sus análogos.
Con base en lo anterior, y como una forma de superar los problemas expuestos en el estado de la técnica, la presente invención aporta todas las bases genéticas necesarias para la biosíntesis de leupeptina, así como la expresión heteróloga de los genes biosintéticos para obtenerla en el medio de cultivo.
Breve descripción de las figuras.
Figura 1. Se muestran las estructuras químicas y masas teóricas de la leupeptina (N-acetil-leucil-N- {(5-[(diaminometilideno)amino]-1-oxopentano-2-il}-leucinamida) y otras moléculas relacionadas. Se muestran las características estructurales básicas de dos grupos de SPA's. El grupo acetilo protector característico del grupo I se muestra en verde. El grupo ureido y su aminoácido en contrasentido característicos del grupo II se muestran en verde y azul respectivamente.
Figura 2. Se muestra la organización del clústerde genes que dirigen la síntesis de flavopeptina y su estructura química.
Figura 3. Se muestran análisis de HPLC-MS que confirman la producción de leupeptina por la cepa S. roseus ATCC 31245.
Figura 4. Se muestra la minería genómica con EvoMining para la identificación del BGC de leupeptina. Se muestra el árbol filogenético que arroja EvoMining utilizando una enzima ASL del metabolismo central de Actinobacterias. El ciado en el que se encuentra la ASL2 de S. roseus ATCC 31245 se resalta en un marco. Otras ASL divergentes involucradas en la síntesis de ocho NP conocidas aparecen como filogenéticamente cercanas dentro de ese subclado.
Figura 5. Se muestra el BGC de Leupeptina propuesto por EvoMining y CORASON.
Figura 6. Se muestran BGC's de Actinobacterias relacionadas evolutivamente con el BGC de leupeptina de S. roseus ATCC 31245. El análisis CORASON se realizó utilizando los genes argininosuccinato liasa, cisteína sintasa y treonina quinasa que se especula están implicados en la biosíntesis de DABA. Entre los BGC's identificados con estas tres enzimas se encuentran los siguientes: A) loboforina, B) leupeptina, C) friulimicina, D) pacidamicina y E) napsamicina.
Figura 7. Se muestra la vía biosintética general propuesta de leupeptina.
Figura 8. Se muestra el análisis de HPLC-MS de leupeptina producida por E. cotí DHLeup que expresa la construcción pESAC_810 de la presente invención. Se observa la comparación del perfil cromatográfico de leupeptina producida por E. cotí DHLeup y su análisis MS/MS del pico que eluye
alrededor de los 28.5 min a TA. El metabolito aislado, muestra una masa de 427 (m/z), y fragmentos MS/MS derivados de 367 y 409 (m/z), que concuerdan con el estándar de leupeptina.
Descripción detallada de la invención.
La presente invención se refiere a la identificación de genes que dirigen la biosíntesis del SPA leupeptina; así mismo comprende proveer un sistema heterólogo capaz de dirigir la biosíntesis del SPA leupeptina con actividad inhibitoria sobre proteasas.
Como se ha mencionado, los primeros esfuerzos de caracterización de la biosíntesis de leupeptina se basaron en la identificación de fracciones con capacidad de inhibir la actividad de proteasas. Dichas fracciones fueron obtenidas mediante el fraccionamiento de sobrenadantes provenientes del cultivo de la cepa Streptomyces roseus ATCC 31245 mediante el uso de HPLC. Estos estudios sugirieron que una sintasa de péptidos no ribosomales (NRPS, por sus siglas en inglés), así como una reductasa, estarían involucradas en la vía de síntesis de este compuesto. Estos estudios determinaron la incorporación de L-Leucina, D-Leucina y acetil-CoA como precursores [Suzukake, 1980], También se reportó que el intermediario acil-Leu-Leu era liberado de la presunta sintetasa, responsable de su formación, lo cual es inusual durante el proceso de ensamblado de un péptido por las NRPS.
La caracterización biosintética de la leupeptina se realizó mediante estudios de minería genómica utilizando como base el conocimiento previamente obtenido sobre la síntesis del SPA livipeptina, una molécula con características biocinéticas similares. A través de una revisión de la literatura referente al descubrimiento y estudios iniciales de organismos productores de SPAs, identificamos y adquirimos la cepa productora de leupeptina S. roseus ATCC 31245. Con base en los reportes originales del descubrimiento de los SPAs, diseñamos distintos medios de producción que facilitaran la biosíntesis de SPAs para posteriormente cultivar la cepa S. roseus ATCC 31245. Los sobrenadantes de estos cultivos fueron concentrados y la fracción acuosa de estos extractos fue analizada por HPLC. Los perfiles de HPLC de las fermentaciones con S. roseus ATCC 31245 fueron comparados con estándares auténticos obtenidos de proveedores comerciales. Las fracciones provenientes de fermentaciones, cuyos tiempos de retención coincidieron con los de los estándares, fueron colectadas y analizadas utilizando MS y ensayos de inhibición (Figura 3). De este modo se logró confirmar que S. roseus ATCC 31245 produce leupeptina.
Una vez que la producción de leupeptina fue demostrada, el genoma de S. roseus ATCC 31245 fue secuenciado utilizando la plataforma MiSEQ de ¡Ilumina (pair end 2 X 250 y 2 X 300). El genoma obtenido fue ensamblado y anotado para su posterior análisis según procedimientos internos del laboratorio. Las características generales del genoma se muestran en la Tabla 2.
Para la identificación de los genes que dirigen la síntesis de leupeptina, la minería genómica se enfocó en la búsqueda de secuencias proteicas homologas a las de las enzimas que participan en las vías biosintéticas de livipeptina y flavopeptina, así como datos bioquímicos obtenidos durante la temprana caracterización de la vía biosintética de leupeptina. Cabe mencionar que estos últimos estudios fueron realizados cuando las herramientas de análisis genético (secuenciación y clonación de DNA) aun no eran de uso común.
Estos estudios revelaron cuatro datos clave:
(i) Entre los precursores de la biosíntesis de leupeptina están leucina, arginina y acetato,
(ii) Una sintetasa dependiente de ATP es responsable de la síntesis de acetil-leucina-leucina;
(iii) Este intermediario es liberado de la sintetasa antes de la condensación con el grupo arginal, y finalmente,
(iv) El complejo responsable de la formación del ácido leupeptídico (leupeptina con un grupo carboxílico en lugar de uno aldehídico) tiene una masa de 320 KDa [Suzukake, 1979, 1980 y 1981],
Con base en estos datos se postularon tres hipótesis:
A. La leupeptina es producida por un sistema que incluía una L/F transferasa (LFT), como en el caso de la síntesis de livipeptina en S. lividans 66.
B. La leupeptina es sintetizada por un sistema de NRPS similar al de flavopeptina por lo que esta línea de ensamblado debe contar con un dominio acil transferasa en el extremo N-terminal, tres dominios de adenilación, dos de condensación, un dominio de reductasa en el extremo C- terminal y tres dominios de acarreo de péptidos (PCP).
C. De acuerdo con los experimentos reportados anteriormente por Suzukake y colaboradores, la leupeptina debe ser sintetizada por un grupo de genes que incluye una NRPS con un dominio de acetilación, dos dominios de adenilación, dos de acarreamiento de péptidos, uno de condensación y uno de tioesterasa acompañados de un gen que codifica alguna enzima que sea capaz de procesar un dipéptido con una arginina con la posibilidad de formar un tripéptido acilado. Finalmente, este clúster de genes debe incluir una reductasa que modifique la arginina C terminal para formar el grupo aldehido.
Para determinar si alguna de estas hipótesis era correcta, se minó el genoma de S. roseus ATCC 31245 (número de acceso al genoma NZ_LFML01000000), utilizando el software EvoMining (Sélem- Mojica et al. 2019), el cual complementa el análisis, con BGCs muy bien anotados y caracterizados experimentalmente de la base de datos de MiBig (Satria A Kautsar et al. 2020). Estos análisis identificaron un evento de expansión y reclutamiento de la enzima argininosuccinato liasa (ASL), enzima que inmediatamente se relacionó con la capacidad de procesar un dipéptido con arginina, que se propuso como una actividad enzimática clave durante el ensamblaje molecular de la leupeptina en la hipótesis C. La ASL condensa succinato y arginina a través de un enlace amídico en el grupo guanidina de la arginina en una reacción reversible durante la biosíntesis de arginina (Sampaleanu et al. 2001). Como resultado, EvoMining proporcionó un árbol filogenético con enzimas parálogas de ASL del metabolismo central y la versión de la presunta enzima perteneciente al metabolismo especializado en ramas diferentes y bien definidas (Figura 4). La topología de este árbol es canónica, ubicando las enzimas centrales en el núcleo del árbol y las enzimas divergentes en las ramas externas. Se identificó que el genoma de S. roseus ATCC 31245 posee dos ASL, y se propuso que una de ellas estaba dedicada a la biosíntesis de arginina; mientras que la segunda copia, ASL2, al encontrarse en la penúltima rama y presentar un contexto genómico característico de genes biosintéticos de metabolites secundarios, se propuso como reclutado por un BGC de siete genes que no ha sido vinculado a ningún producto natural hasta el momento. El ciado al que pertenece la ASL2, es un ciado bien definido e incluye varios homólogos involucrados en la síntesis de productos naturales conocidos, incluida la kirromicina (Weber et al.2008), malacidina (Lam y Crawford 2018), totopensamida (Chen et al.2017), loboforina (L¡ et al.2013), kasumigamida (Ishida y Murakami 2000), vanchrobactina (Balado et al. 2006), luminaolida (Kitamura et al. 2009) y escitoficina (Paterson et al. 1997). Con base en estas observaciones se postuló que este locus es responsable de la síntesis de leupeptina. Es interesante notar que la rama divergente se divide se divide a su vez en dos, donde la más grande incluye la mayoría de los hits de MiBIG (de color azul), y la más pequeña incluye a la ASL2 de S. roseus ATCC 31245. Es sumamente interesante notar entonces que la ASL es una enzima muy versátil, que ha sido reclutada en muchos sistemas bioquímicos relacionados con la síntesis de metabolites secundarios.
Después de una revisión exhaustiva de la vecindad de este gen ASL, conforme a la presente invención identificamos varios genes NRPS (leuP1 , leuP6, 7, 8, 9: Sro1471 , Sro1476-79), así como genes que codifican una treonina quinasa (leuP3, Sro1473), una cisteína sintasa (leuP4, Sro1474) y una proteína MbtH (leuP5, Sro1475). Por lo tanto, definimos estos elementos como presunto BGC para la síntesis de leupeptina. La NRPS1 (LeuP1) contiene un dominio de condensación N-terminal (C1), seguido de un dominio de adenilación, que se predice reconoce una L-treonina (A1); un dominio acarreador de peptidilos (PCP1); un segundo dominio de condensación (C2); un segundo dominio de adenilación que se predice une una L-serina (A2); un segundo dominio acarreador de peptidilos (PCP2); y un dominio de tioesterasa (TE). El NRPS2 (LeuP6) solo incluye un dominio de condensación N-terminal (C) (Figura 5). NRPS3 y NRPS4 (LeuP7 y LeuP8) codifican la misma conformación: un dominio de condensación N-terminal (C); seguido de un dominio de adenilación (A); y un dominio de tioesterasa (TE). Si bien está claro que el dominio de adenilación de LeuP7 y LeuP9 pueden unirse a L-isoleucina y ornitina respectivamente, no es posible predecir adecuadamente la especificidad del dominio A para LeuP8 (Figura 5).
Este BGC también se exploró utilizando el software CORASON (Navarro-Muñoz et al. 2020). Con este análisis se identificaron varias vecindades genómicas de BGCs relacionados, en las que se conservan el casete de genes biosintéticos de S. roseus ATCC 31245. Para este análisis, concatenamos las secuencias de aminoácidos de tres enzimas conservadas: argininosuccinato liasa,
treonin cinasa y cisteína sintasa, lo que arrojó como resultado más de 200 BGC con estas mismas enzimas, entre los que se encuentran los BGCs responsables de la síntesis de la loboforina, napsamicina, pacidamicina y friulimicina, aunque muestran diferencias más allá de estos genes (Figura 6). Interesantemente, se ha demostrado que los homólogos de argininosuccinato liasa y cisteína sintasa son esenciales para la síntesis de ácido N-metil 2,3-diaminobutírico (DABA), durante el ensamblaje de pacidamicina y friulimicina (Müller et al. 2007; Zhang et al. 2011). Aunque el papel del homólogo de la treonin cinasa no está claro, estos tres genes podrían considerarse como un subcluster dentro de este BGC que proporciona DABA como precursor para la síntesis de leupeptina (Figura 7). Adicionalmente, como resultado de este análisis, también fue posible identificar genomas que poseen el BGC de leupeptina y que no habían sido asociados a ningún metabolite, lo que abre una oportunidad para encontrar congéneres químicos (Figura 6).
Para confirmar que el clúster de longitud de 22.4 Kb y 9 genes (Sro1471-75) está directamente involucrado en la biosíntesis de leupeptina, optamos por una estrategia de mutagénesis de inserción transitoria, utilizando un plásmido suicida con un fragmento de 640 pb homólogo al gen leuP1 y seleccionando una cepa deficiente en este gen, mediante su resistencia a Kanamicina. Después del análisis de los extractos de fermentación de S. roseus ATCC 31245 y la cepa mutante seleccionada, se identificó por HPLC un compuesto diferencial en el RT de 28.5 min (ausente en la cepa mutante). La identidad de este compuesto se confirmó como leupeptina, utilizando el estándar auténtico y mediante espectrometría de masas, que arrojó una masa de 427.3 (m/z). Adicionalmente, se comprobó por análisis MS/MS el patrón de fragmentación de leupeptina, identificando como fragmentos principales MS2 de 367.3 y 409.3 (m/z). Para establecer aún más un vínculo entre la biosíntesis de leupeptina y el locus postulado que incluye los genes leuP1-9 (Sro1471-75), se construyó una biblioteca genómica utilizando el cósmido pESAC-13A (Tocchetti et al. 2018) y el genoma de S. roseus ATCC 31245. La construcción pESAC_810 de la invención que lleva los genes leuP1-9, denominada DHLeup, se expresó y utilizó para experimentos de fermentación comparativos. El análisis mediante LC-MS de los cultivos de E. cali DH10B expresando el pESAC_810 de la invención también reveló una masa de 427.3 (m/z) en el mismo tiempo de retención y con el mismo patrón de fragmentación que el estándar de leupeptina (Figura 8).
Actualmente se necesitan más experimentos para demostrar cuantas NRPS's están involucrados en la biosíntesis de leupeptina, y si en dicha síntesis son necesarios bloques de DABA. No obstante, la identificación del clúster biosintético de leupeptina conforme a la presente invención, permite su expresión heteróloga en diferentes sistemas de expresión, ya sea para la producción del metabolite o para el desarrollo de hospederos para la expresión de proteínas en las que la leupeptina se produzca in situ bajo el control de un inductor manipuladle. El objeto principal de la invención es proveer de los elementos de la ruta biosintética para leupeptina para lograr su expresión heteróloga. La presente invención provee del método para la biosíntesis heteróloga del SPA leupeptina que concretamente implica la obtención de una cepa microbiana transformada con un vector de expresión que posee una secuencia de DNA (SEQ.ID.No. 1) que codifica para: a) Una NRPS1 (LeuP1) que contiene: un dominio de condensación N-terminal (C1), seguido de un dominio de adenilación, que se predice reconoce una L-treonina (A1); un dominio acarreador de peptidilos (PCP1); un segundo dominio de condensación (C2); un segundo dominio de adenilación que se predice une una L-serina (A2); un segundo dominio acarreador de peptidilos (PCP2); y un dominio de tioesterasa (TE), b) Una NRPS2 (LeuP6) que contiene un dominio de condensación N-terminal (C), c) Una NRPS3 (LeuP7) que contiene un dominio de condensación N-terminal (C); seguido de un dominio de adenilación (A) que se presume reconoce una L-isoleucina; y un dominio de tioesterasa (TE), d) Una NRPS4 (LeuP8) que contiene un dominio de condensación N-terminal (C); seguido de un dominio de adenilación con afinidad desconocida (A); y un dominio de tioesterasa (TE), e) Una NRPS5 (LeuP9) que contiene un dominio de condensación N-terminal (C); seguido de un dominio de adenilación (A) que se presume reconoce una ornitina; y un dominio de tioesterasa (TE), f) Una enzima argininosuccinato liasa divergente (Leup2), g) Una enzima treonin cinasa (Leup3), h) Una enzima sintasa de cisteína (Leup4), y i) Una proteína MbtH (Leup5).
El método además implica inducir la expresión y la biosíntesis de leupeptina mediante el cultivo de dicha cepa microbiana transformada con dicho vector de expresión que puede ser el vector pESAC_810, donde el método además implica cultivar la cepa microbiana transformada con dicho
vector y luego recuperar la fracción de leupeptina y purificarla por métodos convencionales conocidos en el campo técnico de la presente invención. En una de sus modalidades, el método de la invención además implica expresar este clúster de forma heteróloga en una cepa de E. coli transformada con el vector que contiene dicho clúster, por ejemplo el vector pESAC_810, para inducir la biosíntesis de leupeptina en cultivos de fermentación y purificarla por métodos convencionales conocidos en el campo técnico de la presente invención.
Una modalidad de la presente invención comprende un método en donde además de la expresión de leupeptina se exprese simultáneamente alguna otra proteína de interés, donde la leupeptina ejerza una actividad antiproteolítica que favorezca la expresión de la proteína de interés. El sistema biológico para llevar a cabo lo anterior pueden ser microorganismos del género Streptomyces, incluyendo S. roseus, además de otros sistemas de expresión como son Escherichia coli, Saccharomyces cerevisiae o Pichia pastoris.
Los siguientes ejemplos son ilustrativos del desarrollo de la presente invención y también proveen de los medios para reproducirla y probar su efectividad, por lo que en dichos ejemplos se pueden considerar variaciones adaptables por personas con conocimientos en este campo, sin que por ello implique abarcar más allá del alcance del espíritu de la invención.
Ejemplo 1. Construcción de mutantes en S. roseus ATCC 31245. La mutante de S. roseus ATCC 31245 en el gen leupA se construyó siguiendo una estrategia de mutagénesis de inserción. Para ello, se amplificó mediante PCR un fragmento de 640 pb correspondiente al primer dominio de adenilación (Fragmento A1) utilizando los siguientes primers:
LeupA_F (CGGCACCACCGGCACCCGGGC) (SEQ.ID.No. 2) y
LeupA_R1 (ACGCAGGTCCGGGATGGGCAC) (SEQ.ID.No. 3).
Este fragmento se clonó en el vector pCR2.1-TOPO (resistencia a ampicilina/kanamicina) utilizando un kit de clonación TA de Invitrogen (Carlsbad, EE. U Ú .), generando el plásmido suicida pLEUPI que no puede replicarse en S. roseus. Este plásmido se introdujo en S. roseus ATCC 31245 mediante la generación de protoplastos siguiendo protocolos estándar [Kieser et al. 2000], Los transformantes se seleccionaron usando kanamicina (50 pg/mL) y el genotipo de los mutantes insercionales se confirmó mediante PCR.
Ejemplo 2. Métodos microbiológicos y medios de cultivo. Los Streptomyces fueron adquiridos de la American Type Culture Collection (ATCC). Para la producción de leupeptina en S. roseus ATCC 31245, se utilizó un medio de producción el cual contenía glucosa 3 g, NH4NO3 0.5g, MgSO4(7H2O) 0.5 g, KCI 0.05 g, L-leucina 0.75 g, L-arginina 0.75 g, glicina 0.75 g, casaminoácidos 0.1 g, extracto de levadura 0.4 g/L. Estos cultivos se dispusieron en matraces agitados con resortes metálicos durante 48 horas a 30°C. Para la producción heteróloga de leupeptina, se cultivaron transformantes de E. coli DH10B que expresaban el vector pESAC_810 en medio mínimo M9 suplementado (Glc 4 g/L + Casaminoácidos 2 g/L) en matraces bafleados con 50 pg/mL de apramicina a 30°C y con agitación de 200 rpm durante 48 horas.
Ejemplo 3. Secuenciación y minería de genomas. El DNA genómico de S. roseus ATCC 31245 se obtuvo mediante extracciones con fenol-cloroformo, usando métodos ampliamente conocidos. El DNA genómico se usó para obtener librerías pair-end con insertos de entre 1000 y 1600 nucleótidos. Estas librerías fueron secuenciadas en un quipo MiSeq en la unidad de secuenciación genómica de Langebio (Irapuato, México). La calidad de las lecturas fue analizada utilizando FastQC (http://www.bioinformatics.bbsrc.ac.uk/projects/fastqc) y las lecturas fueron filtradas utilizando trimmomatic [Bolger, 2014] con un corte de calidad de 28 o más y un tamaño mínimo de 200 para aquellas de 250 bases. Las lecturas que pasaron los filtros de calidad fueron ensambladas de novo utilizando Velvet [Zerbino, 2008] con un rango de Kmers de 30 a 120. Se seleccionaron aquellos ensamblados con el menor número de contigs, el mayor número de bases y la mejor cobertura. Estos ensamblados fueron anotados usando RAST [Aziz, 2008], Los genomas anotados fueron minados utilizando AntiSMASH, EvoMining y CORASON.
Ejemplo 4. Análisis metabólico: obtención de extractos, métodos cromatográficos y de espectrometría de masas (HPLC-MS). Todos los datos reportados obtenidos mediante HPLC-MS se realizaron de la siguiente manera: los cultivos obtenidos en las fermentaciones se centrifugaron y sus sobrenadantes se liofilizaron para ser concentrados 10X. Los extractos crudos se analizaron/purificaron utilizando una columna de 5um ZORBAX Eclipse XDB-C18 Analytical 4.6 x 150 mm, con un gradiente de 0-25% B [A: TFA 0.1% y B: Acetonitrilo 100%] y una matriz de diodos (DAD)
a A=210 y 230 nm. Se utilizó como referencia el estándar auténtico de leupeptina (L2884, Sigma- Aldrich, St Louis, EUA) Posteriormente se recogieron los picos con tiempos de retención equivalentes de los extractos para el análisis de MS realizado en un equipo LTQVELOS trampa de iones en modo positivo (Thermo Scientific, Waltham, USA) en la Unidad de EM de Unidad Irapuato Cinvestav-IPN (Irapuato, México).
Referencias.
Altschul SF, et.al. 1990. Journal of Molecular Biology 215, 403-410.
Aoyagi T, et.al. 1969. J Antibiot (Tokyo). 22(6):283-6.
Aziz RK, et al, 2008. BMC Genomics. 9:75.
Bolger AM, et.al. 2014. Bioinformatics. 30(15):2114-20.
Borin G, et.al. 1981 . Hoppe Seylers Z Physiol Chem., 362(11): 1435-1445.
Brayer GD, et.al. 1979. Proc Natl Acad Sci USA. 76(1):96-100.
Bullock TL, et.al. 1996. J Mol Biol. 255(5):714-25.
Carver T, et.al. 2012. Bioinformatics. 28(4):464-9.
Chen Y, et.al. 2013. J Am Chem Soc. 135(28): 10449-56.
Demain AL. Med Res Rev. 2009 Nov;29(6):821-42.
Hines J, et.al. 2008. Chem Biol. 15(5):501 -12.
Hirao T, et.al. 1995. J Antibiot (Tokyo).48(12): 1494-6.
Kamiyama T., et.al. 1994. The Journal of antibiotics, 47(9), 959-968.
Kaspari M, et.al. 2008. FEBS Lett. 582(5):666-72.
Kieran & Greensmith. 2004. Neuroscience; 125(2):427-39.
Kieser, T, et.al. 2000. Practical Streptomyces genetics. Norwich, UK: John Innes Foundation.
Kisselev AF, at.al. 2012. Chem Biol. 19(1):99-115.
Kondo SI, et.al. 1969. Chem Pharm Bull (Tokyo). 17(9):1896-901 .
Maes K, et.al. 2007. American Journal of Respiratory and Critical Care Medicine, 175:1134-1138.
Momose, I., et.al. 2001. The Journal of antibiotics, 54(12), 1004-1012.
Morishima H, et.al. 1970. J Antibiot (Tokyo). 23(5):263-5.
Murao, S., et.al. 1977. Chem. 41 (7), 1313-1314.
Murao, S., et.al. 1985. Agricultural and biological chemistry, 49(3), 895-897.
Ning MC, et.al. 1986. Int J Biochem;18(9):813-20.
Nishikiori T, et.al. 1984. J Antibiot (Tokyo). 37(6):680-1.
Oda, K., et.al. 1989. Agricultural and biological chemistry, 53(2), 405-415.
Ogura, K., et.al. 1985. Agricultural and biological chemistry, 49(3), 799-805.
Okura A, et.al. 1975. J Antibiot (Tokyo). 28(4):337-9.
Saito, M., et.al. 1987. Agricultural and biological chemistry, 51 (3), 861-868.
Shigemori H., et.al. 1991. Tetrahedron 47 (40):8529-8534.
Stefanelli S, et.al. 1995. J Antibiot (Tokyo). 48(4):332-4.
Sosio M, et.al. 2000. Nat Biotechnol.18(3):343-5.
Suda H, et.al. 1972. J Antibiot (Tokyo). 25(4):263-6.
Suzukake K, et.al. 1979. J Antibiot (Tokyo). 32(5):523-30.
Suzukake K, et.al. 1980. J Antibiot (Tokyo). 33(8):857-62.
Suzukake K, et.al. 1981. Biochim Biophys Acta. 661 (2):175-81.
Tatsuta K, et.al. 1973. J Antibiot (Tokyo). 26(11):625-46.
Umezawa H, et.al. 1970. J Antibiot (Tokyo). 23(8):425-7.
Umezawa H, et.al. 1973. J Antibiot (Tokyo). 26(12):787-9.
Umezawa S, et.al. 1972. J Antibiot (Tokyo). 25(4):267-70.
Van Lanen y Shen, 2006. Current opinion in microbiology 9 (3), 252-260.
Watanabe, T., et.al. 1979. Tetrahedron Letters, 20(7), 625-628.
WIodawer A, et.al. 2001. Biochemistry. 40(51):15602-11.
Xia ZF, et.al. 1995. J Burn Care Rehabil., 16:111-117.
Zerbino DR, et.al. 2008. Genome Res. 18(5):821-9.
Satria A Kautsar et al. 2020. Nucleic Acids Research, 48(D1):454-458.
Claims
1. Un método para la biosíntesis heteróloga del SPA leupeptina, caracterizado porque comprende los pasos de: a) Obtener una cepa microbiana transformada con un vector de expresión que comprende una secuencia de DNA que codifica para: i. Una NRPS1 (LeuP1) que contiene: un dominio de condensación N-terminal (C1), seguido de un dominio de adenilación, que se predice reconoce una L-treonina (A1); un dominio acarreador de peptidilos (PCP1); un segundo dominio de condensación (C2); un segundo dominio de adenilación que se predice une una L-serina (A2); un segundo dominio acarreador de peptidilos (PCP2); y un dominio de tioesterasa (TE),
¡i. Una NRPS2 (LeuP6) que contiene un dominio de condensación N-terminal (C), iii. Una NRPS3 (LeuP7) que contiene un dominio de condensación N-terminal (C); seguido de un dominio de adenilación (A) que se presume reconoce una L-isoleucina; y un dominio de tioesterasa (TE), iv. Una NRPS4 (LeuP8) que contiene un dominio de condensación N-terminal (C); seguido de un dominio de adenilación con afinidad desconocida (A); y un dominio de tioesterasa (TE), v. Una NRPS5 (LeuP9) que contiene un dominio de condensación N-terminal (C); seguido de un dominio de adenilación (A) que se presume reconoce una ornitina; y un dominio de tioesterasa (TE), vi. Una enzima argininosuccinato liasa divergente (Leup2), vii. Una enzima treonin cinasa (Leup3), viii. Una enzima sintasa de cisteína (Leup4), y ix. Una proteína MbtH (Leup5), b) Inducir la expresión y la biosíntesis de leupeptina mediante el cultivo de dicha cepa microbiana transformada con dicho vector de expresión, y c) Recuperar la fracción de leupeptina y purificarla.
2. El método para la biosíntesis heteróloga del SPA leupeptina de la reivindicación 1 , caracterizado porque durante el cultivo de la cepa microbiana transformada se adicionan concentraciones adecuadas de al menos un metal, tanto de transición como metaloides, o sales de los mismos, incluyendo Na, Mg, K, Ca, Mn, Fe, Co, Ni, Cu, Zn o As, o mezclas de los mismos.
3. El método de la reivindicación 1 o 2, caracterizado porque además de la expresión de leupeptina se expresa una proteína de interés, y en donde la leupeptina ejerce una actividad antiproteolítica que favorece la expresión de dicha proteína de interés.
4. El método de la reivindicación 1 a 3, caracterizado porque la cepa de expresión heteróloga pertenece al género Streptomyces, incluyendo S. roseus.
5. El método de la reivindicación 1 a 4, caracterizado porque el vector de expresión es pESAC_810.
6. El método de la reivindicación 1 a 5, caracterizado porque la secuencia de DNA tiene la secuencia mostrada en SEQ.ID.No. 1.
7. Una secuencia de ácidos nucleicos que codifica para leupeptina, caracterizada porque comprende: a) Una NRPS1 (LeuP1) que contiene: un dominio de condensación N-terminal (C1), seguido de un dominio de adenilación, que se predice reconoce una L-treonina (A1); un dominio acarreador de peptidilos (PCP1); un segundo dominio de condensación (C2); un segundo dominio de adenilación que se predice une una L-serina (A2); un segundo dominio acarreador de peptidilos (PCP2); y un dominio de tioesterasa (TE), b) Una NRPS2 (LeuP6) que contiene un dominio de condensación N-terminal (C), c) Una NRPS3 (LeuP7) que contiene un dominio de condensación N-terminal (C); seguido de un dominio de adenilación (A) que se presume reconoce una L-isoleucina; y un dominio de tioesterasa (TE), d) Una NRPS4 (LeuP8) que contiene un dominio de condensación N-terminal (C); seguido de un dominio de adenilación con afinidad desconocida (A); y un dominio de tioesterasa (TE), e) Una NRPS5 (LeuP9) que contiene un dominio de condensación N-terminal (C); seguido de un dominio de adenilación (A) que se presume reconoce una ornitina; y un dominio de tioesterasa (TE), f) Una enzima argininosuccinato liasa divergente (Leup2), g) Una enzima treonin cinasa (Leup3), h) Una enzima sintasa de cisteína (Leup4), y i) Una proteína MbtH (Leup5),
8. La secuencia de ácidos nucleicos que codifica para leupeptina de la reivindicación 7, caracterizada porque tiene la secuencia mostrada en SEQ.ID.No. 1.
9. Un vector para la producción de leupeptina, caracterizado porque comprende la secuencia de ácidos nucleicos de la reivindicación 7.
10. Un vector para la producción de leupeptina, caracterizado porque comprende la secuencia de ácidos nucleicos de la reivindicación 8.
11 . El vector para la producción de leupeptina de las reivindicaciones 9 o 10, caracterizado porque el vector es el vector de expresión pESAC_810.
12. Una célula huésped para la producción de leupeptina, caracterizada porque comprende el vector de la reivindicación 9, o 10 u 11.
13. La célula huésped para la producción de leupeptina de la reivindicación 12, caracterizada porque es Escherichia col i.
14. La célula huésped para la producción de leupeptina de la reivindicación 13, caracterizada porque es Escherichia col i DH10B.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
MXMX/A/2021/012945 | 2021-10-22 | ||
MX2021012945A MX2021012945A (es) | 2021-10-22 | 2021-10-22 | Sistema genetico para la biosintesis de leupeptina y su uso en sistemas heterologos de produccion. |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2023067380A1 true WO2023067380A1 (es) | 2023-04-27 |
Family
ID=86058827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/IB2021/062510 WO2023067380A1 (es) | 2021-10-22 | 2021-12-31 | Sistema genético para la biosíntesis de leupeptina y su uso en sistemas heterólogos de producción |
Country Status (2)
Country | Link |
---|---|
MX (1) | MX2021012945A (es) |
WO (1) | WO2023067380A1 (es) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016097957A2 (en) * | 2014-12-16 | 2016-06-23 | Centro De Investigación Y De Estudios Avanzados Del Instituto Politécnico Nacional | Genetic system for producing a proteases inhibitor of a small peptide aldehyde type |
WO2016193954A2 (en) * | 2015-06-05 | 2016-12-08 | Centro De Investigación Y De Estudios Avanzados Del Instituto Politécnico Nacional | Genetic system for the production of leupeptin and its use for heterologous protein production |
-
2021
- 2021-10-22 MX MX2021012945A patent/MX2021012945A/es unknown
- 2021-12-31 WO PCT/IB2021/062510 patent/WO2023067380A1/es active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016097957A2 (en) * | 2014-12-16 | 2016-06-23 | Centro De Investigación Y De Estudios Avanzados Del Instituto Politécnico Nacional | Genetic system for producing a proteases inhibitor of a small peptide aldehyde type |
WO2016193954A2 (en) * | 2015-06-05 | 2016-12-08 | Centro De Investigación Y De Estudios Avanzados Del Instituto Politécnico Nacional | Genetic system for the production of leupeptin and its use for heterologous protein production |
Non-Patent Citations (3)
Title |
---|
AGUILAR, C.: "Convergent evolution of Streptomyces protease inhibitors involving a tRNA-mediated condensation-minus NRPS", BIORXIV, 28 October 2020 (2020-10-28), pages 1 - 37, XP093062562 * |
CRUZ-MORALES, P., JOHANNES FLORIAN KOPP, CHRISTIAN MARTINEZ-GUERRERO, LUIS ALFONSO YAN EZ-GUERRA, NELLY SELEM-MOJICA, HILDA RAMOS-: "Phylogenomic analysis of natural products biosynthetic gene clusters allows discovery of arseno-organic metabolites in model streptomycetes", GENOME BIOLOGY AND EVOLUTION, 1 January 2016 (2016-01-01), XP093062570 * |
JHE‐HAO LI; JOONSEOK OH; SABINE KIENESBERGER; NAM YOON KIM; DAVID J. CLARKE; ELLEN L. ZECHNER; JASON M. CRAWFORD: "Making and Breaking Leupeptin Protease Inhibitors in Pathogenic Gammaproteobacteria", ANGEWANDTE CHEMIE INTERNATIONAL EDITION, VERLAG CHEMIE, HOBOKEN, USA, vol. 59, no. 41, 13 August 2020 (2020-08-13), Hoboken, USA, pages 17872 - 17880, XP072105333, ISSN: 1433-7851, DOI: 10.1002/anie.202005506 * |
Also Published As
Publication number | Publication date |
---|---|
MX2021012945A (es) | 2023-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pantel et al. | Odilorhabdins, antibacterial agents that cause miscoding by binding at a new ribosomal site | |
Maksimov et al. | Lasso peptides: structure, function, biosynthesis, and engineering | |
Zafrir-Ilan et al. | Eight novel serine proteases inhibitors from a water bloom of the cyanobacterium Microcystis sp. | |
Rowe et al. | The role of chemical synthesis in developing RiPP antibiotics | |
Thomy et al. | The ADEP biosynthetic gene cluster in Streptomyces hawaiiensis NRRL 15010 reveals an accessory clpP gene as a novel antibiotic resistance factor | |
JP6020706B2 (ja) | ジペプチド合成酵素(バリアント)をコードするdna、エシェリヒア属に属する細菌、およびそれらを用いるジペププドの生産方法 | |
Lima et al. | Genetic organization of anabaenopeptin and spumigin biosynthetic gene clusters in the cyanobacterium Sphaerospermopsis torques-reginae ITEP-024 | |
Ogasawara et al. | Biosynthesis of oligopeptides using ATP‐grasp enzymes | |
US7811790B2 (en) | Polymyxin synthetase and gene cluster thereof | |
Unno et al. | Heterologous expression of cryptic biosynthetic gene cluster from Streptomyces prunicolor yields novel bicyclic peptide prunipeptin | |
Cheung-Lee et al. | Pandonodin: a proteobacterial lasso peptide with an exceptionally long C-terminal tail | |
Adiv et al. | New aeruginazoles, a group of thiazole-containing cyclic peptides from Microcystis aeruginosa blooms | |
Ouyang et al. | Direct pathway cloning and expression of the radiosumin biosynthetic gene cluster | |
US20140178353A1 (en) | Bacterial anti-phage defense systems | |
Hegemann et al. | A bifunctional leader peptidase/ABC transporter protein is involved in the maturation of the lasso peptide cochonodin I from Streptococcus suis | |
WO2016193954A2 (en) | Genetic system for the production of leupeptin and its use for heterologous protein production | |
WO2023067380A1 (es) | Sistema genético para la biosíntesis de leupeptina y su uso en sistemas heterólogos de producción | |
Wang et al. | Genome Mining of Myxopeptins Reveals a Class of Lanthipeptide-Derived Linear Dehydroamino Acid-Containing Peptides from Myxococcus sp. MCy9171 | |
JP6637904B2 (ja) | コリスチンシンセターゼ及び対応する遺伝子のクラスター | |
Wai S. Fung et al. | The molecular basis for the post-translational addition of amino acids by L/F transferase in the N-end rule pathway | |
Usuki et al. | Peptide bond formation by aminolysin-A catalysis: a simple approach to enzymatic synthesis of diverse short oligopeptides and biologically active puromycins | |
Li-Yuan et al. | H1-A, a compound isolated from Fusarium oxysporum inhibits hepatitis C virus (HCV) NS3 serine protease | |
US10414796B2 (en) | Genetic system for producing a proteases inhibitor of a small peptide aldehyde type | |
Kim | Structural Principles of Substrate Recognition and Unfolding by the ClpAP and ClpXP AAA+ Proteases | |
Morgan | Expanding the Ramoplanin Family of Antimicrobial Peptides |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 21961291 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 21961291 Country of ref document: EP Kind code of ref document: A1 |