JP6486440B2 - Method for producing fungal ribosomal peptides - Google Patents
Method for producing fungal ribosomal peptides Download PDFInfo
- Publication number
- JP6486440B2 JP6486440B2 JP2017197163A JP2017197163A JP6486440B2 JP 6486440 B2 JP6486440 B2 JP 6486440B2 JP 2017197163 A JP2017197163 A JP 2017197163A JP 2017197163 A JP2017197163 A JP 2017197163A JP 6486440 B2 JP6486440 B2 JP 6486440B2
- Authority
- JP
- Japan
- Prior art keywords
- amino acid
- gene
- acid sequence
- sequence
- protein
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 210000003705 ribosome Anatomy 0.000 title claims description 177
- 108090000765 processed proteins & peptides Proteins 0.000 title claims description 159
- 230000002538 fungal effect Effects 0.000 title claims description 41
- 238000004519 manufacturing process Methods 0.000 title claims description 36
- 102000004196 processed proteins & peptides Human genes 0.000 title claims description 23
- 108090000623 proteins and genes Proteins 0.000 claims description 412
- 102000004169 proteins and genes Human genes 0.000 claims description 153
- 108091008053 gene clusters Proteins 0.000 claims description 113
- 230000015572 biosynthetic process Effects 0.000 claims description 107
- 238000000034 method Methods 0.000 claims description 59
- 230000001851 biosynthetic effect Effects 0.000 claims description 51
- 101800001442 Peptide pr Proteins 0.000 claims description 40
- 241000233866 Fungi Species 0.000 claims description 33
- 229930000044 secondary metabolite Natural products 0.000 claims description 27
- 230000003252 repetitive effect Effects 0.000 claims description 20
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 18
- 210000002472 endoplasmic reticulum Anatomy 0.000 claims description 18
- 239000002243 precursor Substances 0.000 claims description 18
- 108091005804 Peptidases Proteins 0.000 claims description 17
- 230000000694 effects Effects 0.000 claims description 17
- 102000035195 Peptidases Human genes 0.000 claims description 16
- 235000019833 protease Nutrition 0.000 claims description 16
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 14
- 241000228212 Aspergillus Species 0.000 claims description 11
- 101150070161 ustYa gene Proteins 0.000 claims description 9
- 230000007704 transition Effects 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 6
- 230000005945 translocation Effects 0.000 claims description 6
- 230000001580 bacterial effect Effects 0.000 claims description 4
- 125000003275 alpha amino acid group Chemical group 0.000 claims 35
- 239000002773 nucleotide Substances 0.000 claims 2
- 125000003729 nucleotide group Chemical group 0.000 claims 2
- 150000001413 amino acids Chemical class 0.000 description 211
- 235000018102 proteins Nutrition 0.000 description 129
- 210000004027 cell Anatomy 0.000 description 51
- 101100102178 Aspergillus flavus (strain ATCC 200026 / FGSC A1120 / IAM 13836 / NRRL 3357 / JCM 12722 / SRRC 167) ustYa gene Proteins 0.000 description 37
- 235000001014 amino acid Nutrition 0.000 description 34
- 229940024606 amino acid Drugs 0.000 description 34
- 239000012634 fragment Substances 0.000 description 31
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 30
- 239000002609 medium Substances 0.000 description 29
- 230000014509 gene expression Effects 0.000 description 24
- 101100102179 Aspergillus flavus (strain ATCC 200026 / FGSC A1120 / IAM 13836 / NRRL 3357 / JCM 12722 / SRRC 167) ustYb gene Proteins 0.000 description 23
- 230000006870 function Effects 0.000 description 23
- 239000002299 complementary DNA Substances 0.000 description 19
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 18
- 239000000470 constituent Substances 0.000 description 18
- 150000001875 compounds Chemical class 0.000 description 17
- 101150054232 pyrG gene Proteins 0.000 description 16
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 15
- 239000000126 substance Substances 0.000 description 15
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 14
- 108091023040 Transcription factor Proteins 0.000 description 13
- 102000040945 Transcription factor Human genes 0.000 description 13
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 12
- 101100102174 Aspergillus flavus (strain ATCC 200026 / FGSC A1120 / IAM 13836 / NRRL 3357 / JCM 12722 / SRRC 167) ustR gene Proteins 0.000 description 11
- 230000014616 translation Effects 0.000 description 10
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 10
- 230000004927 fusion Effects 0.000 description 9
- 238000004128 high performance liquid chromatography Methods 0.000 description 9
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 9
- 150000007523 nucleic acids Chemical class 0.000 description 9
- 210000001938 protoplast Anatomy 0.000 description 9
- 239000000243 solution Substances 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 8
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 8
- 101150025711 TF gene Proteins 0.000 description 8
- 229910052751 metal Inorganic materials 0.000 description 8
- 239000002184 metal Substances 0.000 description 8
- 239000007787 solid Substances 0.000 description 8
- 238000013519 translation Methods 0.000 description 8
- 241000228197 Aspergillus flavus Species 0.000 description 7
- 102100033007 Carbonic anhydrase 14 Human genes 0.000 description 7
- 101000867862 Homo sapiens Carbonic anhydrase 14 Proteins 0.000 description 7
- 230000027455 binding Effects 0.000 description 7
- 125000004122 cyclic group Chemical group 0.000 description 7
- 229940088598 enzyme Drugs 0.000 description 7
- 239000003550 marker Substances 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 6
- 108020004414 DNA Proteins 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- 101150074253 TEF1 gene Proteins 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 238000013507 mapping Methods 0.000 description 6
- 108020004999 messenger RNA Proteins 0.000 description 6
- 102000039446 nucleic acids Human genes 0.000 description 6
- 108020004707 nucleic acids Proteins 0.000 description 6
- 239000000523 sample Substances 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- 101100102175 Aspergillus flavus (strain ATCC 200026 / FGSC A1120 / IAM 13836 / NRRL 3357 / JCM 12722 / SRRC 167) ustS gene Proteins 0.000 description 5
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 5
- 238000003559 RNA-seq method Methods 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 238000004587 chromatography analysis Methods 0.000 description 5
- 239000008121 dextrose Substances 0.000 description 5
- 238000010647 peptide synthesis reaction Methods 0.000 description 5
- HNSDLXPSAYFUHK-UHFFFAOYSA-N 1,4-bis(2-ethylhexyl) sulfosuccinate Chemical compound CCCCC(CC)COC(=O)CC(S(O)(=O)=O)C(=O)OCC(CC)CCCC HNSDLXPSAYFUHK-UHFFFAOYSA-N 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 4
- 239000004471 Glycine Substances 0.000 description 4
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 4
- 108700026244 Open Reading Frames Proteins 0.000 description 4
- 239000002202 Polyethylene glycol Substances 0.000 description 4
- 238000012300 Sequence Analysis Methods 0.000 description 4
- 244000061456 Solanum tuberosum Species 0.000 description 4
- 235000002595 Solanum tuberosum Nutrition 0.000 description 4
- 108091081024 Start codon Proteins 0.000 description 4
- 241001199012 Usta Species 0.000 description 4
- 240000008042 Zea mays Species 0.000 description 4
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 4
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 4
- 235000005822 corn Nutrition 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 108020001507 fusion proteins Proteins 0.000 description 4
- 102000037865 fusion proteins Human genes 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 230000014759 maintenance of location Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 230000002018 overexpression Effects 0.000 description 4
- 239000012071 phase Substances 0.000 description 4
- 229920001223 polyethylene glycol Polymers 0.000 description 4
- 229930001118 polyketide hybrid Natural products 0.000 description 4
- 125000003308 polyketide hybrid group Chemical group 0.000 description 4
- 239000002904 solvent Substances 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 235000015192 vegetable juice Nutrition 0.000 description 4
- 101100209356 Aspergillus flavus (strain ATCC 200026 / FGSC A1120 / IAM 13836 / NRRL 3357 / JCM 12722 / SRRC 167) ustH gene Proteins 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 108010059892 Cellulase Proteins 0.000 description 3
- 101000925662 Enterobacteria phage PRD1 Endolysin Proteins 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 239000008346 aqueous phase Substances 0.000 description 3
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 229910000019 calcium carbonate Inorganic materials 0.000 description 3
- 229940106157 cellulase Drugs 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 239000012153 distilled water Substances 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 235000011389 fruit/vegetable juice Nutrition 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 239000000644 isotonic solution Substances 0.000 description 3
- 230000002934 lysing effect Effects 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- 238000000655 nuclear magnetic resonance spectrum Methods 0.000 description 3
- 230000001766 physiological effect Effects 0.000 description 3
- 239000011148 porous material Substances 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 230000008929 regeneration Effects 0.000 description 3
- 238000011069 regeneration method Methods 0.000 description 3
- 230000019702 secondary metabolite biosynthetic process Effects 0.000 description 3
- 238000001179 sorption measurement Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000009966 trimming Methods 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- 235000020138 yakult Nutrition 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- 241000186361 Actinobacteria <class> Species 0.000 description 2
- 101100209350 Aspergillus flavus (strain ATCC 200026 / FGSC A1120 / IAM 13836 / NRRL 3357 / JCM 12722 / SRRC 167) ustA gene Proteins 0.000 description 2
- 101100102170 Aspergillus flavus (strain ATCC 200026 / FGSC A1120 / IAM 13836 / NRRL 3357 / JCM 12722 / SRRC 167) ustO gene Proteins 0.000 description 2
- 101100102171 Aspergillus flavus (strain ATCC 200026 / FGSC A1120 / IAM 13836 / NRRL 3357 / JCM 12722 / SRRC 167) ustP gene Proteins 0.000 description 2
- 101100102173 Aspergillus flavus (strain ATCC 200026 / FGSC A1120 / IAM 13836 / NRRL 3357 / JCM 12722 / SRRC 167) ustQ gene Proteins 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- XUIIKFGFIJCVMT-GFCCVEGCSA-N D-thyroxine Chemical compound IC1=CC(C[C@@H](N)C(O)=O)=CC(I)=C1OC1=CC(I)=C(O)C(I)=C1 XUIIKFGFIJCVMT-GFCCVEGCSA-N 0.000 description 2
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 2
- 102000013446 GTP Phosphohydrolases Human genes 0.000 description 2
- 108091006109 GTPases Proteins 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical compound CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 2
- 238000005481 NMR spectroscopy Methods 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 238000011529 RT qPCR Methods 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- PTFCDOFLOPIGGS-UHFFFAOYSA-N Zinc dication Chemical compound [Zn+2] PTFCDOFLOPIGGS-UHFFFAOYSA-N 0.000 description 2
- 229930013930 alkaloid Natural products 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000003766 bioinformatics method Methods 0.000 description 2
- 230000003570 biosynthesizing effect Effects 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 210000004748 cultured cell Anatomy 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 229910021645 metal ion Inorganic materials 0.000 description 2
- 150000002739 metals Chemical group 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- 229930001119 polyketide Natural products 0.000 description 2
- -1 polyketide compounds Chemical class 0.000 description 2
- 238000001243 protein synthesis Methods 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 150000003505 terpenes Chemical class 0.000 description 2
- 235000007586 terpenes Nutrition 0.000 description 2
- 229940034208 thyroxine Drugs 0.000 description 2
- XUIIKFGFIJCVMT-UHFFFAOYSA-N thyroxine-binding globulin Natural products IC1=CC(CC([NH3+])C([O-])=O)=CC(I)=C1OC1=CC(I)=C(O)C(I)=C1 XUIIKFGFIJCVMT-UHFFFAOYSA-N 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 101150007906 ustYb gene Proteins 0.000 description 2
- 241000866068 'Nocardioides flavus' Ruan and Zhang 1979 Species 0.000 description 1
- NEPLBHLFDJOJGP-BYPYZUCNSA-N (2s)-2-(5-fluoro-2,4-dinitroanilino)propanamide Chemical compound NC(=O)[C@H](C)NC1=CC(F)=C([N+]([O-])=O)C=C1[N+]([O-])=O NEPLBHLFDJOJGP-BYPYZUCNSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 101150029062 15 gene Proteins 0.000 description 1
- 101150090724 3 gene Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 235000001674 Agaricus brunnescens Nutrition 0.000 description 1
- 241001136782 Alca Species 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 241000134916 Amanita Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 101100209354 Aspergillus flavus (strain ATCC 200026 / FGSC A1120 / IAM 13836 / NRRL 3357 / JCM 12722 / SRRC 167) ustF1 gene Proteins 0.000 description 1
- 241000351920 Aspergillus nidulans Species 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 108010069514 Cyclic Peptides Proteins 0.000 description 1
- 102000001189 Cyclic Peptides Human genes 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 101900343506 Escherichia coli Beta-glucuronidase Proteins 0.000 description 1
- 101710172229 Exo-1,4-beta-xylosidase xlnD Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 101150108358 GLAA gene Proteins 0.000 description 1
- 101710107035 Gamma-glutamyltranspeptidase Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 1
- 101710173228 Glutathione hydrolase proenzyme Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- SNDPXSYFESPGGJ-BYPYZUCNSA-N L-2-aminopentanoic acid Chemical group CCC[C@H](N)C(O)=O SNDPXSYFESPGGJ-BYPYZUCNSA-N 0.000 description 1
- SNDPXSYFESPGGJ-UHFFFAOYSA-N L-norVal-OH Natural products CCCC(N)C(O)=O SNDPXSYFESPGGJ-UHFFFAOYSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 240000005379 Mecopus nidulans Species 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 101710083258 Probable exo-1,4-beta-xylosidase xlnD Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Chemical class OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 101100010928 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) tuf gene Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 102000004243 Tubulin Human genes 0.000 description 1
- 108090000704 Tubulin Proteins 0.000 description 1
- 241001474928 Ustilaginoidea virens Species 0.000 description 1
- BISPUFPESHDUKH-UHFFFAOYSA-N Ustiloxin B Natural products OC1C(NC)C(=O)NC(C)C(=O)NC(C(=O)NCC(O)=O)C(CC)(C)OC2=CC1=C(S(=O)CC(O)CC(N)C(O)=O)C=C2O BISPUFPESHDUKH-UHFFFAOYSA-N 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 238000005903 acid hydrolysis reaction Methods 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 108090000637 alpha-Amylases Proteins 0.000 description 1
- 238000003277 amino acid sequence analysis Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 238000011098 chromatofocusing Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000002330 electrospray ionisation mass spectrometry Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 238000004362 fungal culture Methods 0.000 description 1
- 102000006640 gamma-Glutamyltransferase Human genes 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 210000002288 golgi apparatus Anatomy 0.000 description 1
- 101150073906 gpdA gene Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 238000004896 high resolution mass spectrometry Methods 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 238000006011 modification reaction Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000004570 mortar (masonry) Substances 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 210000004897 n-terminal region Anatomy 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 125000004434 sulfur atom Chemical group 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 238000001195 ultra high performance liquid chromatography Methods 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 108010033601 ustiloxin B Proteins 0.000 description 1
- BISPUFPESHDUKH-CEALTDAMSA-N ustiloxin B Chemical compound O[C@H]1[C@H](NC)C(=O)N[C@@H](C)C(=O)N[C@H](C(=O)NCC(O)=O)[C@](CC)(C)OC2=CC1=C(S(=O)C[C@@H](O)C[C@H](N)C(O)=O)C=C2O BISPUFPESHDUKH-CEALTDAMSA-N 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
Images
Landscapes
- Enzymes And Modification Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Description
本発明は、真菌が産生するペプチド性二次代謝産物に関与する真菌特異的な生合成遺伝子クラスターを利用したペプチド性二次代謝産物の製造方法、及び前記クラスターにおいて発現誘導されるタンパク質に関する。 The present invention relates to a method for producing a peptidic secondary metabolite using a fungal-specific biosynthetic gene cluster involved in a peptidic secondary metabolite produced by a fungus, and a protein whose expression is induced in the cluster.
真菌、放線菌及び細菌を含む微生物が産生する二次代謝産物は、医薬又は医薬原料を含む様々な用途に用いられている。 Secondary metabolites produced by microorganisms including fungi, actinomycetes and bacteria are used in various applications including pharmaceuticals or pharmaceutical raw materials.
幾つかの真菌、代表的にはアスペルギルス(Aspergillus)属の真菌の幾つかのゲノム解析が行われた結果、真菌には、ポリケタイド化合物、非リボソーム型ペプチド(リボソームを経由せずに非リボソームペプチド合成酵素によりアミノ酸から合成される、ペプチド結合を有する化合物)、テルペン類又はアルカロイドなどを含む多様な二次代謝産物の生合成に関与する遺伝子クラスター(生合成遺伝子クラスター)が存在していることが明らかにされている。 As a result of several genome analyzes of some fungi, typically those of the genus Aspergillus, the fungi contain polyketide compounds, non-ribosomal peptides (non-ribosomal peptide synthesis without going through ribosomes) It is clear that there is a gene cluster (biosynthetic gene cluster) involved in biosynthesis of various secondary metabolites including terpenes or alkaloids, which are synthesized from amino acids by enzymes) Has been.
例えば、黄色麹菌(A.flavus)では、55種類の二次代謝産物生合成遺伝子クラスターが染色体上にコードされていることが示されている。しかし、この様な遺伝子クラスターの半数以上は真菌細胞内において殆ど発現されていないか、あるいは極めて微量の二次代謝産物しか産生されない程度にしか発現されていないのが現実である。 For example, in A. flavus, 55 secondary metabolite biosynthesis gene clusters are shown to be encoded on the chromosome. However, in reality, more than half of such gene clusters are hardly expressed in fungal cells, or are expressed only to such an extent that only a very small amount of secondary metabolites are produced.
このことは、未だその具体的な構造や機能が特定されていない多数の未知の二次代謝産物を生産する能力を真菌が潜在的に有していることを意味する。そこで、真菌の潜在的な二次代謝産物の生産能力を発揮させるために、二次代謝産物生合成遺伝子クラスターの発現を人為的に誘導し、十分な量の二次代謝産物を合成させようとする試みが提唱されている。その1つは、目的となる二次代謝産物生合成遺伝子クラスターに含まれる遺伝子クラスターの転写因子を過剰発現させ、二次代謝産物の合成量を高める方法である。もう一つは、二次代謝産物生合成遺伝子クラスターのcDNAを構築し、これを適当な宿主発現系を用いて高発現させて二次代謝産物を合成させる方法である。特に後者の場合、複数の生合成遺伝子クラスターの間で各クラスターの構成遺伝子を組み換えて非天然の二次代謝産物を合成しようとする試みも提唱されている。 This means that the fungus has the potential to produce a large number of unknown secondary metabolites whose specific structures and functions have not yet been identified. Therefore, in order to demonstrate the ability to produce potential secondary metabolites of fungi, we tried to artificially induce the expression of secondary metabolite biosynthetic gene clusters and synthesize a sufficient amount of secondary metabolites. An attempt to do so has been proposed. One of them is a method of increasing the amount of secondary metabolite synthesis by overexpressing the transcription factor of the gene cluster contained in the target secondary metabolite biosynthesis gene cluster. The other is a method of synthesizing a secondary metabolite by constructing cDNA of a secondary metabolite biosynthetic gene cluster and highly expressing it using an appropriate host expression system. Particularly in the latter case, an attempt to synthesize a non-natural secondary metabolite by recombining the constituent genes of each cluster among a plurality of biosynthetic gene clusters has also been proposed.
ところで、放線菌の一部では、二次代謝産物としてリボソームペプチドと称される化合物を生成することが知られている。リボソームペプチドは、タンパク質合成の場であるリボソームを介して生合成されるが、環状構造、枝状構造あるいは非天然アミノ酸を含むなど、通常の構成タンパク質や酵素タンパク質にはあまり見られない化学的特徴を伴った、ペプチド結合を有する化合物である。一方、前述のように真菌が産生する二次代謝産物としてはポリケタイド化合物、非リボソーム型ペプチド、テルペン類又はアルカロイドなどが知られているが、真菌由来のリボソームペプチド及びその生合成に関する生合成遺伝子クラスターに関する報告は、これまでのところAmanita属由来のものが知られている程度しかない(非特許文献1)。 By the way, it is known that some actinomycetes produce a compound called a ribosomal peptide as a secondary metabolite. Ribosomal peptides are biosynthesized through ribosomes, the field of protein synthesis, but contain chemical features that are rarely found in normal constituent proteins and enzyme proteins, including cyclic structures, branched structures, and unnatural amino acids. Is a compound having a peptide bond. On the other hand, as described above, polyketide compounds, non-ribosomal peptides, terpenes or alkaloids are known as secondary metabolites produced by fungi, but fungal-derived ribosomal peptides and biosynthetic gene clusters related to their biosynthesis To date, there are only a few reports on what is derived from the genus Amanita (Non-patent Document 1).
本発明者らは、塩基配列情報を基にして二次代謝産物生合成遺伝子クラスターの存在を推定するバイオインフォマティクス的手法を提唱している(特許文献1)。 The present inventors have proposed a bioinformatics method for estimating the presence of secondary metabolite biosynthetic gene clusters based on base sequence information (Patent Document 1).
本発明は、真菌由来のリボソームペプチドの生合成に関与する遺伝子クラスターを特定し、これを用いて真菌由来のリボソームペプチドを組換え的に生産する方法を提供することを目的とするものである。真菌由来のリボソームペプチドの生合成遺伝子クラスターのさらなる存在を明らかにすること、及びその組換え的生産を可能にするための真菌由来のリボソームペプチド生合成遺伝子クラスターの特定及び利用は、真菌由来のリボソームペプチドの有効利用において重要である。 An object of the present invention is to provide a method for identifying a gene cluster involved in the biosynthesis of a fungal ribosomal peptide and using this to recombinantly produce a fungal ribosomal peptide. The identification and utilization of fungal-derived ribosomal peptide biosynthetic gene clusters to elucidate the further existence of fungal-derived ribosomal peptide biosynthetic gene clusters and to enable their recombinant production It is important for effective utilization of peptides.
本発明者らは、稲コウジ病菌(ウスチラギノイデア・ヴィレンス、Ustilaginoidea virens)が産生する二次代謝産物として知られているウスチロキシン(ustiloxin)Bの生合成経路に関する研究過程において、ウスチロキシンB生合成に関連する遺伝子が遺伝子クラスターを形成していることを見いだした。さらに、小胞体移行シグナル配列とウスチロキシンBの化学構造中に見られるアミノ酸配列が複数回繰り返されてなる反復配列とを含むウスチロキシンBの前駆体ペプチドをコードする遺伝子(ustA)が同クラスターの構成遺伝子であること、真菌特異的なアミノ酸配列を含むタンパク質をコードする遺伝子が同クラスターの構成遺伝子として存在することを見いだした。さらに、前記小胞体移行シグナル配列及び反復配列を含むという特徴を有するリボソームペプチド前駆体遺伝子、前記真菌特異的なアミノ酸配列を含むタンパク質のアミノ酸配列と一定の相同性を有するアミノ酸配列からなるタンパク質をコードする遺伝子を含むリボソームペプチド生合成遺伝子クラスターが、A.flavusを含む複数の糸状菌のゲノムに多数存在していることを確認し、下記の各発明を完成させた。 In the course of research on the biosynthetic pathway of ustiloxin B, which is known as a secondary metabolite produced by rice mushroom fungus (Ustylaginoidea virens), We found that genes related to biosynthesis formed a gene cluster. Furthermore, a gene (ustA) encoding a precursor peptide of ustyroxin B, which includes an endoplasmic reticulum transition signal sequence and a repetitive sequence in which the amino acid sequence found in the chemical structure of ustyroxin B is repeated multiple times, is included in the cluster. It was found that a gene encoding a protein containing a fungal-specific amino acid sequence exists as a constituent gene of the cluster. Furthermore, it encodes a protein consisting of an amino acid sequence having a certain homology with an amino acid sequence of a protein containing the endoplasmic reticulum translocation signal sequence and a repetitive sequence, and a protein containing the fungus-specific amino acid sequence. A ribosomal peptide biosynthetic gene cluster containing genes that After confirming the presence of a large number in the genome of a plurality of filamentous fungi including flavus, the following inventions were completed.
(1)真菌由来のリボソームペプチドを製造する方法であって、
工程a)小胞体移行シグナル配列及び反復配列を含むアミノ酸配列からなるリボソームペプチド前駆体をコードする遺伝子、並びに配列番号1に示される塩基配列に対するE値が1e−4未満でリボソームペプチドの生合成に関与するタンパク質をコードする塩基配列を有する遺伝子、配列番号2に示されるアミノ酸配列に対するE値が1e−4未満のアミノ酸配列からなりリボソームペプチドの生合成に関与するタンパク質をコードする遺伝子、若しくは配列番号3に示されるアミノ酸配列に対するE値が1e−4未満のアミノ酸配列からなりリボソームペプチドの生合成に関与するタンパク質をコードする遺伝子、及び/又は配列番号6に示されるアミノ酸配列に対するE値が1e−4未満のアミノ酸配列からなりリボソームペプチドの生合成に関与するタンパク質をコードする遺伝子を少なくとも含むリボソームペプチド生合成遺伝子クラスターを細胞内で強制発現させる工程、並びに
工程b)細胞からリボソームペプチドを回収する工程を含む、前記製造方法。
(2)リボソームペプチド前駆体をコードする遺伝子が、AspGD ID番号がAFL2G_08516、Acar5010_211921、Acar5010_131040、ACLA_063320、Aspbr1_0148406、An06g02130、Aspzo1_1501727、Acar5010_210441、Aspzo1_0132961、Aacu16872_042334、An03g05230、Asptu1_0047109、Aspfo1_0048058、Aspka1_0178058、Aspzo1_0673756、AFUB_096780、Aspwe1_0028756、Aspwe1_0177551、Aspfo1_0041528、Aspka1_0176174、Aspzo1_0138840及びAacu16872_044658である遺伝子よりなる群から選ばれる遺伝子である、(1)に記載の製造方法。
(3)配列番号2に示されるアミノ酸配列に対するE値が1e−4未満のアミノ酸配列からなりリボソームペプチドの生合成に関与するタンパク質をコードする遺伝子が、AspGD ID番号がAFL2G_08517、Acar5010_156521、Acar5010_131041、ACLA_063300、ACLA_063310、Aspbr1_0073580、An06g02120、Aspzo1_0020615、Aspzo1_0147593、Acar5010_399409、Aspzo1_0097397、Aacu16872_042333、An03g05220、Asptu1_0047108、Aspfo1_0048061、Aspka1_0178059、Aspzo1_0070555、AFUB_096790、Aspwe1_0041401、Aspwe1_0188242、Aspfo1_0203572、Aspka1_0176173、Aspzo1_0163562及びAacu16872_044657である遺伝子よりなる群から選ばれる遺伝子である、(1)又は(2)に記載の製造方法。
(4)工程a)の強制発現が、リボソームペプチド生合成遺伝子クラスターに含まれる転写因子をコードする遺伝子のプロモーターを高発現プロモーターに組み換えることによって達成される、(1)〜(3)のいずれかに記載の製造方法。
(5)前記リボソームペプチド生合成遺伝子クラスターが、ペプチダーゼ活性を有するタンパク質をコードする遺伝子をさらに含む、(1)〜(4)のいずれかに記載の製造方法。
(6)細胞が真菌細胞である、(1)〜(5)のいずれかに記載の製造方法。
(7)真菌細胞がAspergillus属真菌の細胞である、(6)に記載の製造方法。
(8)配列番号3に示されるアミノ酸配列、又は前記アミノ酸配列の1〜数個のアミノ酸が欠失若しくは置換されたアミノ酸配列若しくは前記アミノ酸配列に1〜数個のアミノ酸が付加されたアミノ酸配列からなり、真菌細胞内におけるリボソームペプチドの生合成に関与するタンパク質。
(9)(8)に記載のタンパク質をコードするcDNA。
(10)配列番号6に示されるアミノ酸配列、又は前記アミノ酸配列の1〜数個のアミノ酸が欠失若しくは置換されたアミノ酸配列若しくは前記アミノ酸配列に1〜数個のアミノ酸が付加されたアミノ酸配列からなり、真菌細胞内におけるリボソームペプチドの生合成に関与するタンパク質。
(11)(10)に記載のタンパク質をコードするcDNA。
(12)真菌由来のリボソームペプチドを製造する方法であって、
工程a)小胞体移行シグナル配列及び反復配列を含むアミノ酸配列からなるリボソームペプチド前駆体をコードする遺伝子、並びに配列番号3に示されるアミノ酸配列の81番目〜225番目のアミノ酸配列と20%以上の同一性を有するアミノ酸配列を含み、リボソームペプチドの生合成に関与するタンパク質をコードする遺伝子、及び/又は配列番号6に示されるアミノ酸配列の57番目〜259番目のアミノ酸配列と20%以上の同一性を有するアミノ酸配列を含み、リボソームペプチドの生合成に関与するタンパク質をコードする遺伝子を少なくとも含むリボソームペプチド生合成遺伝子クラスターを細胞内で強制発現させる工程、並びに
工程b)細胞からリボソームペプチドを回収する工程を含む、前記製造方法。
(13)リボソームペプチド前駆体をコードする遺伝子が、AspGD ID番号がAFL2G_08516、Acar5010_211921、Acar5010_131040、ACLA_063320、Aspbr1_0148406、An06g02130、Aspzo1_1501727、Acar5010_210441、Aspzo1_0132961、Aacu16872_042334、An03g05230、Asptu1_0047109、Aspfo1_0048058、Aspka1_0178058、Aspzo1_0673756、AFUB_096780、Aspwe1_0028756、Aspwe1_0177551、Aspfo1_0041528、Aspka1_0176174、Aspzo1_0138840及びAacu16872_044658である遺伝子よりなる群から選ばれる遺伝子である、(12)に記載の製造方法。
(14)配列番号3に示されるアミノ酸配列の81番目〜225番目のアミノ酸配列と20%以上の同一性を有するアミノ酸配列を含み、リボソームペプチドの生合成に関与するタンパク質をコードする遺伝子が、AspGD ID番号がAFL2G_08517、Acar5010_156521、Acar5010_131041、ACLA_063300、ACLA_063310、Aspbr1_0073580、An06g02120、Aspzo1_0020615、Aspzo1_0147593、Acar5010_399409、Aspzo1_0097397、Aacu16872_042333、An03g05220、Asptu1_0047108、Aspfo1_0048061、Aspka1_0178059、Aspzo1_0070555、AFUB_096790、Aspwe1_0041401、Aspwe1_0188242、Aspfo1_0203572、Aspka1_0176173、Aspzo1_0163562及びAacu16872_044657である遺伝子よりなる群から選ばれる遺伝子である、(12)又は(13)に記載の製造方法。
(15)工程a)の強制発現が、リボソームペプチド生合成遺伝子クラスターに含まれる転写因子をコードする遺伝子のプロモーターを高発現プロモーターに組み換えることによって達成される、(12)〜(14)のいずれかに記載の製造方法。
(16)前記リボソームペプチド生合成遺伝子クラスターが、ペプチダーゼ活性を有するタンパク質をコードする遺伝子をさらに含む、(12)〜(15)のいずれかに記載の製造方法。
(17)細胞が真菌細胞である、(12)〜(16)のいずれかに記載の製造方法。
(1) A method for producing a ribosomal peptide derived from a fungus,
Step a) Biosynthesis of a ribosomal peptide having an E value of less than 1e-4 for a gene encoding a ribosomal peptide precursor consisting of an amino acid sequence including an endoplasmic reticulum translocation signal sequence and a repetitive sequence, and the base sequence shown in SEQ ID NO: 1. A gene having a base sequence encoding a protein involved, a gene consisting of an amino acid sequence having an E value of less than 1e-4 with respect to the amino acid sequence shown in SEQ ID NO: 2, or a gene encoding a protein involved in ribosomal peptide biosynthesis, or SEQ ID NO: A gene encoding a protein involved in the biosynthesis of a ribosomal peptide consisting of an amino acid sequence having an E value of less than 1e-4 with respect to the amino acid sequence shown in Fig. 3, and / or an E value of 1e- with respect to the amino acid sequence shown in SEQ ID NO: 6 Ribosomal peptide consisting of less than 4 amino acid sequences Step of including at least ribosomal peptide biosynthetic gene cluster of genes encoding proteins involved in the synthesis is forcibly expressed in the cell, as well as step b) recovering the ribosomal peptide from the cells, the production method.
(2) genes encoding ribosomal peptide precursor, AspGD ID number AFL2G_08516, Acar5010_211921, Acar5010_131040, ACLA_063320, Aspbr1_0148406, An06g02130, Aspzo1_1501727, Acar5010_210441, Aspzo1_0132961, Aacu16872_042334, An03g05230, Asptu1_0047109, Aspfo1_0048058, Aspka1_0178058, Aspzo1_0673756, AFUB_096780, Aspwe1_0028756 Aspwe1_01775551, Aspfo1_0041528, Aspka1_0176174, Aspzo1_01 The production method according to (1), which is a gene selected from the group consisting of 38840 and Acu16887_044658.
(3) A gene encoding a protein involved in the biosynthesis of a ribosomal peptide having an E value of less than 1e-4 with respect to the amino acid sequence shown in SEQ ID NO: 2 has AspGD ID numbers of AFL2G — 08517, Acar5010 — 156521, Acar5010 — 131041, ACLA — 063300 , ACLA — 063310, Aspbr1 — 0073580, An06g02120, Aspzo1 — 0020615, Aspzo1 — 0147593, Acar5010 — 399409, Aspozo1 — 0097397, Acu168872 — 043333, An03g05220, Asp611sp0A1 The production method according to (1) or (2), which is a gene selected from the group consisting of B — 096790, Aspwe1 — 0041401, Aspwe1 — 0188242, Aspfo1 — 0203572, Aspka1 — 0176173, Aspzo1 — 0163562, and Acu168872 — 046657.
(4) The forced expression in step a) is achieved by recombining a promoter of a gene encoding a transcription factor contained in a ribosomal peptide biosynthesis gene cluster with a high expression promoter, any of (1) to (3) The manufacturing method of crab.
(5) The production method according to any one of (1) to (4), wherein the ribosomal peptide biosynthesis gene cluster further includes a gene encoding a protein having peptidase activity.
(6) The production method according to any one of (1) to (5), wherein the cell is a fungal cell.
(7) The production method according to (6), wherein the fungal cell is a cell of the genus Aspergillus.
(8) From the amino acid sequence shown in SEQ ID NO: 3, the amino acid sequence in which one to several amino acids of the amino acid sequence are deleted or substituted, or the amino acid sequence in which one to several amino acids are added A protein involved in the biosynthesis of ribosomal peptides in fungal cells.
(9) cDNA encoding the protein according to (8).
(10) From the amino acid sequence shown in SEQ ID NO: 6, the amino acid sequence in which one to several amino acids of the amino acid sequence are deleted or substituted, or the amino acid sequence in which one to several amino acids are added A protein involved in the biosynthesis of ribosomal peptides in fungal cells.
(11) cDNA encoding the protein according to (10).
(12) A method for producing a ribosomal peptide derived from a fungus,
Step a) A gene encoding a ribosomal peptide precursor consisting of an amino acid sequence including an endoplasmic reticulum transition signal sequence and a repetitive sequence, and 20% or more identical to the 81st to 225th amino acid sequences of the amino acid sequence shown in SEQ ID NO: 3 20% or more identity with the 57th to 259th amino acid sequences of the amino acid sequence shown in SEQ ID NO: 6 and / or the gene encoding the protein involved in the biosynthesis of ribosomal peptides A step of forcibly expressing a ribosomal peptide biosynthetic gene cluster in a cell including at least a gene encoding a protein involved in ribosomal peptide biosynthesis, and b) a step of recovering the ribosomal peptide from the cell. The manufacturing method.
(13) a gene encoding ribosomal peptide precursor, AspGD ID number AFL2G_08516, Acar5010_211921, Acar5010_131040, ACLA_063320, Aspbr1_0148406, An06g02130, Aspzo1_1501727, Acar5010_210441, Aspzo1_0132961, Aacu16872_042334, An03g05230, Asptu1_0047109, Aspfo1_0048058, Aspka1_0178058, Aspzo1_0673756, AFUB_096780, Aspwe1_0028756 , Aspwe1 — 0177551, Aspfo1 — 0041528, Aspka1 — 0176174, Aspzo1 — 0 The production method according to (12), which is a gene selected from the group consisting of 138840 and Acu16887_044658.
(14) A gene containing an amino acid sequence having 20% or more identity with the 81st to 225th amino acid sequences of the amino acid sequence shown in SEQ ID NO: 3 and encoding a protein involved in ribosomal peptide biosynthesis is AspGD ID number is AFL2G_08517, Acar5010_156521, Acar5010_131041, ACLA_063300, ACLA_063310, Aspbr1_0073580, An06g02120, Aspzo1_0020615, Aspzo1_0147593, Acar5010_399409, Aspzo1_0097397, Aacu16872_042333, An03g05220, Asptu1_0047108, Aspfo1_0048061, Aspka1_0178059 , Aspzo1 — 0070555, AFUB — 096790, Aspwe1 — 0041401, Aspwe1 — 0188242, Aspfo1 — 0203572, Aspka1 — 0176563, Aspzo1 — 0163562 and Acu16887 — 046657.
(15) The forced expression in step a) is achieved by recombining a promoter of a gene encoding a transcription factor contained in a ribosomal peptide biosynthesis gene cluster with a high expression promoter, any of (12) to (14) The manufacturing method of crab.
(16) The production method according to any one of (12) to (15), wherein the ribosomal peptide biosynthesis gene cluster further comprises a gene encoding a protein having peptidase activity.
(17) The production method according to any one of (12) to (16), wherein the cell is a fungal cell.
本発明によれば、これまでに報告のない新規な真菌由来のリボソームペプチドを製造することができる。これにより、医薬その他の有用物質への応用が期待される真菌由来の二次代謝産物であるリボソームペプチドを提供することが可能となる。 According to the present invention, a novel fungal-derived ribosomal peptide that has not been reported so far can be produced. This makes it possible to provide a ribosomal peptide that is a secondary metabolite derived from a fungus expected to be applied to pharmaceuticals and other useful substances.
本発明は、真菌由来のリボソームペプチドを製造する方法であって、工程a)小胞体移行シグナル配列及び反復配列を含むアミノ酸配列からなるリボソームペプチド前駆体をコードする遺伝子、並びに配列番号1に示される塩基配列に対するE値が1e−4未満でリボソームペプチドの生合成に関与するタンパク質をコードする塩基配列を有する遺伝子、配列番号2に示されるアミノ酸配列に対するE値が1e−4未満のアミノ酸配列からなりリボソームペプチドの生合成に関与するタンパク質をコードする遺伝子、若しくは配列番号3に示されるアミノ酸配列に対するE値が1e−4未満のアミノ酸配列からなりリボソームペプチドの生合成に関与するタンパク質をコードする遺伝子、及び/又は配列番号6に示されるアミノ酸配列に対するE値が1e−4未満のアミノ酸配列からなりリボソームペプチドの生合成に関与するタンパク質をコードする遺伝子を少なくとも含むリボソームペプチド生合成遺伝子クラスターを細胞内で強制発現させる工程、並びに工程b)細胞からリボソームペプチドを回収する工程を含む、前記製造方法を提供する。 The present invention is a method for producing a ribosomal peptide derived from a fungus, which is represented by step a) a gene encoding a ribosomal peptide precursor consisting of an amino acid sequence including an endoplasmic reticulum translocation signal sequence and a repetitive sequence, and SEQ ID NO: 1. A gene having a base sequence encoding a protein involved in ribosomal peptide biosynthesis with an E value of less than 1e-4 for the base sequence, and an amino acid sequence having an E value of less than 1e-4 for the amino acid sequence shown in SEQ ID NO: 2 A gene encoding a protein involved in ribosomal peptide biosynthesis, or a gene encoding a protein involved in ribosomal peptide biosynthesis consisting of an amino acid sequence having an E value of less than 1e-4 with respect to the amino acid sequence shown in SEQ ID NO: 3, And / or against the amino acid sequence shown in SEQ ID NO: 6 A step of forcibly expressing a ribosomal peptide biosynthetic gene cluster comprising at least a gene comprising an amino acid sequence having an E value of less than 1e-4 and encoding a protein involved in ribosomal peptide biosynthesis; and b) from the cell to the ribosome The production method includes the step of recovering the peptide.
本発明者らは、前記特許文献1に記載された二次代謝産物生合成遺伝子クラスターの存在を推定するバイオインフォマティクス的手法をさらに発展させて、MIDDAS−M(Motif−Independent De novo Detection Algorithm for Secondary Metabolite Gene clusters)を開発した(Umemuraら、2013年、PLOS ONE、第8巻、e84028、http://www.ncbi.nlm.nih.gov/PMC/articles/PMC3877130/pdf/pone.0084028.pdf)。このMIDDAS−Mを用いて、A. flavusを含む3種類のカビのゲノム塩基配列上で、480の二次代謝産物生合成遺伝子クラスターの存在を推定し、A.flavusが産生するウスチロキシンBがリボソームペプチドであり、遺伝子情報のデータベースを提供しているNCBI(http://www.ncbi.nlm.nih.gov/gene)遺伝子IDでAFLA_094940からAFLA_095110遺伝子で構成される遺伝子クラスターの働きによって産生されることを明らかにした。
The present inventors have further developed a bioinformatics method for estimating the presence of the secondary metabolite biosynthesis gene cluster described in
ウスチロキシンBは、図1に示される一般式で表される物質で、稲コウジ病菌(ウスチラギノイデア・ヴィレンス、Ustilaginoidea virens)が産生する二次代謝産物として知られている。ウスチロキシンBは、チロシン(Tyr)、アラニン(Ala)、イソロイシン(Ile)及びグリシン(Gly)がペプチド結合によって繋がった基本構造と、TyrとIleの間の環状構造とを有し、Tyrの芳香環にノルバリンが硫黄原子を介して結合している構造を有する。 Ustyroxine B is a substance represented by the general formula shown in FIG. 1 and is known as a secondary metabolite produced by rice Koji disease fungus (Ustilaginidea virens). Ustyroxine B has a basic structure in which tyrosine (Tyr), alanine (Ala), isoleucine (Ile) and glycine (Gly) are linked by a peptide bond, and a cyclic structure between Tyr and Ile. It has a structure in which norvaline is bonded to the ring through a sulfur atom.
<リボソームペプチド前駆体をコードする遺伝子>
本発明におけるリボソームペプチド生合成遺伝子クラスターは、小胞体移行シグナル配列及び反復配列を含むアミノ酸配列からなるリボソームペプチド前駆体をコードする遺伝子(以下、リボソームペプチド前駆体遺伝子と表す)を含む。ここで小胞体移行シグナル配列とは、タンパク質分子のN末端に位置する、正に荷電したアミノ酸、疎水性アミノ酸に富む領域及び極性を有するアミノ酸から構成されるアミノ酸配列として一般に認識されているアミノ酸配列であり、その具体的なアミノ酸配列は多数存在することが当業者に広く知られている。
<Gene encoding ribosomal peptide precursor>
The ribosomal peptide biosynthesis gene cluster in the present invention includes a gene encoding a ribosomal peptide precursor (hereinafter referred to as a ribosomal peptide precursor gene) consisting of an amino acid sequence including an endoplasmic reticulum translocation signal sequence and a repetitive sequence. Here, the endoplasmic reticulum migration signal sequence is an amino acid sequence generally recognized as an amino acid sequence composed of positively charged amino acids, regions rich in hydrophobic amino acids, and polar amino acids located at the N-terminus of the protein molecule. It is well known to those skilled in the art that there are many specific amino acid sequences.
リボソームペプチドは、非リボソームペプチドとは異なり、タンパク質合成の場であるリボソームを介して生合成されるが、環状構造、枝状構造あるいは非天然アミノ酸を含むなど、通常の構造タンパク質や酵素タンパク質にはあまり見られることのない化学的特徴を伴った、ペプチド結合を有する化合物をいう。本発明は、真菌由来のリボソームペプチドを製造する方法であり、かかるリボソームペプチドは、真菌のゲノムにコードされるリボソームペプチド前駆体から生合成される。 Unlike non-ribosomal peptides, ribosomal peptides are biosynthesized via the ribosome, which is the site of protein synthesis. However, ribosomal peptides include cyclic structures, branched structures, or unnatural amino acids, and so on. A compound having a peptide bond with chemical characteristics that are rarely seen. The present invention is a method for producing a ribosomal peptide derived from a fungus, which is biosynthesized from a ribosomal peptide precursor encoded in the fungal genome.
ウスチロキシンBの生合成遺伝子クラスターの構成遺伝子を詳細に解析したところ、NCBI遺伝子IDがAFLA_094980である機能未同定であった遺伝子が、小胞体移行シグナル配列とウスチロキシンBに見られる4つのアミノ酸(Tyr、Ala、Ile、Gly)がこの順序で並ぶ配列が16回繰り返されてなる反復配列とを含むアミノ酸配列をコードしていることが確認された。 When the constituent genes of the biosynthesis gene cluster of ustyroxin B were analyzed in detail, the gene whose NCBI gene ID was AFLA_094980, whose function was unidentified, was found to be 4 amino acids ( It was confirmed that Tyr, Ala, Ile, and Gly) encode an amino acid sequence including a repetitive sequence obtained by repeating a sequence arranged in this order 16 times.
上記解析の結果から、AFLA_094980は、小胞体移行能を有し、小胞体内でのペプチド合成経路を経てウスチロキシンBに変換されるウスチロキシンB前駆体をコードする遺伝子、すなわちリボソームペプチド前駆体遺伝子であると判断される。 From the results of the above analysis, AFLA — 0949980 is a gene encoding a ustyroxin B precursor that has an endoplasmic reticulum transfer ability and is converted to ustyroxin B through a peptide synthesis pathway in the ER, that is, a ribosomal peptide precursor gene. It is judged that.
また、Aspergillus属の真菌の分子生物学的情報をデータベース化しているAspGD(http://www.aspgd.org/、Cerqueiraら、2013年、Nucleic Acids Res.、第42巻、705−710ページ)に対して、Smith−Watermanアルゴリズム(Smithら、1981年、J.Mol.Biol.、第147巻、195−197ページ)を用いて自己配列内で局所的に類似する配列を有する反復配列を含むタンパク質を探索し、さらにフリーソフトであるSignalP 4.1(Nielsenら、1997年、Protein Eng.、第10巻、1−6ページ及びPetersenら、2011年、Nat.Methods、第8巻、785−786ページ)を用いてシグナルペプチドの有無を確認したところ、リボソームペプチド前駆体遺伝子が下記表1に示されるように複数のAspergillus属の真菌において見いだされた。これら遺伝子は、本発明における真菌由来のリボソームペプチド前駆体遺伝子としての好適な例を構成する。 In addition, AspGD (http://www.aspgd.org/, Cerqueira et al., 2013, Nucleic Acids Res., 42, 705-710) is a database of molecular biological information of fungi belonging to the genus Aspergillus. In contrast, using the Smith-Waterman algorithm (Smith et al., 1981, J. Mol. Biol., 147, 195-197), including repetitive sequences having locally similar sequences within the self-sequence ProteinP 4.1 (Nielsen et al., 1997, Protein Eng., Vol. 10, pages 1-6 and Petersen et al., 2011, Nat. Methods, Vol. 8, 785- 786 pages ) Was to confirm the presence or absence of a signal peptide using a ribosomal peptide precursor gene was found in fungi of a plurality of the genus Aspergillus, as shown in Table 1 below. These genes constitute a suitable example as a fungal-derived ribosome peptide precursor gene in the present invention.
<ustYaホモログ>
本発明におけるリボソームペプチド生合成遺伝子クラスターは、配列番号1に示される塩基配列に対するE値が1e−4未満でリボソームペプチドの生合成に関与するタンパク質をコードする塩基配列を有する遺伝子、配列番号2に示されるアミノ酸配列に対するE値が1e−4未満のアミノ酸配列からなりリボソームペプチドの生合成に関与するタンパク質をコードする遺伝子、又は配列番号3に示されるアミノ酸配列に対するE値が1e−4未満のアミノ酸配列からなりリボソームペプチドの生合成に関与するタンパク質をコードする遺伝子を含む。
<UstYa homolog>
The ribosomal peptide biosynthesis gene cluster in the present invention is a gene having a base sequence encoding a protein involved in ribosomal peptide biosynthesis with an E value of less than 1e-4 with respect to the base sequence shown in SEQ ID NO: 1, A gene that encodes a protein involved in the biosynthesis of a ribosomal peptide consisting of an amino acid sequence with an E value of less than 1e-4 for the amino acid sequence shown, or an amino acid with an E value of less than 1e-4 for the amino acid sequence shown in SEQ ID NO: 3 It contains a gene that encodes a protein consisting of a sequence and involved in the biosynthesis of ribosomal peptides.
また本発明におけるリボソームペプチド生合成遺伝子クラスターは、配列番号1に示される塩基配列に対するビットスコア(bit score)が50以上、好ましくは60以上、さらに好ましくは75以上であるリボソームペプチドの生合成に関与するタンパク質をコードする塩基配列を有する遺伝子、配列番号2に示されるアミノ酸配列に対するビットスコアが50以上、好ましくは60以上、さらに好ましくは75以上であるアミノ酸配列からなりリボソームペプチドの生合成に関与するタンパク質をコードする遺伝子、又は配列番号3に示されるアミノ酸配列に対するビットスコアが50以上、好ましくは60以上、さらに好ましくは75以上であるアミノ酸配列からなりリボソームペプチドの生合成に関与するタンパク質をコードする遺伝子を含むものであってもよい。 The ribosomal peptide biosynthetic gene cluster in the present invention is involved in the biosynthesis of ribosomal peptides having a bit score of 50 or more, preferably 60 or more, more preferably 75 or more with respect to the base sequence shown in SEQ ID NO: 1. A gene having a base sequence encoding a protein to be encoded, and an amino acid sequence having a bit score of 50 or more, preferably 60 or more, more preferably 75 or more with respect to the amino acid sequence shown in SEQ ID NO: 2, and is involved in the biosynthesis of ribosomal peptides A protein encoding a protein or a protein involved in the biosynthesis of a ribosomal peptide consisting of an amino acid sequence having a bit score of 50 or more, preferably 60 or more, more preferably 75 or more with respect to the amino acid sequence shown in SEQ ID NO: 3 Gene may include a that.
さらに本発明におけるリボソームペプチド生合成遺伝子クラスターは、配列番号3に示されるアミノ酸配列の81番目〜225番目のアミノ酸配列と20%以上、好ましくは40%以上、より好ましくは60%以上、なおより好ましくは80%以上、さらに好ましくは90%以上、最も好ましくは95%以上の同一性を有するアミノ酸配列を含み、リボソームペプチドの生合成に関与するタンパク質をコードする遺伝子を含むものであってもよい。 Furthermore, the ribosomal peptide biosynthetic gene cluster in the present invention is 20% or more, preferably 40% or more, more preferably 60% or more, even more preferably, the amino acid sequence of amino acid sequence 81 to 225 of SEQ ID NO: 3. May comprise an amino acid sequence having an identity of 80% or more, more preferably 90% or more, and most preferably 95% or more, and a gene encoding a protein involved in ribosomal peptide biosynthesis.
また本発明におけるリボソームペプチド生合成遺伝子クラスターは、
(i)配列番号1に示される塩基配列に対するE値が1e−4未満でリボソームペプチドの生合成に関与するタンパク質をコードする塩基配列を有する遺伝子、配列番号2に示されるアミノ酸配列に対するE値が1e−4未満のアミノ酸配列からなりリボソームペプチドの生合成に関与するタンパク質をコードする遺伝子、若しくは配列番号3に示されるアミノ酸配列に対するE値が1e−4未満のアミノ酸配列からなりリボソームペプチドの生合成に関与するタンパク質をコードする遺伝子、
(ii)配列番号1に示される塩基配列に対するビットスコアが50以上、好ましくは60以上、さらに好ましくは75以上であるリボソームペプチドの生合成に関与するタンパク質をコードする塩基配列を有する遺伝子、配列番号2に示されるアミノ酸配列に対するビットスコアが50以上、好ましくは60以上、さらに好ましくは75以上であるアミノ酸配列からなりリボソームペプチドの生合成に関与するタンパク質をコードする遺伝子、若しくは配列番号3に示されるアミノ酸配列に対するビットスコアが50以上、好ましくは60以上、さらに好ましくは75以上であるアミノ酸配列からなりリボソームペプチドの生合成に関与するタンパク質をコードする遺伝子、
又は
(iii)配列番号3に示されるアミノ酸配列の81番目〜225番目のアミノ酸配列と20%以上、好ましくは40%以上、より好ましくは60%以上、なおより好ましくは80%以上、さらに好ましくは90%以上、最も好ましくは95%以上の同一性を有するアミノ酸配列を含み、リボソームペプチドの生合成に関与するタンパク質をコードする遺伝子
であって、かつ、少なくとも一つの2核型金属捕捉モチーフを有するタンパク質をコードする遺伝子を含むものであってもよい。2核型金属捕捉モチーフの好ましいアミノ酸配列はHis−Xxx−Xxx−His−Cys(HXXHC)である。
The ribosomal peptide biosynthesis gene cluster in the present invention is
(I) a gene having a base sequence encoding a protein involved in biosynthesis of a ribosomal peptide having an E value of less than 1e-4 with respect to the base sequence shown in SEQ ID NO: 1, and an E value for the amino acid sequence shown in SEQ ID NO: 2 Biosynthesis of a ribosomal peptide comprising an amino acid sequence comprising an amino acid sequence of less than 1e-4 and encoding a protein involved in ribosomal peptide biosynthesis, or an amino acid sequence having an E value of less than 1e-4 relative to the amino acid sequence shown in SEQ ID NO: 3 A gene encoding a protein involved in
(Ii) a gene having a base sequence encoding a protein involved in biosynthesis of a ribosomal peptide having a bit score of 50 or more, preferably 60 or more, more preferably 75 or more with respect to the base sequence shown in SEQ ID NO: 1, SEQ ID NO: 2. A gene encoding a protein involved in the biosynthesis of a ribosomal peptide consisting of an amino acid sequence having a bit score of 50 or more, preferably 60 or more, more preferably 75 or more with respect to the amino acid sequence shown in 2, or shown in SEQ ID NO: 3 A gene encoding a protein involved in the biosynthesis of a ribosomal peptide, comprising an amino acid sequence having a bit score of 50 or more, preferably 60 or more, more preferably 75 or more, relative to the amino acid sequence;
Or (iii) 20% or more, preferably 40% or more, more preferably 60% or more, still more preferably 80% or more, and more preferably, the amino acid sequence of amino acid sequence 81 to 225 of SEQ ID NO: 3 A gene encoding a protein involved in ribosomal peptide biosynthesis, comprising an amino acid sequence having 90% or more, most preferably 95% or more identity, and having at least one binuclear metal capture motif It may contain a gene encoding a protein. A preferred amino acid sequence of the binuclear metal capture motif is His-Xxx-Xxx-His-Cys (HXXHC).
配列番号1に示される塩基配列からなる遺伝子(以下、ustYaと表す)は、NCBI遺伝子IDがAFLA_094990である機能未同定であった遺伝子である。本発明者らの研究により、ウスチロキシンBを生合成することのできる黄色麹菌(A.flavus)のゲノム上でustYaが破壊された株は、ウスチロキシンBを生産しなくなることが確認された。すなわちustYaは、リボソームペプチドであるウスチロキシンBの生合成に関与する遺伝子である。また、ゲノム上の位置は、ウスチロキシンBの前駆体をコードしている前記AFLA_094980に隣接して存在しており、ウスチロキシンBの生合成遺伝子クラスターの構成遺伝子の1つである。 The gene consisting of the base sequence shown in SEQ ID NO: 1 (hereinafter referred to as ustYa) is an unidentified gene whose NCBI gene ID is AFLA_094990. According to the studies by the present inventors, it was confirmed that a strain in which ustYa was disrupted on the genome of A. flavus capable of biosynthesizing ustyroxin B does not produce ustyroxin B. That is, ustYa is a gene involved in biosynthesis of ustyroxin B, which is a ribosomal peptide. Further, the position on the genome is adjacent to the AFLA_094980 encoding the precursor of ustyroxin B, and is one of the constituent genes of the biosynthesis gene cluster of ustyroxin B.
また、配列番号2は、配列番号1の塩基配列から演繹推定されたアミノ酸配列として、NCBIデータベースに登録されているアミノ酸配列である。このアミノ酸配列を基に、2013年12月16日の時点の前記AspGD及びUniProtKB(version 2013_08、Magraneら、2011年、Database bar009)に対してBlastp検索を行ったところ、E値が1e−4未満のアミノ酸配列からなるタンパク質をコードしている遺伝子が、下記表2に示されるように複数のAspergillus属の真菌において見いだされた。さらに、これら遺伝子はいずれも、各真菌においてリボソームペプチド前駆体遺伝子に隣接あるいは最大で25Kbの範囲内(遺伝子の数では、リボソームペプチド前駆体遺伝子との間に最大で10遺伝子が存在している程度の範囲)といった近傍に位置していることも確認された。これら遺伝子は、リボソームペプチド前駆体遺伝子と共に真菌由来のリボソームペプチド生合成遺伝子クラスターの構成遺伝子であり、当該リボソームペプチド前駆体からのリボソームペプチドの生合成に関与するタンパク質をコードする遺伝子としての好適な例を構成する。なお、表中のAspGD ID番号は、前記AspGDにおいて使用されている、登録された遺伝子のID番号である。 SEQ ID NO: 2 is an amino acid sequence registered in the NCBI database as an amino acid sequence deduced from the base sequence of SEQ ID NO: 1. When a Blastp search was performed on the AspGD and UniProtKB (version 2013 — 08, Magrane et al., 2011, Database bar009) as of December 16, 2013 based on this amino acid sequence, the E value was less than 1e-4. As shown in Table 2 below, a gene encoding a protein consisting of the amino acid sequences of Aspergillus was found in a plurality of fungi of the genus Aspergillus. Furthermore, all of these genes are adjacent to the ribosomal peptide precursor gene in each fungus or within a range of 25 Kb at the maximum (in terms of the number of genes, there is a maximum of 10 genes between the ribosomal peptide precursor gene and each gene). It was also confirmed that it is located in the vicinity. These genes are constituent genes of fungal-derived ribosomal peptide biosynthesis gene clusters together with ribosomal peptide precursor genes, and suitable examples as genes encoding proteins involved in ribosomal peptide biosynthesis from the ribosomal peptide precursors. Configure. The AspGD ID number in the table is an ID number of a registered gene used in the AspGD.
配列番号3に示されるアミノ酸配列は、後に説明するように、配列番号1の塩基配列を有する遺伝子から転写翻訳されることで実際に生合成されるタンパク質(以下、ustYaタンパク質と表す)のアミノ酸配列である。 As will be described later, the amino acid sequence shown in SEQ ID NO: 3 is an amino acid sequence of a protein that is actually biosynthesized by transcription and translation from a gene having the base sequence of SEQ ID NO: 1 (hereinafter referred to as a ustYa protein). It is.
E値(E−value、expectation value)とは、ある配列(クエリー配列)ともう一つの配列との間の相同性を評価する指標の一つであり、あるクエリー配列に対してランダムな配列データベースを検索した際に、そのスコア以上の値になるアライメントの本数の期待値をいう。特に本発明では、配列データベースに対して検索手段としてblastx、tblastx、tblastn、blastp、又はpsi−blastのいずれかの相同性検索プログラム(以下、纏めてBlast法と表す)を用いた相同性検索を実行したときのE値を採用する。特にBlast法においてデフォルトのパラメータ条件で相同性検索を実行したときのE値であることが好ましい。従って、ある1つの種の微生物の全配列情報に対して、配列番号1に示される塩基配列をクエリー配列とし、Blast法を用いた相同性検索の結果としてE値が1e−4未満である塩基配列を含む遺伝子、又は配列番号2に示されるアミノ酸配列若しくは配列番号3に示されるアミノ酸配列をクエリー配列とし、Blast法を用いた相同性検索の結果としてE値が1e−4未満であるアミノ酸配列をコードする遺伝子などを含むリボソームペプチド生合成遺伝子クラスターが、本発明の対象とされる。また、検索対象とされるデータベースとしては、前述のUniProt若しくはAspGD、又はUniProtKB/Swiss−Prot(http://web.expasy.org/docs/swiss−prot_guideline.html)などを挙げることができる。 The E value (E-value, extraction value) is one of indices for evaluating the homology between a certain sequence (query sequence) and another sequence, and is a random sequence database for a certain query sequence. Is the expected value of the number of alignments that becomes a value equal to or higher than that score. In particular, in the present invention, homology search using any of the blastx, tblastx, tblastn, blastp, or psi-blast homology search programs (hereinafter collectively referred to as the Blast method) as a search means for the sequence database. The E value when executed is adopted. In particular, the E value is preferred when the homology search is executed under the default parameter conditions in the Blast method. Therefore, for the entire sequence information of a microorganism of a certain species, the base sequence shown in SEQ ID NO: 1 is used as a query sequence, and the E value is less than 1e-4 as a result of homology search using the Blast method. A gene containing a sequence, or an amino acid sequence having an E value of less than 1e-4 as a result of a homology search using the Blast method using the amino acid sequence shown in SEQ ID NO: 2 or the amino acid sequence shown in SEQ ID NO: 3 as a query sequence A ribosomal peptide biosynthetic gene cluster containing a gene coding for and the like is a subject of the present invention. Examples of databases to be searched include UniProt or AspGD, or UniProtKB / Swiss-Prot (http://web.expasy.org/docs/swiss-prot_guideline.html).
ビットスコアは、Blast法においてデフォルトのパラメータ条件で相同性検索を実行したときの値であることが好ましい。 The bit score is preferably a value obtained when a homology search is executed under the default parameter conditions in the Blast method.
また本発明では、配列番号3に示されるアミノ酸配列の81番目〜225番目のアミノ酸配列と20%以上、好ましくは40%以上、より好ましくは60%以上、なおより好ましくは80%以上、さらに好ましくは90%以上、最も好ましくは95%以上の同一性を有するアミノ酸配列を含み、リボソームペプチドの生合成に関与するタンパク質をコードする遺伝子を含むリボソームペプチド生合成遺伝子クラスターも対象とされる。前記81番目〜225番目のアミノ酸配列は、配列番号3に示されるアミノ酸配列からなるタンパク質の膜貫通(TM)へリックスよりもC末端側の領域である。 Further, in the present invention, the amino acid sequence of amino acids 81 to 225 of SEQ ID NO: 3 is 20% or more, preferably 40% or more, more preferably 60% or more, still more preferably 80% or more, even more preferably. Also included are ribosomal peptide biosynthetic gene clusters comprising amino acid sequences having 90% or more identity, most preferably 95% or more identity, and including genes encoding proteins involved in ribosomal peptide biosynthesis. The 81st to 225th amino acid sequences are regions C-terminal to the transmembrane (TM) helix of the protein consisting of the amino acid sequence shown in SEQ ID NO: 3.
本発明では、ustYaと上記の一定の相同性を示す遺伝子をUstYaホモログ遺伝子と表す。 In the present invention, a gene exhibiting the above-mentioned certain homology with ustYa is represented as a UstYa homolog gene.
本発明にいうリボソーム前駆体ペプチドとustYaホモログ遺伝子との組合せは、前記表1に示されるリボソーム前駆体ペプチドをコードする遺伝子22種類と表2に示されるustYaホモログ遺伝子22種類を含み、2013年12月16日の時点でAspGDに登録されているAspergillus属細菌において多数存在することが本発明者らにより確認された。これら両遺伝子の組合せを表3〜表6に示す。これら組合せを含むリボソームペプチド生合成遺伝子クラスターは本発明の製造方法において利用可能なものの例である。 The combination of the ribosome precursor peptide and the ustYa homolog gene referred to in the present invention includes 22 types of genes encoding the ribosome precursor peptide shown in Table 1 and 22 types of ustYa homolog genes shown in Table 2. As of the 16th of the month, the present inventors have confirmed that a large number of bacteria exist in the genus Aspergillus registered in AspGD. Tables 3 to 6 show combinations of these two genes. Ribosomal peptide biosynthetic gene clusters containing these combinations are examples of those that can be used in the production method of the present invention.
<ustYbホモログ>
本発明におけるリボソームペプチド生合成遺伝子クラスターは、上記ustYaホモログ遺伝子と共に又はこれに代えて、配列番号6に示されるアミノ酸配列に対するE値が1e−4未満のアミノ酸配列からなりリボソームペプチドの生合成に関与するタンパク質をコードする遺伝子を含んでいるものでもよい。
<UstYb homolog>
The ribosomal peptide biosynthetic gene cluster in the present invention consists of an amino acid sequence having an E value of less than 1e-4 with respect to the amino acid sequence shown in SEQ ID NO: 6 together with or in place of the above ustYa homolog gene and is involved in the biosynthesis of ribosomal peptides. It may contain a gene encoding the protein to be processed.
また本発明におけるリボソームペプチド生合成遺伝子クラスターは、上記ustYaホモログ遺伝子と共に又はこれに代えて、配列番号6に示されるアミノ酸配列に対するビットスコアが50以上、好ましくは60以上、さらに好ましくは75以上であるアミノ酸配列からなりリボソームペプチドの生合成に関与するタンパク質をコードする遺伝子を含むものであってもよい。 The ribosomal peptide biosynthetic gene cluster in the present invention has a bit score of 50 or more, preferably 60 or more, more preferably 75 or more with respect to the amino acid sequence shown in SEQ ID NO: 6 together with or instead of the above ustYa homolog gene. It may contain an amino acid sequence and a gene encoding a protein involved in ribosomal peptide biosynthesis.
また、本発明におけるリボソームペプチド生合成遺伝子クラスターは、上記ustYaホモログ遺伝子と共に又はこれに代えて、配列番号6に示されるアミノ酸配列の57番目〜259番目のアミノ酸配列と20%以上、好ましくは40%以上、より好ましくは60%以上、なおより好ましくは80%以上、さらに好ましくは90%以上、最も好ましくは95%以上の同一性を有するアミノ酸配列を含み、リボソームペプチドの生合成に関与するタンパク質をコードする遺伝子を含んでいるものでもよい。 The ribosomal peptide biosynthetic gene cluster in the present invention is 20% or more, preferably 40% of the 57th to 259th amino acid sequences of the amino acid sequence shown in SEQ ID NO: 6, together with or in place of the above ustYa homolog gene. Or more, more preferably 60% or more, still more preferably 80% or more, more preferably 90% or more, most preferably 95% or more of an amino acid sequence having an identity, and a protein involved in ribosomal peptide biosynthesis It may contain a gene to be encoded.
また本発明におけるリボソームペプチド生合成遺伝子クラスターは、配列番号6に示されるアミノ酸配列に対するE値が1e−4未満のアミノ酸配列、配列番号6に示されるアミノ酸配列に対するビットスコアが50以上、好ましくは60以上、さらに好ましくは75以上であるアミノ酸配列、又は配列番号6に示されるアミノ酸配列の57番目〜259番目のアミノ酸配列と20%以上、好ましくは40%以上、より好ましくは60%以上、なおより好ましくは80%以上、さらに好ましくは90%以上、最も好ましくは95%以上の同一性を有するアミノ酸配列を含み、かつ少なくとも一つの2核型金属捕捉モチーフを有するタンパク質をコードする遺伝子を含むものであってもよい。2核型金属捕捉モチーフの好ましいアミノ酸配列はHis−Xxx−Xxx−His−Cys(HXXHC)である。 The ribosomal peptide biosynthetic gene cluster in the present invention has an E value of less than 1e-4 for the amino acid sequence shown in SEQ ID NO: 6, and a bit score of 50 or more, preferably 60 for the amino acid sequence shown in SEQ ID NO: 6. More preferably, the amino acid sequence is 75 or more, or the 57th to 259th amino acid sequence of the amino acid sequence shown in SEQ ID NO: 6 and 20% or more, preferably 40% or more, more preferably 60% or more, and even more Preferably, the gene comprises a gene encoding a protein having an amino acid sequence having an identity of 80% or more, more preferably 90% or more, most preferably 95% or more, and having at least one binuclear metal capture motif. There may be. A preferred amino acid sequence of the binuclear metal capture motif is His-Xxx-Xxx-His-Cys (HXXHC).
配列番号4に示される塩基配列からなる遺伝子は、NCBI遺伝子IDがAFLA_095020である機能未同定であった遺伝子である。本発明者らの研究により、ウスチロキシンBを生合成することのできる黄色麹菌(A.flavus)のゲノム上で遺伝子AFLA_095020を欠失させた株は、ウスチロキシンBを殆ど生産しなくなることが確認された。すなわち遺伝子AFLA_095020は、リボソームペプチドであるウスチロキシンBの生合成に関与する遺伝子である。また、ゲノム上の位置は、ウスチロキシンBの前駆体をコードしている前記AFLA_094980から2kbほどの範囲内といった近傍に存在しており、ウスチロキシンBの生合成遺伝子クラスターの構成遺伝子の1つである。 The gene consisting of the base sequence shown in SEQ ID NO: 4 is a gene whose function was unidentified whose NCBI gene ID is AFLA — 095020. According to the study by the present inventors, it was confirmed that a strain in which the gene AFLA — 095020 was deleted on the genome of A. flavus capable of biosynthesizing ustyroxin B hardly produces ustyroxin B. It was done. That is, gene AFLA — 095020 is a gene involved in biosynthesis of ustyroxin B, which is a ribosomal peptide. In addition, the position on the genome is in the vicinity of the AFLA_0949980 encoding the precursor of ustyroxin B and within a range of about 2 kb, and is one of the constituent genes of the biosynthesis gene cluster of ustyroxin B. is there.
一方、遺伝子AFLA_095020から演繹推定され、NCBIに登録されているタンパク質のアミノ酸配列は配列番号5に示されるものであるが、実際に遺伝子AFLA_095020を含むゲノム領域から転写翻訳されるタンパク質のアミノ酸配列は、配列番号6に示されるものであることが確認された。したがって、かかる配列番号6に示されるアミノ酸配列からなるタンパク質(以下、ustYbタンパク質と表す)が、ウスチロキシンB生合成経路に関与していることが明らかとなった。 On the other hand, the amino acid sequence of the protein deduced from the gene AFLA — 095020 and registered in NCBI is shown in SEQ ID NO: 5, but the amino acid sequence of the protein that is actually transcribed and translated from the genomic region containing the gene AFLA — 095020 is It was confirmed that it was shown in SEQ ID NO: 6. Therefore, it was clarified that the protein consisting of the amino acid sequence shown in SEQ ID NO: 6 (hereinafter referred to as ustYb protein) is involved in the ustyroxin B biosynthetic pathway.
本発明は、前記リボソームペプチド前駆体遺伝子、及びustYbタンパク質に対する先に説明したE値が1e−4未満のアミノ酸配列からなりリボソームペプチドの生合成に関与するタンパク質をコードする遺伝子(以下、ustYbホモログ遺伝子と表す)を含むリボソームペプチド生合成遺伝子クラスターも、対象とするものである。 The present invention provides a gene encoding a protein involved in the biosynthesis of a ribosomal peptide (hereinafter referred to as a ustYb homolog gene) consisting of the amino acid sequence having an E value of less than 1e-4 as described above for the ribosomal peptide precursor gene and the ustYb protein. A ribosomal peptide biosynthetic gene cluster including
ここで、E値、ビットスコア、Blast法の検索条件、対象データベース等については先に述べたとおりである。従って、データベースに登録されたアミノ酸配列情報に対して、配列番号6に示されるアミノ酸配列をクエリー配列とし、Blast法を用いた相同性検索の結果としてE値が1e−4未満であるアミノ酸配列又はビットスコアが50以上、好ましくは60以上、さらに好ましくは75以上であるアミノ酸配列をコードする遺伝子及び前記リボソームペプチド前駆体遺伝子を含むリボソームペプチド生合成遺伝子クラスターは、本発明の対象とされる。 Here, the E value, the bit score, the search condition of the Blast method, the target database, and the like are as described above. Therefore, for the amino acid sequence information registered in the database, the amino acid sequence shown in SEQ ID NO: 6 is used as a query sequence, and as a result of homology search using the Blast method, an amino acid sequence having an E value of less than 1e-4 or A gene encoding an amino acid sequence having a bit score of 50 or more, preferably 60 or more, more preferably 75 or more, and a ribosome peptide biosynthesis gene cluster including the ribosome peptide precursor gene are a subject of the present invention.
また本発明では、前記リボソームペプチド前駆体遺伝子及び配列番号6に示されるアミノ酸配列の57番目〜259番目のアミノ酸配列と20%以上、好ましくは40%以上、より好ましくは60%以上、なおより好ましくは80%以上、さらに好ましくは90%以上、最も好ましくは95%以上の同一性を有するアミノ酸配列を含み、リボソームペプチドの生合成に関与するタンパク質をコードする遺伝子を含むリボソームペプチド生合成遺伝子クラスターも本発明の対象に含まれる。配列番号6に示されるアミノ酸配列の57番目〜259番目のアミノ酸配列は、配列番号6に示されるアミノ酸配列からなるタンパク質の膜貫通(TM)へリックスよりもC末端側の領域である。 In the present invention, the 57-259th amino acid sequence of the ribosomal peptide precursor gene and the amino acid sequence shown in SEQ ID NO: 6 is 20% or more, preferably 40% or more, more preferably 60% or more, and even more preferably. Is a ribosomal peptide biosynthesis gene cluster comprising an amino acid sequence having an identity of 80% or more, more preferably 90% or more, most preferably 95% or more, and a gene encoding a protein involved in ribosomal peptide biosynthesis. It is included in the subject of the present invention. The 57th to 259th amino acid sequences of the amino acid sequence shown in SEQ ID NO: 6 are regions on the C-terminal side of the transmembrane (TM) helix of the protein consisting of the amino acid sequence shown in SEQ ID NO: 6.
本発明では、ustYbと上記の一定の相同性を示す遺伝子をUstYbホモログ遺伝子と表す。 In the present invention, a gene showing a certain homology with ustYb is represented as a UstYb homolog gene.
<強制発現>
本発明は、前述のリボソームペプチド前駆体をコードする遺伝子並びにustYaホモログ遺伝子及び/又はustYbホモログ遺伝子を少なくとも含むリボソームペプチド生合成遺伝子クラスターを細胞内で強制発現させる工程a)を含む。
<Forced expression>
The present invention includes a step a) of forcibly expressing in a cell a ribosomal peptide biosynthetic gene cluster containing at least a gene encoding the above-mentioned ribosomal peptide precursor and a ustYa homolog gene and / or a ustYb homolog gene.
真菌における前記特徴を有するリボソームペプチド生合成遺伝子クラスターに関する報告は非特許文献1以外にはなく、またかかるリボソームペプチド生合成遺伝子クラスターを細胞内で強制発現させて真菌由来のリボソームペプチドを製造しようとする試みも行われてはいなかった。本発明は、これまでに報告のない新規な真菌由来のリボソームペプチドを製造する方法を提供するものである。
There are no reports on ribosomal peptide biosynthetic gene clusters having the above-mentioned characteristics in fungi other than
リボソームペプチド前駆体をコードする遺伝子並びにustYaホモログ遺伝子及び/又はustYbホモログ遺伝子を少なくとも含むリボソームペプチド生合成遺伝子クラスターは、MIDDAS−Mアルゴリズムを用いることで、ゲノム配列上において特定すればよい。また、真菌由来のリボソームペプチドの配列情報が蓄積されたときは、SMURF(J.Craig Venter Institute、http://jcvi.org/smurf/index.php)又はantiSMASH(Antibiotics&Secondery Metabolite Analysis SHell、http://antismash.secondarymetabolites.org/)等の既知の二次代謝遺伝子クラスター予測アルゴリズムも利用可能となる。あるいは、配列番号1〜6に示されるアミノ酸配列又は塩基配列を基にそれぞれのホモログ遺伝子を検索し、その結果を基に当該遺伝子の近傍にあるリボソームペプチド前駆体遺伝子を含むクラスターを特定してもよい。なお、前記リボソームペプチド前駆体をコードする遺伝子とustYaホモログ遺伝子及び/又はustYbホモログ遺伝子とが、隣接している又は最大で25Kbの範囲内に位置している、又はリボソームペプチド前駆体遺伝子とustYaホモログ遺伝子及び/又はustYbホモログ遺伝子との間に最大で10遺伝子が存在している程度の範囲内に位置しているリボソームペプチド生合成遺伝子クラスターが、本発明の対象である。 A ribosomal peptide biosynthetic gene cluster including at least a gene encoding a ribosomal peptide precursor and a ustYa homolog gene and / or a ustYb homolog gene may be identified on the genome sequence by using the MIDDAS-M algorithm. In addition, when sequence information of ribosomal peptides derived from fungi is accumulated, SMURF (J. Craig Venter Institute, http://jcvi.org/smurf/index.php) or anti-SMASH (Antibiotics & Secondary Metals / Secondary Metals: Also known secondary metabolic gene cluster prediction algorithms such as /antismash.secondarymetabolites.org/) are available. Alternatively, even if each homologous gene is searched based on the amino acid sequence or base sequence shown in SEQ ID NOs: 1 to 6 and a cluster containing a ribosomal peptide precursor gene in the vicinity of the gene is specified based on the result, Good. The gene encoding the ribosomal peptide precursor and the ustYa homolog gene and / or the ustYb homolog gene are adjacent to each other or located within a range of 25 Kb at the maximum, or the ribosomal peptide precursor gene and the ustYa homolog A ribosomal peptide biosynthetic gene cluster located within a range where there are at most 10 genes between the gene and / or the ustYb homolog gene is the subject of the present invention.
本発明におけるリボソームペプチド生合成遺伝子クラスターは、ペプチダーゼ活性を有するタンパク質をコードする遺伝子を含むように特定することが好ましい。ペプチダーゼ活性を有するタンパク質は、リボソームペプチド前駆体の反復配列を切断するなどして、リボソームペプチドの生合成に関与する。ペプチダーゼ活性を有するタンパク質をコードする遺伝子は、ゲノムの塩基配列から演繹推定される既知のペプチダーゼドメイン配列又はこれに類似するアミノ酸配列をコードする遺伝子として特定することができる。 The ribosomal peptide biosynthesis gene cluster in the present invention is preferably specified so as to include a gene encoding a protein having peptidase activity. Proteins having peptidase activity are involved in the biosynthesis of ribosomal peptides, such as by cleaving repetitive sequences of ribosomal peptide precursors. A gene encoding a protein having peptidase activity can be identified as a gene encoding a known peptidase domain sequence deduced from the base sequence of the genome or an amino acid sequence similar thereto.
リボソームペプチド生合成遺伝子クラスターの強制発現は、かかるリボソームペプチド生合成遺伝子クラスターをゲノム上に有する真菌細胞内において行ってもよく、又は当業者に知られた遺伝子組換え手法を用いてリボソームペプチド生合成遺伝子クラスター全体を適当な発現ベクターにクローニングし、異種若しくは同種の真菌細胞、酵母、又は細菌その他の宿主細胞に導入した後にこれを強制発現させてもよい。真菌細胞を宿主とするときは、A.niger、A.nidulans、A.flavus、A.oryzaeその他のAspergillus属の真菌細胞を用いることが好ましい。 The forced expression of a ribosomal peptide biosynthesis gene cluster may be performed in a fungal cell having such a ribosomal peptide biosynthesis gene cluster on its genome, or ribosomal peptide biosynthesis using a genetic recombination technique known to those skilled in the art. The entire gene cluster may be cloned into an appropriate expression vector and introduced into heterologous or homologous fungal cells, yeast, bacteria or other host cells and then forced to express. When fungal cells are used as a host, A. niger, A.M. nidulans, A.N. flavus, A.M. It is preferable to use oryzae and other Aspergillus fungal cells.
上記アルゴリズムあるいは相同性検索によって特定されたリボソームペプチド生合成遺伝子クラスターの強制発現は、リボソームペプチド生合成遺伝子クラスター自身が有する転写因子をコードする遺伝子(以下、C6型TF遺伝子と称する)の転写を誘導することにより行うことができる。C6型TF遺伝子の転写は、C6型TF遺伝子自身のプロモーターによるものでもよく、又はC6型TF遺伝子のプロモーターを細胞内で機能する別のプロモーターに置き換えて誘導してもよい。また、C6型TF遺伝子のプロモーターに細胞内で機能する別のプロモーターを連結させて、C6型TF遺伝子の転写を誘導してもよい。あるいは、C6型TF遺伝子全体を細胞内で機能するプロモーターを有する別のTF遺伝子に置き換えて、リボソーム生合成遺伝子クラスター全体の発現を誘導してもよい。また、上記の方法に準じて、リボソームペプチド生合成遺伝子クラスターを構成する遺伝子の一つ一つの発現を誘導することにより、リボソームペプチド生合成遺伝子クラスター全体を強制発現させてもよい。 The forced expression of the ribosomal peptide biosynthetic gene cluster identified by the above algorithm or homology search induces the transcription of the gene encoding the transcription factor of the ribosomal peptide biosynthetic gene cluster itself (hereinafter referred to as C6 type TF gene). This can be done. The transcription of the C6 type TF gene may be performed by the promoter of the C6 type TF gene itself, or may be induced by replacing the promoter of the C6 type TF gene with another promoter that functions in the cell. Alternatively, transcription of the C6 type TF gene may be induced by linking another promoter that functions in the cell to the promoter of the C6 type TF gene. Alternatively, the entire C6 type TF gene may be replaced with another TF gene having a promoter that functions in the cell to induce expression of the entire ribosome biosynthesis gene cluster. Further, in accordance with the above method, the entire ribosome peptide biosynthesis gene cluster may be forcibly expressed by inducing the expression of each gene constituting the ribosome peptide biosynthesis gene cluster.
細胞内で機能する別のプロモーターは、リボソームペプチド生合成遺伝子クラスターを強制発現させようとする細胞の種類によって適宜選択し、当業者に知られた遺伝子組換え手法によってゲノム上で又はベクター上で組み換えることができる。真菌細胞内でリボソームペプチド生合成遺伝子クラスターを強制発現させるために好適なプロモーターの例としては、アスペルギルス属菌由来のtef1遺伝子プロモーター(Kitamotoら、1998年、Appl.Microbiol.Biotechnol.、第50巻、85−92ページ)、gpdA遺伝子プロモーター(Puntら、J Biotechnol.1991年、第17巻、19−33ページ)、β−キシロシダーゼxlnDプロモーター、アルコール脱水素酵素(alcA)のプロモーター(Waringら、Gene,1989年、第79巻、119−130ページ)、α−アミラーゼ遺伝子のプロモーター(Tadaら、Mol.Gen.Genet.、1991年、第229巻、301−306ページ)、ThiAプロモーター(Shojiら、FEMS Microbiol.Lett.、2005年、第244巻、41−46ページ)、大腸菌のβ−グルクロニダーゼ遺伝子プロモーター(Robertsら、Curr.Genet.、1989年、第15巻、177−180ページ)、グルコアミラーゼ遺伝子(glaA)のプロモーターなどを挙げることができる。 Another promoter that functions in the cell is appropriately selected according to the type of cell for which the ribosomal peptide biosynthesis gene cluster is to be forcibly expressed, and recombined on the genome or on the vector by genetic recombination methods known to those skilled in the art. Can. Examples of promoters suitable for forced expression of ribosomal peptide biosynthetic gene clusters in fungal cells include the tef1 gene promoter from Aspergillus (Kitamoto et al., 1998, Appl. Microbiol. Biotechnol., 50, 85-92), gpdA gene promoter (Punt et al., J Biotechnol. 1991, 17, 19-33), β-xylosidase xlnD promoter, alcohol dehydrogenase (alcA) promoter (Waring et al., Gene, 1989, 79, 119-130), promoter of α-amylase gene (Tada et al., Mol. Gene. Genet., 1991, 229, 301-306), hiA promoter (Shoji et al., FEMS Microbiol. Lett., 2005, 244, 41-46), Escherichia coli β-glucuronidase gene promoter (Roberts et al., Curr. Genet., 1989, 15, 177-). 180)) and a promoter of glucoamylase gene (glaA).
細胞内でのリボソームペプチド生合成遺伝子クラスターの強制発現は、当該クラスターを有する細胞を、その細胞に適した培地で培養することにより行うことができる。真菌の培養に適した培地としては、サブローデキストロース培地、ポテトデキストロース培地、マイコセル培地、ブレインハートインフュージョン培地、野菜ジュース培地、イーストエクストラクト培地、トリプティックソイ培地等を挙げることができ、その形態は液体培地でも寒天培地等の固形培地でもよい。培養は、真菌に一般的な条件、例えば30℃前後の温度で好気的に培養すればよい。 The forced expression of a ribosomal peptide biosynthesis gene cluster in a cell can be performed by culturing a cell having the cluster in a medium suitable for the cell. Examples of the medium suitable for fungal culture include Sabouraud dextrose medium, potato dextrose medium, mycocell medium, brain heart infusion medium, vegetable juice medium, yeast extract medium, tryptic soy medium, and the like. It may be a medium or a solid medium such as an agar medium. The culture may be aerobically cultured under conditions common to fungi, for example, at a temperature around 30 ° C.
<回収>
本発明は、細胞からリボソームペプチドを回収する工程b)を含む。リボソームペプチドの細胞からの回収は、リボソームペプチドを生産可能な条件で培養した細胞の培地から、一般的に知られた手法により回収することができる。また、当該細胞の内部にリボソームペプチドが蓄積しているときは、細胞を適当な方法で破壊した後に通常の手法により回収すればよい。回収されたリボソームペプチドは、水又は適当な緩衝溶液あるいは有機溶媒などに溶解又は懸濁して保存し、使用してもよい。また、凍結乾燥その他の適当な方法によって乾燥させてもよい。
<Recovery>
The present invention includes step b) of recovering the ribosomal peptide from the cell. The ribosomal peptide can be recovered from the cells by a generally known technique from a cell culture medium cultured under conditions capable of producing the ribosomal peptide. Further, when ribosomal peptides are accumulated inside the cells, the cells may be collected by a normal method after being destroyed by an appropriate method. The recovered ribosomal peptide may be stored and used after dissolving or suspending in water, a suitable buffer solution or an organic solvent. Moreover, you may dry by freeze drying and other suitable methods.
<ustYaタンパク質>
本発明はさらに、配列番号3に示されるアミノ酸配列、又は前記アミノ酸配列の1〜数個のアミノ酸が欠失若しくは置換されたアミノ酸配列若しくは前記アミノ酸配列に1〜数個のアミノ酸が付加されたアミノ酸配列からなり、真菌細胞内におけるリボソームペプチドの生合成に関与するタンパク質、及びこれをコードするcDNAを提供する。
<UstYa protein>
The present invention further includes the amino acid sequence shown in SEQ ID NO: 3, the amino acid sequence in which one to several amino acids of the amino acid sequence are deleted or substituted, or the amino acid sequence in which one to several amino acids are added. A protein comprising a sequence and involved in the biosynthesis of a ribosomal peptide in a fungal cell, and a cDNA encoding the same are provided.
配列番号3に示されるアミノ酸配列からなるタンパク質は、配列番号1に示される塩基配列からなる遺伝子すなわちustYa(NCBI遺伝子ID AFLA_094990)から転写翻訳され、生合成されるタンパク質である。ustYaの塩基配列の開始コドン及び読み枠を考慮した解析は、複数のイントロン及びエクソンの存在と、ustYa遺伝子産物として配列番号2に示されるアミノ酸配列からなるタンパク質を示す。しかしながら、A.flavus細胞内で転写されているmRNAの塩基配列を実験的に決定した結果、ustYaタンパク質のアミノ酸配列は配列番号3に示されるものであり、演繹推定される配列番号2のそれとは異なることが確認された。この様に、配列番号3に示されるアミノ酸配列からなるタンパク質は新規な物質である。 The protein consisting of the amino acid sequence shown in SEQ ID NO: 3 is a protein that is transcriptionally translated from the gene consisting of the base sequence shown in SEQ ID NO: 1, ie, ustYa (NCBI gene ID AFLA — 094990), and biosynthesized. The analysis of the base sequence of ustYa in consideration of the start codon and the reading frame shows the presence of a plurality of introns and exons and a protein consisting of the amino acid sequence shown in SEQ ID NO: 2 as the ustYa gene product. However, A. As a result of experimental determination of the base sequence of mRNA transcribed in flavus cells, it was confirmed that the amino acid sequence of the ustYa protein is as shown in SEQ ID NO: 3, which is different from that of SEQ ID NO: 2 deduced. It was done. Thus, the protein consisting of the amino acid sequence shown in SEQ ID NO: 3 is a novel substance.
後に実施例で示すように、A.flavusのゲノム上のustYa遺伝子を外来遺伝子で置換してustYa遺伝子の機能を失わせることにより、A.flavusのウスチロキシンB及びウスチロキシンFの生産能が失われる。すなわち、ustYaタンパク質はウスチロキシンB及びウスチロキシンFの生合成に関与するタンパク質である。ustYaタンパク質には、金属イオン、特に亜鉛イオンとの結合に関与するモチーフ配列領域、及びWH1ドメインに似た領域などが認められ、リボソームペプチド前駆体の翻訳過程におけるタンパク質輸送、tyrとIleとの間の環状構造の形成、酸化還元活性、GTPase活性、ATP結合能、遺伝子発現又は転写制御能などの機能を通じて、ウスチロキシンBの生合成に関与していると推察される。 As will be shown later in the examples, A.I. By replacing the ustYa gene on the flavus genome with a foreign gene, the function of the ustYa gene is lost. The ability to produce flavus ustyroxine B and ustyroxine F is lost. That is, the ustYa protein is a protein involved in biosynthesis of ustyroxin B and ustyroxine F. The ustYa protein includes a motif sequence region involved in binding to metal ions, particularly zinc ions, and a region similar to the WH1 domain. Protein transport during translation of the ribosomal peptide precursor, between tyr and Ile It is presumed that it is involved in the biosynthesis of austyroxin B through functions such as the formation of a cyclic structure, redox activity, GTPase activity, ATP binding ability, gene expression or transcription control ability.
また、配列番号3に示されるアミノ酸配列を基にタンパク質配列データベースである前記UniProtKBについてBlast検索したところ、真菌類(Fungi)以外の生物種において相同性が認められる配列は検出されなかった。 In addition, when a blast search was performed on the UniProtKB, which is a protein sequence database, based on the amino acid sequence shown in SEQ ID NO: 3, no sequence that was found to be homologous in species other than fungi (Fungi) was detected.
なお、配列番号3に示されるアミノ酸配列の1〜数個のアミノ酸が欠失若しくは置換されたアミノ酸配列又は前記アミノ酸配列に1〜数個のアミノ酸が付加されたアミノ酸配列からなり、真菌細胞内におけるリボソームペプチドの生合成に関与するタンパク質も、本発明の一態様である。 The amino acid sequence shown in SEQ ID NO: 3 consists of an amino acid sequence in which one to several amino acids are deleted or substituted, or an amino acid sequence in which one to several amino acids are added to the amino acid sequence. A protein involved in ribosomal peptide biosynthesis is also an embodiment of the present invention.
タンパク質のアミノ酸配列は、アミノ酸残基の電荷、大きさ、疎水性等の物理化学的性質について、保存性の高い変異が許容され得ることが、経験的に認められている。例えば、アミノ酸残基の置換については、グリシン(Gly)とプロリン(Pro)、Glyとアラニン(Ala)又はバリン(Val)、ロイシン(Leu)とイソロイシン(Ile)、グルタミン酸(Glu)とグルタミン(Gln)、アスパラギン酸(Asp)とアスパラギン(Asn)、システイン(Cys)とスレオニン(Thr)、Thrとセリン(Ser)又はAla、リジン(Lys)とアルギニン(Arg)等が挙げられる。また、上述の保存性を超えた場合でも、なおそのタンパク質の本質的な機能を失わない変異が存在し得ることも当業者において経験されるところである。 It has been empirically recognized that the amino acid sequence of a protein can tolerate highly conservative mutations in physicochemical properties such as charge, size, and hydrophobicity of amino acid residues. For example, for substitution of amino acid residues, glycine (Gly) and proline (Pro), Gly and alanine (Ala) or valine (Val), leucine (Leu) and isoleucine (Ile), glutamic acid (Glu) and glutamine (Gln) ), Aspartic acid (Asp) and asparagine (Asn), cysteine (Cys) and threonine (Thr), Thr and serine (Ser) or Ala, lysine (Lys) and arginine (Arg), and the like. It is also experienced by those skilled in the art that even when the above-described conservation is exceeded, mutations that do not lose the essential function of the protein can exist.
したがって、配列番号3に示されるアミノ酸配列の1〜数個のアミノ酸が欠失若しくは置換されたアミノ酸配列又は前記アミノ酸配列に1〜数個のアミノ酸が付加されたアミノ酸配列からなるタンパク質であって、真菌由来のリボソームペプチドの生合成に関与するタンパク質、特にリボソームペプチド前駆体の翻訳過程におけるタンパク質輸送又はTyrとIleとの間の環状構造の形成に関与するタンパク質は、本発明の一態様として理解される。 Therefore, a protein comprising an amino acid sequence in which one to several amino acids of the amino acid sequence shown in SEQ ID NO: 3 has been deleted or substituted, or an amino acid sequence in which one to several amino acids have been added to the amino acid sequence, Proteins involved in the biosynthesis of fungal ribosomal peptides, in particular proteins involved in protein transport in the translation process of ribosomal peptide precursors or the formation of a cyclic structure between Tyr and Ile, are understood as one aspect of the present invention. The
<ustYbタンパク質>
本発明はさらに、配列番号6に示されるアミノ酸配列、又は前記アミノ酸配列の1〜数個のアミノ酸が欠失若しくは置換されたアミノ酸配列若しくは前記アミノ酸配列に1〜数個のアミノ酸が付加されたアミノ酸配列からなり、真菌細胞内におけるリボソームペプチドの生合成に関与するタンパク質、及びこれをコードするcDNAを提供する。
<UstYb protein>
The present invention further includes an amino acid sequence represented by SEQ ID NO: 6, an amino acid sequence in which one to several amino acids of the amino acid sequence are deleted or substituted, or an amino acid in which one to several amino acids are added to the amino acid sequence A protein comprising a sequence and involved in the biosynthesis of a ribosomal peptide in a fungal cell, and a cDNA encoding the same are provided.
配列番号6に示されるアミノ酸配列からなるタンパク質は、配列番号4に示される塩基配列からなる遺伝子(NCBI遺伝子ID AFLA_095020)を一部に含む周辺領域から転写翻訳され、生合成されるタンパク質である。遺伝子AFLA_095020から演繹推定され、NCBIに登録されているタンパク質のアミノ酸配列は配列番号5に示されるものであるが、実際に遺伝子AFLA_095020を含むゲノム領域から転写翻訳されるタンパク質のアミノ酸配列は、配列番号6に示されるものであることが確認された。この様に、配列番号6に示されるアミノ酸配列からなるタンパク質は新規な物質である。 The protein consisting of the amino acid sequence shown in SEQ ID NO: 6 is a protein that is transcriptionally translated from a peripheral region partially including the gene consisting of the base sequence shown in SEQ ID NO: 4 (NCBI gene ID AFLA — 095020) and biosynthesized. The amino acid sequence of the protein deduced from the gene AFLA — 095020 and registered in NCBI is shown in SEQ ID NO: 5, but the amino acid sequence of the protein actually transcribed and translated from the genomic region containing the gene AFLA — 095020 is SEQ ID NO: 6 was confirmed. Thus, the protein consisting of the amino acid sequence shown in SEQ ID NO: 6 is a novel substance.
後に実施例で示すように、A.flavusのゲノム上の遺伝子AFLA_095020を外来遺伝子で置換して欠失させることにより、A.flavusのウスチロキシン生産能が失われる。すなわち、ustYbタンパク質はウスチロキシンBの生合成に関与するタンパク質である。ustYbタンパク質には、金属イオン、特に亜鉛イオンとの結合に関与するモチーフ配列領域が2箇所、及びヒスチジン−リッチ領域などが認められ、リボソームペプチド前駆体の翻訳過程におけるタンパク質輸送、tyrとIleとの間の環状構造の形成、酸化還元活性、GTPase活性、ATP結合能、遺伝子発現又は転写制御能などの機能を通じて、ウスチロキシンBの生合成に関与していると推察される。 As will be shown later in the examples, A.I. by replacing the gene AFLA — 095020 on the flavus genome with a foreign gene and deleting it. The ability of flavus to produce ustyroxine is lost. That is, the ustYb protein is a protein involved in the biosynthesis of ustyroxin B. The ustYb protein has two motif sequence regions involved in binding to metal ions, particularly zinc ions, and a histidine-rich region. Protein transport during the translation process of the ribosomal peptide precursor, between tyr and Ile It is presumed to be involved in the biosynthesis of ustyroxin B through functions such as the formation of a cyclic structure, redox activity, GTPase activity, ATP binding ability, gene expression or transcriptional control ability.
また、配列番号6に示されるアミノ酸配列を基にタンパク質配列データベースである前記UniProtKBについてBlast検索したところ、真菌類(Fungi)以外の生物種において相同性が認められる配列は検出されなかった。 In addition, when a blast search was performed on the UniProtKB, which is a protein sequence database, based on the amino acid sequence shown in SEQ ID NO: 6, no sequence that was found to be homologous in any species other than fungi (Fungi) was detected.
なお、配列番号6に示されるアミノ酸配列の1〜数個のアミノ酸が欠失若しくは置換されたアミノ酸配列又は前記アミノ酸配列に1〜数個のアミノ酸が付加されたアミノ酸配列からなり、真菌細胞内におけるリボソームペプチドの生合成に関与するタンパク質も、本発明の一態様である。 The amino acid sequence shown in SEQ ID NO: 6 consists of an amino acid sequence in which one to several amino acids are deleted or substituted, or an amino acid sequence in which one to several amino acids are added to the amino acid sequence. A protein involved in ribosomal peptide biosynthesis is also an embodiment of the present invention.
前述の通り、タンパク質のアミノ酸配列は、アミノ酸残基の電荷、大きさ、疎水性等の物理化学的性質について、保存性の高い変異が許容され得ることが、経験的に認められている。 As described above, it has been empirically recognized that the amino acid sequence of a protein can tolerate highly conservative mutations in physicochemical properties such as the charge, size, and hydrophobicity of amino acid residues.
したがって、配列番号6に示されるアミノ酸配列の1〜数個のアミノ酸が欠失若しくは置換されたアミノ酸配列又は前記アミノ酸配列に1〜数個のアミノ酸が付加されたアミノ酸配列からなるタンパク質であって、真菌由来のリボソームペプチドの生合成に関与するタンパク質、特にリボソームペプチド前駆体の翻訳過程におけるタンパク質輸送又はtyrとIleとの間の環状構造の形成に関与するタンパク質は、本発明の一態様として理解される。 Therefore, a protein consisting of an amino acid sequence in which one to several amino acids of the amino acid sequence shown in SEQ ID NO: 6 are deleted or substituted, or an amino acid sequence in which one to several amino acids are added to the amino acid sequence, Proteins involved in the biosynthesis of ribosomal peptides derived from fungi, in particular proteins involved in protein transport in the translation process of ribosomal peptide precursors or the formation of a cyclic structure between tyr and Ile are understood as one aspect of the present invention. The
<cDNA>
本発明はさらに、前記ustYaタンパク質又はustYbタンパク質をコードするcDNAも提供する。ここにいうcDNAとは、配列番号3又は配列番号6に示されるアミノ酸配列を組換え的に生産するに適した、ゲノム上の塩基配列の一部に改変が加えられた塩基配列からなるDNA分子を意味する。その好適な例は、配列番号3又は配列番号6に示されるアミノ酸配列を一続きのオープンリーディングフレーム(ORF)としてコードするcDNA、又は配列番号3又は配列番号6に示されるアミノ酸配列の1〜数個のアミノ酸が欠失若しくは置換されたアミノ酸配列又は前記アミノ酸配列に1〜数個のアミノ酸が付加されたアミノ酸配列を一続きのORFとしてコードするcDNAである。異なる態様として、ゲノム上の塩基配列にあるイントロン配列の一部を含むcDNAも本発明の範囲に含まれる。
<CDNA>
The present invention further provides a cDNA encoding the ustYa protein or ustYb protein. The cDNA herein is a DNA molecule comprising a base sequence in which a part of the base sequence on the genome is modified, which is suitable for recombinantly producing the amino acid sequence shown in SEQ ID NO: 3 or SEQ ID NO: 6. Means. Suitable examples thereof include cDNA encoding the amino acid sequence shown in SEQ ID NO: 3 or SEQ ID NO: 6 as a series of open reading frames (ORFs), or 1 to the number of amino acid sequences shown in SEQ ID NO: 3 or SEQ ID NO: 6. A cDNA encoding an amino acid sequence in which one or more amino acids have been deleted or substituted, or an amino acid sequence in which one to several amino acids have been added to the amino acid sequence as a series of ORFs. As a different embodiment, a cDNA containing a part of an intron sequence in the base sequence on the genome is also included in the scope of the present invention.
本発明のcDNAは1本鎖であっても、それに相補的な配列を有する核酸と結合した2本鎖、3重鎖であってもよい。また、ホースラディッシュペルオキシダーゼ(HRPO)等の酵素や放射性同位体、蛍光物質、化学発光物質等で標識されていてもよい。 The cDNA of the present invention may be a single strand or a double strand or triple strand bound to a nucleic acid having a complementary sequence thereto. Further, it may be labeled with an enzyme such as horseradish peroxidase (HRPO), a radioisotope, a fluorescent substance, a chemiluminescent substance, or the like.
本発明のcDNAは、配列番号1〜6に示される配列情報を基に、ハイブリダイゼーションやPCR法などの遺伝子工学的手法を用いたクローニングや、ホスホアミダイト法などの化学合成的手法を利用して、当業者が容易に製造することができる。また本発明のcDNAは、市販されあるいは当業者が一般に入手容易な様々なベクターに組み換えて使用することができる。ベクターは、必要に応じて他の塩基配列を有していてもよい。他の塩基配列の例としては、エンハンサー配列、プロモーター配列、リボゾーム結合配列、コピー数の増幅を目的として使用される塩基配列、シグナルペプチドをコードする塩基配列、他のタンパク質をコードする塩基配列、ポリA付加配列、スプライシング配列、複製開始点、選択マーカーとなる遺伝子の塩基配列等を挙げることができる。 Based on the sequence information shown in SEQ ID NOs: 1 to 6, the cDNA of the present invention is cloned using a genetic engineering technique such as hybridization or PCR, or a chemical synthesis technique such as a phosphoramidite method. Can be easily manufactured by those skilled in the art. Moreover, the cDNA of the present invention can be used after being recombined into various vectors that are commercially available or generally available to those skilled in the art. The vector may have other base sequences as necessary. Examples of other base sequences include enhancer sequences, promoter sequences, ribosome binding sequences, base sequences used for the purpose of copy number amplification, base sequences encoding signal peptides, base sequences encoding other proteins, poly sequences A additional sequence, splicing sequence, replication origin, base sequence of gene serving as a selection marker, and the like.
本発明のcDNA、これを含む組み換えベクター、及び該ベクターによって形質転換された宿主細胞は、ustYaタンパク質、ustYbタンパク質の組換え的生産に利用することができる。本発明のタンパク質を組み換え生産するには、本発明のcDNA又は該cDNAを含むベクターで形質転換された宿主細胞を適当な条件下で培養して培養混合物を回収し、本発明のタンパク質を回収し、必要に応じて精製すればよい。培養混合物から本発明のタンパク質を精製する方法としては、タンパク質や低分子化合物の精製に通常使用されている方法の中から適切な方法を適宜選択して行うことができる。すなわち、塩析法、限外濾過法、等電点沈澱法、ゲル濾過法、電気泳動法、イオン交換クロマトグラフィー、疎水性クロマトグラフィーや抗体クロマトグラフィー等の各種アフィニティークロマトグラフィー、クロマトフォーカシング法、吸着クロマトグラフィー及び逆相クロマトグラフィー等、通常使用され得る方法の中から適切な方法を適宜選択し、必要によりHPLCシステム等を使用して適当な順序で精製を行えば良い。 The cDNA of the present invention, a recombinant vector containing the cDNA, and a host cell transformed with the vector can be used for recombinant production of ustYa protein and ustYb protein. In order to recombinantly produce the protein of the present invention, host cells transformed with the cDNA of the present invention or a vector containing the cDNA are cultured under appropriate conditions, and the culture mixture is recovered, and the protein of the present invention is recovered. It may be purified as necessary. As a method for purifying the protein of the present invention from the culture mixture, an appropriate method can be appropriately selected from methods usually used for the purification of proteins and low molecular compounds. That is, salting-out method, ultrafiltration method, isoelectric point precipitation method, gel filtration method, electrophoresis method, various affinity chromatography such as ion exchange chromatography, hydrophobic chromatography and antibody chromatography, chromatofocusing method, adsorption An appropriate method may be appropriately selected from commonly used methods such as chromatography and reverse phase chromatography, and if necessary, purification may be performed in an appropriate order using an HPLC system or the like.
なお、本発明のタンパク質を他のタンパク質やタグ(例、グルタチオンSトランスフェラーゼ、プロテインA、ヒスチジンタグ、FLAGタグその他)との融合タンパク質として発現させることも可能である。この様な融合タンパク質もまた、本発明の一態様である。これらの融合タンパク質は、適当なプロテアーゼ(例、トロンビンその他)を用いて切り出すことが可能であり、タンパク質の調製をより有利に行うことが可能となる。 The protein of the present invention can also be expressed as a fusion protein with other proteins and tags (eg, glutathione S transferase, protein A, histidine tag, FLAG tag, etc.). Such a fusion protein is also an embodiment of the present invention. These fusion proteins can be excised using an appropriate protease (eg, thrombin or the like), and the protein can be prepared more advantageously.
この様に、本発明のタンパク質は、それ単独の形態でも別種のタンパク質との融合タンパク質の形態でも調製することができるが、これらのみに制限されるものではなく、本願発明のタンパク質を更に種々の形態へと変換させることも可能である。例えば、タンパク質に対する種々の化学修飾、ポリエチレングリコール等の高分子との結合、不溶性担体への結合、リポソームへの封入など、当業者に知られている種々の手法による加工も可能である。 As described above, the protein of the present invention can be prepared in the form of a single protein alone or in the form of a fusion protein with another type of protein. However, the present invention is not limited to these. It is also possible to convert it into a form. For example, various chemical modifications to proteins, binding to polymers such as polyethylene glycol, binding to insoluble carriers, encapsulation in liposomes, and the like can be performed by various techniques known to those skilled in the art.
本発明を通じて特定される真菌由来のリボソームペプチド合成遺伝子クラスターは、リボソームペプチド前駆体遺伝子並びにustYaホモログ遺伝子及び/又はustYbホモログ遺伝子の他に、様々な修飾反応に関与するタンパク質をコードする遺伝子を含んでおり、それらタンパク質はそれぞれのリボソームペプチドの生合成に最適化されたタンパク質であると推察される。そのため、各クラスターの構成遺伝子を相互に組換え、あるいは複数の構成遺伝子を任意に組み合わせることで、天然に生産されるものとは異なる構造や生理活性を有する非天然型のリボソームペプチドを製造することも可能となる。 The fungal-derived ribosomal peptide synthesis gene cluster identified through the present invention includes genes encoding proteins involved in various modification reactions in addition to the ribosomal peptide precursor gene and the ustYa homolog gene and / or ustYb homolog gene. These proteins are presumed to be proteins optimized for the biosynthesis of the respective ribosomal peptides. For this reason, non-natural ribosomal peptides with structures and physiological activities different from those produced in nature can be produced by recombining the constituent genes of each cluster with each other or arbitrarily combining multiple constituent genes. Is also possible.
また、特定されたリボソームペプチド合成遺伝子クラスターが、例えば調節因子をコードする遺伝子を欠いている、あるいはustYa遺伝子ホモログ及び/又はustYb遺伝子ホモログの一部が欠失している等の場合には、他のリボソームペプチド合成遺伝子クラスターを構成する遺伝子から相当する機能を有する遺伝子又は別のustYa遺伝子ホモログ及び/又はustYb遺伝子ホモログを補填することで、新たなリボソームペプチドを製造することも可能である。 In addition, when the specified ribosomal peptide synthesis gene cluster lacks a gene encoding a regulatory factor, or a part of the ustYa gene homolog and / or ustYb gene homolog is deleted, etc. It is also possible to produce a new ribosomal peptide by supplementing a gene having a corresponding function or another ustYa gene homolog and / or ustYb gene homolog from the genes constituting the ribosomal peptide synthesis gene cluster.
本発明における遺伝子組換え手法、細胞培養、タンパク化学的手法は、当業者に知られた種々の実験ハンドブック、マニュアル、教科書あるいは様々な学術文献や特許文献に記載された手法を適宜選択して採用することができる。例えばJ.Sambrookら(Molecular Cloning、a Laboratory Manual、2nd ed.、Cold Spring Harbor Laboratory、New York、1989年)その他の実験操作マニュアルに記載された方法などを挙げることができる。 For the genetic recombination technique, cell culture, and protein chemistry technique in the present invention, various experimental handbooks, manuals, textbooks known to those skilled in the art, or techniques described in various academic literatures and patent literatures are appropriately selected and adopted. can do. For example, J. et al. Examples include Sambrook et al. (Molecular Cloning, a Laboratory Manual, 2nd ed., Cold Spring Harbor Laboratory, New York, 1989) and other methods described in experimental operation manuals.
以下の実施例によって本発明をさらに詳細に説明する。 The following examples further illustrate the present invention.
<実施例1>ウスチロキシンB生合成遺伝子クラスターの同定
(1)GenBankEQ963472−EQ966232として登録されている黄色麹菌(Aspergillus flavus)の全ゲノム情報を基に、MIDDAS−M法を用いて二次代謝産物合成遺伝子クラスター解析を行った。その結果、NCBI遺伝子IDのAFLA_095040からAFLA_095110までの18遺伝子が、上記クラスターを構成する候補遺伝子として推定された。
<Example 1> Identification of a Ustyroxine B biosynthetic gene cluster (1) Secondary metabolite using MIDDAS-M method based on whole genome information of Aspergillus flavus registered as GenBankEQ963472-EQ966232 Synthetic gene cluster analysis was performed. As a result, 18 genes from NCLA gene IDs AFLA — 095040 to AFLA — 095110 were estimated as candidate genes constituting the cluster.
(2)Minら(2007年、Process Biochemistry、第42巻、729−733頁)の方法に従い、pyrG遺伝子を選択マーカーとして上記遺伝子を1つずつ選択マーカー遺伝子と置換することで欠失させた、計18種類のA.flavus変異株を作成した。具体的な作業は次の通りである。 (2) According to the method of Min et al. (2007, Process Biochemistry, Vol. 42, 729-733), deletion was performed by replacing the above genes one by one with the selection marker gene using the pyrG gene as a selection marker. A total of 18 types of A.P. A flavus mutant was created. The specific work is as follows.
まず、標的となる18の遺伝子それぞれについて、その上流及び下流各1kbを含むゲノム領域が増幅されるよう設計したプライマーセットを用いてPCRを行い、前記ゲノム領域の増幅断片1を作製した。一方、A.nidulansのpyrG遺伝子を含む約1.8kbのゲノム領域が増幅されるよう設計したプライマーセットを用いてPCRを行い、前記pyrG遺伝子を含むゲノム領域の増幅断片2を作製した。さらに、増幅断片1及び2を鋳型として、両断片が連結した核酸が増幅されるよう設計されたプライマーセットを用いてPCRを行い、両ゲノム領域の融合PCR増幅断片3を調製した。
First, PCR was performed for each of the 18 target genes using a primer set designed to amplify the genomic region including 1 kb upstream and downstream thereof, and amplified
1.12mg/mLのウラシルを含む24g/LのDifcoポテトデキストロース培地にA.flavus(CA14株、Δku70 ΔpyrG ΔniaD)の分生胞子を懸濁し(106/mL)、37℃で2日間培養した。菌体を回収し、溶菌酵素(Sigma社のlysing enzyme、TaKaRa社のYatalase、ヤクルト社のセルラーゼ)を含む緩衝液中に懸濁して30℃で3時間インキュベートして、プロトプラストを調製した。このプロトプラストを等張液に懸濁後、前記18種類の融合PCR増幅断片3(1μg)を別々に加えて形質転換させ、ポリエチレングリコールの存在下でインキュベートした。インキュベーション後、プロトプラストを再生培地上に置き、3〜5日間培養して真菌細胞を再生させた。再生された18の変異株が、導入されたpyrG遺伝子との置換によって各標的遺伝子が欠失したゲノム構造を有するものであることを、組み換えられたゲノム領域を鋳型にPCRで増幅させた核酸断片の配列解析により、確認した。 1. Add 24 g / L Difco potato dextrose medium containing 12 mg / mL uracil to The conidia of flavus (CA14 strain, Δku70 ΔpyrG ΔniaD) were suspended (10 6 / mL) and cultured at 37 ° C. for 2 days. The cells were collected, suspended in a buffer containing a lytic enzyme (lysing enzyme from Sigma, Yatalase from TaKaRa, cellulase from Yakult), and incubated at 30 ° C. for 3 hours to prepare a protoplast. After suspending this protoplast in an isotonic solution, the 18 kinds of fusion PCR amplified fragments 3 (1 μg) were added separately for transformation, and incubated in the presence of polyethylene glycol. After incubation, the protoplasts were placed on the regeneration medium and cultured for 3-5 days to regenerate the fungal cells. A nucleic acid fragment obtained by amplifying by PCR using the recombined genomic region as a template that the regenerated 18 mutant strains have a genomic structure in which each target gene has been deleted by substitution with the introduced pyrG gene. This was confirmed by sequence analysis.
(3)18の変異体それぞれを30mLのV8ジュース培地(20%キャンベル社V8野菜ジュース及び0.3%炭酸カルシウムを含む)中で30℃で5日間した後、23mLのアセトンを加えて室温で1時間インキュベートした。菌糸体をフィルターで取り除いた抽出液からアセトンを蒸発させ、残った濃縮液に等量の酢酸エチルを添加して1時間静置後、水相をポアサイズ0.22μmのフィルターに通して、LC−MS用試料を調製した。 (3) Each of the 18 mutants was treated in 30 mL of V8 juice medium (containing 20% Campbell V8 vegetable juice and 0.3% calcium carbonate) at 30 ° C. for 5 days, then 23 mL of acetone was added at room temperature. Incubated for 1 hour. Acetone is evaporated from the extract from which the mycelium has been removed with a filter, an equivalent amount of ethyl acetate is added to the remaining concentrated solution, and the mixture is allowed to stand for 1 hour. The aqueous phase is passed through a filter having a pore size of 0.22 μm, and LC- A sample for MS was prepared.
LC−MS用試料を、Develosil XG−C18M−5逆相カラム(野村化学社)をセットしたUltimate3000 HPLC(Dionex社)及び水/アセトニトリルのグラジエント(0%−100%)溶媒を用いて分画した。溶出画分中のウスチロキシンBの含有量をmicrOTOFII KIK2 MS(Bruker社)を用いて定量した。定量は、RT=9分におけるm/z644.2±0.1のEICs[M−H]−のピークエリアの算出によって行った。上記LC−MSの結果を図2に示す。 LC-MS samples were fractionated using Ultimate 3000 HPLC (Dionex) with Develosil XG-C18M-5 reverse phase column (Nomura Chemical) and water / acetonitrile gradient (0% -100%) solvent. . The content of ustyroxin B in the eluted fraction was quantified using a MICROTOFII KIK2 MS (Bruker). Quantification was carried out by calculating the peak area of EICs [M−H] − at m / z 644.2 ± 0.1 at RT = 9 minutes. The results of the LC-MS are shown in FIG.
上記の遺伝子のうち、ustH(AFLA_095030、γ−グルタミルトランスペプチダーゼ)の欠失はウスチロキシンBの再生能に影響を与えなかったが、これはA.flavusのゲノムに同一の生理活性を有するタンパク質をコードする別の遺伝子(AFLA_074100)が存在しており、これが欠失したustHの機能を補っているためと推察される。 Among the above genes, deletion of ustH (AFLA — 095030, γ-glutamyl transpeptidase) did not affect the regenerative ability of ustyroxin B. It is inferred that another gene (AFLA — 074100) encoding a protein having the same physiological activity exists in the flavus genome, and this supplements the function of the deleted ustH.
ustF1(AFLA_094950)及びustP2(AFLA_095010)がそれぞれ欠失した変異株はいずれも少量のウスチロキシンBの産生能を示した。A.flavusのゲノムにはこれら遺伝子と高い相同性を有する別の遺伝子が存在しており、これらが欠失した遺伝子の機能を補っているものと推察される。 All of the mutant strains lacking ustF1 (AFLA — 094950) and ustP2 (AFLA — 095010) showed the ability to produce a small amount of ustyroxin B. A. There is another gene having high homology with these genes in the flavus genome, and it is speculated that these supplement the function of the deleted gene.
ustP1(AFLA_095000)及びustYb(AFLA_095020)については相同性の高い他の遺伝子がゲノム上には存在しないが、ustP1及びustYbがそれぞれ欠失した変異株も、少量のウスチロキシンBの産生能を示した。後に説明するが、RNAシーケンスによって決定されるustP1及びustYbそれぞれから発現されるタンパク質のアミノ酸配列は、NCBIデータベースにおいてアノテーションされているアミノ酸配列とは異なるものであった。推測に拘束されるものではないが、結果的にpyrG遺伝子との置換はustP1及びustYbそれぞれから発現されるタンパク質の一部が欠損した変異体の発現を許しており、これが前記少量のウスチロキシンBの産生能をもたらしているものと推察される。 For ustP1 (AFLA — 095000) and ustYb (AFLA — 095020), other highly homologous genes do not exist in the genome, but mutant strains lacking ustP1 and ustYb, respectively, also showed the ability to produce small amounts of ustyroxin B. . As will be described later, the amino acid sequence of the protein expressed from each of ustP1 and ustYb determined by the RNA sequence was different from the amino acid sequence annotated in the NCBI database. Although not constrained by speculation, as a result, replacement with the pyrG gene allows the expression of mutants in which a part of the protein expressed from each of ustP1 and ustYb is deleted. It is presumed that this has brought about the production ability of.
UniProtKBに対するBlastpサーチの結果によると、ustP1はS41ペプチダーゼファミリーのN末端領域に、及びustP2は同じS41ペプチダーゼファミリーの活性領域にそれぞれ相当する配列をコードしており、両遺伝子で1つのタンパク質をコードしていることが推察された。 According to the results of the Blastp search for UniProtKB, ustP1 encodes a sequence corresponding to the N-terminal region of the S41 peptidase family and ustP2 encodes a sequence corresponding to the active region of the same S41 peptidase family, and both genes encode one protein. It was inferred that
ustYa(AFLA_094990)及びustYbは、Blastデータベースに対する検索の結果、真菌に特異的な遺伝子であることが確認された。 As a result of searching against the Blast database, it was confirmed that ustYa (AFLA — 0949990) and ustYb are genes specific to fungi.
ustS(AFLA_095110、グルタチオンS−トランスフェラーゼ)は、ウスチロキシンBの生合成において必須の反応工程である、ウスチロキシンを構成するチロシン残基の芳香環にS−ノルバリンを転移させる反応を触媒する酵素である。しかし、ustSの欠失はウスチロキシン産生能に影響を与えなかった。これは遺伝子クラスターの外に存在する相同遺伝子AFLA_087240が欠失したustSの機能を補っているためと推察される。 ustS (AFLA — 095110, glutathione S-transferase) is an enzyme that catalyzes the reaction of transferring S-norvaline to the aromatic ring of the tyrosine residue that constitutes ustyroxin, which is an essential reaction step in the biosynthesis of ustyroxin B. . However, deletion of ustS did not affect the ability to produce usthyroxine. This is presumed to be because the function of ustS lacking the homologous gene AFLA — 087240 existing outside the gene cluster is compensated.
AFLA_095080及びAFLA_095090にコードされているアミノ酸配列はそれぞれ、真菌特異的な転写因子ドメイン(pfamドメイン)及びZn2Cys6バイヌクレアクラスターDNA結合ドメインを完全に保持した、A.oryzae由来の転写因子(遺伝子名;AO090113000035)のN末端とC末端のアミノ酸配列はと一致していた。cDNAとしてAFLA_095080及びAFLA_095090をつなぐ領域が増幅されることが、定量的リアルタイムPCR法によって確認された。以上から、AFLA_095080及びAFLA_095090は連続して転写され、一つの転写因子(ustR)を形成していることが確認された。 The amino acid sequences encoded by AFLA — 095080 and AFLA — 095090, respectively, completely retained the fungal-specific transcription factor domain (pfam domain) and the Zn2Cys6 binucure cluster DNA binding domain. The N-terminal and C-terminal amino acid sequences of the oryzae-derived transcription factor (gene name: AO090113000035) were identical. It was confirmed by quantitative real-time PCR that the region connecting AFLA — 095080 and AFLA — 095090 was amplified as cDNA. From the above, it was confirmed that AFLA — 095080 and AFLA — 095090 were continuously transcribed to form one transcription factor (ustR).
上記の変異体の解析結果から、遺伝子の欠失でウスチロキシンBの産生が消失する遺伝子、欠失してもウスチロキシンBの産生能は維持されるが生合成経路上重要な役割を有する遺伝子として、ustO(AFLA_094940)〜ustS(AFLA_095110)までの遺伝子をウスチロキシンBの生合成に実質的に関与しているウスチロキシンB生合成遺伝子クラスターと判断した。これらの遺伝子のNCBI ID番号、推定機能、及び大きさ(塩基対数)を表7に、またゲノム上の配置を図3に示す。 From the results of the analysis of the above mutants, a gene whose production of ustyroxin B disappears due to the deletion of the gene, and a gene that plays an important role in the biosynthetic pathway even though the production ability of ustyroxin B is maintained even if the deletion The genes from ustO (AFLA — 094940) to ustS (AFLA — 095110) were determined to be the ustyroxin B biosynthesis gene cluster that is substantially involved in the biosynthesis of ustyroxin B. Table 7 shows NCBI ID numbers, estimated functions, and sizes (number of base pairs) of these genes, and FIG. 3 shows the arrangement on the genome.
<実施例2>ustRの過剰発現によるustBの産生量の亢進
A.flavusのtef1遺伝子(Kitamotoら、1998年、Appl.Microbiol.Biotechnol.、第50巻、85−92ページ)のプロモーター領域を増幅断片として得ることができるように設計したプライマーを用いて調製した増幅断片4と、ウスチロキシンB生合成遺伝子クラスターをコードする核酸中のustRプロモーター領域を増幅断片として得ることができるように設計したプライマーを用いて調製した増幅断片5とを用いて、ustRのプロモーター領域がtef1遺伝子プロモーターに置き換わった増幅断片6を、融合PCR法で調製した。この増幅断片6を用いてA.flavus CA14株(Δku70 ΔpyrG ΔniaD)を形質転換して、ustRの過剰発現変異株ustROEを得た。
<Example 2> Enhancement of ustB production by overexpression of ustR Amplified fragment prepared using primers designed so that the promoter region of the flavus tef1 gene (Kitamoto et al., 1998, Appl. Microbiol. Biotechnol., 50, 85-92) can be obtained as an amplified fragment. 4 and the amplified fragment 5 prepared using a primer designed so that the ustR promoter region in the nucleic acid encoding the ustyroxin B biosynthetic gene cluster can be obtained as an amplified fragment. An amplified fragment 6 in which the tef1 gene promoter was replaced was prepared by a fusion PCR method. Using this amplified fragment 6, A. The flavus CA14 strain (Δku70 ΔpyrG ΔniaD) was transformed to obtain a ustR overexpression mutant ustR OE .
ustROEを100mLのV8ジュース培地(20%キャンベル社V8野菜ジュース及び0.3%炭酸カルシウムを含む)に植菌し、30℃で4日間撹拌培養した後、菌体を回収し、ISOGEN(ニッポンジーン社)を用いて全RNAを菌体から抽出し、high capacity RNA−to−cDNAキット(Applied Biosystems社)を用いてcDNAを誘導した。StepOnePlus Real−Time PCR System(Applied Biosystems社)上で、qPCR with Power SYRB Green PCR master mix(Applied Biosystems社)を用いてustRの発現の定量解析を行った。発現量は、チューブリンβサブユニット(AFLA_051840)の発現量を元に標準化した。 ustR OE was inoculated into 100 mL of V8 juice medium (containing 20% Campbell V8 vegetable juice and 0.3% calcium carbonate), and stirred and cultured at 30 ° C. for 4 days. The total RNA was extracted from the cells using a high capacity RNA-to-cDNA kit (Applied Biosystems). On the OneOnePlus Real-Time PCR System (Applied Biosystems), the quantitative analysis of the expression of ustR was performed using qPCR with Power SYRB Green PCR master mix (Applied Biosystems). The expression level was standardized based on the expression level of tubulin β subunit (AFLA — 051840).
その結果、ustROEにおけるustRの発現量は、対照と比較して15倍に上昇することが確認された。また、実施例1と同様にしてウスチロキシンBの定量を行ったところ、ウスチロキシンBの産生量も4.8倍に上昇していた。 As a result, it was confirmed that the expression level of ustR in ustR OE increased 15 times compared to the control. In addition, when the amount of ustyroxin B was quantified in the same manner as in Example 1, the production amount of ustyroxine B was increased 4.8 times.
<実施例3>RNAシーケンシングによるustBクラスター遺伝子翻訳領域の再アノテーション
A.flavus CA14株(Δku70 ΔpyrG ΔniaD)を親株としてpyrG遺伝子を復帰させた復帰変異株を用意した。復帰変異株を100mLのV8ジュース培地(20%キャンベル社V8野菜ジュース及び0.3%炭酸カルシウムを含む)に植菌し、30℃で4日間撹拌培養した。培養後に回収された菌体を液体窒素で凍らせ、乳鉢内で十分に粉砕した。粉砕された菌体を、15mLのISOGEN(ニッポンジーン社)に加えて十分に混和し、氷上に置いた。遠心後の上清を3mLのクロロホルムに加えて十分に混和したのち、室温で3分間静置した。再び遠心して回収した水層を7.5mLのイソプロパノールに加え、室温で10分間静置した。再度遠心して得たペレットをエタノール洗浄して、RNAサンプルとした。
<Example 3> Re-annotation of translation region of ustB cluster gene by RNA sequencing A revertant strain in which the pyrG gene was restored was prepared using flavus CA14 strain (Δku70 ΔpyrG ΔniaD) as a parent strain. The revertant strain was inoculated into 100 mL of V8 juice medium (containing 20% Campbell V8 vegetable juice and 0.3% calcium carbonate), and cultured with stirring at 30 ° C. for 4 days. The cells recovered after the cultivation were frozen with liquid nitrogen and sufficiently pulverized in a mortar. The crushed cells were added to 15 mL of ISOGEN (Nippon Gene), mixed well, and placed on ice. The supernatant after centrifugation was added to 3 mL of chloroform and mixed well, and then allowed to stand at room temperature for 3 minutes. The aqueous layer recovered by centrifugation again was added to 7.5 mL of isopropanol and allowed to stand at room temperature for 10 minutes. The pellet obtained by centrifugation again was washed with ethanol to obtain an RNA sample.
SOLiD Total RNA−Seqキット(Applied Biosystems)を用いて、メーカーの取扱説明書に基づいてフラグメントライブラリを作成した。次世代シークエンサーシステムSOLiD 5500xl(Applied Biosystems)を用い、プロトコールに従ってRNAシークエンシングを行った。 A fragment library was created using the SOLiD Total RNA-Seq kit (Applied Biosystems) based on the manufacturer's instructions. RNA sequencing was performed using a next-generation sequencer system SOLiD 5500xl (Applied Biosystems) according to the protocol.
SOLiDシステムから算出されたXSQファイルを展開し、各サンプルに対応したfastqファイルを得た。本データ及び公共配列リードデータベースNCBI SRA(http://www.ncbi.nlm.nih.gov/SRA)に登録されたリードデータとして、SRR283857、SRR283858、SRR495778、SRR495942、SRR495943、SRR544871、SRR544872、SRR544873、SRR610531、SRR610532、SRR610533、SRR610534、SRR610535、SRR610537及びSRR610538を用いて、以下の作業を行った。未同定塩基を含まず、Q値(Quality value)が連続7塩基平均20未満の塩基をトリムした後の長さが30塩基以上のリードを用いて、マッピング作業を行った。ソフトウェアにはbowtie及びtophatを使用した。作業はコンピューター(DELL社製:CPU Intel Xeon E52643、メモリー256GB、ハードディスク40TB、OS:Ubuntu Linux(登録商標)13.10))上で行った。マッピング結果をゲノム情報可視化ツールで表示の上、該当遺伝子領域(スキャフォールドGenBank EQ963480上の遺伝子AFLA_094940−AFLA_095110)を目視で確認し、開始コドンとコドンの読み枠に矛盾のない領域をCDS領域と同定した。この結果を表8〜表12に示す。また、得られた結果すなわちmRNAから実際に翻訳される各タンパク質とゲノム配列から演繹推定される推定アミノ酸配列それぞれについて、それらのゲノム配列に対するORFの位置を対比させた図を図4及び図5に示す。 The XSQ file calculated from the SOLiD system was expanded to obtain a fastq file corresponding to each sample. This data and the read data registered in the public sequence read database NCBI SRA (http://www.ncbi.nlm.nih.gov/SRA) are SRR283857, SRR283858, SRR495778, SRR495942, SRR4594431, SRR544487, SRR544872, The following operations were performed using the SRR 610531, the SRR 610532, the SRR 610533, the SRR 610534, the SRR 610535, the SRR 610537, and the SRR 610538. Mapping work was performed using a lead having a length of 30 bases or more after trimming bases that do not contain unidentified bases and have a Q value (Quality value) of less than 20 consecutive 7 bases on average. The software used was bowtie and tophat. The work was carried out on a computer (DELL: CPU Intel Xeon E52643, memory 256 GB, hard disk 40 TB, OS: Ubuntu Linux (registered trademark) 13.10)). Display the mapping result with the genome information visualization tool, visually check the corresponding gene region (gene AFLA_0994940-AFLA_095110 on scaffold GenBank EQ963480), and identify the region that is consistent with the start codon and codon reading frame as the CDS region did. The results are shown in Tables 8-12. In addition, for each of the obtained results, that is, each protein actually translated from mRNA and the deduced amino acid sequence deduced from the genome sequence, the positions of the ORFs relative to the genome sequence are compared in FIGS. 4 and 5. Show.
<実施例4>Ustilaginoidea virensのウスチロキシン生合成遺伝子クラスターの同定
Zhangら(Nat.Commun.2014年、第5巻、3849ページ)によって報告され、NCBIに登録されているUstilaginoidea virens(U.virens)のゲノム塩基配列UV−8b(NCBIアクセッション番号JHTR01000001−JHTR01000449)に対して、前記表8〜12に示されるA.flavusのウスチロキシンB生合成遺伝子クラスターのうちの、ustUを除く遺伝子の各塩基配列(表に示された各アミノ酸配列をコードするCDS領域に相当する塩基配列)をそれぞれクエリーとし、E値が1e−4未満であることを相同性のカットオフ値としてtBLASTx検索を行った。検出された領域についてALN法及びGlimmerHMM法を使用したパイプラインによる遺伝子アノテーションを再度行った後、アノテーションされた遺伝子がコードするアミノ酸配列情報をクエリーとして、A.flavusのウスチロキシンB生合成遺伝子クラスターを構成する各遺伝子に対するBlastpサーチを行い、相同性を評価した。また同様のクエリーで、UniProtKBデータベースに対するBlastpサーチを行い、機能予測を行った。これらの解析により、NCIBアクセッション番号JHTR01000063.1であるU.virensゲノムのスキャフォールドにおいて、表13に示される13の遺伝子が特定された。
<Example 4> Identification of Ustylaginidea virens ustyroxine biosynthetic gene cluster Ustylaginoide virens (U. virens) reported by Zhang et al. (Nat. Commun. 2014, Vol. 5, page 3849) and registered in NCBI. Of the genomic base sequence UV-8b (NCBI Accession Nos. JHTR01000001-JHTR01000449) shown in Tables 8-12 above. Of the flavus ustyroxin B biosynthetic gene cluster, each base sequence of the gene excluding ustU (base sequence corresponding to the CDS region encoding each amino acid sequence shown in the table) is used as a query, and the E value is 1e. The tBLASTx search was performed with the homology cutoff value being less than −4. After the gene annotation by the pipeline using the ALN method and GlimerHMM method is performed again for the detected region, the amino acid sequence information encoded by the annotated gene is used as a query. A blastp search was performed for each gene constituting the flavus ustyroxin B biosynthesis gene cluster, and the homology was evaluated. In addition, with a similar query, a Blastp search was performed on the UniProtKB database to perform function prediction. Based on these analyses, U.I. Thirteen genes shown in Table 13 were identified in the scaffold of the virens genome.
ZhangらによってアノテーションされているUV8b_7484〜UV8b_7494の他に、3つの遺伝子(uv_ustT、uv_ustC及びuv_ustYb)が新たに本発明者らによってアノテーションされた。また、これら13の遺伝子はいずれもA.flavusのウスチロキシンB生合成遺伝子クラスターを構成する各遺伝子に対するE値は1e−4未満であり、相同性が高いことが確認された。なお、上記の検索条件では、A.flavusのウスチロキシンB生合成遺伝子クラスターに含まれるustP及びustHに相同性のある遺伝子は、U.virensの上記スキャフォールドの範囲からは見いだされなかった。また、遺伝子の順序はA.flavusのそれとは異なるものであった(図6)。 In addition to UV8b — 7484 to UV8b — 7494 annotated by Zhang et al., Three genes (uv_ustT, uv_ustC and uv_ustYb) were newly annotated by the inventors. All of these 13 genes are A. The E value for each gene constituting the flavus ustyroxin B biosynthetic gene cluster was less than 1e-4, confirming high homology. In the above search conditions, A. The genes homologous to ustP and ustH contained in the flavus ustyroxin B biosynthesis gene cluster are described in U.S. Pat. It was not found from the range of the above Virens scaffold. In addition, the gene order is A.I. It was different from that of flavus (FIG. 6).
各遺伝子にコードされるアミノ酸配列の解析により、uv_ustAは、小胞体移行シグナル配列と、ウスチロキシンAを構成するアミノ酸残基であるTyr、Val、Ile及びGlyがこの順序で並ぶ反復配列及びウスチロキシンBを構成するアミノ酸残基であるTyr、Ala、Ile及びGlyがこの順序で並ぶ反復配列とをコードしていることが確認された(図7(B))。
このことから、uv ustAはウスチロキシンA前駆体及びウスチロキシンB前駆体をコードする遺伝子であると推察された。また、A.flavusのustYa及びustYbと相同性の高い(E値が1e−4未満、ビットスコアが50以上)遺伝子として、uv_ustYa及びuv_ustYbがそれぞれ見いだされた。これらは、本発明にいうustYaホモログ遺伝子及びustYbホモログ遺伝子にそれぞれ相当する。
By analysis of the amino acid sequence encoded by each gene, uv_ustA is an endoplasmic reticulum transition signal sequence and a repetitive sequence in which Uyroxin A amino acid residues Tyr, Val, Ile, and Gly are arranged in this order, and ustyroxin It was confirmed that the amino acid residues constituting B, Tyr, Ala, Ile and Gly, encoded a repetitive sequence arranged in this order (FIG. 7B).
From this, it was speculated that uv ustA is a gene encoding a ustyroxin A precursor and a ustyroxine B precursor. A. uv_ustYa and uv_ustYb were found as genes having high homology with flavus ustYa and ustYb (E value less than 1e-4 and bit score of 50 or more), respectively. These correspond to the ustYa homolog gene and ustYb homolog gene according to the present invention, respectively.
さらに、表13に示される13の遺伝子は、前記スキャフォールド内において概ね30kbほどの範囲内にまとまって存在していることが確認された。さらに、uv_ustAとuv_ustYaとの間及びuv_ustAとuv_ustYbとの間は、それぞれ1.4Kb及び3.0kbであった。 Furthermore, it was confirmed that the 13 genes shown in Table 13 existed together within a range of about 30 kb in the scaffold. Furthermore, the distance between uv_ustA and uv_ustYa and between uv_ustA and uv_ustYb was 1.4 Kb and 3.0 kb, respectively.
以上から、Uviresnsにおいて今回確認された13の遺伝子は、ウスチロキシンA及びBを合成することのできるU.virensの、ウスチロキシンA及びBの生合成遺伝子クラスターを構成しているものと推察された。 From the above, the 13 genes confirmed this time in Uviresns are the U.S. genes capable of synthesizing ustyroxins A and B. It was inferred that it constitutes a biosynthetic gene cluster of virenes, ustyroxin A and B.
<実施例5>ウスチロキシン生合成遺伝子クラスター中の各遺伝子破壊株の分析
実施例1で特定したウスチロキシン生合成遺伝子クラスター中の15の遺伝子各々の破壊株の培養上清についてLC−MS分析を行ったところ、ウスチロキシンBに対応するm/z 644.2[M−H]−のMSピークに加えて、いくつかの破壊株でのみ顕著に蓄積する2つのMSピーク(m/z 465.2[M−H]−及びm/z 451.2[M−H]−)が見いだされた。これらのピークを分取してNMRにより構造決定を行ったところ、それぞれウスチロキシンBからS−ノルバリンが除かれたウスチロキシンF(図8)及びさらにメチル基が除去された化合物FΔMe(図9)であると同定された。
<Example 5> Analysis of each gene disruption strain in the ustyroxine biosynthesis gene cluster LC-MS analysis was performed on the culture supernatant of each of the 15 gene disruption strains in the ustyroxine biosynthesis gene cluster specified in Example 1. When performed, in addition to the MS peak of m / z 644.2 [M−H] − corresponding to ustyroxine B, two MS peaks (m / z 465. 2 [M−H] − and m / z 451.2 [M−H] − ) were found. These peaks were separated and subjected to structure determination by NMR. As a result, ustyroxin F from which S-norvaline was removed from ustyroxin B (FIG. 8) and compound FΔMe from which the methyl group was further removed (FIG. 9) were obtained. Was identified.
また、ustA、ustR、ustYa、ustYb及びustQの各遺伝子の破壊株において、ウスチロキシンB、ウスチロキシンF及び化合物FΔMeの各環状ペプチドのピークはいずれも消失することが確認された。ustAはリボソームペプチドの前駆体タンパク質遺伝子であり、またustRは遺伝子クラスターの発現を誘導する転写因子であることから、ustYa、ustYb及びustQが、前記各化合物を環状化させてゴルジ体等のペプチダーゼによる分解から保護する役割を担っていると推定された。
<実施例6>ustYaの機能同定
Moreover, it was confirmed that in the disrupted strains of each gene of ustA, ustR, ustYa, ustYb and ustQ, the peaks of the cyclic peptides of ustyroxin B, ustyroxine F and compound FΔMe all disappeared. Since ustA is a ribosomal peptide precursor protein gene, and ustR is a transcription factor that induces gene cluster expression, ustYa, ustYb, and ustQ circulate each of the above compounds and use peptidases such as the Golgi apparatus. It was presumed to play a role in protecting against degradation.
<Example 6> Function identification of ustYa
ustYa(AFLA_094990)に含まれる2つの2核型金属捕捉モチーフであるHXXHCモチーフについて、それぞれのHC(配列番号3の168−169番目のHCと195−196番目のHC)をAS−AS、AS−HC、HS−HC、HC−HSへと変異させた4種類のustYa変異体をコードする遺伝子を含む発現ベクターを次のようにして構築した。 For HXXHC motifs, which are two binuclear metal capture motifs included in ustYa (AFLA — 094990), the respective HCs (168-169th HC and 195-196th HC in SEQ ID NO: 3) are AS-AS, AS- An expression vector containing genes encoding four types of ustYa mutants mutated to HC, HS-HC and HC-HS was constructed as follows.
上流145bp及び下流443bpを含むustYaの塩基配列を、両端に制限酵素サイトSmaIを付加した形で、TArget Clone−Plus−(東洋紡、TAK−201)を用いてTAクローニングによりプラスミドベクターに導入した。配列を確認後、PrimeSTAR Mutagenesis Basal Kit(TaKaRa、R046A)を用いて、モチーフ中の2つのHCをHC−HC(コントロール)、AS−AS、AS−HC、HS−HC、HC−HSとなるよう変異させた5種類のクローニングベクターを作製した。この際用いたコドンは、A:GCC、S:TCC、H:CATである。 The base sequence of ustYa containing 145 bp upstream and 443 bp downstream was introduced into a plasmid vector by TA cloning using TTarget Clone-Plus- (Toyobo, TAK-201) with a restriction enzyme site SmaI added to both ends. After confirming the sequence, two HCs in the motif become HC-HC (control), AS-AS, AS-HC, HS-HC, HC-HS using PrimeSTA Mutagenesis Basal Kit (TaKaRa, R046A). Five types of mutated cloning vectors were prepared. The codons used at this time are A: GCC, S: TCC, and H: CAT.
5種類それぞれについて、プラスミドベクター上で変異箇所の配列を確認した後、制限酵素SmaIによって切り出したDNAコンストラクトを、ustYaと隣接するustP配列及びその下流でありustYaの残りの上流部分でもあるDNAコンストラクト、及びマーカーリサイクルシステムであるCre−loxP配列にAspergillus nidulans pyrGマーカーをつないだDNAコンストラクトとfusion PCR法により融合させて、7kb弱のDNAコンストラクトを作製した。 For each of the five types, after confirming the sequence of the mutation site on the plasmid vector, the DNA construct excised by the restriction enzyme SmaI was used as a ustP sequence adjacent to ustYa and a DNA construct that is downstream and also the remaining upstream part of ustYa, A DNA construct having the Aspergillus nidulans pyrG marker linked to the Cre-loxP sequence, which is a marker recycling system, was fused with the fusion PCR method to prepare a DNA construct of less than 7 kb.
このDNAコンストラクトをプロトプラスト法によってA.flavus CA14株に形質転換し、ゲノム配列上での上記コンストラクト増幅によるPCR確認及び塩基配列確認を行い、ustYaの2種類のHXXHCモチーフを変化させた上記4種類の点変異株(それぞれAS−AS株、AS−HC株、HS−HC株、HC−HS株)とコントロール株(HC−HC株)を取得した。 This DNA construct was prepared by A.P. The flavus CA14 strain was transformed, PCR confirmation and base sequence confirmation were performed by amplification of the construct on the genome sequence, and the four types of point mutant strains (two AS-AS strains, respectively) in which two types of HXXHC motifs of ustYa were changed. AS-HC strain, HS-HC strain, HC-HS strain) and control strain (HC-HC strain) were obtained.
取得した4種類の点変異株及びHC−HC株を、1%キシロースを含む培地で培養してCre−loxP配列を除去した後、コーン固体培地上で培養を行い、80%アセトン及び等量の酢酸エチルによる抽出後の水層をLC−MS分析した。その結果、コントロール株であるHC−HC株では、ウスチロキシンB及びウスチロキシンFに対応するm/z 644.2及びm/z 465.2の[M−H]−MSピークが確認されたが、残りの点変異株4株ではいずれもこれらのピークが消失した(図10)。 The obtained four types of point mutants and HC-HC strains were cultured in a medium containing 1% xylose to remove the Cre-loxP sequence, and then cultured on a corn solid medium. The aqueous layer after extraction with ethyl acetate was analyzed by LC-MS. As a result, in a control strain HC-HC strain, [M-H] of m / z 644.2 and m / z 465.2 corresponding to the mouse thyroxine B and mouse thyroxine F - but MS peaks were confirmed In the remaining 4 point mutants, these peaks disappeared (FIG. 10).
以上より、ustYa及びそのホモログであるustYbはウスチロキシン生産に必須な活性を持つ酵素であり、その活性中心は2つのHXXHCモチーフを中心とする2核型金属捕捉モチーフ部分であると推定された。 From the above, it was presumed that ustYa and its homologue ustYb are enzymes having an essential activity for the production of ustyroxine, and the active center is a binuclear metal capture motif part centered on two HXXHC motifs.
<実施例7>分子量1019のペプチド化合物を生合成するリボソームペプチド生合成遺伝子クラスターの同定
GenBank EQ963472−EQ966232として登録されている黄色麹菌(Aspergillus flavus)の全ゲノム情報を基に、小胞体移行シグナル配列及び反復配列を含むアミノ酸配列からなるリボソームペプチド前駆体をコードする遺伝子及び配列番号3に示されるアミノ酸配列(UstYa)に対するE値が1e−4未満のアミノ酸配列からなるタンパク質をコードする遺伝子を、前述のSmith−Watermanアルゴリズム、signalP 4.1及びBlast法によって検索した。その結果、リボソームペプチド前駆体をコードする遺伝子(AFLA_063260)及び配列番号3に示されるアミノ酸配列(UstYa)に対するE値が1e−11のアミノ酸配列からなるタンパク質をコードする塩基配列を有する5つの遺伝子(AFLA_063270〜AFLA_063310)が隣接する領域が見いだされた。
<Example 7> Identification of a ribosomal peptide biosynthetic gene cluster that biosynthesizes a peptide compound having a molecular weight of 1019 Based on whole genome information of Aspergillus flavus registered as GenBank EQ963472-EQ966232, an endoplasmic reticulum migration signal sequence A gene encoding a ribosomal peptide precursor consisting of an amino acid sequence including a repetitive sequence and a gene encoding a protein consisting of an amino acid sequence having an E value of less than 1e-4 with respect to the amino acid sequence shown in SEQ ID NO: 3 (UstYa), By the Smith-Waterman algorithm, signalP 4.1 and the Blast method. As a result, five genes having a base sequence encoding a protein consisting of an amino acid sequence having an E value of 1e-11 with respect to the gene (AFLA — 063260) encoding a ribosomal peptide precursor and the amino acid sequence (UstYa) represented by SEQ ID NO: 3 ( AFLA_063270 to AFLA_0631010) were found to be adjacent.
さらに、公共データベース(NCBI GEO http://www.ncbi.nlm.nih.gov/geo/)に登録された、二次代謝物質を多く産生する培養条件を含む28条件下で取得された発現情報(GSE15435)及び前述のMIDDAS−Mを利用して、上記遺伝子を含み共同的に発現している遺伝子領域を調べた。 Furthermore, expression information obtained under 28 conditions including culture conditions that produce a lot of secondary metabolites registered in a public database (NCBI GEO http://www.ncbi.nlm.nih.gov/geo/) Using (GSE15435) and the above-mentioned MIDDAS-M, the gene region including the above gene and co-expressed was examined.
その結果(図11)及び遺伝子機能アノテーションから、少なくともNCBI遺伝子IDがAFLA_063170〜AFLA_063330からなる領域が新規リボソームペプチド生合成遺伝子クラスターとして推定された。 As a result (FIG. 11) and gene function annotation, at least a region consisting of NCBI gene IDs AFLA — 063170 to AFLA — 063330 was estimated as a novel ribosomal peptide biosynthesis gene cluster.
さらに、上記クラスター領域のうちAFLA_063260からAFLA_063320の7つの遺伝子全て、AFLA_063280及びAFLA_063310それぞれを選択マーカー遺伝子(pyrG)と置換することで欠失させた、計3種類のA.flavus変異株を作成した。具体的な作業は次の通りである。 Further, in the above cluster region, all seven types of AFA_06260 to AFLA_06320, each of AFLA_063280 and AFLA_0631010 were deleted by substituting each with a selectable marker gene (pyrG). A flavus mutant was created. The specific work is as follows.
上記3種類の標的遺伝子領域それぞれについて、その上流及び下流各1kbを含むゲノム領域が増幅されるよう設計したプライマーセットを用いてPCRを行い、前記ゲノム領域の増幅断片1を作製した。一方、A.nidulansのpyrG遺伝子を含む約1.8kbのゲノム領域が増幅されるよう設計したプライマーセットを用いてPCRを行い、前記pyrG遺伝子を含むゲノム領域の増幅断片2を作製した。さらに、増幅断片1及び2を鋳型として、両断片が連結した核酸が増幅されるよう設計されたプライマーセットを用いてPCRを行い、両ゲノム領域の融合PCR増幅断片3を調製した。
For each of the above three types of target gene regions, PCR was performed using a primer set designed to amplify a genomic region containing 1 kb upstream and downstream thereof, thereby producing an amplified
1.12mg/mLのウラシルを含む24g/LのDifcoポテトデキストロース培地にA.flavus(CA14株、Δku70 ΔpyrG ΔniaD)の分生胞子を懸濁し(106/mL)、37℃で2日間培養した。菌体を回収し、溶菌酵素(Sigma社のlysing enzyme、TaKaRa社のYatalase、ヤクルト社のセルラーゼ)を含む緩衝液中に懸濁して30℃で3時間インキュベートして、プロトプラストを調製した。このプロトプラストを等張液に懸濁後、前記3種類の融合PCR増幅断片3(1μg)を別々に加えて形質転換させ、ポリエチレングリコールの存在下でインキュベートした。インキュベーション後、プロトプラストを再生培地上に置き、3〜5日間培養して真菌細胞を再生させた。再生された3つの変異株が、導入されたpyrG遺伝子との置換によって各標的遺伝子が欠失したゲノム構造を有するものであることを、組み換えられたゲノム領域を鋳型にPCRで増幅させた核酸断片の配列解析により確認した。 1. Add 24 g / L Difco potato dextrose medium containing 12 mg / mL uracil to The conidia of flavus (CA14 strain, Δku70 ΔpyrG ΔniaD) were suspended (10 6 / mL) and cultured at 37 ° C. for 2 days. The cells were collected, suspended in a buffer containing a lytic enzyme (lysing enzyme from Sigma, Yatalase from TaKaRa, cellulase from Yakult), and incubated at 30 ° C. for 3 hours to prepare a protoplast. After suspending this protoplast in an isotonic solution, the three kinds of fusion PCR amplified fragments 3 (1 μg) were separately added for transformation, and incubated in the presence of polyethylene glycol. After incubation, the protoplasts were placed on the regeneration medium and cultured for 3-5 days to regenerate the fungal cells. A nucleic acid fragment obtained by PCR amplification using the recombined genomic region as a template, indicating that each of the three regenerated mutant strains has a genomic structure in which each target gene has been deleted by substitution with the introduced pyrG gene. This was confirmed by sequence analysis.
3つの変異体それぞれを、1.2mLの蒸留水を加えて滅菌処理をした2.5gの粉砕とうもろこし上で、30℃で6日間した後、10mLの80%アセトンを加えて室温で1時間インキュベートした。菌体や固形培地を除いた抽出液からアセトンを蒸発させ、残った濃縮液に等量の酢酸エチルを添加して1時間反応後、水相をポアサイズ0.22μmのフィルターに通して、LC−MS用試料を調製した。この試料をDevelosil XG−C18M−5逆相カラム(野村化学社)をセットしたUltimate3000 HPLC(Dionex社)及び水/アセトニトリルのグラジエント(0%−100%)溶媒を用いて分画した。 Each of the three mutants was sterilized by adding 1.2 mL of distilled water, cultivated on 2.5 g of ground corn for 6 days at 30 ° C., then added with 10 mL of 80% acetone and incubated at room temperature for 1 hour. did. Acetone is evaporated from the extract from which the bacterial cells and solid medium have been removed, and an equivalent amount of ethyl acetate is added to the remaining concentrated solution. After reacting for 1 hour, the aqueous phase is passed through a filter having a pore size of 0.22 μm. A sample for MS was prepared. This sample was fractionated using Ultimate 3000 HPLC (Dionex) equipped with a Develosil XG-C18M-5 reverse phase column (Nomura Chemical Co.) and a water / acetonitrile gradient (0% -100%) solvent.
3種類の破壊株及びコントロール株(pyrGマーカー復帰株)間で保持時間と分子量に相当するm/zの値のパターンを比較したところ、コントロール株では存在するが、上記リボソームペプチド生合成遺伝子クラスターに相当する3種類の破壊株でのみ消失するm/z 1018.4[M−H]−(陽イオンでm/z 1020.4[M+H]+)のMSピークを保持時間12分の位置に見いだした(図12)。 When the patterns of m / z values corresponding to the retention time and molecular weight were compared between the three types of disrupted strains and the control strain (pyrG marker-reverted strain), it was present in the control strain, but the ribosomal peptide biosynthesis gene cluster An MS peak of m / z 1018.4 [M−H] − (m / z 1020.4 [M + H] + with a cation) disappeared only in the corresponding three types of disrupted strains was found at a retention time of 12 minutes. (FIG. 12).
上記ピークを分取して構成アミノ酸の種類を酸分解法で解析し、本化合物が新規リボソームペプチド前駆体タンパク質のコアペプチド配列を構成要素とする分子量1019のペプチド化合物(以下、PMW1019と表す)であることを同定した。 The above peaks are collected and the types of constituent amino acids are analyzed by acidolysis, and this compound is a peptide compound having a molecular weight of 1019 (hereinafter referred to as PMW1019) whose core peptide sequence is a novel ribosomal peptide precursor protein. I identified it.
以上の変異体の解析結果から、AFLA_063170〜AFLA_063330の17遺伝子を、PMW1019の生合成に実質的に関与している生合成遺伝子クラスターの構成遺伝子と判断した。これらの遺伝子のNCBI ID番号、推定機能、及び大きさ(塩基対数)を表14に示す。
<実施例8>転写因子の過剰発現によるPMW1019の産生量の亢進
実施例6で特定した生合成遺伝子クラスターに含まれるNCBI遺伝子AFLA_063180は、転写因子に含まれるジンクフィンガーC2H2モチーフを含むタンパク質と相同性があることが、アミノ酸配列解析によって明らかとなった。そこで、A.flavusのtef1遺伝子(Kitamotoら、1998年、Appl.Microbiol.Biotechnol.、第50巻、85−92ページ)のプロモーター領域を増幅断片として得ることができるように設計したプライマーを用いて調製した増幅断片4と、AFLA_063180の翻訳領域約1kbを増幅断片として得ることができるように設計したプライマーを用いて調製した増幅断片5とを用いて、AFLA_063180のプロモーター領域がtef1遺伝子プロモーターに置き換わった増幅断片6を、融合PCR法で調製した。この増幅断片6を用いてA.flavus CA14株(Δku70 ΔpyrG ΔniaD)を形質転換して、AFLA_063180の過剰発現変異株を得た。
<Example 8> Enhancement of production amount of PMW1019 by overexpression of transcription factor NCBI gene AFLA_063180 contained in the biosynthetic gene cluster specified in Example 6 is homologous to a protein containing the zinc finger C2H2 motif contained in the transcription factor It was revealed by amino acid sequence analysis. Therefore, A. Amplified fragment prepared using primers designed so that the promoter region of the flavus tef1 gene (Kitamoto et al., 1998, Appl. Microbiol. Biotechnol., 50, 85-92) can be obtained as an amplified fragment. 4 and an amplified fragment 5 prepared using a primer designed so that the translated region of AFLA — 063180 can be obtained as an amplified fragment, the amplified fragment 6 in which the promoter region of AFLA — 063180 is replaced with the tef1 gene promoter Prepared by the fusion PCR method. Using this amplified fragment 6, A. The flavus CA14 strain (Δku70 ΔpyrG ΔniaD) was transformed to obtain an overexpressing mutant of AFLA — 063180.
AFLA_063180過剰発現変異株を、1.2mLの蒸留水を加えて滅菌処理を施した2.5gの粉砕とうもろこし上で、30℃で6日間培養した後、10mLの80%アセトンを培地に加えて室温で1時間インキュベートした。菌体や固形培地を除いた抽出液からアセトンを蒸発させ、残った濃縮液に等量の酢酸エチルを添加して1時間反応後、水相をポアサイズ0.22μmのフィルターに通してLC−MS測定用試料を調製し、Develosil XG−C18M−5逆相カラム(野村化学社)をセットしたUltimate3000 HPLC(Dionex社)及び水/アセトニトリルのグラジエント(0%−100%)溶媒を用いて分画した。溶出画分中のPMW1019の含有量を、micrOTOFII KIK2 MS(Bruker社)を用いて定量した。定量は、RT=12分におけるm/z 1018.4±0.1のEICs[M−H]−のピークエリアの算出によって行った。
その結果、AFLA_063180過剰発現変異株のPMW1019の産生量は、対照である野生株と比較して1.8倍に上昇することが確認された。
AFLA — 063180 overexpressing mutant strain was cultured for 6 days at 30 ° C. on 2.5 g of ground corn that had been sterilized by adding 1.2 mL of distilled water, and then 10 mL of 80% acetone was added to the medium at room temperature. And incubated for 1 hour. Acetone is evaporated from the extract from which the bacterial cells and solid medium have been removed, and an equivalent amount of ethyl acetate is added to the remaining concentrated solution. After reacting for 1 hour, the aqueous phase is passed through a filter having a pore size of 0.22 μm to perform LC-MS. Samples for measurement were prepared and fractionated using Ultimate 3000 HPLC (Dionex) equipped with Develosil XG-C18M-5 reverse phase column (Nomura Chemical Co.) and water / acetonitrile gradient (0% -100%) solvent. . The content of PMW1019 in the elution fraction was quantified using a microOTOFII KIK2 MS (Bruker). Quantification was performed by calculating the peak area of EICs [M−H] − at m / z 1018.4 ± 0.1 at RT = 12 minutes.
As a result, it was confirmed that the production amount of PMW1019 of the AFLA_063180 overexpressing mutant increased 1.8 times compared to the wild-type control strain.
<実施例9> PMW1019の構成アミノ酸の同定
培養菌体を80%アセトンで抽出、ろ過後、濃縮した。水に溶解する該当画分を吸着樹脂を用いて分離し、吸着画分を中圧クロマトグラフィーとODSカラムを用いて精製した。さらに、該当画分を高速液体クロマトグラフィーとODSカラムを用いてメタノール水溶液で分離し、再度高速液体クロマトグラフィーとODSカラムを用いてアセトニトリル水溶液で分離、精製した。精製した分子量1019のペプチド化合物を酸加水分解に供した。得られたアミノ酸はFDAA誘導化し、超高速液体クロマトグラフィーとODSカラムを用いて分析した。結果、グルタミン酸、アラニン、グリシンが検出された。これらは、該当リボソームペプチド前駆体タンパク質のコアペプチド配列の構成アミノ酸である。
<Example 9> Identification of constituent amino acids of PMW1019 The cultured cells were extracted with 80% acetone, filtered and concentrated. The relevant fraction dissolved in water was separated using an adsorption resin, and the adsorption fraction was purified using medium pressure chromatography and an ODS column. Furthermore, the relevant fraction was separated with an aqueous methanol solution using high performance liquid chromatography and an ODS column, and again separated and purified with an aqueous acetonitrile solution using high performance liquid chromatography and an ODS column. The purified peptide compound having a molecular weight of 1019 was subjected to acid hydrolysis. The resulting amino acid was derivatized with FDAA and analyzed using ultra high performance liquid chromatography and an ODS column. As a result, glutamic acid, alanine, and glycine were detected. These are the constituent amino acids of the core peptide sequence of the relevant ribosomal peptide precursor protein.
<実施例10>RNAシーケンシングによるPMW1019生合成遺伝子クラスターの遺伝子翻訳領域の再アノテーション
公共配列リードデータベースNCBI SRA(http://www.ncbi.nlm.nih.gov/SRA)に登録されたリードデータとして、SRR283857、SRR283858、SRR495778、SRR495942、SRR495943、SRR544871、SRR544872、SRR544873、SRR610531、SRR610532、SRR610533、SRR610534、SRR610535、SRR610537及びSRR610538を用いて、以下の作業を行った。
Example 10 Re-annotation of gene translation region of PMW1019 biosynthesis gene cluster by RNA sequencing Read data registered in public sequence read database NCBI SRA (http://www.ncbi.nlm.nih.gov/SRA) SRR 283857, SRR 283858, SRR 495778, SRR 495842, SRR 495932, SRR 544873, SRR 54472, SRR 544873, SRR 610531, SRR 610532, SRR 610533, SRR 610534, SRR 610535, SRR 610537 and SRR 610538 are used.
未同定塩基を含まず、Q値(Quality value)が連続7塩基平均20未満の塩基をトリムした後の長さが30塩基以上のリードを用いて、マッピング作業を行った。ソフトウェアにはbowtie及びtophatを使用した。作業はコンピューター(DELL社製:CPU Intel Xeon E52643、メモリー256GB、ハードディスク40TB、OS:Ubuntu Linux(登録商標)13.10))上で行った。マッピング結果をゲノム情報可視化ツールで表示の上、該当遺伝子領域(スキャフォールドGenBank EQ963477上の遺伝子AFLA_063120〜AFLA_063320)を目視で確認し、開始コドンとコドンの読み枠に矛盾のない領域をCDS領域と同定した。 Mapping work was performed using a lead having a length of 30 bases or more after trimming bases that do not contain unidentified bases and have a Q value (Quality value) of less than 20 consecutive 7 bases on average. The software used was bowtie and tophat. The work was carried out on a computer (DELL: CPU Intel Xeon E52643, memory 256 GB, hard disk 40 TB, OS: Ubuntu Linux (registered trademark) 13.10)). Display the mapping result with the genome information visualization tool, visually check the corresponding gene region (genes AFLA_063120 to AFLA_0632020 on the scaffold GenBank EQ963477), and identify the region consistent with the start codon and codon reading frame as the CDS region did.
配列解析の結果、AFLA_063230からは配列番号50及び51に示される2つのアミノ酸配列からなるタンパク質が、AFLA_063270から配列番号52に示されるアミノ酸配列からなるタンパク質が、AFLA_063280から配列番号53に示されるアミノ酸配列からなるタンパク質が、AFLA_063320から配列番号54に示されるアミノ酸配列からなるタンパク質が、AFLA_063330から配列番号55に示されるアミノ酸配列からなるタンパク質が、それぞれ転写翻訳されていることが確認された。また、表14に示される遺伝子のうち上記以外の遺伝子から転写翻訳されるタンパク質のアミノ酸配列は、各遺伝子のNCBI遺伝子IDで演繹推定されているアミノ酸配列と同一であることが確認された。 As a result of sequence analysis, the protein consisting of the two amino acid sequences shown in SEQ ID NOs: 50 and 51 from AFLA_063230, the protein consisting of the amino acid sequence shown in SEQ ID NO: 52 from AFLA_063270, and the amino acid sequence shown in SEQ ID NO: 53 from AFLA_063280 It was confirmed that the protein consisting of the protein consisting of the amino acid sequence shown in SEQ ID NO: 54 from AFLA — 063320 and the protein consisting of the amino acid sequence shown in SEQ ID NO: 55 from AFLA — 0633330 were each translated and translated. Moreover, it was confirmed that the amino acid sequences of the proteins that are transcribed and translated from genes other than the above among the genes shown in Table 14 are the same as the amino acid sequences deduced and estimated by the NCBI gene ID of each gene.
<実施例11>分子量809のペプチド化合物を生合成するリボソームペプチド生合成遺伝子クラスターの同定
GenBank EQ963472−EQ966232として登録されている黄色麹菌(A.flavus)の全ゲノム情報を基に、小胞体移行シグナル配列及び反復配列を含むアミノ酸配列からなるリボソームペプチド前駆体をコードする遺伝子及び配列番号3に示されるアミノ酸配列(UstYa)に対するE値が1e−4未満のアミノ酸配列からなるタンパク質をコードする遺伝子を、前述のSmith−Watermanアルゴリズム、signalP 4.1及びBlast法によって検索した。その結果、リボソームペプチド前駆体をコードする遺伝子(AFLA_041400)及び配列番号3に示されるアミノ酸配列(UstYa)に対するE値が1e−48未満のアミノ酸配列からなるタンパク質をコードする塩基配列を有する遺伝子(AFLA_041390)が隣接する領域が見いだされた。
<Example 11> Identification of a ribosomal peptide biosynthetic gene cluster that biosynthesizes a peptide compound having a molecular weight of 809 Based on whole genome information of A. flavus registered as GenBank EQ963472-EQ966232, an endoplasmic reticulum migration signal A gene encoding a ribosomal peptide precursor consisting of an amino acid sequence comprising a sequence and a repetitive sequence, and a gene encoding a protein consisting of an amino acid sequence having an E value of less than 1e-4 with respect to the amino acid sequence shown in SEQ ID NO: 3 (UstYa), The search was performed by the aforementioned Smith-Waterman algorithm, signalP 4.1 and the Blast method. As a result, a gene (AFLA — 041390) having a base sequence encoding a protein consisting of an amino acid sequence having an E value of less than 1e-48 relative to the gene (AFLA — 041400) encoding a ribosomal peptide precursor and the amino acid sequence (UstYa) shown in SEQ ID NO: 3 ) Was found adjacent.
さらに、公共データベース(NCBI GEO http://www.ncbi.nlm.nih.gov/geo/)に登録された、二次代謝物質を多く産生する培養条件を含む28条件下で取得された発現情報(GSE15435)を用いて、上記2遺伝子を含み共同的に発現している遺伝子領域を調べた。 Furthermore, expression information obtained under 28 conditions including culture conditions that produce a lot of secondary metabolites registered in a public database (NCBI GEO http://www.ncbi.nlm.nih.gov/geo/) Using (GSE15435), the gene region including the above two genes and co-expressed was examined.
その結果(図13)及び遺伝子機能アノテーションから、NCBI遺伝子AFLA_041320〜AFLA_041490の計18の遺伝子が、新規リボソームペプチド生合成遺伝子クラスターとして推定された。これらの遺伝子のNCBI ID番号、推定機能、及び大きさ(塩基対数)を表15に示す。 From the results (FIG. 13) and gene function annotation, a total of 18 genes of NCBI genes AFLA — 043120 to AFLA — 041490 were estimated as novel ribosomal peptide biosynthesis gene clusters. Table 15 shows the NCBI ID numbers, estimated functions, and sizes (base pairs) of these genes.
さらに、AFLA_041320〜AFLA_041490の18の遺伝子すべて、並びにAFLA_041330(C6型転写因子)、AFLA_041390(UstYaホモログ)及びAFLA_041400(前駆体タンパク質)のそれぞれを選択マーカー遺伝子と置換することで欠失させた、計4種類のA.flavus変異株を作成した。具体的な作業は次の通りである。 Furthermore, all 18 genes of AFLA_041320 to AFLA_041490, and AFLA_041330 (C6 type transcription factor), AFLA_041390 (UstYa homolog) and AFLA_041400 (precursor protein) were deleted by substituting each with a selectable marker gene, for a total of 4 Type A. A flavus mutant was created. The specific work is as follows.
上記4種類の標的遺伝子領域それぞれについて、その上流及び下流各1kbを含むゲノム領域が増幅されるよう設計したプライマーセットを用いてPCRを行い、前記ゲノム領域の増幅断片1を作製した。一方、A.nidulansのpyrG遺伝子を含む約1.8kbのゲノム領域が増幅されるよう設計したプライマーセットを用いてPCRを行い、前記pyrG遺伝子を含むゲノム領域の増幅断片2を作製した。さらに、増幅断片1及び2を鋳型として、両断片が連結した核酸が増幅されるよう設計されたプライマーセットを用いてPCRを行い、両ゲノム領域の融合PCR増幅断片3を調製した。
For each of the above four types of target gene regions, PCR was performed using a primer set designed to amplify a genomic region containing 1 kb upstream and downstream thereof, thereby producing an amplified
1.12mg/mLのウラシルを含む24g/LのDifcoポテトデキストロース培地にA.flavus(CA14株、Δku70 ΔpyrG ΔniaD)の分生胞子を懸濁し(106/mL)、37℃で2日間培養した。菌体を回収し、溶菌酵素(Sigma社のlysing enzyme、TaKaRa社のYatalase、ヤクルト社のセルラーゼ)を含む緩衝液中に懸濁して30℃で3時間インキュベートして、プロトプラストを調製した。このプロトプラストを等張液に懸濁後、前記4種類の融合PCR増幅断片3(1μg)を別々に加えて形質転換させ、ポリエチレングリコールの存在下でインキュベートした。インキュベーション後、プロトプラストを再生培地上に置き、3〜5日間培養して真菌細胞を再生させた。再生された4つの変異株が、導入されたpyrG遺伝子との置換によって各標的遺伝子が欠失したゲノム構造を有するものであることを、組み換えられたゲノム領域を鋳型にPCRで増幅させた核酸断片の配列解析により確認した。 1. Add 24 g / L Difco potato dextrose medium containing 12 mg / mL uracil to The conidia of flavus (CA14 strain, Δku70 ΔpyrG ΔniaD) were suspended (10 6 / mL) and cultured at 37 ° C. for 2 days. The cells were collected, suspended in a buffer containing a lytic enzyme (lysing enzyme from Sigma, Yatalase from TaKaRa, cellulase from Yakult), and incubated at 30 ° C. for 3 hours to prepare a protoplast. After suspending this protoplast in an isotonic solution, the four types of fusion PCR amplified fragments 3 (1 μg) were separately added for transformation, and incubated in the presence of polyethylene glycol. After incubation, the protoplasts were placed on the regeneration medium and cultured for 3-5 days to regenerate the fungal cells. Nucleic acid fragments obtained by PCR amplification using the recombined genomic region as a template, indicating that each of the four regenerated mutant strains has a genomic structure in which each target gene has been deleted by substitution with the introduced pyrG gene This was confirmed by sequence analysis.
4つの変異体それぞれを1.2mLの蒸留水を加えて滅菌処理をした2.5gの粉砕とうもろこし上で30℃で6日間した後、10mLの80%アセトンを加えて室温で1時間インキュベートした。菌体や固形培地を除いた抽出液からアセトンを蒸発させ、残った濃縮液に等量の酢酸エチルを添加して1時間反応後、水相をポアサイズ0.22μmのフィルターに通してLC−MS用試料を調製した。この試料を、Develosil XG−C18M−5逆相カラム(野村化学社)をセットしたUltimate3000 HPLC(Dionex社)及び水/アセトニトリルのグラジエント(0%−100%)溶媒を用いて分画した。 Each of the four mutants was sterilized by adding 1.2 mL of distilled water and sterilized on 2.5 g of ground corn for 6 days at 30 ° C., and then added with 10 mL of 80% acetone and incubated at room temperature for 1 hour. Acetone is evaporated from the extract from which the bacterial cells and solid medium have been removed, and an equivalent amount of ethyl acetate is added to the remaining concentrated solution and reacted for 1 hour. A sample was prepared. The sample was fractionated using an Ultimate 3000 HPLC (Dionex) with a Develosil XG-C18M-5 reverse phase column (Nomura Chemical) and a water / acetonitrile gradient (0% -100%) solvent.
上記4種類の破壊株及びコントロール株(pyrGマーカー復帰株)間で保持時間と分子量に相当するm/zの値のパターンを比較したところ、コントロール株では存在するが、AFLA_041320−AFLA_041490、AFLA_041390(UstYaホモログ)、AFLA_041400(前駆体タンパク質)を破壊した3種類の破壊株でのみ消失するm/z 808.3[M−H]−(陽イオンでm/z 810.3[M+H]+)のMSピークを、保持時間13.8分の位置に見いだした(図14)。 When the patterns of m / z values corresponding to the retention time and molecular weight were compared between the four types of disrupted strains and the control strain (pyrG marker-reverted strain), AFLA_041320-AFLA_041490, AFLA_041390 (UstYa) existed in the control strain. Homolog), MS of m / z 808.3 [M−H] − (m / z 810.3 [M + H] + in cation) disappeared only in three types of disrupted strains that destroyed AFLA — 041400 (precursor protein) A peak was found at a retention time of 13.8 minutes (FIG. 14).
上記ピークを分取してNMRによる構造解析を行った結果、本化合物が新規リボソームペプチド前駆体タンパク質のコアペプチド配列を構成要素とする、新規な分子量809のペプチド化合物(以下、PMW809と表す)であることが確認された。一方、C6型転写因子であるAFLA_041330を破壊しても、またtef1プロモーターを用いてC6型転写因子を過剰発現させても、PMW809の生産性に変化は見られなかった。 As a result of separating the peak and analyzing the structure by NMR, the present compound is a novel peptide compound having a molecular weight of 809 (hereinafter referred to as PMW809) having a core peptide sequence of a novel ribosomal peptide precursor protein as a constituent element. It was confirmed that there was. On the other hand, even when AFLA — 041330, which is a C6 transcription factor, was disrupted or overexpression of the C6 transcription factor using the tef1 promoter, there was no change in the productivity of PMW809.
以上から、NCBI遺伝子AFLA_041370〜AFLA_041400の4つの遺伝子(表16)を、新規リボソームペプチドであるPMW809の生合成に実質的に関与している生合成遺伝子クラスターと判断した。 From the above, the four genes (Table 16) of NCBI genes AFLA — 041370 to AFLA — 041400 were determined to be biosynthetic gene clusters that are substantially involved in the biosynthesis of PMW809, a novel ribosomal peptide.
<実施例12>PMW809の構成アミノ酸の同定
培養菌体を80%アセトンで抽出、ろ過後、濃縮した。ブタノールに溶解する該当画分を中圧クロマトグラフィーとODSカラムを用いて精製した。さらに、該当画分を高速液体クロマトグラフィーとODSカラムを用いてメタノール水溶液で分離し、再度高速液体クロマトグラフィーとODSカラムを用いてアセトニトリル水溶液で分離、精製した。精製した分子量809のペプチド化合物の構造解析を高分解能ESI 質量分析及び核磁気共鳴スペクトルにより行った。まず、高分解能質量分析により分子式をC42H43N5O12と決定した。また、13C−核磁気共鳴スペトル及び1H−核磁気共鳴スペクトルから、本化合物が、フェニルアラニン、チロシン3つ、スレオニン、グリシンを含むことが分かった。これらは該当リボソームペプチド前駆体タンパク質のコアペプチド配列に含まれるアミノ酸である。
<Example 12> Identification of constituent amino acids of PMW809 The cultured cells were extracted with 80% acetone, filtered and concentrated. The relevant fraction dissolved in butanol was purified using medium pressure chromatography and an ODS column. Furthermore, the relevant fraction was separated with an aqueous methanol solution using high performance liquid chromatography and an ODS column, and again separated and purified with an aqueous acetonitrile solution using high performance liquid chromatography and an ODS column. The structural analysis of the purified peptide compound having a molecular weight of 809 was performed by high resolution ESI mass spectrometry and nuclear magnetic resonance spectrum. First, the molecular formula was determined as C 42 H 43 N 5 O 12 by high resolution mass spectrometry. Further, from the 13 C-nuclear magnetic resonance spectrum and 1 H-nuclear magnetic resonance spectrum, it was found that the present compound contained phenylalanine, three tyrosine, threonine, and glycine. These are amino acids contained in the core peptide sequence of the corresponding ribosomal peptide precursor protein.
<実施例13>RNAシーケンシングによるPMW809生合成遺伝子クラスターの遺伝子翻訳領域再アノテーション
公共配列リードデータベースNCBI SRA(http://www.ncbi.nlm.nih.gov/SRA)に登録されたリードデータとして、SRR283857、SRR283858、SRR495778、SRR495942、SRR495943、SRR544871、SRR544872、SRR544873、SRR610531、SRR610532、SRR610533、SRR610534、SRR610535、SRR610537及びSRR610538を用いて、以下の作業を行った。未同定塩基を含まず、Q値(Quality value)が連続7塩基平均20未満の塩基をトリムした後の長さが30塩基以上のリードを用いて、マッピング作業を行った。ソフトウェアにはbowtie及びtophatを使用した。作業はコンピューター(DELL社製:CPU Intel Xeon E52643、メモリー256GB、ハードディスク40TB、OS:Ubuntu Linux(登録商標)13.10))上で行った。マッピング結果をゲノム情報可視化ツールで表示の上、該当遺伝子領域(スキャフォールドGenBank EQ963476上の遺伝子AFLA_041370〜AFLA_041400)を目視で確認し、開始コドンとコドンの読み枠に矛盾のない領域をCDS領域と同定した。
<Example 13> Re-annotation of gene translation region of PMW809 biosynthesis gene cluster by RNA sequencing As read data registered in public sequence read database NCBI SRA (http://www.ncbi.nlm.nih.gov/SRA) , SRR 283857, SRR 283858, SRR 495778, SRR 495842, SRR 495932, SRR 544971, SRR 54472, SRR 544873, SRR 610531, SRR 610532, SRR 610533, SRR 610534, SRR 610535, SRR 610537 and SRR 610537 are used. Mapping work was performed using a lead having a length of 30 bases or more after trimming bases that do not contain unidentified bases and have a Q value (Quality value) of less than 20 consecutive 7 bases on average. The software used was bowtie and tophat. The work was carried out on a computer (DELL: CPU Intel Xeon E52643, memory 256 GB, hard disk 40 TB, OS: Ubuntu Linux (registered trademark) 13.10)). After displaying the mapping result with the genome information visualization tool, the corresponding gene region (genes AFLA_041370 to AFLA_041400 on the scaffold GenBank EQ963476) is visually confirmed, and the region that is consistent with the reading frame of the start codon and codon is identified as the CDS region. did.
本発明によれば、これまでに報告のない新規な真菌由来のリボソームペプチドを製造することができる。これにより、医薬その他の有用物質への応用が期待される真菌由来の二次代謝産物であるリボソームペプチドを提供することが可能となる。また、各クラスターの構成遺伝子を相互に組換え、あるいは複数の構成遺伝子を任意に組み合わせることで、天然に生産されるものとは異なる構造や生理活性を有する非天然型のリボソームペプチドを製造することも可能となる。 According to the present invention, a novel fungal-derived ribosomal peptide that has not been reported so far can be produced. This makes it possible to provide a ribosomal peptide that is a secondary metabolite derived from a fungus expected to be applied to pharmaceuticals and other useful substances. In addition, by recombining the constituent genes of each cluster with each other or arbitrarily combining multiple constituent genes, non-natural ribosomal peptides with structures and physiological activities different from those produced in nature can be produced. Is also possible.
Claims (6)
工程(i)
前記真菌ゲノムの塩基配列又はこれに対応するアミノ酸配列を含むデータベースに対して、
配列番号1に示されるustYa遺伝子の塩基配列、配列番号2に示されるUstYaタンパク質のアミノ酸配列若しくは配列番号3に示されるUstYaタンパク質のアミノ酸配列、
及び/又は
配列番号6に示されるUstYbタンパク質のアミノ酸配列
をクエリー配列として相同性検索を行い、ヒットした塩基配列又はアミノ酸配列の中から、配列番号1に示されるustYa遺伝子の塩基配列に対するE値が1e−4未満である塩基配列、配列番号2に示されるUstYaタンパク質のアミノ酸配列に対するE値が1e−4未満であるアミノ酸配列、若しくは配列番号3に示されるUstYaタンパク質のアミノ酸配列に対するE値が1e−4未満であるアミノ酸配列、
及び/又は
配列番号6に示されるUstYbタンパク質のアミノ酸配列に対するE値が1e−4未満であるアミノ酸配列
を抽出する工程;
工程(ii)
工程(i)で抽出された塩基配列を有する遺伝子及び/又は工程(i)で抽出されたアミノ酸配列からなるタンパク質をコードする遺伝子の位置を、ゲノム配列上から特定する工程、
工程(iii)
工程(ii)で特定された遺伝子の位置と隣接している真菌ゲノム領域又は最大で25kbの範囲内の真菌ゲノム領域において、小胞体移行シグナル配列及び反復配列を含むアミノ酸配列からなる前記リボソームペプチドの前駆体をコードする遺伝子の存在を確認する工程;並びに
工程(iv)
工程(iii)において小胞体移行シグナル配列及び反復配列を含むアミノ酸配列からなるリボソームペプチド前駆体をコードする遺伝子の存在が確認された場合、
工程(i)で抽出された塩基配列を有する遺伝子及び/又は工程(i)で抽出されたアミノ酸配列からなるタンパク質をコードする遺伝子並びに前記小胞体移行シグナル配列及び反復配列を含むアミノ酸配列からなるリボソームペプチド前駆体をコードする遺伝子を含む遺伝子クラスターを、リボソームペプチド生合成遺伝子クラスター候補であると推定する工程
を含む、前記推定方法。 Present on fungal genome, a method of estimating the biosynthetic gene cluster candidates ribosomal peptides are peptidic secondary metabolites,
Step (i)
For a database containing the base sequence of the fungal genome or the amino acid sequence corresponding thereto,
The nucleotide sequence of the ustYa gene shown in SEQ ID NO: 1, the amino acid sequence of the UstYa protein shown in SEQ ID NO: 2, or the amino acid sequence of the UstYa protein shown in SEQ ID NO: 3,
And / or
Amino acid sequence of UstYb protein shown in SEQ ID NO: 6
Is used as a query sequence, and from among the hit base sequences or amino acid sequences, a base sequence having an E value of less than 1e-4 for the base sequence of the ustYa gene shown in SEQ ID NO: 1 is shown in SEQ ID NO: 2. An amino acid sequence having an E value of less than 1e-4 for the amino acid sequence of the UstYa protein, or an amino acid sequence having an E value of less than 1e-4 for the amino acid sequence of the UstYa protein shown in SEQ ID NO: 3;
And / or
An amino acid sequence having an E value of less than 1e-4 with respect to the amino acid sequence of the UstYb protein shown in SEQ ID NO: 6
Extracting
Step (ii)
Identifying the position of the gene having the base sequence extracted in step (i) and / or the gene encoding the protein comprising the amino acid sequence extracted in step (i) from the genome sequence;
Step (iii)
In the fungal genomic region adjacent to the position of the gene specified in step (ii) or the fungal genomic region within a range of at most 25 kb, the ribosomal peptide comprising an amino acid sequence comprising an endoplasmic reticulum translocation signal sequence and a repetitive sequence Confirming the presence of the gene encoding the precursor; and
Step (iv)
When the presence of a gene encoding a ribosomal peptide precursor consisting of an amino acid sequence including an endoplasmic reticulum transition signal sequence and a repetitive sequence is confirmed in step (iii),
A gene having a base sequence extracted in step (i) and / or a gene encoding a protein comprising the amino acid sequence extracted in step (i) and a ribosome comprising an amino acid sequence including the endoplasmic reticulum transition signal sequence and a repetitive sequence The said estimation method including the process of estimating that the gene cluster containing the gene which codes a peptide precursor is a ribosome peptide biosynthesis gene cluster candidate.
工程(iv)において、工程(i)で抽出された塩基配列を有する遺伝子及び/又は工程(i)で抽出されたアミノ酸配列からなるタンパク質をコードする遺伝子並びに前記小胞体移行シグナル配列及び反復配列を含むアミノ酸配列からなるリボソームペプチド前駆体をコードする遺伝子に加えてペプチダーゼ活性を有するタンパク質をコードする遺伝子を含む遺伝子クラスターを、リボソームペプチド生合成遺伝子クラスター候補であると推定する、請求項1に記載の方法。 In step (iii), the presence of a gene encoding a protein having peptidase activity is further confirmed,
In step (iv), the gene having the base sequence extracted in step (i) and / or the gene encoding the protein comprising the amino acid sequence extracted in step (i), and the endoplasmic reticulum transition signal sequence and the repetitive sequence, The gene cluster comprising a gene encoding a protein having a peptidase activity in addition to a gene encoding a ribosomal peptide precursor comprising an amino acid sequence comprising the amino acid sequence is estimated as a candidate ribosomal peptide biosynthesis gene cluster. Method.
工程(i)
前記真菌ゲノムの塩基配列又はこれに対応するアミノ酸配列を含むデータベースに対して、
配列番号1に示されるustYa遺伝子の塩基配列、配列番号2に示されるUstYaタンパク質のアミノ酸配列若しくは配列番号3に示されるUstYaタンパク質のアミノ酸配列、
及び/又は
配列番号6に示されるUstYbタンパク質のアミノ酸配列
をクエリー配列として相同性検索を行い、ヒットした塩基配列又はアミノ酸配列の中から、
配列番号1に示されるustYa遺伝子の塩基配列に対するE値が1e−4未満である塩基配列、配列番号2に示されるUstYaタンパク質のアミノ酸配列に対するE値が1e−4未満であるアミノ酸配列、若しくは配列番号3に示されるUstYaタンパク質のアミノ酸配列に対するE値が1e−4未満であるアミノ酸配列、
及び/又は
配列番号6に示されるUstYbタンパク質のアミノ酸配列に対するE値が1e−4未満であるアミノ酸配列
を抽出する工程;
工程(ii)
工程(i)で抽出された塩基配列を有する遺伝子及び/又は工程(i)で抽出されたアミノ酸配列からなるタンパク質をコードする遺伝子の位置を、ゲノム配列上から特定する工程、
工程(iii)
工程(ii)で特定された遺伝子の位置と隣接している真菌ゲノム領域又は最大で25kbの範囲内の真菌ゲノム領域において、小胞体移行シグナル配列及び反復配列を含むアミノ酸配列からなる前記リボソームペプチドの前駆体をコードする遺伝子の存在を確認する工程;並びに
工程(iv)
工程(iii)において小胞体移行シグナル配列及び反復配列を含むアミノ酸配列からなるリボソームペプチド前駆体をコードする遺伝子の存在が確認された場合、
工程(i)で抽出された塩基配列を有する遺伝子及び/又は工程(i)で抽出されたアミノ酸配列からなるタンパク質をコードする遺伝子並びに前記小胞体移行シグナル配列及び反復配列を含むアミノ酸配列からなるリボソームペプチド前駆体をコードする遺伝子を含む遺伝子クラスターを、リボソームペプチド生合成遺伝子クラスター候補であると推定する工程
を含み、さらに
工程(v)
推定されたリボソームペプチド生合成遺伝子クラスター候補を構成する1又は複数の遺伝子を欠失させることでリボソームペプチド産生量の減少が確認された場合に、前記推定された遺伝子クラスター候補はリボソームペプチド生合成遺伝子クラスターであると同定する工程
を含む、前記同定方法。 A method of identifying a biosynthetic gene cluster of ribosomal peptide which is a true present on bacterial genome, peptidic secondary metabolites,
Step (i)
For a database containing the base sequence of the fungal genome or the amino acid sequence corresponding thereto,
The nucleotide sequence of the ustYa gene shown in SEQ ID NO: 1, the amino acid sequence of the UstYa protein shown in SEQ ID NO: 2, or the amino acid sequence of the UstYa protein shown in SEQ ID NO: 3,
And / or
Amino acid sequence of UstYb protein shown in SEQ ID NO: 6
As a query sequence, and from the hit base sequence or amino acid sequence,
A base sequence whose E value for the base sequence of the ustYa gene shown in SEQ ID NO: 1 is less than 1e-4, an amino acid sequence whose E value for the amino acid sequence of the UstYa protein shown in SEQ ID NO: 2 is less than 1e-4, or a sequence An amino acid sequence having an E value of less than 1e-4 with respect to the amino acid sequence of the UstYa protein represented by No. 3;
And / or
An amino acid sequence having an E value of less than 1e-4 with respect to the amino acid sequence of the UstYb protein shown in SEQ ID NO: 6
Extracting
Step (ii)
Identifying the position of the gene having the base sequence extracted in step (i) and / or the gene encoding the protein comprising the amino acid sequence extracted in step (i) from the genome sequence;
Step (iii)
In the fungal genomic region adjacent to the position of the gene specified in step (ii) or the fungal genomic region within a range of at most 25 kb, the ribosomal peptide comprising an amino acid sequence comprising an endoplasmic reticulum translocation signal sequence and a repetitive sequence Confirming the presence of the gene encoding the precursor; and
Step (iv)
When the presence of a gene encoding a ribosomal peptide precursor consisting of an amino acid sequence including an endoplasmic reticulum transition signal sequence and a repetitive sequence is confirmed in step (iii),
A gene having a base sequence extracted in step (i) and / or a gene encoding a protein comprising the amino acid sequence extracted in step (i) and a ribosome comprising an amino acid sequence including the endoplasmic reticulum transition signal sequence and a repetitive sequence Estimating a gene cluster containing a gene encoding a peptide precursor as a candidate ribosomal peptide biosynthesis gene cluster
Including
Step (v)
When a decrease in ribosome peptide production is confirmed by deleting one or more genes constituting the estimated ribosome peptide biosynthesis gene cluster candidate, the estimated gene cluster candidate is the ribosome peptide biosynthesis gene The said identification method including the process of identifying as a cluster.
6. The method according to claim 4 or 5, wherein the fungus is a genus Aspergillus.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014044277 | 2014-03-06 | ||
JP2014044277 | 2014-03-06 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014232267A Division JP2015180609A (en) | 2014-03-06 | 2014-11-15 | Methods for producing ribosome peptides derived from fungi |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018050623A JP2018050623A (en) | 2018-04-05 |
JP6486440B2 true JP6486440B2 (en) | 2019-03-20 |
Family
ID=61833694
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017197163A Active JP6486440B2 (en) | 2014-03-06 | 2017-10-10 | Method for producing fungal ribosomal peptides |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6486440B2 (en) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005176602A (en) * | 2001-12-27 | 2005-07-07 | National Institute Of Advanced Industrial & Technology | Koji mold gene |
-
2017
- 2017-10-10 JP JP2017197163A patent/JP6486440B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018050623A (en) | 2018-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Murphy et al. | Structure and expression of the maize (Zea mays L.) SUN-domain protein gene family: evidence for the existence of two divergent classes of SUN proteins in plants | |
JP6486440B2 (en) | Method for producing fungal ribosomal peptides | |
JP6637904B2 (en) | Cluster of colistin synthetase and corresponding genes | |
WO2015133609A1 (en) | Method for producing fungus-derived ribosomal peptide | |
CA2816217C (en) | Compositions and methods of producing enterokinase in yeast | |
AU2005214322B2 (en) | Hyphal growth in fungi | |
JP4756743B2 (en) | Fungal hyphae growth | |
JP5247112B2 (en) | Bacterial enzyme inhibitor, lysis inhibitor, poly-gamma-glutamic acid degradation inhibitor, and method for producing poly-gamma-glutamic acid | |
CN112055751B (en) | Modified esterases and their use | |
CN114703169B (en) | L-threonine aldolase mutant R318L/H128N and application thereof | |
KR101400903B1 (en) | Novel gene encoding esterase derived from compost metagenome and preparation method thereof | |
JP2022117365A (en) | Genes encoding heat-stable antibacterial substances, vectors, transformants, heat-stable antibacterial substances, resistance genes, drug resistance markers and kits | |
Mizutani et al. | Elucidating the role of KojR in transcriptional regulation of carbon metabolism for kojic acid biosynthesis in Aspergillus oryzae | |
JP6218512B2 (en) | Ayu cold water fungus toxin | |
KR101646728B1 (en) | A method of synthesizing unnatural protein using degenercy reprogramming | |
JP4251446B2 (en) | Gene encoding aldehyde dehydrogenase | |
TW201343911A (en) | Escherichia coli expression system for producing mature human tyrosinase and producing method thereof | |
EP3615666A1 (en) | Process for obtaining omphalotin in a host cell comprising polynucleotides encoding for polypeptides involved in the omphatolin biosynthesis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180904 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20181029 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20190104 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6486440 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |