TWI328612B - Genes and their encoded polypeptides involved in the biosynthetic pathway of vitamin b12, vectors and host cells comprising the genes, and process for producing vitamin b12 - Google Patents
Genes and their encoded polypeptides involved in the biosynthetic pathway of vitamin b12, vectors and host cells comprising the genes, and process for producing vitamin b12 Download PDFInfo
- Publication number
- TWI328612B TWI328612B TW092120267A TW92120267A TWI328612B TW I328612 B TWI328612 B TW I328612B TW 092120267 A TW092120267 A TW 092120267A TW 92120267 A TW92120267 A TW 92120267A TW I328612 B TWI328612 B TW I328612B
- Authority
- TW
- Taiwan
- Prior art keywords
- ala
- gly
- leu
- val
- arg
- Prior art date
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims description 140
- 102000004196 processed proteins & peptides Human genes 0.000 title claims description 133
- 229920001184 polypeptide Polymers 0.000 title claims description 129
- 108090000623 proteins and genes Proteins 0.000 title claims description 115
- 239000013598 vector Substances 0.000 title claims description 101
- 238000000034 method Methods 0.000 title claims description 85
- RMRCNWBMXRMIRW-WYVZQNDMSA-L vitamin b12 Chemical compound N([C@@H]([C@@]1(C)[C@@](C)(CC(N)=O)[C@H](CCC(N)=O)\C(N1[Co+]C#N)=C(/C)\C1=N\C([C@H]([C@@]1(CC(N)=O)C)CCC(N)=O)=C\C1=N\C([C@H](C1(C)C)CCC(N)=O)=C/1C)[C@@H]2CC(N)=O)=C\1[C@]2(C)CCC(=O)NCC(C)OP([O-])(=O)O[C@H]1[C@@H](O)[C@@H](N2C3=CC(C)=C(C)C=C3N=C2)O[C@@H]1CO RMRCNWBMXRMIRW-WYVZQNDMSA-L 0.000 title claims description 11
- 230000006696 biosynthetic metabolic pathway Effects 0.000 title description 8
- 230000008569 process Effects 0.000 title description 4
- 108091033319 polynucleotide Proteins 0.000 claims description 85
- 102000040430 polynucleotide Human genes 0.000 claims description 85
- 239000002157 polynucleotide Substances 0.000 claims description 84
- 239000012634 fragment Substances 0.000 claims description 57
- FDJOLVPMNUYSCM-WZHZPDAFSA-L cobalt(3+);[(2r,3s,4r,5s)-5-(5,6-dimethylbenzimidazol-1-yl)-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl] [(2r)-1-[3-[(1r,2r,3r,4z,7s,9z,12s,13s,14z,17s,18s,19r)-2,13,18-tris(2-amino-2-oxoethyl)-7,12,17-tris(3-amino-3-oxopropyl)-3,5,8,8,13,15,18,19-octamethyl-2 Chemical compound [Co+3].N#[C-].N([C@@H]([C@]1(C)[N-]\C([C@H]([C@@]1(CC(N)=O)C)CCC(N)=O)=C(\C)/C1=N/C([C@H]([C@@]1(CC(N)=O)C)CCC(N)=O)=C\C1=N\C([C@H](C1(C)C)CCC(N)=O)=C/1C)[C@@H]2CC(N)=O)=C\1[C@]2(C)CCC(=O)NC[C@@H](C)OP([O-])(=O)O[C@H]1[C@@H](O)[C@@H](N2C3=CC(C)=C(C)C=C3N=C2)O[C@@H]1CO FDJOLVPMNUYSCM-WZHZPDAFSA-L 0.000 claims description 55
- 229930003779 Vitamin B12 Natural products 0.000 claims description 54
- 235000019163 vitamin B12 Nutrition 0.000 claims description 54
- 239000011715 vitamin B12 Substances 0.000 claims description 54
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 34
- 230000000694 effects Effects 0.000 claims description 33
- 102000004169 proteins and genes Human genes 0.000 claims description 31
- 125000003729 nucleotide group Chemical group 0.000 claims description 30
- 239000002777 nucleoside Substances 0.000 claims description 29
- 239000002773 nucleotide Substances 0.000 claims description 29
- 150000001413 amino acids Chemical class 0.000 claims description 18
- 239000002243 precursor Substances 0.000 claims description 17
- 150000007523 nucleic acids Chemical group 0.000 claims description 16
- 150000003833 nucleoside derivatives Chemical class 0.000 claims description 11
- 102000002226 Alkyl and Aryl Transferases Human genes 0.000 claims description 5
- 108010014722 Alkyl and Aryl Transferases Proteins 0.000 claims description 5
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims description 3
- 238000012258 culturing Methods 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 241000186360 Mycobacteriaceae Species 0.000 claims description 2
- 241000186428 Propionibacterium freudenreichii Species 0.000 claims description 2
- 210000004027 cell Anatomy 0.000 description 119
- 241000186429 Propionibacterium Species 0.000 description 73
- 108090000992 Transferases Proteins 0.000 description 55
- 210000002706 plastid Anatomy 0.000 description 55
- 102000004357 Transferases Human genes 0.000 description 54
- 108020004414 DNA Proteins 0.000 description 53
- 102000004190 Enzymes Human genes 0.000 description 52
- 108090000790 Enzymes Proteins 0.000 description 52
- 229940088598 enzyme Drugs 0.000 description 52
- 241000894006 Bacteria Species 0.000 description 37
- -1 methyl cyanocobalamin Chemical compound 0.000 description 36
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 34
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 34
- 241000588724 Escherichia coli Species 0.000 description 32
- 238000006243 chemical reaction Methods 0.000 description 32
- 229910019142 PO4 Inorganic materials 0.000 description 31
- 239000010452 phosphate Substances 0.000 description 31
- 102000003960 Ligases Human genes 0.000 description 29
- 108090000364 Ligases Proteins 0.000 description 29
- 239000000758 substrate Substances 0.000 description 28
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 27
- 235000018102 proteins Nutrition 0.000 description 27
- 239000000523 sample Substances 0.000 description 27
- 235000013601 eggs Nutrition 0.000 description 25
- XBDQKXXYIPTUBI-UHFFFAOYSA-N dimethylselenoniopropionate Natural products CCC(O)=O XBDQKXXYIPTUBI-UHFFFAOYSA-N 0.000 description 22
- 238000004519 manufacturing process Methods 0.000 description 22
- 238000003752 polymerase chain reaction Methods 0.000 description 22
- VZXTWGWHSMCWGA-UHFFFAOYSA-N 1,3,5-triazine-2,4-diamine Chemical compound NC1=NC=NC(N)=N1 VZXTWGWHSMCWGA-UHFFFAOYSA-N 0.000 description 21
- 235000001014 amino acid Nutrition 0.000 description 21
- 238000000855 fermentation Methods 0.000 description 21
- 230000004151 fermentation Effects 0.000 description 21
- 230000014509 gene expression Effects 0.000 description 21
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 20
- 241000282326 Felis catus Species 0.000 description 20
- 230000009466 transformation Effects 0.000 description 20
- 108091026890 Coding region Proteins 0.000 description 19
- 230000009261 transgenic effect Effects 0.000 description 19
- 239000002253 acid Substances 0.000 description 18
- 125000003275 alpha amino acid group Chemical group 0.000 description 18
- 125000003118 aryl group Chemical group 0.000 description 18
- 239000002609 medium Substances 0.000 description 18
- 238000004458 analytical method Methods 0.000 description 17
- RMRCNWBMXRMIRW-BYFNXCQMSA-M cyanocobalamin Chemical compound N#C[Co+]N([C@]1([H])[C@H](CC(N)=O)[C@]\2(CCC(=O)NC[C@H](C)OP(O)(=O)OC3[C@H]([C@H](O[C@@H]3CO)N3C4=CC(C)=C(C)C=C4N=C3)O)C)C/2=C(C)\C([C@H](C/2(C)C)CCC(N)=O)=N\C\2=C\C([C@H]([C@@]/2(CC(N)=O)C)CCC(N)=O)=N\C\2=C(C)/C2=N[C@]1(C)[C@@](C)(CC(N)=O)[C@@H]2CCC(N)=O RMRCNWBMXRMIRW-BYFNXCQMSA-M 0.000 description 17
- 108010050848 glycylleucine Proteins 0.000 description 17
- 239000000047 product Substances 0.000 description 16
- 229940088594 vitamin Drugs 0.000 description 16
- 229930003231 vitamin Natural products 0.000 description 16
- 235000013343 vitamin Nutrition 0.000 description 16
- 239000011782 vitamin Substances 0.000 description 16
- 241000196324 Embryophyta Species 0.000 description 15
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical class [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 15
- 150000001875 compounds Chemical class 0.000 description 15
- 230000002538 fungal effect Effects 0.000 description 15
- 239000007788 liquid Substances 0.000 description 15
- 241000894007 species Species 0.000 description 15
- 230000001580 bacterial effect Effects 0.000 description 14
- 229910017052 cobalt Inorganic materials 0.000 description 14
- 239000010941 cobalt Substances 0.000 description 14
- 230000000295 complement effect Effects 0.000 description 14
- 239000013604 expression vector Substances 0.000 description 14
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 13
- 241000233866 Fungi Species 0.000 description 13
- 241000193830 Bacillus <bacterium> Species 0.000 description 12
- 108010076504 Protein Sorting Signals Proteins 0.000 description 12
- 108010047495 alanylglycine Proteins 0.000 description 12
- 244000005700 microbiome Species 0.000 description 12
- 102000039446 nucleic acids Human genes 0.000 description 12
- 108020004707 nucleic acids Proteins 0.000 description 12
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 11
- 230000007062 hydrolysis Effects 0.000 description 11
- 238000006460 hydrolysis reaction Methods 0.000 description 11
- 235000019260 propionic acid Nutrition 0.000 description 11
- IUVKMZGDUIUOCP-BTNSXGMBSA-N quinbolone Chemical compound O([C@H]1CC[C@H]2[C@H]3[C@@H]([C@]4(C=CC(=O)C=C4CC3)C)CC[C@@]21C)C1=CCCC1 IUVKMZGDUIUOCP-BTNSXGMBSA-N 0.000 description 11
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 10
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 10
- 230000015572 biosynthetic process Effects 0.000 description 10
- 229960003276 erythromycin Drugs 0.000 description 10
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 10
- 101150083586 hemL gene Proteins 0.000 description 10
- 150000003722 vitamin derivatives Chemical class 0.000 description 10
- 108020004465 16S ribosomal RNA Proteins 0.000 description 9
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 9
- 244000269722 Thea sinensis Species 0.000 description 9
- 238000007792 addition Methods 0.000 description 9
- 239000002585 base Substances 0.000 description 9
- 239000002299 complementary DNA Substances 0.000 description 9
- 235000000639 cyanocobalamin Nutrition 0.000 description 9
- 239000011666 cyanocobalamin Substances 0.000 description 9
- 229960002104 cyanocobalamin Drugs 0.000 description 9
- 238000006467 substitution reaction Methods 0.000 description 9
- 101150035484 cobT gene Proteins 0.000 description 8
- 101150025266 cobU gene Proteins 0.000 description 8
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 8
- 230000010076 replication Effects 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 125000001424 substituent group Chemical group 0.000 description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 7
- 101100015910 Alkalihalobacillus halodurans (strain ATCC BAA-125 / DSM 18197 / FERM 7344 / JCM 9153 / C-125) hemL2 gene Proteins 0.000 description 7
- 241000228245 Aspergillus niger Species 0.000 description 7
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 7
- 150000001412 amines Chemical class 0.000 description 7
- 101150055766 cat gene Proteins 0.000 description 7
- 210000000349 chromosome Anatomy 0.000 description 7
- 125000004122 cyclic group Chemical group 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 101150036807 hemL1 gene Proteins 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 239000003550 marker Substances 0.000 description 7
- 229910052751 metal Inorganic materials 0.000 description 7
- 239000002184 metal Substances 0.000 description 7
- 108010029020 prolylglycine Proteins 0.000 description 7
- 239000013605 shuttle vector Substances 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 238000011144 upstream manufacturing Methods 0.000 description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 7
- 229920001817 Agar Polymers 0.000 description 6
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 6
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 6
- 241000351920 Aspergillus nidulans Species 0.000 description 6
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 6
- 108020004635 Complementary DNA Proteins 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 241000700605 Viruses Species 0.000 description 6
- 229960005305 adenosine Drugs 0.000 description 6
- 239000008272 agar Substances 0.000 description 6
- 150000001408 amides Chemical class 0.000 description 6
- 108010047857 aspartylglycine Proteins 0.000 description 6
- 238000010804 cDNA synthesis Methods 0.000 description 6
- 229910052799 carbon Inorganic materials 0.000 description 6
- 239000013611 chromosomal DNA Substances 0.000 description 6
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 229910052757 nitrogen Inorganic materials 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 108010061238 threonyl-glycine Proteins 0.000 description 6
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 5
- IHWDSEPNZDYMNF-UHFFFAOYSA-N 1H-indol-2-amine Chemical compound C1=CC=C2NC(N)=CC2=C1 IHWDSEPNZDYMNF-UHFFFAOYSA-N 0.000 description 5
- 125000002124 5'-adenosyl group Chemical group N1=CN=C2N(C=NC2=C1N)[C@H]1[C@H](O)[C@H](O)[C@H](O1)C* 0.000 description 5
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 5
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 5
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 5
- 241000880493 Leptailurus serval Species 0.000 description 5
- 238000012300 Sequence Analysis Methods 0.000 description 5
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 5
- NVJHHSJKESILSZ-UHFFFAOYSA-N [Co].N1C(C=C2N=C(C=C3NC(=C4)C=C3)C=C2)=CC=C1C=C1C=CC4=N1 Chemical compound [Co].N1C(C=C2N=C(C=C3NC(=C4)C=C3)C=C2)=CC=C1C=C1C=CC4=N1 NVJHHSJKESILSZ-UHFFFAOYSA-N 0.000 description 5
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 5
- 108010070944 alanylhistidine Proteins 0.000 description 5
- 229960000723 ampicillin Drugs 0.000 description 5
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 5
- 108010060035 arginylproline Proteins 0.000 description 5
- 238000006254 arylation reaction Methods 0.000 description 5
- 108010093581 aspartyl-proline Proteins 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 5
- 101150089563 cbiA gene Proteins 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 108010085325 histidylproline Proteins 0.000 description 5
- 125000003835 nucleoside group Chemical group 0.000 description 5
- 108091008146 restriction endonucleases Proteins 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 229910001868 water Inorganic materials 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 4
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 4
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 4
- NOGFDULFCFXBHB-CIUDSAMLSA-N Ala-Leu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NOGFDULFCFXBHB-CIUDSAMLSA-N 0.000 description 4
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 4
- 241000228212 Aspergillus Species 0.000 description 4
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 4
- 108010042653 IgA receptor Proteins 0.000 description 4
- 241000235649 Kluyveromyces Species 0.000 description 4
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 4
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 4
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 4
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 4
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 4
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 4
- VUYCNYVLKACHPA-KKUMJFAQSA-N Phe-Asp-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VUYCNYVLKACHPA-KKUMJFAQSA-N 0.000 description 4
- 108091000080 Phosphotransferase Proteins 0.000 description 4
- 241000235648 Pichia Species 0.000 description 4
- 241000090219 Planococcus faecalis Species 0.000 description 4
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 4
- 102100034014 Prolyl 3-hydroxylase 3 Human genes 0.000 description 4
- KAESVJOAVNADME-UHFFFAOYSA-N Pyrrole Chemical compound C=1C=CNC=1 KAESVJOAVNADME-UHFFFAOYSA-N 0.000 description 4
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 4
- CXBFHZLODKPIJY-AAEUAGOBSA-N Ser-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N CXBFHZLODKPIJY-AAEUAGOBSA-N 0.000 description 4
- 229930006000 Sucrose Natural products 0.000 description 4
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 4
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 4
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 4
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 4
- 229930003270 Vitamin B Natural products 0.000 description 4
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 4
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 4
- 125000004429 atom Chemical group 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 101150087945 cobA gene Proteins 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 4
- 108010016616 cysteinylglycine Proteins 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- 239000008103 glucose Substances 0.000 description 4
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 4
- 108010084389 glycyltryptophan Proteins 0.000 description 4
- 108010025306 histidylleucine Proteins 0.000 description 4
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 4
- 210000004962 mammalian cell Anatomy 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 238000006366 phosphorylation reaction Methods 0.000 description 4
- 102000020233 phosphotransferase Human genes 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 239000005720 sucrose Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000001890 transfection Methods 0.000 description 4
- 239000001226 triphosphate Substances 0.000 description 4
- 235000011178 triphosphate Nutrition 0.000 description 4
- 230000003612 virological effect Effects 0.000 description 4
- 235000019156 vitamin B Nutrition 0.000 description 4
- 239000011720 vitamin B Substances 0.000 description 4
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 3
- WFDIJRYMOXRFFG-UHFFFAOYSA-N Acetic anhydride Chemical compound CC(=O)OC(C)=O WFDIJRYMOXRFFG-UHFFFAOYSA-N 0.000 description 3
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 3
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 3
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 3
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 3
- YFWTXMRJJDNTLM-LSJOCFKGSA-N Arg-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFWTXMRJJDNTLM-LSJOCFKGSA-N 0.000 description 3
- JGDGLDNAQJJGJI-AVGNSLFASA-N Arg-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N JGDGLDNAQJJGJI-AVGNSLFASA-N 0.000 description 3
- XEPSCVXTCUUHDT-AVGNSLFASA-N Arg-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N XEPSCVXTCUUHDT-AVGNSLFASA-N 0.000 description 3
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 3
- 240000006439 Aspergillus oryzae Species 0.000 description 3
- 241000701489 Cauliflower mosaic virus Species 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- MHZGKXUYDGKKIU-UHFFFAOYSA-N Decylamine Chemical compound CCCCCCCCCCN MHZGKXUYDGKKIU-UHFFFAOYSA-N 0.000 description 3
- 101150108358 GLAA gene Proteins 0.000 description 3
- 241000447437 Gerreidae Species 0.000 description 3
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 3
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 3
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- 241001138401 Kluyveromyces lactis Species 0.000 description 3
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 3
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 3
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 3
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 3
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 3
- 101800004937 Protein C Proteins 0.000 description 3
- 241000589516 Pseudomonas Species 0.000 description 3
- 241000714474 Rous sarcoma virus Species 0.000 description 3
- 101800001700 Saposin-D Proteins 0.000 description 3
- 102400000827 Saposin-D Human genes 0.000 description 3
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 3
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 3
- 229920002472 Starch Polymers 0.000 description 3
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 3
- 241000223259 Trichoderma Species 0.000 description 3
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 3
- OFNPHOGOJLNVLL-KCTSRDHCSA-N Trp-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N OFNPHOGOJLNVLL-KCTSRDHCSA-N 0.000 description 3
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 3
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 3
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 108010087924 alanylproline Proteins 0.000 description 3
- 238000005576 amination reaction Methods 0.000 description 3
- 108010038633 aspartylglutamate Proteins 0.000 description 3
- 125000003785 benzimidazolyl group Chemical group N1=C(NC2=C1C=CC=C2)* 0.000 description 3
- 230000008827 biological function Effects 0.000 description 3
- 229940041514 candida albicans extract Drugs 0.000 description 3
- 125000003917 carbamoyl group Chemical group [H]N([H])C(*)=O 0.000 description 3
- 239000007795 chemical reaction product Substances 0.000 description 3
- 229960005091 chloramphenicol Drugs 0.000 description 3
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 150000004985 diamines Chemical class 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 210000004907 gland Anatomy 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 230000013595 glycosylation Effects 0.000 description 3
- 238000006206 glycosylation reaction Methods 0.000 description 3
- 108010015792 glycyllysine Proteins 0.000 description 3
- 108010037850 glycylvaline Proteins 0.000 description 3
- 238000010438 heat treatment Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- LFGREXWGYUGZLY-UHFFFAOYSA-N phosphoryl Chemical group [P]=O LFGREXWGYUGZLY-UHFFFAOYSA-N 0.000 description 3
- 230000026731 phosphorylation Effects 0.000 description 3
- 150000004032 porphyrins Chemical class 0.000 description 3
- 108010004914 prolylarginine Proteins 0.000 description 3
- 235000021251 pulses Nutrition 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 238000010188 recombinant method Methods 0.000 description 3
- 108010026333 seryl-proline Proteins 0.000 description 3
- 238000002741 site-directed mutagenesis Methods 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 239000001509 sodium citrate Substances 0.000 description 3
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 3
- 239000008107 starch Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 229910052723 transition metal Inorganic materials 0.000 description 3
- 150000003624 transition metals Chemical class 0.000 description 3
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 3
- 108010080629 tryptophan-leucine Proteins 0.000 description 3
- 108010084932 tryptophyl-proline Proteins 0.000 description 3
- 241000701161 unidentified adenovirus Species 0.000 description 3
- 239000013603 viral vector Substances 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- 239000012138 yeast extract Substances 0.000 description 3
- HYZJCKYKOHLVJF-UHFFFAOYSA-N 1H-benzimidazole Chemical compound C1=CC=C2NC=NC2=C1 HYZJCKYKOHLVJF-UHFFFAOYSA-N 0.000 description 2
- CYDQOEWLBCCFJZ-UHFFFAOYSA-N 4-(4-fluorophenyl)oxane-4-carboxylic acid Chemical compound C=1C=C(F)C=CC=1C1(C(=O)O)CCOCC1 CYDQOEWLBCCFJZ-UHFFFAOYSA-N 0.000 description 2
- DLFVBJFMPXGRIB-UHFFFAOYSA-N Acetamide Chemical compound CC(N)=O DLFVBJFMPXGRIB-UHFFFAOYSA-N 0.000 description 2
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 2
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 2
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 2
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 2
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 2
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 2
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 2
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 2
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 2
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 2
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 2
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 2
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 2
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 2
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 2
- OAIGZYFGCNNVIE-ZPFDUUQYSA-N Ala-Val-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O OAIGZYFGCNNVIE-ZPFDUUQYSA-N 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- 239000004382 Amylase Substances 0.000 description 2
- 108010065511 Amylases Proteins 0.000 description 2
- 102000013142 Amylases Human genes 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 2
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 2
- OLDOLPWZEMHNIA-PJODQICGSA-N Arg-Ala-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OLDOLPWZEMHNIA-PJODQICGSA-N 0.000 description 2
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 2
- GHNDBBVSWOWYII-LPEHRKFASA-N Arg-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GHNDBBVSWOWYII-LPEHRKFASA-N 0.000 description 2
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 2
- NYZGVTGOMPHSJW-CIUDSAMLSA-N Arg-Glu-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N NYZGVTGOMPHSJW-CIUDSAMLSA-N 0.000 description 2
- XUUXCWCKKCZEAW-YFKPBYRVSA-N Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 description 2
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 2
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 2
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 2
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 2
- AUZAXCPWMDBWEE-HJGDQZAQSA-N Arg-Thr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O AUZAXCPWMDBWEE-HJGDQZAQSA-N 0.000 description 2
- QNYWYYNQSXANBL-WDSOQIARSA-N Arg-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N QNYWYYNQSXANBL-WDSOQIARSA-N 0.000 description 2
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 2
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 2
- NKTLGLBAGUJEGA-BIIVOSGPSA-N Asn-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N)C(=O)O NKTLGLBAGUJEGA-BIIVOSGPSA-N 0.000 description 2
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 2
- YRTOMUMWSTUQAX-FXQIFTODSA-N Asn-Pro-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O YRTOMUMWSTUQAX-FXQIFTODSA-N 0.000 description 2
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 2
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 2
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 2
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 2
- LKIYSIYBKYLKPU-BIIVOSGPSA-N Asp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O LKIYSIYBKYLKPU-BIIVOSGPSA-N 0.000 description 2
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 2
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 2
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 2
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 2
- NRIFEOUAFLTMFJ-AAEUAGOBSA-N Asp-Gly-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NRIFEOUAFLTMFJ-AAEUAGOBSA-N 0.000 description 2
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 2
- HICVMZCGVFKTPM-BQBZGAKWSA-N Asp-Pro-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HICVMZCGVFKTPM-BQBZGAKWSA-N 0.000 description 2
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 2
- 241001513093 Aspergillus awamori Species 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- 102100026189 Beta-galactosidase Human genes 0.000 description 2
- 101000583086 Bunodosoma granuliferum Delta-actitoxin-Bgr2b Proteins 0.000 description 2
- 102000003858 Chymases Human genes 0.000 description 2
- 108090000227 Chymases Proteins 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 241000186427 Cutibacterium acnes Species 0.000 description 2
- AMRLSQGGERHDHJ-FXQIFTODSA-N Cys-Ala-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMRLSQGGERHDHJ-FXQIFTODSA-N 0.000 description 2
- 101100271445 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) atp9 gene Proteins 0.000 description 2
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 description 2
- 241000192125 Firmicutes Species 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 2
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 2
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- LLEUXCDZPQOJMY-AAEUAGOBSA-N Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 LLEUXCDZPQOJMY-AAEUAGOBSA-N 0.000 description 2
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 2
- 102000053187 Glucuronidase Human genes 0.000 description 2
- 108010060309 Glucuronidase Proteins 0.000 description 2
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 2
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 2
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 2
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 2
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 2
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 2
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 2
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 2
- FSPVILZGHUJOHS-QWRGUYRKSA-N Gly-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 FSPVILZGHUJOHS-QWRGUYRKSA-N 0.000 description 2
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 2
- YSDLIYZLOTZZNP-UWVGGRQHSA-N Gly-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN YSDLIYZLOTZZNP-UWVGGRQHSA-N 0.000 description 2
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 2
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 2
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 2
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 2
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 2
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 2
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 2
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 2
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 2
- AJHCSUXXECOXOY-NSHDSACASA-N Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-NSHDSACASA-N 0.000 description 2
- KBBFOULZCHWGJX-KBPBESRZSA-N Gly-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN)O KBBFOULZCHWGJX-KBPBESRZSA-N 0.000 description 2
- DUAWRXXTOQOECJ-JSGCOSHPSA-N Gly-Tyr-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O DUAWRXXTOQOECJ-JSGCOSHPSA-N 0.000 description 2
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 2
- ZRALSGWEFCBTJO-UHFFFAOYSA-N Guanidine Chemical compound NC(N)=N ZRALSGWEFCBTJO-UHFFFAOYSA-N 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- AFPFGFUGETYOSY-HGNGGELXSA-N His-Ala-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AFPFGFUGETYOSY-HGNGGELXSA-N 0.000 description 2
- NIKBMHGRNAPJFW-IUCAKERBSA-N His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 NIKBMHGRNAPJFW-IUCAKERBSA-N 0.000 description 2
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 2
- NTXIJPDAHXSHNL-ONGXEEELSA-N His-Gly-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NTXIJPDAHXSHNL-ONGXEEELSA-N 0.000 description 2
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 2
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 2
- UMBKDWGQESDCTO-KKUMJFAQSA-N His-Lys-Lys Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O UMBKDWGQESDCTO-KKUMJFAQSA-N 0.000 description 2
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 2
- ABCCKUZDWMERKT-AVGNSLFASA-N His-Pro-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O ABCCKUZDWMERKT-AVGNSLFASA-N 0.000 description 2
- UIRUVUUGUYCMBY-KCTSRDHCSA-N His-Trp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC3=CN=CN3)N UIRUVUUGUYCMBY-KCTSRDHCSA-N 0.000 description 2
- VLDVBZICYBVQHB-IUCAKERBSA-N His-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 VLDVBZICYBVQHB-IUCAKERBSA-N 0.000 description 2
- 206010021143 Hypoxia Diseases 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- KVRKAGGMEWNURO-CIUDSAMLSA-N Leu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N KVRKAGGMEWNURO-CIUDSAMLSA-N 0.000 description 2
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 2
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 2
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 2
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 2
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 2
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 2
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 2
- OYQUOLRTJHWVSQ-SRVKXCTJSA-N Leu-His-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O OYQUOLRTJHWVSQ-SRVKXCTJSA-N 0.000 description 2
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 2
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 2
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 2
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 2
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 2
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 2
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 2
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 2
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 2
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 2
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 2
- UASDAHIAHBRZQV-YUMQZZPRSA-N Met-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N UASDAHIAHBRZQV-YUMQZZPRSA-N 0.000 description 2
- ZMYHJISLFYTQGK-FXQIFTODSA-N Met-Asp-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMYHJISLFYTQGK-FXQIFTODSA-N 0.000 description 2
- FJVJLMZUIGMFFU-BQBZGAKWSA-N Met-Asp-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FJVJLMZUIGMFFU-BQBZGAKWSA-N 0.000 description 2
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 2
- IILAGWCGKJSBGB-IHRRRGAJSA-N Met-Phe-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IILAGWCGKJSBGB-IHRRRGAJSA-N 0.000 description 2
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 2
- IIHMNTBFPMRJCN-RCWTZXSCSA-N Met-Val-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IIHMNTBFPMRJCN-RCWTZXSCSA-N 0.000 description 2
- 102000016943 Muramidase Human genes 0.000 description 2
- 108010014251 Muramidase Proteins 0.000 description 2
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 2
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- 229930193140 Neomycin Natural products 0.000 description 2
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 2
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 2
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 2
- FCCBQBZXIAZNIG-LSJOCFKGSA-N Pro-Ala-His Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O FCCBQBZXIAZNIG-LSJOCFKGSA-N 0.000 description 2
- CQZNGNCAIXMAIQ-UBHSHLNASA-N Pro-Ala-Phe Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O CQZNGNCAIXMAIQ-UBHSHLNASA-N 0.000 description 2
- ONPFOYPPPOHMNH-UVBJJODRSA-N Pro-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@@H]3CCCN3 ONPFOYPPPOHMNH-UVBJJODRSA-N 0.000 description 2
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 2
- GLEOIKLQBZNKJZ-WDSKDSINSA-N Pro-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GLEOIKLQBZNKJZ-WDSKDSINSA-N 0.000 description 2
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 2
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 2
- ZTVCLZLGHZXLOT-ULQDDVLXSA-N Pro-Glu-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O ZTVCLZLGHZXLOT-ULQDDVLXSA-N 0.000 description 2
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 2
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 2
- VWXGFAIZUQBBBG-UWVGGRQHSA-N Pro-His-Gly Chemical compound C([C@@H](C(=O)NCC(=O)[O-])NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 VWXGFAIZUQBBBG-UWVGGRQHSA-N 0.000 description 2
- ZKQOUHVVXABNDG-IUCAKERBSA-N Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 ZKQOUHVVXABNDG-IUCAKERBSA-N 0.000 description 2
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 2
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 2
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 2
- AJNGQVUFQUVRQT-JYJNAYRXSA-N Pro-Pro-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 AJNGQVUFQUVRQT-JYJNAYRXSA-N 0.000 description 2
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 2
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 2
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 2
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 2
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 2
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 2
- 206010036790 Productive cough Diseases 0.000 description 2
- 241001430313 Propionibacteriaceae Species 0.000 description 2
- 102000013009 Pyruvate Kinase Human genes 0.000 description 2
- 108020005115 Pyruvate Kinase Proteins 0.000 description 2
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 2
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 2
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 2
- VBKBDLMWICBSCY-IMJSIDKUSA-N Ser-Asp Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O VBKBDLMWICBSCY-IMJSIDKUSA-N 0.000 description 2
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 2
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 2
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 2
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 2
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 2
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 2
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 2
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 2
- AXKJPUBALUNJEO-UBHSHLNASA-N Ser-Trp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O AXKJPUBALUNJEO-UBHSHLNASA-N 0.000 description 2
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 2
- 241001085826 Sporotrichum Species 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 2
- 241001495429 Thielavia terrestris Species 0.000 description 2
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 2
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 2
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 2
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 2
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 2
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 2
- XSTGOZBBXFKGHA-YJRXYDGGSA-N Thr-His-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O XSTGOZBBXFKGHA-YJRXYDGGSA-N 0.000 description 2
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 2
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 2
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 2
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 2
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 2
- 241000499912 Trichoderma reesei Species 0.000 description 2
- HOJPPPKZWFRTHJ-PJODQICGSA-N Trp-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N HOJPPPKZWFRTHJ-PJODQICGSA-N 0.000 description 2
- WACMTVIJWRNVSO-CWRNSKLLSA-N Trp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O WACMTVIJWRNVSO-CWRNSKLLSA-N 0.000 description 2
- CCZXBOFIBYQLEV-IHPCNDPISA-N Trp-Leu-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O CCZXBOFIBYQLEV-IHPCNDPISA-N 0.000 description 2
- UKWSFUSPGPBJGU-VFAJRCTISA-N Trp-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O UKWSFUSPGPBJGU-VFAJRCTISA-N 0.000 description 2
- KEANSLVUGJADPN-LKTVYLICSA-N Tyr-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N KEANSLVUGJADPN-LKTVYLICSA-N 0.000 description 2
- AVIQBBOOTZENLH-KKUMJFAQSA-N Tyr-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N AVIQBBOOTZENLH-KKUMJFAQSA-N 0.000 description 2
- XJPXTYLVMUZGNW-IHRRRGAJSA-N Tyr-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O XJPXTYLVMUZGNW-IHRRRGAJSA-N 0.000 description 2
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 2
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 2
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 2
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 2
- KXUKIBHIVRYOIP-ZKWXMUAHSA-N Val-Asp-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KXUKIBHIVRYOIP-ZKWXMUAHSA-N 0.000 description 2
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 2
- MHAHQDBEIDPFQS-NHCYSSNCSA-N Val-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C MHAHQDBEIDPFQS-NHCYSSNCSA-N 0.000 description 2
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 2
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 2
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 2
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 2
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 2
- MLADEWAIYAPAAU-IHRRRGAJSA-N Val-Lys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MLADEWAIYAPAAU-IHRRRGAJSA-N 0.000 description 2
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 2
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 2
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 2
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 2
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 2
- 108010059993 Vancomycin Proteins 0.000 description 2
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 2
- DZBUGLKDJFMEHC-UHFFFAOYSA-N acridine Chemical group C1=CC=CC2=CC3=CC=CC=C3N=C21 DZBUGLKDJFMEHC-UHFFFAOYSA-N 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 108010078114 alanyl-tryptophyl-alanine Proteins 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 108090000637 alpha-Amylases Proteins 0.000 description 2
- HLRUKOJSWOKCPP-SYQHCUMBSA-N alpha-ribazole Chemical compound C1=2C=C(C)C(C)=CC=2N=CN1[C@H]1O[C@H](CO)[C@@H](O)[C@H]1O HLRUKOJSWOKCPP-SYQHCUMBSA-N 0.000 description 2
- 101150069003 amdS gene Proteins 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 125000003277 amino group Chemical group 0.000 description 2
- 235000019418 amylase Nutrition 0.000 description 2
- 230000003698 anagen phase Effects 0.000 description 2
- 108010080488 arginyl-arginyl-leucine Proteins 0.000 description 2
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 2
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 108010005774 beta-Galactosidase Proteins 0.000 description 2
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 230000001851 biosynthetic effect Effects 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 150000001721 carbon Chemical group 0.000 description 2
- 238000006555 catalytic reaction Methods 0.000 description 2
- 230000006037 cell lysis Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000001913 cellulose Substances 0.000 description 2
- 229920002678 cellulose Polymers 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 239000012531 culture fluid Substances 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 125000002235 cyanocobalamin group Chemical group 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 239000008367 deionised water Substances 0.000 description 2
- 229910021641 deionized water Inorganic materials 0.000 description 2
- 238000000502 dialysis Methods 0.000 description 2
- 239000001177 diphosphate Substances 0.000 description 2
- 235000011180 diphosphates Nutrition 0.000 description 2
- 238000004090 dissolution Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000009585 enzyme analysis Methods 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 229930195712 glutamate Natural products 0.000 description 2
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 2
- KZNQNBZMBZJQJO-YFKPBYRVSA-N glyclproline Chemical compound NCC(=O)N1CCC[C@H]1C(O)=O KZNQNBZMBZJQJO-YFKPBYRVSA-N 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 2
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 2
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 125000005842 heteroatom Chemical group 0.000 description 2
- 230000000423 heterosexual effect Effects 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 2
- 108010028295 histidylhistidine Proteins 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- YOZNUFWCRFCGIH-BYFNXCQMSA-L hydroxocobalamin Chemical compound O[Co+]N([C@]1([H])[C@H](CC(N)=O)[C@]\2(CCC(=O)NC[C@H](C)OP(O)(=O)OC3[C@H]([C@H](O[C@@H]3CO)N3C4=CC(C)=C(C)C=C4N=C3)O)C)C/2=C(C)\C([C@H](C/2(C)C)CCC(N)=O)=N\C\2=C\C([C@H]([C@@]/2(CC(N)=O)C)CCC(N)=O)=N\C\2=C(C)/C2=N[C@]1(C)[C@@](C)(CC(N)=O)[C@@H]2CCC(N)=O YOZNUFWCRFCGIH-BYFNXCQMSA-L 0.000 description 2
- 230000007954 hypoxia Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 229960000274 lysozyme Drugs 0.000 description 2
- 239000004325 lysozyme Substances 0.000 description 2
- 235000010335 lysozyme Nutrition 0.000 description 2
- 229910000357 manganese(II) sulfate Inorganic materials 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 2
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 229960004927 neomycin Drugs 0.000 description 2
- 125000004433 nitrogen atom Chemical group N* 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 238000006146 oximation reaction Methods 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 2
- 230000003389 potentiating effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 125000000168 pyrrolyl group Chemical group 0.000 description 2
- 230000002285 radioactive effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 239000001540 sodium lactate Substances 0.000 description 2
- 229940005581 sodium lactate Drugs 0.000 description 2
- 235000011088 sodium lactate Nutrition 0.000 description 2
- 210000003802 sputum Anatomy 0.000 description 2
- 208000024794 sputum Diseases 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 125000003396 thiol group Chemical group [H]S* 0.000 description 2
- 238000006177 thiolation reaction Methods 0.000 description 2
- 239000011573 trace mineral Substances 0.000 description 2
- 235000013619 trace mineral Nutrition 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- MYPYJXKWCTUITO-LYRMYLQWSA-N vancomycin Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1=C2C=C3C=C1OC1=CC=C(C=C1Cl)[C@@H](O)[C@H](C(N[C@@H](CC(N)=O)C(=O)N[C@H]3C(=O)N[C@H]1C(=O)N[C@H](C(N[C@@H](C3=CC(O)=CC(O)=C3C=3C(O)=CC=C1C=3)C(O)=O)=O)[C@H](O)C1=CC=C(C(=C1)Cl)O2)=O)NC(=O)[C@@H](CC(C)C)NC)[C@H]1C[C@](C)(N)[C@H](O)[C@H](C)O1 MYPYJXKWCTUITO-LYRMYLQWSA-N 0.000 description 2
- 229960003165 vancomycin Drugs 0.000 description 2
- MYPYJXKWCTUITO-UHFFFAOYSA-N vancomycin Natural products O1C(C(=C2)Cl)=CC=C2C(O)C(C(NC(C2=CC(O)=CC(O)=C2C=2C(O)=CC=C3C=2)C(O)=O)=O)NC(=O)C3NC(=O)C2NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(CC(C)C)NC)C(O)C(C=C3Cl)=CC=C3OC3=CC2=CC1=C3OC1OC(CO)C(O)C(O)C1OC1CC(C)(N)C(O)C(C)O1 MYPYJXKWCTUITO-UHFFFAOYSA-N 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- OAJLVMGLJZXSGX-NDSREFPTSA-L (2r,3s,4s,5r)-2-(6-aminopurin-9-yl)-5-methanidyloxolane-3,4-diol;cobalt(3+);[(2r,3s,4r,5s)-5-(5,6-dimethylbenzimidazol-1-yl)-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl] [(2r)-1-[3-[(2r,3r,4z,7s,9z,12s,13s,14z,17s,18s,19r)-2,13,18-tris(2-amino-2-oxoethyl)-7,12 Chemical compound [Co+3].O[C@H]1[C@H](O)[C@@H]([CH2-])O[C@H]1N1C2=NC=NC(N)=C2N=C1.C1([C@H](CC(N)=O)[C@@]2(C)CCC(=O)NC[C@@H](C)OP([O-])(=O)O[C@H]3[C@H]([C@H](O[C@@H]3CO)N3C4=CC(C)=C(C)C=C4N=C3)O)[N-]\C2=C(C)/C([C@H](C\2(C)C)CCC(N)=O)=N/C/2=C\C([C@H]([C@@]/2(CC(N)=O)C)CCC(N)=O)=N\C\2=C(C)/C2=N[C@]1(C)[C@@](C)(CC(N)=O)[C@@H]2CCC(N)=O OAJLVMGLJZXSGX-NDSREFPTSA-L 0.000 description 1
- FYGDTMLNYKFZSV-URKRLVJHSA-N (2s,3r,4s,5s,6r)-2-[(2r,4r,5r,6s)-4,5-dihydroxy-2-(hydroxymethyl)-6-[(2r,4r,5r,6s)-4,5,6-trihydroxy-2-(hydroxymethyl)oxan-3-yl]oxyoxan-3-yl]oxy-6-(hydroxymethyl)oxane-3,4,5-triol Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1[C@@H](CO)O[C@@H](OC2[C@H](O[C@H](O)[C@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O FYGDTMLNYKFZSV-URKRLVJHSA-N 0.000 description 1
- MPUUQNGXJSEWTF-BYPYZUCNSA-N (S)-4-amino-5-oxopentanoic acid Chemical compound O=C[C@@H]([NH3+])CCC([O-])=O MPUUQNGXJSEWTF-BYPYZUCNSA-N 0.000 description 1
- PPCWDOKVYNKIHV-UHFFFAOYSA-N 2,4-dimethoxy-1h-benzimidazole Chemical compound C1=CC(OC)=C2NC(OC)=NC2=C1 PPCWDOKVYNKIHV-UHFFFAOYSA-N 0.000 description 1
- PAWQVTBBRAZDMG-UHFFFAOYSA-N 2-(3-bromo-2-fluorophenyl)acetic acid Chemical compound OC(=O)CC1=CC=CC(Br)=C1F PAWQVTBBRAZDMG-UHFFFAOYSA-N 0.000 description 1
- OSJPPGNTCRNQQC-UWTATZPHSA-N 3-phospho-D-glyceric acid Chemical compound OC(=O)[C@H](O)COP(O)(O)=O OSJPPGNTCRNQQC-UWTATZPHSA-N 0.000 description 1
- HJXJVORILFDIOT-UHFFFAOYSA-N 4,6-dioxo-1H-1,3,5-triazine-2-carboxamide Chemical compound NC(=O)C1=NC(=O)NC(=O)N1 HJXJVORILFDIOT-UHFFFAOYSA-N 0.000 description 1
- XGYIMTFOTBMPFP-KQYNXXCUSA-N 5'-deoxyadenosine Chemical compound O[C@@H]1[C@H](O)[C@@H](C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 XGYIMTFOTBMPFP-KQYNXXCUSA-N 0.000 description 1
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 1
- 108010011619 6-Phytase Proteins 0.000 description 1
- 240000000073 Achillea millefolium Species 0.000 description 1
- 235000007754 Achillea millefolium Nutrition 0.000 description 1
- 241000186426 Acidipropionibacterium acidipropionici Species 0.000 description 1
- 102100022900 Actin, cytoplasmic 1 Human genes 0.000 description 1
- 241001156739 Actinobacteria <phylum> Species 0.000 description 1
- 241000203809 Actinomycetales Species 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- VBDMWOKJZDCFJM-FXQIFTODSA-N Ala-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N VBDMWOKJZDCFJM-FXQIFTODSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- IMMKUCQIKKXKNP-DCAQKATOSA-N Ala-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCN=C(N)N IMMKUCQIKKXKNP-DCAQKATOSA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 1
- PJNSIUPOXFBHDM-GUBZILKMSA-N Ala-Arg-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O PJNSIUPOXFBHDM-GUBZILKMSA-N 0.000 description 1
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 1
- FOWHQTWRLFTELJ-FXQIFTODSA-N Ala-Asp-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N FOWHQTWRLFTELJ-FXQIFTODSA-N 0.000 description 1
- CXZFXHGJJPVUJE-CIUDSAMLSA-N Ala-Cys-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O)N CXZFXHGJJPVUJE-CIUDSAMLSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 1
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 1
- BFMIRJBURUXDRG-DLOVCJGASA-N Ala-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 BFMIRJBURUXDRG-DLOVCJGASA-N 0.000 description 1
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- GMGWOTQMUKYZIE-UBHSHLNASA-N Ala-Pro-Phe Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 GMGWOTQMUKYZIE-UBHSHLNASA-N 0.000 description 1
- IPWKGIFRRBGCJO-IMJSIDKUSA-N Ala-Ser Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O IPWKGIFRRBGCJO-IMJSIDKUSA-N 0.000 description 1
- UCDOXFBTMLKASE-HERUPUMHSA-N Ala-Ser-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N UCDOXFBTMLKASE-HERUPUMHSA-N 0.000 description 1
- SYIFFFHSXBNPMC-UWJYBYFXSA-N Ala-Ser-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N SYIFFFHSXBNPMC-UWJYBYFXSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- AENHOIXXHKNIQL-AUTRQRHGSA-N Ala-Tyr-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H]([NH3+])C)CC1=CC=C(O)C=C1 AENHOIXXHKNIQL-AUTRQRHGSA-N 0.000 description 1
- BOKLLPVAQDSLHC-FXQIFTODSA-N Ala-Val-Cys Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N BOKLLPVAQDSLHC-FXQIFTODSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 101100519158 Arabidopsis thaliana PCR2 gene Proteins 0.000 description 1
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 1
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 1
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 1
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 1
- YBIAYFFIVAZXPK-AVGNSLFASA-N Arg-His-Arg Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YBIAYFFIVAZXPK-AVGNSLFASA-N 0.000 description 1
- JEXPNDORFYHJTM-IHRRRGAJSA-N Arg-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JEXPNDORFYHJTM-IHRRRGAJSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- PQBHGSGQZSOLIR-RYUDHWBXSA-N Arg-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PQBHGSGQZSOLIR-RYUDHWBXSA-N 0.000 description 1
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 1
- LQJAALCCPOTJGB-YUMQZZPRSA-N Arg-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O LQJAALCCPOTJGB-YUMQZZPRSA-N 0.000 description 1
- XSPKAHFVDKRGRL-DCAQKATOSA-N Arg-Pro-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XSPKAHFVDKRGRL-DCAQKATOSA-N 0.000 description 1
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 1
- IJYZHIOOBGIINM-WDSKDSINSA-N Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N IJYZHIOOBGIINM-WDSKDSINSA-N 0.000 description 1
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 1
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 1
- ZPWMEWYQBWSGAO-ZJDVBMNYSA-N Arg-Thr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZPWMEWYQBWSGAO-ZJDVBMNYSA-N 0.000 description 1
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 1
- JJGRJMKUOYXZRA-LPEHRKFASA-N Asn-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O JJGRJMKUOYXZRA-LPEHRKFASA-N 0.000 description 1
- VYLVOMUVLMGCRF-ZLUOBGJFSA-N Asn-Asp-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VYLVOMUVLMGCRF-ZLUOBGJFSA-N 0.000 description 1
- GBAWQWASNGUNQF-ZLUOBGJFSA-N Asp-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N GBAWQWASNGUNQF-ZLUOBGJFSA-N 0.000 description 1
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 1
- GVPSCJQLUGIKAM-GUBZILKMSA-N Asp-Arg-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GVPSCJQLUGIKAM-GUBZILKMSA-N 0.000 description 1
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 1
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 1
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- DJCAHYVLMSRBFR-QXEWZRGKSA-N Asp-Met-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(O)=O DJCAHYVLMSRBFR-QXEWZRGKSA-N 0.000 description 1
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 1
- HRVQDZOWMLFAOD-BIIVOSGPSA-N Asp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N)C(=O)O HRVQDZOWMLFAOD-BIIVOSGPSA-N 0.000 description 1
- GXHDGYOXPNQCKM-XVSYOHENSA-N Asp-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GXHDGYOXPNQCKM-XVSYOHENSA-N 0.000 description 1
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 1
- 241000228215 Aspergillus aculeatus Species 0.000 description 1
- 241000228195 Aspergillus ficuum Species 0.000 description 1
- 241000892910 Aspergillus foetidus Species 0.000 description 1
- 241001480052 Aspergillus japonicus Species 0.000 description 1
- 101100523058 Aspergillus niger pyrG gene Proteins 0.000 description 1
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 1
- 241000131386 Aspergillus sojae Species 0.000 description 1
- 241000228232 Aspergillus tubingensis Species 0.000 description 1
- 101100317631 Aspergillus tubingensis xynA gene Proteins 0.000 description 1
- 101150076489 B gene Proteins 0.000 description 1
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 1
- 241000194108 Bacillus licheniformis Species 0.000 description 1
- 229920002498 Beta-glucan Polymers 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- GHBZRQPPLXSYBA-UHFFFAOYSA-N C(CCCCCCCCC)N.[Co] Chemical compound C(CCCCCCCCC)N.[Co] GHBZRQPPLXSYBA-UHFFFAOYSA-N 0.000 description 1
- 101100294255 Caenorhabditis elegans nmt-1 gene Proteins 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 1
- 241001533384 Circovirus Species 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- XFXPMWWXUTWYJX-UHFFFAOYSA-N Cyanide Chemical compound N#[C-] XFXPMWWXUTWYJX-UHFFFAOYSA-N 0.000 description 1
- CVOZXIPULQQFNY-ZLUOBGJFSA-N Cys-Ala-Cys Chemical compound C[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@@H](CS)C(O)=O CVOZXIPULQQFNY-ZLUOBGJFSA-N 0.000 description 1
- AEJSNWMRPXAKCW-WHFBIAKZSA-N Cys-Ala-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AEJSNWMRPXAKCW-WHFBIAKZSA-N 0.000 description 1
- GEEXORWTBTUOHC-FXQIFTODSA-N Cys-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N GEEXORWTBTUOHC-FXQIFTODSA-N 0.000 description 1
- 101800000778 Cytochrome b-c1 complex subunit 9 Proteins 0.000 description 1
- 102400000011 Cytochrome b-c1 complex subunit 9 Human genes 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- ZAQJHHRNXZUBTE-NQXXGFSBSA-N D-ribulose Chemical compound OC[C@@H](O)[C@@H](O)C(=O)CO ZAQJHHRNXZUBTE-NQXXGFSBSA-N 0.000 description 1
- ZAQJHHRNXZUBTE-UHFFFAOYSA-N D-threo-2-Pentulose Natural products OCC(O)C(O)C(=O)CO ZAQJHHRNXZUBTE-UHFFFAOYSA-N 0.000 description 1
- 108020003215 DNA Probes Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 239000003298 DNA probe Substances 0.000 description 1
- 230000010665 Enzyme Interactions Effects 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 108050001049 Extracellular proteins Proteins 0.000 description 1
- 241000846455 Flavobacterium faecale Species 0.000 description 1
- 108700005088 Fungal Genes Proteins 0.000 description 1
- 241000223218 Fusarium Species 0.000 description 1
- 241000223195 Fusarium graminearum Species 0.000 description 1
- 102100039556 Galectin-4 Human genes 0.000 description 1
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 1
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 1
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 1
- RXESHTOTINOODU-JYJNAYRXSA-N Glu-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N RXESHTOTINOODU-JYJNAYRXSA-N 0.000 description 1
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- WIKMTDVSCUJIPJ-CIUDSAMLSA-N Glu-Ser-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WIKMTDVSCUJIPJ-CIUDSAMLSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- 229920001503 Glucan Polymers 0.000 description 1
- 102100022624 Glucoamylase Human genes 0.000 description 1
- 108010056771 Glucosidases Proteins 0.000 description 1
- 102000004366 Glucosidases Human genes 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- LERGJIVJIIODPZ-ZANVPECISA-N Gly-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)C)C(O)=O)=CNC2=C1 LERGJIVJIIODPZ-ZANVPECISA-N 0.000 description 1
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 1
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 1
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 1
- CQIIXEHDSZUSAG-QWRGUYRKSA-N Gly-His-His Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 CQIIXEHDSZUSAG-QWRGUYRKSA-N 0.000 description 1
- QSVMIMFAAZPCAQ-PMVVWTBXSA-N Gly-His-Thr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QSVMIMFAAZPCAQ-PMVVWTBXSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- HHRODZSXDXMUHS-LURJTMIESA-N Gly-Met-Gly Chemical compound CSCC[C@H](NC(=O)C[NH3+])C(=O)NCC([O-])=O HHRODZSXDXMUHS-LURJTMIESA-N 0.000 description 1
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 1
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 1
- SFOXOSKVTLDEDM-HOTGVXAUSA-N Gly-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CN)=CNC2=C1 SFOXOSKVTLDEDM-HOTGVXAUSA-N 0.000 description 1
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 1
- 108010001483 Glycogen Synthase Proteins 0.000 description 1
- 101100295959 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) arcB gene Proteins 0.000 description 1
- DZMVESFTHXSSPZ-XVYDVKMFSA-N His-Ala-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DZMVESFTHXSSPZ-XVYDVKMFSA-N 0.000 description 1
- PROLDOGUBQJNPG-RWMBFGLXSA-N His-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O PROLDOGUBQJNPG-RWMBFGLXSA-N 0.000 description 1
- YADRBUZBKHHDAO-XPUUQOCRSA-N His-Gly-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C)C(O)=O YADRBUZBKHHDAO-XPUUQOCRSA-N 0.000 description 1
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 1
- GIRSNERMXCMDBO-GARJFASQSA-N His-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O GIRSNERMXCMDBO-GARJFASQSA-N 0.000 description 1
- MDOBWSFNSNPENN-PMVVWTBXSA-N His-Thr-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O MDOBWSFNSNPENN-PMVVWTBXSA-N 0.000 description 1
- 101000608765 Homo sapiens Galectin-4 Proteins 0.000 description 1
- 101000904152 Homo sapiens Transcription factor E2F1 Proteins 0.000 description 1
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 1
- 241000341655 Human papillomavirus type 16 Species 0.000 description 1
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 241000170280 Kluyveromyces sp. Species 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- QLROSWPKSBORFJ-BQBZGAKWSA-N L-Prolyl-L-glutamic acid Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 QLROSWPKSBORFJ-BQBZGAKWSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 101150022713 LAC4 gene Proteins 0.000 description 1
- 108010059881 Lactase Proteins 0.000 description 1
- 101710128836 Large T antigen Proteins 0.000 description 1
- DQPQTXMIRBUWKO-DCAQKATOSA-N Leu-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N DQPQTXMIRBUWKO-DCAQKATOSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- HXWALXSAVBLTPK-NUTKFTJISA-N Leu-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N HXWALXSAVBLTPK-NUTKFTJISA-N 0.000 description 1
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 1
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- WRLPVDVHNWSSCL-MELADBBJSA-N Leu-His-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N WRLPVDVHNWSSCL-MELADBBJSA-N 0.000 description 1
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 1
- PKKMDPNFGULLNQ-AVGNSLFASA-N Leu-Met-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O PKKMDPNFGULLNQ-AVGNSLFASA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- ZASPELYMPSACER-HOCLYGCPSA-N Lys-Gly-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZASPELYMPSACER-HOCLYGCPSA-N 0.000 description 1
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 1
- SEZADXQOJJTXPG-VFAJRCTISA-N Lys-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N)O SEZADXQOJJTXPG-VFAJRCTISA-N 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 229920002774 Maltodextrin Polymers 0.000 description 1
- 239000005913 Maltodextrin Substances 0.000 description 1
- UZVWDRPUTHXQAM-FXQIFTODSA-N Met-Asp-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O UZVWDRPUTHXQAM-FXQIFTODSA-N 0.000 description 1
- FVKRQMQQFGBXHV-QXEWZRGKSA-N Met-Asp-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FVKRQMQQFGBXHV-QXEWZRGKSA-N 0.000 description 1
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 1
- YGNUDKAPJARTEM-GUBZILKMSA-N Met-Val-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O YGNUDKAPJARTEM-GUBZILKMSA-N 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 241000713869 Moloney murine leukemia virus Species 0.000 description 1
- 102100035854 N(G),N(G)-dimethylarginine dimethylaminohydrolase 1 Human genes 0.000 description 1
- 108050006009 N(G),N(G)-dimethylarginine dimethylaminohydrolase 1 Proteins 0.000 description 1
- 108050004975 N(G),N(G)-dimethylarginine dimethylaminohydrolase 2 Proteins 0.000 description 1
- 102100036658 N(G),N(G)-dimethylarginine dimethylaminohydrolase 2 Human genes 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- CHJJGSNFBQVOTG-UHFFFAOYSA-N N-methyl-guanidine Natural products CNC(N)=N CHJJGSNFBQVOTG-UHFFFAOYSA-N 0.000 description 1
- CNTJAUMVLJHQGQ-UHFFFAOYSA-N N1C(=CC2=CC=CC=C12)N.P(=O)(O)(O)O Chemical compound N1C(=CC2=CC=CC=C12)N.P(=O)(O)(O)O CNTJAUMVLJHQGQ-UHFFFAOYSA-N 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 206010029240 Neuritis Diseases 0.000 description 1
- 241000221960 Neurospora Species 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 241000320412 Ogataea angusta Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 241000228150 Penicillium chrysogenum Species 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 208000031845 Pernicious anaemia Diseases 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- YRKFKTQRVBJYLT-CQDKDKBSSA-N Phe-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 YRKFKTQRVBJYLT-CQDKDKBSSA-N 0.000 description 1
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 1
- SWCOXQLDICUYOL-ULQDDVLXSA-N Phe-His-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SWCOXQLDICUYOL-ULQDDVLXSA-N 0.000 description 1
- OAOLATANIHTNCZ-IHRRRGAJSA-N Phe-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N OAOLATANIHTNCZ-IHRRRGAJSA-N 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- XNQMZHLAYFWSGJ-HTUGSXCWSA-N Phe-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XNQMZHLAYFWSGJ-HTUGSXCWSA-N 0.000 description 1
- 108010073135 Phosphorylases Proteins 0.000 description 1
- 102000009097 Phosphorylases Human genes 0.000 description 1
- FKUYMLZIRPABFK-UHFFFAOYSA-N Plastoquinone 9 Natural products CC(C)=CCCC(C)=CCCC(C)=CCCC(C)=CCCC(C)=CCCC(C)=CCCC(C)=CCCC(C)=CCCC(C)=CCC1=CC(=O)C(C)=C(C)C1=O FKUYMLZIRPABFK-UHFFFAOYSA-N 0.000 description 1
- 108010039918 Polylysine Chemical group 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 1
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 1
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 1
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 1
- HXNYBZQLBWIADP-WDSKDSINSA-N Pro-Cys Chemical compound OC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 HXNYBZQLBWIADP-WDSKDSINSA-N 0.000 description 1
- CKXMGSJPDQXBPG-JYJNAYRXSA-N Pro-Cys-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O CKXMGSJPDQXBPG-JYJNAYRXSA-N 0.000 description 1
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 1
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- AUYKOPJPKUCYHE-SRVKXCTJSA-N Pro-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 AUYKOPJPKUCYHE-SRVKXCTJSA-N 0.000 description 1
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 1
- MMFLWRSVOVXBDP-BJLQDIEVSA-N Pro-Trp-Val-Gly Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O)C(=O)[C@@H]1CCCN1 MMFLWRSVOVXBDP-BJLQDIEVSA-N 0.000 description 1
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 1
- XBDQKXXYIPTUBI-UHFFFAOYSA-M Propionate Chemical compound CCC([O-])=O XBDQKXXYIPTUBI-UHFFFAOYSA-M 0.000 description 1
- 241000186334 Propionibacterium freudenreichii subsp. shermanii Species 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 241000168053 Pseudomonas denitrificans (nomen rejiciendum) Species 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 102000002278 Ribosomal Proteins Human genes 0.000 description 1
- 108010000605 Ribosomal Proteins Proteins 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 101001102892 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Adenylosuccinate synthetase Proteins 0.000 description 1
- 241000187559 Saccharopolyspora erythraea Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- VQBLHWSPVYYZTB-DCAQKATOSA-N Ser-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N VQBLHWSPVYYZTB-DCAQKATOSA-N 0.000 description 1
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 1
- CAOYHZOWXFFAIR-CIUDSAMLSA-N Ser-His-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CAOYHZOWXFFAIR-CIUDSAMLSA-N 0.000 description 1
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 1
- RXSWQCATLWVDLI-XGEHTFHBSA-N Ser-Met-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RXSWQCATLWVDLI-XGEHTFHBSA-N 0.000 description 1
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 1
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 1
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 1
- GSCVDSBEYVGMJQ-SRVKXCTJSA-N Ser-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)O GSCVDSBEYVGMJQ-SRVKXCTJSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 241000228341 Talaromyces Species 0.000 description 1
- 241000228178 Thermoascus Species 0.000 description 1
- 241001494489 Thielavia Species 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical group OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 1
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 1
- NQVDGKYAUHTCME-QTKMDUPCSA-N Thr-His-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O NQVDGKYAUHTCME-QTKMDUPCSA-N 0.000 description 1
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 1
- APIDTRXFGYOLLH-VQVTYTSYSA-N Thr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)[C@@H](C)O APIDTRXFGYOLLH-VQVTYTSYSA-N 0.000 description 1
- SIEZEMFJLYRUMK-YTWAJWBKSA-N Thr-Met-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N)O SIEZEMFJLYRUMK-YTWAJWBKSA-N 0.000 description 1
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 1
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 102100024026 Transcription factor E2F1 Human genes 0.000 description 1
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 1
- 102100033598 Triosephosphate isomerase Human genes 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- DXYQIGZZWYBXSD-JSGCOSHPSA-N Trp-Pro Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)N1CCC[C@H]1C(O)=O DXYQIGZZWYBXSD-JSGCOSHPSA-N 0.000 description 1
- HIZDHWHVOLUGOX-BPUTZDHNSA-N Trp-Ser-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O HIZDHWHVOLUGOX-BPUTZDHNSA-N 0.000 description 1
- IEESWNWYUOETOT-BVSLBCMMSA-N Trp-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(=O)N[C@@H](Cc1ccccc1)C(O)=O IEESWNWYUOETOT-BVSLBCMMSA-N 0.000 description 1
- IELISNUVHBKYBX-XDTLVQLUSA-N Tyr-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IELISNUVHBKYBX-XDTLVQLUSA-N 0.000 description 1
- 108010085193 UDP-N-acetylglucosamine 1-carboxyvinyltransferase Proteins 0.000 description 1
- 229910052770 Uranium Inorganic materials 0.000 description 1
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 1
- VJOWWOGRNXRQMF-UVBJJODRSA-N Val-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 VJOWWOGRNXRQMF-UVBJJODRSA-N 0.000 description 1
- DNOOLPROHJWCSQ-RCWTZXSCSA-N Val-Arg-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DNOOLPROHJWCSQ-RCWTZXSCSA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 1
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 1
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 1
- SSKKGOWRPNIVDW-AVGNSLFASA-N Val-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SSKKGOWRPNIVDW-AVGNSLFASA-N 0.000 description 1
- 108050006628 Viral movement proteins Proteins 0.000 description 1
- 229930003451 Vitamin B1 Natural products 0.000 description 1
- 239000005862 Whey Substances 0.000 description 1
- 102000007544 Whey Proteins Human genes 0.000 description 1
- 108010046377 Whey Proteins Proteins 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- KKYXVXDDVONUGW-UHFFFAOYSA-N [Co].[PH2](=O)O Chemical group [Co].[PH2](=O)O KKYXVXDDVONUGW-UHFFFAOYSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 108010048241 acetamidase Proteins 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 108010015351 acyl-CoA-independent retinyl ester synthetase Proteins 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 230000006154 adenylylation Effects 0.000 description 1
- 238000005273 aeration Methods 0.000 description 1
- 238000012867 alanine scanning Methods 0.000 description 1
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 1
- 125000003158 alcohol group Chemical group 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 102000004139 alpha-Amylases Human genes 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 229940024171 alpha-amylase Drugs 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 238000011938 amidation process Methods 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 239000000908 ammonium hydroxide Substances 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- OIRDTQYFTABQOQ-UHFFFAOYSA-N ara-adenosine Natural products Nc1ncnc2n(cnc12)C1OC(CO)C(O)C1O OIRDTQYFTABQOQ-UHFFFAOYSA-N 0.000 description 1
- 101150008194 argB gene Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 239000013602 bacteriophage vector Substances 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 150000001576 beta-amino acids Chemical class 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 235000021152 breakfast Nutrition 0.000 description 1
- 229910052793 cadmium Inorganic materials 0.000 description 1
- BDOSMKKIYDKNTQ-UHFFFAOYSA-N cadmium atom Chemical compound [Cd] BDOSMKKIYDKNTQ-UHFFFAOYSA-N 0.000 description 1
- FAPWYRCQGJNNSJ-UBKPKTQASA-L calcium D-pantothenic acid Chemical compound [Ca+2].OCC(C)(C)[C@@H](O)C(=O)NCCC([O-])=O.OCC(C)(C)[C@@H](O)C(=O)NCCC([O-])=O FAPWYRCQGJNNSJ-UBKPKTQASA-L 0.000 description 1
- 229960002079 calcium pantothenate Drugs 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 101150014229 carA gene Proteins 0.000 description 1
- 101150070764 carB gene Proteins 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000005754 cellular signaling Effects 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- SFZULDYEOVSIKM-UHFFFAOYSA-N chembl321317 Chemical compound C1=CC(C(=N)NO)=CC=C1C1=CC=C(C=2C=CC(=CC=2)C(=N)NO)O1 SFZULDYEOVSIKM-UHFFFAOYSA-N 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- GXAPHLHAAXQSRR-UHFFFAOYSA-N cobalt(2+);hydrate Chemical compound O.[Co+2] GXAPHLHAAXQSRR-UHFFFAOYSA-N 0.000 description 1
- MULYSYXKGICWJF-UHFFFAOYSA-L cobalt(2+);oxalate Chemical compound [Co+2].[O-]C(=O)C([O-])=O MULYSYXKGICWJF-UHFFFAOYSA-L 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 235000013365 dairy product Nutrition 0.000 description 1
- 125000002704 decyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000000378 dietary effect Effects 0.000 description 1
- 238000002050 diffraction method Methods 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 125000000118 dimethyl group Chemical group [H]C([H])([H])* 0.000 description 1
- SWSQBOPZIKWTGO-UHFFFAOYSA-N dimethylaminoamidine Natural products CN(C)C(N)=N SWSQBOPZIKWTGO-UHFFFAOYSA-N 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 210000003038 endothelium Anatomy 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 101150097026 facA gene Proteins 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 235000019688 fish Nutrition 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 230000002414 glycolytic effect Effects 0.000 description 1
- 238000005858 glycosidation reaction Methods 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 101150073906 gpdA gene Proteins 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 101150032210 hel-1 gene Proteins 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 235000004867 hydroxocobalamin Nutrition 0.000 description 1
- 239000011704 hydroxocobalamin Substances 0.000 description 1
- 229960001103 hydroxocobalamin Drugs 0.000 description 1
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 1
- 229940097277 hygromycin b Drugs 0.000 description 1
- 230000014726 immortalization of host cell Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 229940116108 lactase Drugs 0.000 description 1
- 210000002429 large intestine Anatomy 0.000 description 1
- DVCSNHXRZUVYAM-BQBZGAKWSA-N leu-asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O DVCSNHXRZUVYAM-BQBZGAKWSA-N 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 101150039489 lysZ gene Proteins 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 229940035034 maltodextrin Drugs 0.000 description 1
- 108010083942 mannopine synthase Proteins 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 239000012533 medium component Substances 0.000 description 1
- 125000001434 methanylylidene group Chemical group [H]C#[*] 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 1
- SJFKGZZCMREBQH-UHFFFAOYSA-N methyl ethanimidate Chemical compound COC(C)=N SJFKGZZCMREBQH-UHFFFAOYSA-N 0.000 description 1
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical compound CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 235000013379 molasses Nutrition 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000000302 molecular modelling Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- JCJAEDXFONBNIP-PTPTXAFISA-N n-[4-[2-[(2r,3r,4r,5s,6r)-3-acetamido-5-[(2s,3r,4r,5r,6r)-3,4-dihydroxy-6-(hydroxymethyl)-5-[(2r,3r,4s,5r,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxyoxan-2-yl]oxy-4-hydroxy-6-(hydroxymethyl)oxan-2-yl]oxyethyl]phenyl]-2,2,2-trifluoroacetamide Chemical compound O([C@H]1[C@@H](CO)O[C@H]([C@@H]([C@H]1O)O)O[C@H]1[C@H](O)[C@H]([C@@H](O[C@@H]1CO)OCCC=1C=CC(NC(=O)C(F)(F)F)=CC=1)NC(=O)C)[C@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O JCJAEDXFONBNIP-PTPTXAFISA-N 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 201000001119 neuropathy Diseases 0.000 description 1
- 101150095344 niaD gene Proteins 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- VIKNJXKGJWUCNN-XGXHKTLJSA-N norethisterone Chemical compound O=C1CC[C@@H]2[C@H]3CC[C@](C)([C@](CC4)(O)C#C)[C@@H]4[C@@H]3CCC2=C1 VIKNJXKGJWUCNN-XGXHKTLJSA-N 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 150000002923 oximes Chemical class 0.000 description 1
- 238000002161 passivation Methods 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- RLZZZVKAURTHCP-UHFFFAOYSA-N phenanthrene-3,4-diol Chemical compound C1=CC=C2C3=C(O)C(O)=CC=C3C=CC2=C1 RLZZZVKAURTHCP-UHFFFAOYSA-N 0.000 description 1
- XYFCBTPGUUZFHI-UHFFFAOYSA-O phosphonium Chemical compound [PH4+] XYFCBTPGUUZFHI-UHFFFAOYSA-O 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 230000000865 phosphorylative effect Effects 0.000 description 1
- 229940085127 phytase Drugs 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- FKUYMLZIRPABFK-IQSNHBBHSA-N plastoquinone-9 Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CC\C(C)=C\CC\C(C)=C\CC\C(C)=C\CC\C(C)=C\CC\C(C)=C\CC\C(C)=C\CC1=CC(=O)C(C)=C(C)C1=O FKUYMLZIRPABFK-IQSNHBBHSA-N 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 229920000656 polylysine Chemical group 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 235000011056 potassium acetate Nutrition 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 235000013594 poultry meat Nutrition 0.000 description 1
- 150000003141 primary amines Chemical class 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 239000013587 production medium Substances 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 101150054232 pyrG gene Proteins 0.000 description 1
- 238000007342 radical addition reaction Methods 0.000 description 1
- 150000003254 radicals Chemical class 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000012279 sodium borohydride Substances 0.000 description 1
- 229910000033 sodium borohydride Inorganic materials 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- FDDDEECHVMSUSB-UHFFFAOYSA-N sulfanilamide Chemical compound NC1=CC=C(S(N)(=O)=O)C=C1 FDDDEECHVMSUSB-UHFFFAOYSA-N 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 229960003495 thiamine Drugs 0.000 description 1
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 101150101900 uidA gene Proteins 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
- 235000010374 vitamin B1 Nutrition 0.000 description 1
- 239000011691 vitamin B1 Substances 0.000 description 1
- 101150077833 xlnA gene Proteins 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1085—Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1288—Transferases for other substituted phosphate groups (2.7.8)
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Description
i i1328612 玖、發明說明 【發明所屬之技術領域】 本發明係關於與維生素b12生物合成途徑有關聯的基 因以及蛋白質(例如酵素)。特定言之,本發明提供四種 源自丙酸桿菌(Propionibacteria),尤其是費氏丙酸桿菌 (Propionibacterium freudenreichii )的新穎基因(及其 編碼之對應的酵素)。此類酵素是合成酶或轉移酶,以及 可用於維生素B12之製作。 【先前技術】 諸論 維生素B12是人類及動物重要的維生素。其爲必需要 的維生素,且係得自人類及動物的膳食食品。維生素b12 存在於天然的動物食品中,包括:魚類、牛奶以及乳類產 品、蛋類、肉類以及家禽。某些食品,例如早餐的穀類薄 片係添加入維生素B12,並對素食者提供有價値的維生素 來源》 維生素B12係可用於治療惡性貧血以及周圍的神經炎 ,以及亦爲動物飼料之添加物。 本文術語之維生素B12是用以描述類鈷啉家族之化合 物,尤其是氰鈷胺素群之化合物。此群化合物中最具指標 性之化合物是氰鈷胺,因此有時可用維生素B12表示氰鈷 胺。本文術語之維生素B12指廣義的維生素B12,因此包 含所有氰鈷胺素群的類鈷啉’尤其是包含其特徵分別爲氰 1328612, \ 基、羥基、甲基或5'-去氧腺苷基自由基之氰鈷胺、羥鈷 胺素、甲基氰鈷胺素以及5'-去氧腺苷基鈷胺素。 工業上製作維生素B12是利用微生物的發酵,尤其是 使用反硝化假單胞菌(Pseudomonas denitrificans)。然 而目前維生素B12之產量不符合生產維生素B12之成本效 率。爲了增加維生素B12的生產率,則需要改良發酵方法 〇 反硝化假單胞菌中維生素Bl2之生物合成途徑己被特 徵化24。並說明於大部份的路徑25。總共有22個酵素被 純化,並已確認22個cob基因。然而某些此類基因所拌 演的角色仍然是未知的。據推測與謝氏丙酸桿菌( Propionibacterium shermanii )中之作用雖然緊密的相關 ,但仍有一些不同的路徑》 此外,鼠傷寒沙門菌(Salmonella typhimurium)中 鈷胺素之合成途徑亦經硏究。鼠傷寒沙門菌cob操縱子 己被分離並選殖入的大腸桿菌,而且付予新宿主前所未有 之全新地製作氰鈷胺素之能力。就專利公告案而言,在 Blanche of Rhone Poulenc Rorer之專利公告案中提及製備 氰鈷胺素之生物合成方法。 在費氏丙酸桿菌中已假設總共有14個基因,負責編 碼17個厭氧Bl2路徑步驟之酵素。然而此文件未提及任 何序列,以及僅表現二種基因產物,聲稱可造成甲基化作 用》彼係表現於大腸桿菌,以及並未揭示於此類基因在實 際產生維生素B12上的用途。 -6- 1328612 i t 雖然在工業上已使用丙酸桿菌製作維生素b12,但產 率及產量並不完全地令人滿意,仍有改善空間。因此,本 發明經從事硏究闡明費氏丙酸桿菌之生物合成途徑,結果 確認四種不同基因以及酵素。此可改進工業量級維生素 B1 2之產量。 【發明內容】 本發明槪要 目前提供與維生素b12之生物合成有關的新穎酵素。 廣義而言,本發明之第一特色係關於革蘭氏陽性細菌 ’放射菌目,例如丙酸桿菌科,例如丙酸桿菌屬,例如費 氏丙酸桿菌之合成酶或轉移酶。此類酵素爲(例如醯胺) 合成酶或(例如磷醯基或核苷醯基)轉移酶。較佳者具有 EC 6.3.1.—、2.7.7—、2.7.8· -或 2.5.1.17 之活性。 更明確的說,本發明的第一特色提供分離及/或純化 的合成酶或轉移酶多肽,其係包含: (i )序列識別號:2、4、6或8之胺基酸序列;或 (Π)合成酶或轉移酶(i)之變異體;或 (iii)合成酶或轉移酶(i)或(ii)之片段。 依據本發明之第二特色係提供多核苷酸,其係包含: (a) 序列識別號1、3、5或7之核酸序列,或編碼 本發明多肽之序列; (b) 互補至,或雜交至任何定義於(a)之序列的序 列: 1328612 f (C )任何(a )或(b )序列之片段; (d) 與任何定義於(a) ,(b)或(c)之序列至少 有6 Ο、6 5或7 Ο %相似性之序列;或 (e) 任何定義於(a)至(d)之序列,因遺傳密碼 退化造成的序列。 本發明亦提供= ——種(例如表現)載體(第三特色),其係包含本 發明之多核苷酸以及可能表現本發明之多肽; ——種宿主(第四特色),例如包含本發明之載體之 細胞系或菌株; ——種產生本發明多肽之方法,其係包含在適於表現 多肽之條件下維持本發明之細胞系或菌株並視需要的分離 多肽;以及 ——種產生維生素B12或其前驅物之方法(第五特 色),該方法包含接觸反應受質與本發明多肽或宿主細胞 序列簡述 序列識別號1爲本發明來自費氏丙酸桿菌之第一酵素 醯胺合成酶的DNA序列: 序列識別號2爲第一酵素(A )的胺基酸序列; 序列識別號3爲來自相同生物體之第二酵素(磷酸及 /或核苷酿基)轉移酶的DNA序列: 序列識別號4爲第二酵素(B A )的胺基酸序列; -8- 1328612 序列識別號5爲來自相同生物體之第三酵素轉移酶的 DNA序列; 序列識別號6爲第三酵素(C )的胺基酸序列; 序列識別號7爲來自相同生物體之第四酵素(核苷醯 基)轉移酶的DNA序列; 序列識別號8爲第四酵素(D )的胺基酸序列;以及 序列識別號9至1 7爲引子。 發明之詳細描述 A.多核苷酸 本發明提供編碼本發明多胜肽之(例如分離及/或純 化的)多核苷酸。如此本發明提供多核苷酸,較佳者編碼 合成酶或轉移酶’其胺基酸序列爲序列識別號2、4、6及 /或8。本發明進一步的提供與編碼序列識別號2、4、6 及/或8之胺基酸序列具有實質上胺基酸序列同源性之多 核苷酸。 亦包括一種多肽,其係選自: (a)包含序列識別號1、3、5及/或7、或其互補 之核苷酸序列的多核苷酸; (b )包含能(例如選擇地)雜交至序列識別號1、3 、5或7、或其片段之核苷酸序列的多核苷酸; (c )包含能(例如選擇地)雜交至與序列識別號1 、3、5或7互補之核苷酸序列 '或其片段的多核苷酸; (d)包含定義於(a) 、(b)或(c)之聚核苷酸序 1328612 y 列由於遺傳密碼退化的結果產生之多核苷酸》 多核苷酸可含有2、3或更多個本發明之序列,例如 序列識別號1及5或1、3及5 (或任何定義於(a)、( b)或(c)之變體)。 本發明之多核苷酸亦可包含以下之多核苷酸: (a) 編碼具有合成酶或轉移酶活性之多肽,該多核 苷酸爲: (1 )序列識別號1、3、5或7之編碼序列; (2 )選擇地雜交至定義(1 )之互補序列的序列; 或 (3)定義於(1)或(2)由於遺傳密碼退化的結 果產生之序列;或 (b) 互補至定義於(a)之多核苷酸的序列。 可雜交的序列 本文術語之$能雜交'意指本發明之目標多核苷酸( 例如序列識別號1、3、5或7,或其片段或其互補體之核 苷酸序列)可作爲探子在背景以上之水平雜交至核酸。本 發明亦包括編碼合成酶或轉移酶之核苷酸序列或其變異體 以及與彼互補的核苷酸序列。核苷酸序列可爲RNA或 DNA以及包括染色體DNA、合成的DNA或互補DNA )。 較佳之核苷酸序列爲DNA序列以及互補DNA序列。本發 明典型地多核苷酸包含在選擇的條件下能雜交至序列識別 號1、3、5或7之編碼序列或互補之編碼序列的核苷酸之 -10- 1328612 I t 鄰近的序列。該核苷酸可依據技藝上已知的方法合成 本發明多核苷酸可在背景以上的程度(適宜的)雜交 至序列識別號1、3、5或7之編碼序列或其互補之編碼序 列。因爲例如互補DNA庫中存在有其它之互補DNA,故 可發生背景雜交。典型地信號程度(例如本發明多核苷酸 與序列識別號1、3、5或7之編碼序列或其互補之編碼序 列之間產生的交互作用)至少是1 0倍,較佳者至少1 〇〇 倍,或者和其它多核苷酸與序列識別號丨、3、5或7編碼 序列間之交互作用一樣的強烈。交互作用之強度可加以測 量,例如經放射性標記之探針,例如3 2P。通常使用低嚴 格條件(0.3莫耳濃度氯化鈉以及〇.〇3莫耳濃度檸檬酸鈉 ,約40°C )、中嚴格(例如0.3莫耳濃度氯化鈉以及 0.0 3莫耳濃度檸檬酸鈉,約5 0 °C )或高嚴格條件(例如 0.3莫耳濃度氯化鈉以及0.03莫耳濃度檸檬酸鈉。約60 °C )可達成選擇性的雜交。可用技藝上已知的任何適當的 條件1進行雜交,以及低嚴格條件可爲2 X SSC,55 °C、 中嚴格條件可爲〇·5至1.0 X SSC,60°C、以及高嚴格條 件可爲〇.1或0.2 xSSC,60°C或更高(例如68°C ),以 上均含0.5% SDS。 修正 本發明之多核苷酸可包含DNA或RNA。彼可爲單股 或雙股的核苷酸。彼亦可爲其中包含一個或多個合成的或 經修正之核苷酸的多核苷酸。技藝上已知有許多不同修正 -11 - 1328612 類型之多核苷酸。此類修正包含甲基膦酸酯以及硫代磷酸 (酯)骨幹及/或在分子之V及/或5'端添加吖啶或聚賴 氨酸鏈。在本發明之目的中,據了解在此描述之多核苷酸 可經在此技藝中提供的任何方法修正。 據了解熟悉此技藝的專業人士可使用常規地技藝,例 如以反映任何表現本發明多肽的特定宿主生物體密碼子, 選擇性的進行核苷酸取代而不影響本發明多核苷酸編碼之 多肽序列。 序列識別號1、3、5或7之編碼序列可經核苷酸取代 ,例如進行1、2或3多至1 〇、2 5、5 0或1 0 0個取代加以 修正。此外或額外地,多核苷酸可經一個或多個插入及/ 或刪除及/或在各端或兩端延伸加以修正。一般而言經修 正之多核苷酸編碼其帶有合成酶或轉移酶活性之多肽。可 製作退化取代及/或取代,當轉譯(例如以下多胜肽之討 論)經修正之序列時,可導致保守胺基酸的取代。 同系物 能選擇地雜交至(例如互補至)序列識別號1、3、5 或7之DNA編碼序列的核苷酸序列與序列識別號1、3、 5或7之編碼序列有至少50%或60%、至少70%、至少 80%、至少90%、至少95%、至少98%或至少99%的序 列相似性(或同源性)。此涵蓋的區域至少爲20,較佳 者至少爲3 0,例如至少爲4 0或5 0,例如至少爲6 0或8 0 ’更佳者至少爲100、200、400、500或600個鄰近的核 •12· 1 11328612 苷酸或最佳者爲序列識別號1、3、5或7的全長。在個別 地序列中,序列相似性大槪可爲: (a)以序列識別號1爲例,至少85%或90% : (b )以序列識別號3爲例,至少70 % : (c) 以序列識別號5爲例,至少90%或95% ;及/ 或 (d) 以序列識別號7爲例,至少95%或98% ° 任何上述同源性程度之組合以及最小量之大小可用以 定義本發明之多核苷酸,更迫切的組合(即在更長的長度 有較高的同源性)其係較佳。如此例如在25,較佳者30 個核苷酸中至少有80%或90%的同源性,以及在40個核 苷酸中至少有90%的同源,形成本發明特色之一。 典型地多核苷酸(或蛋白質)序列之同系物,例如在 至少15、20、30、100個更多的鄰近核苷酸(或胺基酸) 區域至少有70%的同源性,較佳者至少80、90%、95% 、97%或99%同源性。可基於胺基酸特性計算同源性( 有時稱爲"硬同源性〃)。除非特別說明通常是基於全部 序列計算特性或同源性。 例如UWGCG套裝軟體提供BESTFIT程式,其可用 以計算同源性(例如用其預設設定)。可用PILEUP以及 BLAST演算法計算同源性或排列序列(例如確認等效性 或對應的序列,例如以其預設設定6’7)。 進行 BLAST分析的軟體是可公開得自 National Center for Biotechnology Information -13- 1328612 (http: //www.nebi.nlm.nih.gov/ )。此演算法包含先在 詢問序列中確認長度 W的短字與數據庫序列中相同長度 的短字可匹配或滿足一些正臨界値T,以確認高評分序列 對(HSPs) 。T爲鄰居字分臨界値6,7。此類起始命中的 鄰居字可作爲搜尋發現內含彼之HSP的種子。命中的字 可自各序列往雙方向延伸直到累計的序列對比分數增加爲 止。當累計的序列對比分數從最大値達成値下降X量; 由於累積一個或多個負分殘基序列對比使累計的分數變成 零或以下:或到達序列的一個端點,則命中的字在各方向 之延伸即可停止。BLAST演算法之參數W、T以及X可 決定序列對比之敏感度及速度。BLAST程式預設之字長 度(W)爲11,BLOSUM62分數矩陣8序列對比(B)爲 50,期望値(E)爲10,M = 5,N = 4,並比較雙股。 BLAST演算法在二個序列之間進行相似性之統計分 析9。BLAST演算法提供的相似性測量之一是最小總數或 然率(P(N)),其提供二個核苷酸或胺基酸序列間發 生偶然匹配之或然率。例如,若比較第一序列與第二序列 後其最小總數或然率少於約1,較佳者少於約0.1,更佳 者少於約〇.〇1,最佳者少於約0.001,則可考慮序列相似 於另一序列。 片段、同系物以及其它變異體可至少爲500或550個 核苷酸之長度(例如序列識別號7)以及至少可編碼對應 蛋白質(例如第一)之170、180或200個胺基酸。 -14- 1328612 引子以及探針 本發明多核音酸可作爲引子,例如PCR引子、放大 反應引子、探針、或可選殖入載體的多核苷酸。該引子、 探針以及其它片段之長度至少或多至爲20,例如至少25 、30或40個核苷酸。典型地長度可爲序列識別號1、3、 5 或 7 編碼序列之 40、50、60、70' 1〇〇、150、200 或 300個核苷酸,或即使更多或更少個核苷酸(例如5或1〇 核苷酸)。 一般而言’引子是用合成的方法製作,包含依據所要 求的核酸序列將核苷酸一次一個依序合成之步驟。可使用 在此技藝中提供的自動化技藝加以完成。 一般而言較長的多核苷酸是使用重組方法製作,例如 使用PCR (聚合酶連鎖反應)選殖技藝。其係包含製作— 對引子(例如約1 5 - 3 0個核苷酸),其係對應至合成酶 或轉移酶選殖區域,將引子與得自目標(例如:酵母菌、 細菌、植物、原核或真菌的)細胞(較佳細菌,例如丙酸 桿菌品系)之傳訊RN A或互補DN A接觸,在放大所要求 的區域之條件下進行聚合酶連鎖反應,分離放大的片段( 例如用瓊脂糖凝膠純化反應混合物)以及回收放大的 DNA。引子可設計成含有適當的限制酶識別位而使放大的 DNA可選殖入適當的選殖載體。 該技藝可用以取得在此描述的所有或部份之合成酶或 轉移酶序列。本發明中對應至cDNA序列識別號1、3、5 或7或合成酶或轉移酶基因之基因體選殖菌落可內含例如 -15- 1328612 :內子以及啓動子區域以及彼亦可得自起始自菌的、酵母 菌、細菌性植物或原核細胞基因體DN A之類似的方法( 例如重組方法、PCR、選殖技藝)。 多核苷酸或引子可攜帶透露標記,例如放射性的或非 放射性的標記。適當的標記包含放射性同位素,例如3 2 p 或 s酵素標gS、或其它蛋白質標記,例如生物素。該標 記可爲添加入本發明之多核苷酸或引子以及可使用習知的 技藝本身偵測。 核酸爲基礎的測試可使用標記或未標記的核苷酸進行 偵測或定序樣本(例如細菌的樣本)中之合成酶或轉移酶 或其變異體。一般而言該偵測測試包含將疑似內含DNA 的(例如細菌的)樣本與本發明探子或引子在雜交條件下 接觸以及偵測探子與樣本中之核酸形成的任何雙體。可使 用例如PCR技藝達成該檢測或將探子固定於固態持物上 ’去除樣本中不與探子雜交之核酸,然後偵測雜交至探子 的核酸。此外’可將樣本核酸固定於固態支持物,以及偵 測結合至該支持物的探子。 本發明探針可在適當的容器中方便地包裝成測驗組套 的形式。該組套中探針可結合至固態支持物而該組套設計 之分析形式中則需要該結合。該組套亦可含有處理探測 之樣本、進行探針與樣本核酸之雜交的適當試劑、控制組 試劑、說明書等。 較佳者’本發明之多核苷酸係得自相同生物體之多肽 ’例如細菌’尤其是分歧桿菌科的細菌,較佳者是丙酸 -16- 1 11328612 桿菌屬。 本發明多核苷酸亦包含帶有合成酶或轉移酶活性之序 列識別號1、3、5或7序列的變異體。經加入、取代及/ 或刪除可形成變異體,以及可帶有合成酶或轉移酶或EC 6.3.1—、2.7.7(或 8)或 2.5.1.17 之活性。 產生多核苷酸 有許多方法可得到與序列識別號1、3、5或7沒有 1 〇〇 %相同但屬於本發明範圍之多核苷酸。如此例如經由 探測基因體DNA基因庫(製作自許多生物體,例如本發 明多胜肽來源所討論的生物體)可得到在此描述之序列變 異體。此外’可得自其它細菌的或原核的同系物,—般而 言該同系物以及其片段將能與序列識別號1、3、5或7雜 交。經探測其它物種之互補DNA基因庫或基因體DNA基 因庫’以及用包含所有或部份之SEQ ID. 1、3 ' 5或7之 探針在中至高嚴格之條件下(描述如上)探測該基因庫 可得到該序列。可使用包含所有或部份之序列識別號1、 3、5或7之核酸探針以探測其它物種(例如本發明多胜 肽來源描述之物種)之互補DNA基因庫。 使用退化性聚合酶鏈反應亦可得到物種同系物,其係 使用設計成標定的變異體與編碼保守的胺基酸序列同系物 之引子。該引子可含有一個或多個退化位置以及可用於較 低於以單一的序列引子針對習知的序列進行序列選殖的迫 切條件。 -17- 1328612 此外’合成酶或轉移酶序列或其變異體經位點定向誘 變可得到該多核苷酸。此舉可適用於例如序列須要進行沈 默密碼子的改變以最適化特定的宿主細胞在表現聚核苷酸 序歹U之密碼子優先性。其它序列之改變可能是爲了引入限 制酶識別位’或改變多核苷酸編碼多胜肽之性質或功能。 本發明包括雙股的多核苷酸,其係包含本發明之多核 苷酸以及其互補體。 本發明亦提供編碼如下描述之本發明多胜肽的多核苷 酸。由於該多核苷酸序列將用以重組產生本發明之多胜肽 ’所以雖然最好能,但不必一定要能雜交至序列識別號1 、3、5或7之序列。或者,視需要該多核苷酸可用上述 方法加以標記,使用、以及製作。 B.多胜肽 本發明係關於(例如實質上純化的及/或分離的) 合成酶或轉移酶或其定義於下之變異體。本發明多胜肽本 質上可含有序列識別號2、4、6或8或該序列變異體之胺 基酸序列。多胜肽亦可爲本發明說明如上之多核苷酸編碼 之多胜肽。 本發明多肽可爲分離或相當純的形式。據瞭解該多肽 可與不妨礙預期目的及/多肽功能之載體或稀釋劑混合以 及仍視爲實質上的分離形式。一般而言多肽將內含於制劑 中,制劑大於20% ’例如大於30%、40%、50%、80% 、90%、95%或99%、以重量計之多肽爲本發明之多肽 -18- 1328612 。常規地方法可用以純化及/或合成依據本發明之 蛋白質i。在一些調配物中(例如非藥學的用途)多肽用 量可小到例如0.0 1至1 0 %,例如0 · 1至5 %、或2 %或甚 至0.2至1 %。 較佳者,本發明多肽係得自微生物,例如具有編碼合 成酶或轉移酶酵素活性基因之微生物。更佳者該微生物是 細菌’例如革蘭氏陽性細菌。微生物可爲放線菌( Actinobacteria )門或綱,例如放線菌亞綱(Subclass Adinobacteridae )。較佳的微生是放射菌目,例如丙酸菌 亞目以及最佳的是丙酸菌科。如此較佳的生物體是丙酸桿 菌屬,例如費氏丙酸桿菌。較佳的微生物是能產生或合成 維生素B12。 活性 本發明多肽具有一種或多種以下之特色,其爲 (1) 具有合成酶或轉移酶活性; (2) 作用如醯胺合成酶或磷基-、核苷醯基一或芳 基轉移酶; (3) 催化維生素B12生物合成途徑中至少一個步驟 » (4) 具有 EC 6.3 · 1 ―、EC 2.7.7 _、EC 2.7.8 -或 EC 2.5.1.17 之活性; (5) 長度爲150或17〇至270或300個胺基酸或從 800或840至880或920個胺基酸; -19- 1328612 (6) 是鈷啉胺酸一 a,c -二醯胺合成酶、鈷啉醇醯 胺磷激酶、鈷啉醇醯胺磷酸鹽甲脒基轉移酶、氰鈷胺素( 5'—磷酸鹽)合成酶及/或腺苷基轉移酶; (7) 作用之受質、或產生之產物,包含: (i )咕啉核心或環系統; (ii) 多至4個芳基(可視需要具有吡咯)的環; (iii) 四吡咯環系統及/或過渡金屬(例如鈷)原 子;及/或 (iv) 醢胺、磷酸鹽、胍基、芳基或腺苷基部分或 基團;及/或 (8 )催化醯胺化、磷酸化、核苷醯基化、芳基化 、核醣化或腺苷基加成及/或腺苷基化。 本發明多胜狀主要的特性如下表。 -20- 1328612
基因參考號碼 (編號) PFR111925 (cobA/cbiA) PFR111926 (cobU) PFR111927 (cobS) PFR111924 酵素分類/ 類型 I__________ (醯胺)合成酶 (磷酸)轉移酶 (核苷醯基)轉 移酶 磐 载 S m (核苷醯基)轉 移酶 產物(公式) I__ 塵香 11掘 ^ ο 越仞塵 趄岜氍 腺苷基鈷啉醇醯胺磷 酸鹽(IIA) 腺苷基-GDP-鈷胺醯胺 (ΙΙΒ) ϊ盤胡 1 U\ s^/ H111 ΜΙ *ί« _ Ε- S m 11 I贼 A遽g ~ mi # ϋ ^ _ 者· _ 盤汰_艄 腺苷基鈷啉胺酸a,c 二醯胺(1C) 受質 鈷啉胺酸(I) 腺苷基鈷啉 醇醯胺(Π) 荖氍 m m < _ B 腺苷基-1 GDP-鈷胺 醯胺(ΠΒ) 鈷啉胺酸 a,c二醯胺1 (IB) 酵素活性 I_ 11 趦链3 ^ <Π 5 w m υ 怨鏢e 議S 香Μ 墟蕕 m & c: 饈稍κ ^ m ^ 基fr W 怨氍題 落截 ^链7 账如οΐ S ^ G 碱氍β 迪Μ g δ S鍵ρ δ權;q 序列長度 服基酸) I_ VO oo 〇〇 256 i 1 ο 宕 蛋白質 序列識 別號 (N 寸 oo f m M: 1]¾ g s s P固_ 1(2586) 3(657) 5(780) 1 1 7(603) 指定/ 反應 < Β(Β1, Β2) _1 u Q -21 - 1328612 變異體及同系物 本發明多肽包含序列識別號2、4、6或8(或其變異 體,例如)之胺基酸序列實質上同源的序列或各序列之片 段,以及具有合成酶或轉移酶活性。一般而言,較佳者爲 展不於序列識別號2、4、6或8的天然胺基酸序列。 特定言之,本發明多肽可包括: (〇序列識別號2、4、6或8之多肽序列; (b) 天然變異體或其物種同系物、同物種同源基因 產物或異物種同源基因產物;或 (c) 與(〇或(b)有至少70、至少 80、至少 90 、至少95、至少98或至少99%序列相似性之蛋白質。 變異體可爲天然發生的變異體,例如發生於真菌、細 菌、酵母菌或植物細胞以及其功能實質上相似於序列識別 號2、4、6或8之蛋白質,例如有合成酶或轉移酶之活性 。同樣地,物種同質性之蛋白質是等値的蛋白質,其爲另 一種物種天然發生的蛋白質,其功能爲合成酶或轉移酶酵 素。變異體包含來自本發明多肽之相同菌株或不同菌株( 但相同屬),或相同種之對偶基因的變異體。 變異體以及物種同系物可得自以下描述之產生序列識 別號2、4、6或8之多肽的方法,並於適當的細胞來源, 例如細菌、酵母菌、真菌或植物細胞進行該方法。亦可使 用定義如上之探針探測產自酵母菌、細菌、真菌或植物細 胞的基因庫以取得包括變異體或物種同源性之菌落。菌落 可用產生本發明多肽的習見技藝操作,然後可用習知的重 -22- 1328612 組或合成的技藝本身製作。 本發明多肽較佳者至少與序列識別號2、4、6或8之 任何蛋白質的各自序列區域中例如一段至少60與至少 100、 150 ; 200、 250 或 300 (或甚至 500、 600、 700 或 8 00 )鄰近的胺基酸或序列識別號2、4、6或8的全長有 70%之序列相似性,更佳者至少80%、至少90%、至少 9 5 %、至少9 7 %或至少9 9 %之序列相似性。在個別地序 列中,序列相似性大槪可爲: (a)以序列識別號2爲例,至少55%、60%或65% t (b )以序列識別號4爲例,至少50%、55%或60% (C)以序列識別號6爲例,至少40%或45% ;及/ 或 (d)以序列識別號8爲例,至少90%、95% ' 98% 或99% (例如超過,或至少比150、170、200或230個 胺基酸還長的序列)。 如此序列識別號2、4、6或8之多肽序列以及變異體 及物種同系物可經修正以作爲本發明之多胜肽。胺基酸取 代物可爲例如多至從1、2或3至10、20、30、50或1〇〇 之取代。亦可製作相同數目之刪除及插入。此類改變可位 於多肽功能關鍵區域之外以及仍可產生有活性的酵素。一 般而言經修正之多肽仍可保留合成酶或轉移酶之活性。 本發明多胜肽包含上述全長多胜肽之片段以及其變異 -23- 1328612 體,包括序列識別號2、4、6或8序列之片段。該片段 典型地仍保留合成酶或轉移酶之活性。片段可至少長50 、100、150、200或250個胺基酸或可少於此數之全長的 胺基酸序列(如展示於序列識別號2、4、6或8)。 如果必要的話本發明多胜肽可用合成的方法製作,雖 然通常彼將用如下列所述之重組方法製作。彼可經修正, 例如添加組氨酸殘基或T7標籤以助於其辨別或純化或經 添加信號序列以促進其分泌至細胞外。 本文術語之變異體"意指其帶有與合成酶或轉移酶 相同的基本特性或基本生物學功能之多胜肽,以及包含對 偶基因的變異體。合成酶的基本特性是展現 6.3. — 例如EC 6.3.1. - ·)活性或可將胺基加至受質(例如醯胺 )的酵素。轉移酶是展現EC 2.7·— (例如EC 2.7.7 或 8·-)或 EC 2.5·—.(例如 EC 2.5.1,一,例如 EC 2.5.1.17 )活性或可將取代基或化學部分從一個化合物轉 送到另一化合物的酵素。較佳之變異體是具有相同活性之 多肽。具有相同基本特性之多肽其可經反應受質降解試驗 確認。 序列識別號2、4、6或8之變異體亦包含變化自序列 識別號2、4、6或8但未必是源自天然酵素之序列。此類 變異體可描述爲序列識別號2、4、6或8之同源性百分比 或具有許多取代的此一序列。此外,變異體可爲雜交至序 列識別號1、3、5或7之編碼的多核苷酸。 該變異體之定義與序列識別號1、3、5或7之變異體 -24- 1328612 的定義相似。如此變異體可包含序列源自其它細菌的品系 。例如丙酸桿菌之變異體。其它變異體可經尋找合成酶或 轉移酶活性確認自其它品系,並加以選殖及定序。變異體 可包含在蛋白質序列中删除、修正或添加單一胺基酸或一 群胺基酸,只要該肽仍維持基本的生物學功能,例如合成 酶或轉移酶。 可例如依據下表製作保守性替換。第二欄之相同方塊 中的胺基酸,較佳者第三欄之同一列,可相互取代。較佳 之取代不會影響多肽之摺疊或活性。
脂肪族的胺基酸 非極性 GAP ILV 極性-不帶電 C S T Μ Ν〇 極性-帶電價 DE KR 芳香族的胺基酸 HFW Y 較短的多肽序列亦屬於本發明範圍。例如,長度至少 50 個胺基酸或多至 60、70、80、100、150、200、400、 500、600或7 00個胺基酸之肽只要顯示基本的合成酶或 轉移酶生物學功能亦屬於本發明範圍。特定言之,但非排 外,本發明特色包含蛋白質是完全蛋白質序列片段之狀況 以及可包含或代表反應受質結合區域、切斷及/或轉移區 •25- 1328612 域。 修正 本發明多胜肽可經化學地修正,例如轉譯後之修正。 例如,彼可包含經修正之胺基酸殘基。彼亦可添加組氨酸 殘基(幫助其純化)或添加信號序列(促進插入細胞膜) 加以修正。多肽可帶有一個或多個(N)胺基一或(c) 竣基-端的延伸端,例如胺基端之甲硫胺酸殘基、·多至約 20 - 25殘基小連結子肽、或可增進純化之(小)延伸端 ,例如多組氨酸或T7標籤、抗原性的抗原決定部位或( 例如麥芽糖)結合結構區14(例如位於C一端)。此類延 伸端可或不可經由連結子加入。 本發明多肽可用透露標籤加以標記。透露標籤可爲允 許偵測多肽之任何適當的標籤。 適當的標記包含放射性同位素,例如1251、35S、酵素 、抗體、多核苷酸以及連結子例如生物素。 多肽可修正成包含非天然胺基酸或增加多肽穩定性。 當用合成的方法製作肽,該胺基酸可在生產期間引入。肽 亦可在合成或重組產生之後加以修正。 本發明多胜肽亦可使用,或包含(一個或多個)β-胺基酸加以製作》 許多側鏈之修正是已知的技藝以及可施用於本發明蛋 白質或肽類之側鏈。該修正包括例如··與醛反應接著用 NaBH4還原,還原院化修正胺基酸、用甲基乙醯亞胺醋醯 -26- 1328612 胺化或用乙酸酐醯化。 本發明提供之序列亦可作爲構築"第二代〃酵素之起 始材料。"第二代〃酵素是經誘變技藝(例如定點突變) 加以改變,其性質與野生型或重組酵素例如本發明製作之 酵素不同。例如,可改變最適宜之溫度或酸鹼度、比活性 '反應受質親和性或耐熱性,以更適於應用至特定之方法 0 因此具有活性所必需的胺基酸,是取代較佳的目標, 其可依據技藝上已知的方法,例如位點定向誘變或丙胺酸 掃描誘變10加以確認。後一技術中,在分子的每一殘基 引入突變,測試產生的突變分子之生物活性(例如合成酶 或轉移酶活性)以確認明分子活性關鍵的胺基酸殘基。亦 可用核磁共振、結晶學或光親合力、標記11,12,13或分子 模型測定之晶體結構分析測定酵素受質交互作用位點。 使用可提供後轉譯修正作用(例如蛋白質水解加工、 十六烷基化作用、糖基化作用、截斷以及酪胺酸、絲胺酸 或蘇胺酸磷酸化作用)的酵母菌及真菌宿主細胞以影響重 組表現本發明產物的生物活性。 本發明多肽可提供其天然細胞環境以外的形式。因此 ’彼實質上可被分離或純化(討論如上)、或製作自天然 上不含此肽之細胞,例如其它細菌、動物細胞、酵母菌、 或真菌。 C.重組特色 -27- 1328612 本發明亦提供包含本發明多核苷酸之載體,其係包括 選殖以及表現載體’以及生長(例如在發生表現本發明多 肽之條件下)、轉形或轉染該載體至適當的宿主細胞的方 法。亦提供包含本發明多核苷酸或載體之宿主細胞,其中 多核苷酸是宿主細胞染色體之異源性的多核苷酸。本文術 語之"異源性〃通常係關於宿主細胞,意指宿主細胞染色 體中非天然發生的多核苷酸或細胞中非天然製作的多肽。 較佳之宿主細胞是細菌的細胞,例如(例如革蘭氏陽性) 丙酸桿菌科細胞。 本發明之多核苷酸可併入重組可複製性的載體,例如 選殖或表現載體。在相容的宿主細胞中載體可用以複製核 酸。如此本發明進一步的具體實施例是提供產生本發明多 核苷酸之方法,其係將本發明之多核苷酸引入可複製的載 體,將載體引入相容的宿主細胞,以及在生長宿主細胞之 條件下複製載體。載體可自宿主細胞中回收。適當的宿主 細胞與表現載體將描述如下。 載體 本發明多核苷酸可插入表現卡式盒。插入表現卡式盒 或本發明多核苷酸的載體可爲任何可方便地使用在重組 DN A方法之載體,載體之選擇經常取決於引入之宿主細 胞。因此,載體可爲獨立自主複製的載體,即存在於染色 體外的載體,其複製與染色體的複製無關,例如爲一種質 體。此外,當載體引入宿主細胞後可插入宿主細胞的染色 -28- 1328612 體’且與彼插入的染色體共同複製。 本發明多核苷酸係操作地聯結至能提供宿主細胞自其 編碼序列表現多肽的調控序列,即該載體是表現載體。本 文術語之a操作地聯結〃意指並置,其中描述之成份爲容 許以其預期的方式作用之關係。調控的序列例如啓動子、 強化子或其他的表現調控信號,係a操作地聯結〃至編碼 序列’其置入方法係足以使控制的序列在相容之條件下表 現其編碼序列。 載體可爲質體、黏接質體、病毒或噬菌體載體,通常 提供複製起始點、可視需要表現多核苷酸之啓動子以及可 視需要之增強子及/或啓動子調節器。可存在終止子序列 ,以及聚腺苷酸化序列。載體可含有一個或多個可選擇的 標記基因,例如抗氨比西林基因(細菌的質體)或新黴素 抗性基因(哺乳動物的載體)。可在活體外使用載體,例 如產生RNA或用以轉染或轉形宿主細胞。彼可包含兩種 或多種本發明多核苷酸,例如用於過度表現。 載體可包含二種、三種或所有四種本發明多核苷酸, 換言之至少二種、三種或四種編碼四種本發明多胜肽(序 列識別號2、4、6以及8,或變異體(片段或其實質上同 源的序列)(定義如前)之聚核苷酸序列。較佳的組合包 含編碼蛋白質B(cobU)以及蛋白質C(cobS),可視需 要具有第三種蛋白質A( cobA/ cbiA )之序列。因此,載 體可包含序列識別號1、3、5及/或7,或其片段,或與 其雜交之序列(如定義於上)。 -29- 1328612 較佳者至少爲相同操縱子(例如操縱子C)內之2、3 以及(最佳者爲)4個多核音酸。 彼可安排而使載體(或宿主)包含操縱子、或包含編 碼一個或多個下列酵素之序列,其次序爲:(核苷醯基) 轉移酶、(醯胺)合成酶、(磷基)轉移酶及/或(核苷 醯基)轉移酶、(芳基)轉移酶。因此,若存在所有四種 多核苷酸’則較佳之順序爲序列識別號7、1、3、5 (或 先前定義之此類序列的變異體)。 引入適當宿主的編碼多肽之DNA序列,較佳者是表 現盒(或建築體)的一部份,其中DNA序列係操作地聯 結至其能直接地在宿主細胞中表現DNA序列之表現訊息 。轉形表現建構體引入適當的宿主時,可使用熟悉此技藝 的專業人士熟知的轉形方法3,4。 轉形宿主之表現建構體可爲攜帶可選擇標記的載體之 一部份,或表現建構體可與攜帶可選擇標記的載體之分開 分子共同進行共轉形的作用。載體可包含一種或多種可選 擇的標記基因。 較佳的選擇性標識15’16包含(但非限於)那些可互 補宿主細胞缺點或賦予藥物抗性的標識。彼包含例如可作 爲轉形之細菌(例如大腸桿菌)、大多數絲狀真菌以及酵 母菌之各種標記基因,例如乙醯胺酶基因或cDNA (構巢 曲菌(A. nidulans)、米曲霉(A. oryzae)、或黒曲霉( A. niger)之 amdS、niaD、facA 基因或 cDNA),或提供 抗生素如G418、潮黴素、博來霉素、康黴素、腐草黴素 -30- 1328612 或免賴得抗性(ben A )之抗性基因》此外,可使用需要對 應的突變宿主品系之專一性選擇標識(例如營養缺陷的標 識):例如URA3 (來自啤酒酵母或其它酵母菌的同功基 因)、pyrG或pyrA (來自構巢曲菌或黑曲霉)、argB( 來自構巢曲菌或黑曲霉)或trpC。在較佳的具體實施例中 ,自轉形的宿主細胞刪除選擇標記之後引入表現建構體以 使取得能產生不含選擇標記基因之多肽的轉形宿主細胞 21.22 〇 其它標識包含ATP合成酶、次單體9(oliC)、乳清 嘧啶-5^磷酸鹽脫羧酶(pvrA),細菌的G4 18抗性基 因(此亦可爲用於酵母菌,但非真菌),抗氨比西林基因 (大腸桿菌)、新黴素抗性基因(桿菌)以及大腸桿菌 uidA基因,編碼β_葡萄糖醛酸苷酶(GUS)之基因。可 在活體外使用載體,例如產生RNA或用以轉染或轉形宿 主細胞。 對大多數的絲狀真菌、酵母菌或細菌而言,載體或表 現建構體較佳者係插入宿主細胞染色體以取得穩定轉形株 。然而,對某些酵母菌而言亦可提供倂入穩定及高度表現 表現建構體之適當的染色體外核酸體型載體,其實施例包 含源自2μ之載體以及酵母菌以及克魯維酵母之pKDl質體 ,或內含ΑΜΑ序列之載體(例如麵菌之ΑΜΑ13·2β)。 在表現構築體插入宿主細胞基因組的案例中,構築體可使 用同源重組作用隨機插入基因組中之基因座,或預定目標 的基因座,在後一案例中,較佳之目標基因座係包含高度 -31 - 1328612 表現的基因。高度表現的基因是傳訊RNA佔總細胞傳訊 RNA的至少0.01% (w/w)之基因(例如在誘發的條件 下),或基因產物佔總細胞蛋白質至少0.2% (w/w)的 基因,或分泌的基因產物其分泌的水準至少爲0.05克/ 升。許多高度表現基因的適當實施例將提供於下。 給定的宿主細胞之載體或表現建構體可包含下列從相 對編碼第一發明多肽密碼股序列之5’端至V—端以連續不 斷的次序相互操作地聯結的元件: (1) 在給定的宿主細胞中能直接地轉錄編碼多肽 DNA序列之啓動子序列; (2) 可視需要,能直接地從給定的宿主細胞分泌多 肽至培養基之信號序列; (3) 編碼成熟的以及較佳者爲多肽活性形式的DNA 序列;以及較佳者亦含有 (4 )編碼多肽DNA序列下游能終止轉錄轉錄之終止 區域(終止子)。 編碼多肽之DNA序列下游可爲內含一個或多個轉錄 終止位點(例如終止子)之 3'未轉譯的區域。終止子 的起點較不重要。終止子可爲例如天然的編碼多肽之 DNA序列。然而,較佳者是在酵母菌宿主細胞中使用酵 母菌終止子以及在絲狀真菌的宿主細胞中使用絲狀真菌的 終止子以及細菌細胞的細菌終止子。更佳者,是宿主細胞 (其中表現編碼多肽之DNA序列)之內生的終止子。 選擇可增加表現的異性調控區域,例如啓動子、及/ -32- 1328612 或終止子區域,亦可達成增強編碼本發明多肽多核苷酸之 表現以及,可視需要增強宿主分泌重要蛋白質的量,及/ 或可提供可誘發本發明多肽表現的控制元件。 除了編碼本發明多肽之基因的天然啓動子以外,可使 用其它啓動子表現本發明之多狀。可選擇在表現宿主中可 有效表現本發明多肽之啓動子。 可選擇在設計上係具有能和宿主細胞相容共存之啓動 子/增強子以及其它表現調控的訊息之表現載體。爲了要 在細菌中有效的進行表現,例如可使用適用於大腸桿菌品 系之啓動子。當在哺乳動物的細胞中進行表現時,可使用 哺乳動物的啓動子。亦可使用組織專一性啓動子,例如肝 細胞細胞專一性啓動子。亦可使用病毒的啓動子,例如 Moloney小鼠白血病病毒長末端重複序列(MMLV LTR) 、Rous肉瘤病毒(RSV ) LTR啓動子、SV40 (例如大的 T抗原)啓動子、人類巨細胞病毒(CMV)IE啓動子 、單純皰疹病毒啓動子或腺病毒啓動子、RSV啓動子例如 HSV IE啓動子、或HPV啓動子,尤其是HPV上游調控的 區域(LTRR )。酵母菌啓動子包含釀酒酵母菌(S. cerevisiae)之 GAL4以及 ADH啓動子、裂變酵母(S. pombe)之nmt 1以及adh啓動子。哺乳動物的啓動子包 含金屬硫蛋白啓動子,其可誘發重金屬例如鎘的反應以及 β-肌動蛋白啓動子。尤佳者爲組織專一性啓動子,尤其 是內皮的或神經元的細胞專一性啓動子(例如DDAHI以 及DDAHII啓動子)。 -33- 1328612 能使用各種可在本發明宿主細胞中直接轉錄的 啓動子15>16。較佳者,啓動子序列係源自之前定義的高度 表現之基因。較佳源自及/或其包含表現構築體嵌入較佳 的預定目標基因座啓動子之較佳的高度表現基因的實施例 包含(但非限於)編碼糖解酵素,例如丙糖一磷酸鹽異構 酶(TPI)、甘油醛磷酸鹽去氫酶(GAPD)、磷酸甘油酸 激酶(PGK)、丙酮酸激酶(PYK)、乙醇脫氫酶(ADH )之基因,與編碼澱粉酶、葡糖澱粉酶、蛋白酶、木聚糖 酶、細胞生物水解酶、β-半乳糖苷酶、酒精(甲醇)氧 化酶、延伸因子以及核糖體的蛋白質之基因。適當的高度 表現基因的特定實施例包含例如:克魯維酵母( Kluyveromyces sp.)之 LAC4 基因、漢遜酵母(Hansenula )以及畢赤酵母(Pichia )之甲醇氧化基因(分別地爲 AOX以及MOX)、黑曲霉(A. niger)以及泡盛曲霉(A. awamori )之葡糖澱粉酶(glaA )基因、米曲霉(A. oryzae)之TAKA澱粉基因、構巢曲菌(A. nidulans)之 gpdA基因以及裡氏木黴(T. reesei)之細胞生物水解酶 基因。 較佳的應用於真菌表現宿主15,16的有力的既存的及 /或可誘發的啓動子之實施例係可得自真菌基因木聚糖酶 (xlnA)、植酸酶、ATP —合成酶、次單體 9(oliC)、 丙糖磷酸鹽異構酶(tpi)、乙醇脫氫酶(AdhA) 、α-澱 粉(amy )、戊基葡萄糖苷酶(AG-來自glaA基因)、 acet醯胺酶(amdS)以及甘油醛-3 -磷酸鹽去氫酶( -34- 1328612 gpd )的啓動子。 有力的酵母菌啓動子之實施例係來自乙醇脫氫酶、乳 糖酶、3 -磷酸甘油酸激酶以及丙糖磷酸異構酶基因。 有力的細菌啓動子的實施例是α -澱粉酶以及SPo2 啓動子,與細胞外蛋白質基因之啓動子。 適用於植物細胞之啓動子包含胭脂鹼合成酶(nos) 、章魚鹼合成酶(ocs)、甘露鹼合成酶(mas )、核酮糖 小次單體(rubico ssu )、組織蛋白、稻米肌動蛋白、菜 豆蛋白:花椰菜鑲嵌病毒(CMV ) 35S以及19S以及環狀 病毒之啓動子,所有此類啓動子均可立即得自已知的技藝 〇 載體可進一步的包含得自RNA鄰接的多核苷酸序列 ,其係包含真核基因體序列(較佳者爲哺乳動物的基因 體序列,或病毒基因體的序列)的同源序列。此將允許真 核細胞或病毒之染色體經同源重組作用引入本發明之多核 苷酸。特定言之,包含表現盒鄰接病毒序列的質體載體可 用以製備適用於運送本發明多核苷酸至哺乳動物細胞的病 毒載體。其它適當的病毒載體之實施例包含單純庖疹病毒 的載體18H9以及反轉錄病毒,包括豆狀病毒、腺病毒、 腺病毒相關的病毒及HPV病毒(例如HPV-16或HPV-18)。對熟悉此技藝的專業人士而言使用此類病毒之基因 移轉術是習知的技藝。例如可使用反轉錄病毒載體將此多 核苷酸以產生反義RNA的方式穩定地整合入宿主基因組 。反之’複製具有缺陷的腺病毒載體則保持基因附體的形 -35- 1328612 式,因此可允許短暫的表現。 載體可含有反義方向之本發明多核苷酸以產生反義 RNA。若必要的話。此可用以降低多肽表現之含量。 在細菌中’可使用特別的載體,例如表現載體或質體 。丙酸桿菌的適當載體以及表現系統是已知的技藝2 7,2 8,3 〇 。例如可使用來自另一種丙酸桿菌(例如酸性丙酸桿菌) 之質體。此質體可用於製備內含酸性丙酸桿菌(P. acidipropionici )質體六個開放編閱架構中的一個或多個 開放編閱架構之穿梭載體(例如PPK705)。載體可含有 藥物標記,例如抗潮黴素(hygromycin) B基因。此載體 已成功地轉形入費氏丙酸桿菌謝氏亞種。該轉形可經電穿 孔法進行。 可使用尤其是適用於丙酸桿菌(尤其是費氏丙酸桿菌 謝氏亞種)之許多啓動子。此類啓動子包含丙酸桿菌啓動 子P4以及P138。 此外,可使用一個或多個丙酸桿菌內生性的質體,或 源自該質體之載體,以在細菌中表現較佳之異性蛋白質。 該質體以及載體是習知的技藝29以及可爲基於丙酸桿菌 LMG16545 C 寄存編號 CBS 101022 以及 CBS 101023)之 質體。 宿主細胞以及表現 本發明進一步的特色是提供製備依據本發明多肽之方 法,其係在(以載體)表現依據本發明之多肽之條件下培 -36- 1328612 養宿主細胞(例如轉形或轉染說明如上之表現載體)以及 可視需要回收表現的多肽。本發明之多核苷酸可倂入重組 可複製性的載體,例如表現載體。在相容的宿主細胞中載 體可用以複製核酸。其可至少含有一個本發明多核苷酸之 複本(例如多重複本)。如此本發明進一步的具體實施例 是提供產生本發明多核苷酸之方法,其係將本發明之多核 苷酸引入可複製的載體,將載體引入相容的宿主細胞,以 及在生長宿主細胞之條件下複製載體。載體可自宿主細胞 中回收。適當的宿主細胞包含細菌,較佳者革蘭氏陽性 細菌例如丙酸桿菌科之細菌。其他可包含大腸桿菌、酵母 菌、哺乳動物的細胞系以及其它真核細胞株,例如昆蟲 細胞例如Sf9細胞以及(例如絲狀的)真菌細胞。 多肽係製作成分泌的蛋白質,此案例中表現建構體中 編碼成熟多狀形式的DNA序列可操作地聯結至編碼信號 肽的DNA序列。較佳者該信號序列是編碼多肽的天然( 同源的)DNA序列。此外,信號序列可爲編碼多肽的 DNA序列之外來的(異性的)序列,在此案例中,較佳 之信號序列是表現DNA序列的宿主細胞之內生性序列。 適當的酵母菌宿主細胞信號序列之實施例是源自酵母菌α -因子基因之信號序列。同樣地,絲狀真菌宿主細胞的適 當信號序列可爲例如源自絲狀真菌澱粉葡糖苷酶(AG) 基因(例如黑曲霉之glaA基因)之信號序列。可使用薇 粉葡糖苷酶(亦稱爲(葡糖)澱粉酶)啓動子本身之組合 ,以及與其它啓動子之組合。本發明中亦可使用混合的信 -37- 1328612 號序列。 適當的異生性的分泌前導序列係源自真菌的澱粉葡糖 苷酶(AG)基因(glaA - 18以及24個胺基酸之版本,例 如源自曲霉屬)、α -因子基因(酵母菌例如酵母菌以及 克魯維酵母)或α -澱粉酶基因(芽胞桿菌屬)。 該載體可轉形或轉染入說明如上之適當的宿主以表現 本發明多肽或產生維生素Β12。該方法可包含在表現編碼 序列載體之編碼多肽的條件下培養轉形入上述表現載體之 宿主細胞。 如此本發明進一步的特色是提供轉形的或轉染包含本 發明之多核苷酸或載體的宿主細胞。較佳之多核苷酸內含 複製多核苷酸以及表現多肽之載體。可選擇與該載體能相 容共存之細胞,例如原核的(例如細菌的)、真菌的、酵 母菌或植物細胞。 本發明包含使用編碼多肽之DNA序列進行重組表現 以產生本發明多肽之方法。爲了達成此目的,本發明 DNA序列進行基因擴增及/或交換表現訊息(例如啓動 子、分泌信號序列)以在適當的同源或異性的宿主細胞中 經濟的產生多肽。同源的宿主細胞之定義是相同種之宿主 細胞或DNA序列源自相同種之變異體。 適當的宿主細胞爲原核的微生物例如:細菌,或真核 的生物體,例如:真菌例如酵母菌或絲狀真菌,或植物細 胞。一般而言,酵母菌細胞比真菌細胞好,因爲彼易於操 作。然而,一些蛋白質不是在酵母菌中分泌太差,不然就 -38- 1328612 是加工不適當(例如在酵母菌中過糖基化)。在此類實例 中可選擇真菌的或細菌的宿主生物體。爲了產生維生素 b12,較佳的是原核或細菌的宿主。 宿主細胞可過度表現多肽,以及過度表現多肽是熟知 的技藝3。宿主可具有兩個或多個編碼多核苷酸複本(據 此載體可具有兩個或多個複本)。 來自桿菌屬之細菌爲適當的異生性宿主,因爲其可分 泌蛋白質至培養基。其它適當的細菌宿主是來自鏈黴菌以 及假單胞菌屬。然而,較佳之宿主是來自得到本發明多核 苷酸之費氏丙酸桿菌的相同目(例如放射菌目( Actinomycetales ) ) 或科(丙酸桿菌科 (
Propionibacteriaceae))之細菌。 表現編碼本發明多肽DNA序列之較佳的酵母菌宿主 細胞爲酵母菌 (Saccharomyces )、克魯維酵母( Kluyveromyces)、漢遜酵母(Hansenula)、畢赤酵母( Pichia )、蓍草酵母(Yarr o wia )、以及裂殖酵母( Schizosaccharomyces)。更佳之酵母菌宿主細胞,係選自 :釀酒酵母(Saccharomyces cerevisiae)、乳酸克魯維酵 母(Kluyveromyces lactis)(亦爲習知的克魯維酵母乳酸 亞種(Kluyveromyces marxianus var. lactis ))、多形漢 遜酵母(Hansenula polymorpha )、巴斯德畢赤酵母( Pichia pastoris)、解脂蓍草酵母菌(Yarrowia lipolytica )、及粟酒裂殖酵母(Schizosaccharomyces pombe) β 然而最佳地是(例如絲狀的)真菌宿主細胞。較佳的 -39- 1328612 絲狀真菌宿主細胞係選自:曲霉屬(Aspergillus)、木霉 屬(Trichoderma)、鐮孢屬(Fusarium)、雙側孢黴屬( Disporotrichum )、青霉屬(Penicillium)、頂孢菌屬( Acremonium)、脈孢菌屬(Neurospora)、嗜熱子囊菌屬 (Thermoascus)、毀絲霉屬(Myceliophtora)、孢子絲 菌屬(Sporotrichum)、梭孢殻屬(Thielavia)、及塔拉 霉屬(Talaromyces )。更佳之絲狀真菌宿主細胞是稻米 麹黴(Aspergillus oyzae)、大豆麴黴(Aspergillus sojae )、構巢曲霉、或黑曲霉群。23此類菌種包含(但非限於 ):黑曲霉、泡盛曲霉、塔賓曲霉(Aspergillus tubingensis)、棘抱曲霉(Aspergillus aculeatus)、麵徽 屬(Aspergillus foetidus )、構巢曲霉、日本麹菌( Aspergillus japonicus )、米麹黴以及無花果曲霉( Aspergillus ficuum ),以及進一步的其係包含:裡氏木黴 、禾穀鐮刀菌(Fusarium graminearum )、產黃青黴( Penicillium chrysogenum )、阿拉巴馬枝頂孢菌( Acremonium alabamense )、粗糖脈孢菌(Neurospora crassa)、嗜熱毀絲霉(Myceliophtora thermophilum)、 嗜纖維孢子絲菌(Sporotrichum cellulophilum)、兩形孢 雙側孢黴(Disporotrichum dimorphosporum)以及陸生梭 抱殼(Thielavia terrestris)。 本發明範圍內表現宿主的實施例是:真菌,例如麴黴 31 32及木霉屬:細菌,例如桿菌33’34例如枯草芽孢桿菌 (Bacillus subtilis )、地衣芽胞桿菌(Bacillus -40- 1328612 licheniformis )、解澱粉芽孢桿菌(Bacillus amyloliquefaciens)、假單胞菌;以及酵母菌例如克魯維 酵母3 5 ’例如:乳酸克魯維酵母3 6以及酵母菌,例如釀 酒酵母。 培養宿主細胞以及重組產生:[cobA或cbiA] 本發明亦包括經修正以表現本發明多胜肽之細胞。較 佳者宿主將具有至少二套、或多套的多核苷酸。該細胞包 含短暫的、或較佳者穩定的高等真核細胞株,例如哺乳動 物的細胞或昆蟲細胞、較低等的真核細胞,例如酵母菌及 (例如絲狀的)真菌細胞或原核細胞例如細菌的細胞(例 如放射菌目)。 本發明蛋白質亦可能在細胞株或膜,例如桿狀病毒的 表現系統中進行短暫的表現。 依據本發明,可在習見的營養性發酵培養基中培養帶 有轉形的一個或多個多核苷酸之本發明微生物的表現宿主 以產生本發明多肽。 依據本發明之重組宿主細胞可用技藝上已知的方法培 養。在各啓動子組合以及宿主細胞中,培養條件爲有助於 表現編碼多肽之DNA序列及/或產生維生素B12之條件 。達成所要求的細胞密度或滴度之後,可停止培養並用習 知的方法回收多肽或維生素。 發酵培養基可包含碳源(例如:葡萄糖、麥芽糖、糖 蜜、纖維素、P-葡聚糖等)以及(無機)源(例如:硫 -41 - 1328612 酸銨、硝酸銨、氯化銨等)及/或(有機的)氮來(例如 :酵母菌抽出物、麥芽抽出物 '蛋白腺等)。可含有無機 的營養來源(例如:磷酸鹽、鎂、鉀、鋅、鐵、等)及/ 或誘導物(例如:纖維素、β-葡聚糖、麥芽糖或麥芽糖 糊精)。 適當培養基的選擇可基於表現宿主及/或基於表現建 築體的調控需求。該培養液爲熟悉此技藝的專業人士習知 的培養液。培養基可視需要含有附加的成份使轉形的表現 宿主比其它可能地污染微生物更具生長優勢。 發酵可進行 〇·5- 30天。發酵可爲批次、連續或分 批進料,適當地溫度介於0至45 °C之間,酸鹼度介於例 如2至10之間。較佳的發酵溫度介於20至3 7°C之間及 /或酸鹼度介於3至9之間。適當的條件的選擇通常是基 於選擇之表現宿主以及表現的蛋白質。 發酵之後,如果必要的話可使用離心或過濾自發酵培 養液中移除細胞。發酵停止之後或去除細胞之後,然後可 回收本發明之多肽,視需要用習見的方法純化及分離。 D.使用生物合成途徑之多肽以及產生維生素B12 (反應 /酵素) A醯胺化作用((醯胺)合成酶) 本發明額外的特色係關於醯胺化方法,或製備胺, 該方法包含接觸反應受質與本發明多肽。因此該方法包 括醯胺化受質。較佳之多肽爲合成酶,例如醯胺合成酶。 -42- 1328612 彼可爲具有序列識別號2之序列,或其變異體或片段(定 義如上),例如在第一個特色中之多肽。此外,多肽可爲 分歧桿菌科細菌(例如丙酸桿菌屬,尤其是費氏丙酸桿菌 )之合成酶。 該方法可在麩胺醯胺存在下進行。反應中麩胺醯胺可 轉換成麩胺酸鹽。多肽能將羥基轉換成胺,或將羧基( COOH )轉換成殘醯胺基團(CONH2)。因此該方法之產 物爲一級胺。 可重覆該方法,由於多肽可醯胺化反應受質兩次,換 言之可在受質上產生二個(較佳者一級)胺基取代基。 因此該方法可將第一個羧基轉換成羧醯胺基。可重覆該方 法’並將第二個羧基轉換成羧醯胺基。此方法中可醯胺化 兩次,例如產生二個分開的(例如一級)胺。第二個醯胺 化作用較佳者是發生在受質上的不同取代基(例如羧基) 〇 較佳者’反應受質是鈷啉胺酸或鈷啉胺酸C -醯胺及 /或產物是鈷啉胺酸c一醯胺或鈷啉胺酸_a,c一二醯胺 。此反應中麩胺酸可轉換成麩胺酸鹽。麩胺醯胺之添加或 存在量大約爲鈷啉胺酸之兩倍(換言之,麩胺醯胺之莫耳 濃度約爲鈷啉胺酸莫耳濃度之兩倍)。因爲鈷啉胺酸先醯 胺化成鈷啉胺酸c-醯胺,其可作爲中間物,然後在第二 醯胺化反應中鈷啉胺酸c -醯胺可醯胺化以生成鈷啉胺酸 a ’ c _二醯胺。 因此’此方法中較佳之多肽是鈷啉胺酸a,c -二醯 -43- 1328612 胺合成酶(例如cobA或cbiA)。該多肽可帶有EC 6.3.1. —.之活性。 BI (磷基)轉移酶(磷酸化):[c〇b U] 本發明亦關於磷酸化,或製備內含磷酸鹽化合物之方 法’該方法包含接觸反應受與本發明多肽。較佳之多肽 者包含序列識別號第4號之多肽或其變異體或片段(定義 如上)。此外,多肽可爲分歧桿菌科細菌(例如丙酸桿菌 屬,尤其是費氏丙酸桿菌)之磷酸轉移酶。如此該方法包 含磷醯化(或加上一個磷酸鹽基團)至受質。 該方法可在核苷醯基(例如三)磷酸鹽,例如ATP 存在下進行。反應受質可包含核苷酸,例如包括腺嘌呤核 苷。 較佳之方法包含轉移(從一個化合物轉移至另一個化 合物,例如轉移至受質)磷酸鹽部分,例如磷酸化羥基( 〇H)以形成磷酸鹽基(―P〇_4)。如此多肽可爲磷酸轉 移酶以醇基(例如羥基)作爲受體。 較佳之反應受是腺苷基鈷咐醇醯胺(式II)及/或產 物是腺苷基鈷啉醇醯胺磷酸鹽(式ΠΑ)。該方法可額外 地包含將核苷酸三磷酸鹽轉化成核苷酸二磷酸鹽(例如, 將ATP轉化成ADP ) »因此該多肽可爲鈷啉醇醯胺磷激 酶(例如cobU)。較佳者具有EC2.7.1·—.活性。 B2 (核苷醯基)轉移酶(核苷醯化作用) -44- 1328612 本發明之此特色亦關於核苷醯化,或製備內含核苷_ 基化合物之方法,該方法包含接觸反應受與核苷酸轉移酶 多肽。此多肽與描述於以上B1者相同。因爲(第二)酵 素(稱爲B)具有雙重功能,故爲雙功能酵素》 如此酵素B可作爲普通的轉移酶,轉移磷酸鹽基團與 核苷醯基。因此可作爲磷酸轉移酶(B1)以及作爲核苷_ 基轉移酶(B2 )。 第二種功能(稱爲B2)係關於內含核苷醯基之轉移 酶的酵素活性。 因此,較佳之方法包含核苷醯基化受質,例如胍基化 (受質)。較佳之反應受質包含至少一個磷酸鹽基團。適 當的多肽能核苷醯基化磷酸鹽基團。 該方法可在核苷基(例如三磷酸鹽,例如GTP )存在 下發生。如此在該方法中,多肽較佳者係催化磷酸鹽基團 之胍基化。 較佳之反應受是腺苷基鈷啉醇醯胺磷酸鹽(式IIA) 及/或產物是腺苷基一 GDP—鈷啉醇醯胺(式ΠΒ)。如 此該酵素可催化反應受質例如腺苷基鈷啉醇醯胺磷酸鹽形 成內含核苷醯基之化合物,例如腺苷基GDP-鈷啉醇醯胺 。如此多肽可爲(核苷醯基)轉移酶,或具有EC 2.7.7. -.之活性。多肽其它較佳的特色描述於以前磷酸轉移酶 活性(B I)的部分。 C芳基化(芳基轉移酶)或核氮唑(ribazole)加成: -45- 1328612 [cobS] 本發明方法包含芳基化,或製備內含芳基化合物之方 法,該方法包含接觸反應受質與本發明多肽,較佳者(例 如芳基)轉移酶。較佳之多肽者包含序列識別號第6號之 多肽或其變異體或片段(定義如上)。此外,多肽可爲分 歧桿菌科細菌(例如丙酸桿菌屬,尤其是費氏丙酸桿菌) 之芳基轉移酶。如此該方法包含芳基化受質。 芳基部分(例如核氮唑(ribazole ),可在反應時轉 移)包含芳香族胺基酸環系統。芳基部分可包含一或二個 芳香族胺基酸環。環系統可經一至四個烷基取代。 芳基部分可包含無、一或二個雜原子,例如一或二個氮原 子。較佳之芳基部分包含苯并咪唑環。因此該方法包含製 備內含(例如二甲基)苯并咪唑(DMB )之化合物。 芳基團可鍵結至或相聯至(中心)金屬,例如鈷原子 。此外,芳基團可鍵結至碳原子,例如核糖基團之碳原子 。較佳之芳基部分係鍵結至鈷原子及核糖基團(在反應之 產物中稱爲產生之內含苯并咪唑的化合物)。 該方法可在核氮哩(ribazole),例如α —核氮哩( ribazole)之存在下發生。其存在量大約與受質等莫耳濃 度。反應可包含α —核氮唑(ribazole )加成(至受質) 〇 較佳之反應受質是腺苷基- GDP -鈷胺醯胺。反應之 產物(內含芳基之化合物),較佳者是腺苷基—5,6—二 甲基苯并咪唑基鈷胺醯胺(式IIC)。進行反應時,核 -46- 1328612 氮哩(ribazole)可被轉換成GMP。 本方法中較佳之多肽是氰鈷胺素(5f -磷酸鹽)合成 酶(例如cob)。多肽可帶有EC 2-7.8—.——·之活性。 D腺苷基化(腺苷基轉移酶) 本發明方法包含腺苷基化,或製備內含腺嘌呤核苷化 合物之方法,該方法包含接觸反應受質與本發明多肽,較 佳者是轉移酶,例如腺苷基轉移酶。較佳之多肽者包含序 列識別號第7號之多肽或其變異體或片段(定義如上)。 此外,多肽可爲分歧桿菌(Mycobacteriaceae)科細菌( 例如丙酸桿菌屬,尤其是費氏丙酸桿菌)之轉移酶。如此 該方法包含腺苷基化受質。 因此該方法包含轉移腺嘌呤核苷(較佳者)至受質。 較佳者腺嘌呤核苷可結合至金屬原子,例如過渡金屬(例 如第一系),例如鈷。 反應受質(及/或產物)可爲醯胺,例如二醯胺。較 佳之反應受質是鈷啉胺酸a,c二醯胺及/或產物是腺苷 鈷啉胺酸a,c二醯胺。 該方法可在核苷基(例如三磷酸鹽,例如ATP )存在 下發生。亦可在腺嘌呤核苷存在下發生。較佳者,腺嘌呤 核苷以及核苷基磷酸鹽之量大約與受質等莫耳濃度。核苷 基三磷酸鹽可轉換成核苷基二磷酸鹽。 較佳者本方法中之多肽是腺苷基轉移酶。彼帶有 EC 2.5.1.7之活性。較佳之多肽是能轉移甲基之外的烷基 -47- 1328612 或芳基之轉移酶。如此可排除甲基化,或導致甲 之胜肽。 受質(或催化反應產物):維生素b12中間 前驅物 較佳之反應受質及/或產物包含咕啉核心或 較佳者,彼包含多至四個環(可爲相同或不同) 系統。然而較隹者是具有四個相同的環。各環可 二個雜原子,例如一個氮原子。環可爲五員環。 的環是吡咯,以及較佳之該環系統包含四吡咯系 者是二個吡咯環相互相聯,以及另外二個吡咯環 如甲烯單位)相聯。 環系統可包含金屬原子,例如位於其核心。 爲過渡金屬,例如第一系(基團VIII)。彼可屬 期。較佳之金屬是鈷,以及彼可爲單一中心的鈷 系統可附著至醯胺、磷酸鹽、胍基或腺苷基部分 除了金屬原子以及環系統以外,可有第五、以及 甚至是第六個取代基,例如結合至金屬。各取代 環平面以上及/或低於環平面,二者均可採用。 以及當爲維生素B12)時,此類取代基之可包含 ,例如二氧基核苷基,較佳者爲V -二氧基腺 。另一取代基可爲定義如以上C節芳基化中之芳 因此較佳之取代基可包含二甲氧基苯并咪唑。在 使用之受質,可存在一或二個取代基,以使鈷原 第五以及第六個取代基,5^-二氧基腺嘌呤核苷 基化作用 物及/或 環系統。 之芳基環 含有一或 如此較佳 統。較佳 經橋(例 此金屬可 於第四週 原子。環 或基團。 可視需要 基可位於 適當的( 核苷基團 嘌呤核苷 基部分。 本發明中 子可帶有 以及二甲 -48- 1328612 氧基苯并咪唑基團。只要不是受質,相同較佳的特色亦適 用於反應之產物。 以下列出維生素B12生物合成途徑酵素所拌演的角色 之後的五個催化反應或生物合成步驟之受質及產物。
A(cobA) Uro III— 酵素公式 俗名 I 鈷啉胺酸 B(cobU) C(cobS) ►鈷啉醇醯胺—鈷啉醇醯胺-P—維生素b12 反應/生物合成的步驟: 丄 A 醯胺合成酶
IA
IB
1C 鈷啉胺酸C-醯胺 I 鈷啉胺酸a,c-二醯胺 I 腺苷基鈷啉胺酸a,c-二醯胺 A 醯胺合成酶 D (腺苷基)轉移酶 II 腺苷基鈷啉醇醯胺 1 (cobU)IIA 腺苷基鈷啉醇醯胺磷酸鹽 i (cobU)IIB 腺苷基-GDP鈷胺醯胺 1 轉移酶 腺苷基-5,6-二甲基苯并咪唑基 (cobS)IIC 鈷胺醯胺(維生素B丨2) B1 (磷基)轉移酶 B2 (核苷醯基)轉移酶 C (苯并咪唑基) -49- 1328612 較佳的中間物或前驅物包含鈷啉醇醯胺、鈷啉醇醯胺 —P (磷酸鹽)或式ΙΑ、1B、II、IIA、IIB或IIC之化合 物。 因此本發明之方法可包含一個或多個以下之步驟(使 用化學式說明),其爲:
式I
丄(醯胺)合成酶(A) (序列識別號2,或其變異體) -50- 1328612 式ΙΑ
丄(醯胺)合成酶(A) (序列識別號2,或其變異體)
式IB
co2h (if列識別號8,變異體) -51 - 1328612 式ic
co2h 式π
“碟基讎酶(Bl) 辟列識別號4,或其變異體) -52- 1328612 式ΠΑ
CONH2 (核苷醢基)轉移酶((B2) (序列識別號4,或其變異體) -53- 1328612 式ΠΒ
CONH2 (苯并咪唑基)轉移酶(c) 辟列識別號6,或其變異體) -54- 1328612 式nc(包括維生素b12)
conh2 E.工業上製備維生素B12 如上述之說明,本發明多胜肽可用來進行製備維生素 B12路徑的一個或多個生物合成步驟。多肽可接觸適當的 反應受質並發生反應。當多肽位於(例如宿主)細胞之外 亦可發生該反應,換言之將多肽與受質例如在體外混合。 然而’使用包含一個或多個本發明多胜肽之本發明宿主細 胞將更有效,以進行一個或多個維生素B12生物合成途 徑中所要求的步驟,或較佳者使用宿主細胞產生維生素 Bn (或中間性質或其前驅物)。 @此本發明亦關於製備維生素B12(或其前驅物)之 -55- 1328612 方法,該方法包含在允許細胞生物合成(因此製造) 素b12(或前驅物)之條件下培養一種或多種本發明 細胞。 該方法可使用發酵槽。發酵槽可裝有攪拌裝置, 攪拌器。發酵槽容器亦可裝有通氣裝置,例如造成內 之空氣與發酵槽內之液體接觸的裝置。液體通常是液 養基,內含細胞的懸浮溶液。然後可發生發酵。發酵 最小體積爲10、50、100或1,000公升。 在發酵開始之前、發酵開始時、或連續發酵地期 細胞可提供的一種或多種碳及/或氮源。 發酵後,停止供應碳或氮源,或用盡一種或多種 來源。各碳及/或氮源可爲複雜的來源或有機的或無 合物。 然後可自發酵槽移除細胞。在移除細胞之前或之 可自細胞移除水(或水溶液)。然後可將細胞加熱每 以殺死細胞。 從微生物的細胞萃取或分離維生素B12是熟知的 法45。例如(爲了能夠取得維生素B12),較佳者是 (或至少局部地打開)製作維生素的宿主細胞,而使 內至少部份之可溶解的內含物(包含維生素B12)釋 液體,例如細胞內含之液體。然後從液體(包含維 B12)中可分開打開的或破的細胞,或產生的細胞碎 如此處理的微生物細胞(其中內含維生素Bl2)可導 胞膜之破壞。打開細胞適當的處理包含熱處理’例如 維生 宿主 例如 含氧 體培 槽之 間, 此類 機化 後, 滅菌 方 打破 細胞 出至 生素 片。 致細 巴斯 -56- 1328612 德式處理、高壓滅菌器加熱、溶菌酵素(例如 理、及/或機械性的破壞細胞(硏磨,或使用 化學藥品處理(以導致細胞溶解,例如使用兩 劑或有機溶劑)。 溶解或其它膜破壞方法可產生溶解液,然 固態及液相。然後可分離(從內含維生素b12 解液中包含之固相細胞碎片。有許多適當的固 離技藝,包括離心及/或過濾。然而較佳者之 離是使用超瀘法進行。 較佳者,將打開/打破微生物的細胞清洗 在液體(內含維生素B12)中合併或添加入洗 細胞碎片。適當地清洗包含以去離子水進行之 然後可將內含(維生素b12)之透析過濾物與 素B12)之液相合倂。 然後可將內含維生素B12之液體乾燥,例 、流體-床乾燥、冷凍乾燥或真空乾燥。 較佳者,在打開(溶解)產生維生素b12 清洗,因爲去除培養基成份可增加乾燥物質 濃度。此可使用透析過濾進行,較佳者使 〇 較佳的特色以及本發明特色之一是採用在 必要的修正的另一特色。 【實施方式】 溶菌酶)處 剪力)、或 性介面活性 後可分離成 之液體)溶 體-液體分 固態液體分 ,以及然後 滌劑,分離 透析過濾。 (內含維生 如噴霧乾燥 之細胞前先 中之維生素 用去離子水 細節上已作 -57- 1328612 本發明將用下列實施例加以描述’其僅預期用以說明 而非限制。 實施例1 丙酸菌載體 使用具有相同2個質體之質體圖譜的二種品系(費氏 丙酸桿菌LMG1 6545以及費氏丙酸桿菌LMG1 6546 )。一 個質體較大以及另一個較小’屬於高豐度的質體大小約 3.6仟鹼基。選擇此類來自LMG 1 6545以及LMG1 6546之 3.6仟鹼基之質體作爲進一步的使用的載體。此類載體之 質體已描述於29。丙酸桿菌表現系統是已知的技藝3(5。 構築大腸桿菌/丙酸桿菌穿梭載體 將來自紅色糖多孢菌(Saccharopolyspora erythraea )NRRL23 3 8紅黴素生物合成群以及內含紅黴素抗性授與 基因37,37,38之1.7仟鹼基Acc651片段插入的Acc651線 性化之PBR3 22AI29。然後將此新建築體(名稱爲pBRES )用RcoRV線性化以及連結至用BsaBI水解之p5 45 DNA 。發現具有正確的雙向插入體之載體的大腸桿菌轉形株。 產生的質體載體稱爲PBRESP36B 1以及pBRESP36B2 (參 閱圖2a以及2b29)。 亦得到以P545DNA在假定的複製區域以外其它限制 位點線性化之質體載體構築體,稱爲AIwNI。此建築中 pBRES載體必須提供適當的選殖位點。設計接合器並將寡 -58- 1328612 體徐冷創造出分別具有Acc651及Bgf黏性端地雙股 DNA片段,其內更含有一個Sfil限制位,其可提供與 AIwNI水解 p545質體相容的端點。將接合器選殖入 pBRES的Bglll以及鄰近的Acc65I位點之間。如此得到 pBRES - Sfi載體,接著用 Sfil水解以及連結至 AIwNI 水解的p545。轉形大腸桿菌,以限制酶分析証實正確的 轉形株。得到的載體稱爲PBRESP36A29。 用大腸桿菌/丙酸桿菌穿梭載體轉形丙酸桿菌 描述以 PBRESP36B 1 轉形費氏丙酸桿菌菌株 ATCC6207。 將細菌的細胞培養於SLB (乳酸鈉液體培養基39,30 °C下)至靜止生長相,以及接著用1 : 50新鮮的SLB稀 釋。30°C下培育約20小時之後,收穫細胞(目前在指數 生長相)以及用冷卻的0 · 5莫耳濃度蔗糖廣泛地清洗。接 著細胞用電穿孔緩衝液(0.5莫耳濃度蔗糖,以1毫莫耳 濃度乙酸鉀緩衝,酸鹼度5.5)清洗一次,最後再懸浮於 電穿孔緩衝液,約1/100原本的培養體積。在全部過程 中將細胞保持於冰浴內。 進行電穿孔法(儀器來自BIORAD)時,將80— 100 微升之細胞與±1微克之DNA (或較小量)懸浮於冷卻的 1或2厘米電穿孔透明小容器,以及運送一個電脈衝。最 佳的脈衝條件爲25 kV/公分,電組爲20 ΟΩ,電容爲 25 0。然而,較低以及較高的電壓(亦爲1〇〇Ω )亦可產 -59- 1328612 生轉形株。 脈衝之後,在懸浮液中添加入900微升內含0.5 濃度蔗糖之冷卻的 SLB,並在30 °C下培養2.5至3 ,接著塗片至內含0.5莫耳濃度蔗糖及10微克/毫 黴素之SLB/瓊脂平皿》3 0°C、缺氧情況之下培養5 天之後,偵測轉形株。 自大腸桿菌DH5a(Promega)分離之DNA,轉 率爲20 — 30轉形株/微克DNA。自大腸桿菌 JM1 dam- , dcm ~ 品系)分離之 DNA,轉形效率爲 10-倍的高效率。大腸桿菌轉形是依據 BI OR AD之說明。 轉形株內含的真實載體,與轉形ATCC6207之原 質體DNA無法區別。其可以小量分離步驟分離的 DNA經限制酶分析分離自轉形株質體DNA加以証實< 載體僅爲自主複製質體。用分離的總DNA進行 墨點雜交4()顯示染色體DNA不會與載體DNA探針 ,顯示沒有發生染色體嵌入質體DNA的現象。 載體PBRESP36B2以及PBRESP36A之轉形亦得 功,顯示載體的官能性與p545之方向或選殖位點無 在此案例中亦証實載體之確實性。 此外,用分離自丙酸桿菌轉形株之DNA轉形費 酸桿菌菌株ATCC6207’其結果比用分離自大腸 DH5a之DNA在轉形效率上高出1〇5 — 106倍。 轉形另一費氏丙酸桿菌菌株LMG 16545 (得到 質體之相同菌株),其轉形效率與 ATCC品系相當。 莫耳 小時 升紅 至7 形效 10 ( -100 本的 質體 > 南方 雜交 到成 關。 氏丙 桿菌 p545 -60- 1328612 使用各序列識別號1、3、5以及7操作地聯結至適當 的轉錄以及轉譯作用起始訊息之穿梭載體進行重覆轉形° 實施例 2 構築內含醯胺合成酶(A)基因之質體載體 以下將描述建築以及應用質體載體以增加費氏丙酸桿 菌菌株ATCC6207合成維生素B12(鈷胺素)之水準 使用費氏丙酸桿菌之16S rRNA啓動子構築過度表達 基因之質體。測驗帶有啓動子片段之策略之一是使用啓動 子探測載體。以編碼不存在於野生型品系之容易偵測的酵 素活性之報導基因監測啓動子的活性。以來自pACYC 1841142之cat (氯黴素乙醯基轉移酶)基因構築啓動子 探測載體。爲了分析16S rRNA啓動子活性,該啓動子係 置於cat基因上游。
爲了構築啓動子-探測載體,將無啓動子之cat基因 用 PCR 選殖入大腸桿菌/丙酸桿菌穿梭載體 PBRESP36B229,產生載體pB2/P〇CAT。PCR弓f子上游包 括序歹!J 5,-GGGATCCTCTAGAGCATGCAAGCTTCTCGAGAA TCGATAGATCTCTAAGG AAGCTAAAATG - 3 f > 其中最後 三個核苷酸爲cat基因之起始密碼子。此源自合成的序列 包括多選殖位點(MCS ),其中內含限制位點BamHI、 Xbal ' Hindlll 、SphI、Xhol、Clal 以及 Bglll。PCR 下 游引子包括BamHI限制位點。PCR放大之後將cat基因 以BamHI片段選殖入載體之Bglll位點(喪失 B arnH I -61 - 1328612 以及Bglll位點)。得到二種cat基因方向。使用cat基 因方向與β內醯胺酶基因相同方向的PBR322片段作 進一步的實驗。 基於費氏丙酸桿菌ATCC6207之16S rRNA序列(基 因資料庫寄存編號 X5 3 2 1 7 )選擇適當的限制酶(Hindlll )以及設計可經倒轉PCR2放大的包含啓動子之大約3仟 鹼基區域的適當PCR引子。從PCR片段中分離出6S rRNA編碼序列上游的0.6仟鹼基SphI- HindIII片段。將 此片段與相同酵素水解之PB2/ PoCAT連結產生之質體稱 爲pB2/ PrRNACAT。轉形大腸桿菌之後得到氯黴素抗性 轉形株。轉形費氏丙酸菌菌株ATCC 6207之後,僅於內 含紅黴素之平板得到菌落,而非從內含氯黴素之平板。然 而,當劃線在內含氯黴素之平板上時,內含 PB2/ PrRNACAT之轉形株可生長而內含〃 pB2 / PoCAT之 ATCC6207細胞則不會生長,如此在費氏丙酸菌中顥示 1 6S rRNA之官能性。 內含16S rRNA啓動子但缺少cat基因之表現載體其 構築係聯接來自費氏丙酸桿菌內含16S核糖體RNA啓動 子載體 pB2/PrRNACAT 之大約 700 bp 的 BamHI-Bglll 片段進入PBRESP36B2之獨一無二的Bglll位點。得到二 種啓動子可能之方向的載體。當該核糖體的啓動子進行表 現轉錄基因被不適當的終止時,若核糖體的啓動子走向此 類複製基因,經由該讀取可阻塞丙酸桿菌複製子中二個複 製基因之轉錄。因此可使用啓動子選殖成相反的方向的載 -62- 1328612 體(pBRESP36B2pI6SH)作進一步的實驗。啓動子下游 獨一無二的Bglll位點可作爲表現型基因庫之選殖。 實施例3 從當的引子經PCR產生腺苷基轉移酶(D,序列識別 號7 )。上游PCR引子包括內含Bglll限制位點的5'延伸 端以及基因起始密碼子上游之核糖體結合部位。PCR下游 引子包括內含Bgl II限制位點的5'延伸端。放大的片段用 Bglll酶切消化之後,將該片段連結入用Bglll水解以及 去磷酸化去除51磷酸鹽基團的載體pBRESP36B2pl6Sl·^ 轉形大腸桿菌之後得到氨比西林抗性菌落。可觀察到相對 於載體的雙方向選殖片段。然而,僅以16S rRNA啓動子 直接位於核糖體結合部位上游的建構體表現腺苷基轉移酶 基因。 將後一建構體如前述之描述轉形入費氏丙酸桿菌 ATCC6207。轉形株中合成維生素B12之水準測定如下: 將冷凍培養丙酸桿菌轉形株,與僅含PBRESP36B2載體質 體之對照組菌株,接種入內含50毫升BHI (腦心輸液) 培養基(Difco)之100毫升燒瓶中,並在28°C、未搖動 下反應72小時。將4毫升之前培養轉移至內含200毫升 之生產培養基(其組成爲Difco酵母萃取物15克/升、 乳酸鈉 30 克 /升、KH2P〇4〇.5 克 / 升、MnS04 0.01 克 / 升、以及C〇C120.00 5克/升)之5 00毫升搖動燒瓶以及 在2 8 °C下搖動4 8小時。 -63- 1328612 使用HPLC43測定維生素B1Z力價並顯示比對照組菌 株有較高的維生素B12產生。 將該方法重覆用於其它三個下列之基因: A :序列識別號1,銘啉胺酸一 a,c 一二醯胺合成酶 » B :序列識別號3,鈷啉醇醯胺磷激酶基因;以及 C :序列識別號5,氰鈷胺素(5f _磷酸鹽)合成酶 〇 然後將四種基因(A、B、C、及D)合倂於一個操縱 子之下進一步的增加維生素B12生產。 使用已知的技藝44將產生的轉形細胞(費氏丙酸菌 ATCC 62 07 )培養於發酵槽。爲了殺死細胞,以及導致溶 解,入將液體培養基在65 t下巴氏加熱三十分鐘。將然 後液體培養基進行超濾法,以及得到內含維生素B12之粉 紅色過濾物。加熱引起細胞的溶解,以及因此將細胞內維 生素B12釋放至培養基》 實施例 4 構築丙酸桿菌之表現載體及其於表現本發明酵素以及在費 氏丙酸菌中產生維生素B12上之用途 除了說明如上29’3G的表現系統之外,技藝上已知二 種其它表現系統(視需要可爲多套),可用以進行表現編 碼本發明新穎酵素的基因。第一種是之pRGO 1,其爲來 自酸性丙酸菌之質體27。用此可產生穿梭載體 PPK705。 -64- 1328612 使用該載體可成功地攜帶鈷啉胺酸a,c -二醯胺合成酶 (A)酵素,並進行轉形。費氏丙酸菌shermanii亞種。 其他適當的表現系統是習知的穿梭載體 ΡΡΚ705 28, 其能在大腸桿菌以及丙酸菌之間穿梭移動。如此可容許構 築丙酸菌表現載體,並將酵素B、鈷啉醇醯胺磷激酶倂入 費氏丙酸菌之謝氏亞種。使用本發明之鈷啉醇醯胺磷激酶 基因(序列識別號3 )可達成此目的。 比較實施例 5 搖動燒瓶發酵內含空載體的丙酸桿菌。 用大腸桿菌/丙酸桿菌穿梭載體 pBRESP36B2pl6SH 轉形費氏丙酸桿菌品系ATCC6207已描述於實施例2。以 前述內含紅黴素之瓊脂平皿選擇轉形株,以限制分析選擇 內含真正質體的轉形株。 轉形株生長於棕色玻璃製之青黴素燒瓶,其中內含 50毫升之厭氧Ml培養液,其製備的方法如下。在缺氧 情況下將90毫升之部份B加到810克之部份A以製備 900克之Ml培養液。添加入紅黴素,最終濃度爲1〇毫克 /公升。 810克之部份A是由52.2克MES、12.51克Difco酵 母萃取物及〇_68克甲硫胺酸溶於水所組成。將酸鹼度用 氫氧化銨調至7以及脫氣移除氧氣以及用氮沖洗。最後部 份A以高壓滅菌器滅菌。 90毫升之部份B由1.5毫升微量元素溶液、】·5毫 -65- 1328612 升過濾滅菌的CoC12.6H20(5克/公斤)、0.9毫升過濾 滅菌的泛酸鈣(20克/公斤)以及86.1毫升脫除氣體的 無菌葡萄糖( 440克/公斤)組成。 1公斤之微量元素溶液爲10克檸檬酸、10毫升 H2S04、1.2 克 MnS04. H20、3 00 克 MgS〇4.7H2〇、6 克 FeS04.7H20、以及2.4克ZnS04.7H20溶於水所組成。溶 液經過濾器滅菌。 在缺氧情況下於50毫升Ml培養基中接種入5毫升 先前生長於厭氧、30°C、溫和的震盪3天至OD630大約 爲10之預培養菌種(選擇的pBRESP36B2pl6SH轉形株 )° 將此50毫升菌種在30°C、未搖動下培養40小時》 在此時間點從培養菌種中取樣本並測定〇D63Q ( — OD _ ana)。在厭氧下添加NaOH ( 10% )校正培養液之酸鹼度 。須要之NaOH(10%)微升數之計算公式爲:NaOH(10 %)微升數=(19.67\00—&11〇- 60。下一步驟是在 厭氧下加入0.5毫升DBI(0.5克/公斤)。加入後將菌 種在30 °C、200 rpm震盪下再培養24小時。再一次測定 〇〇63。(—〇〇-終點)。 收集1 〇毫升培養樣品。離心收穫細胞以及用一倍體 積無菌的去礦物水清洗沈澱物。將沈澱物儲存於- 20 °c。 將沈澱物在內含緩衝劑之2%KCN中加熱至80°C解凍樣 品以打開細胞以及穩定維生素B 1 2以及前驅物。使用 HPLC以適當的標準(43 )測定維生素B12値效價與腺苷 -66 - 1328612 基鈷啉醇醯胺以及腺苷基鈷啉醇醯胺磷酸鹽前驅物之含量 。依據質譜分析法數據確立腺苷基鈷啉醇醯胺以及腺苷基 鈷啉醇醯胺磷酸鹽前驅物之吸收峰的相同性。 將每毫升pBRESP36B2p 16SH轉形株菌種製作之維生 素B12量除以0D -終點^ pBRESP36B2p 16SH轉形株得 到之產率可作爲內含其它質體之費氏丙酸桿菌轉形株(例 如下一實施例)得到之產率的參考。經計算腺苷基鈷啉醇 醯胺以及腺苷基鈷啉醇醯胺磷酸鹽之產量(量每毫升菌種 / 0D -終點)亦有相似的比例。此類比例可作爲含其它 質體之費氏丙酸桿菌轉形株分別得到腺苷基鈷啉醇醯胺以 及腺苷基鈷啉醇醯胺磷酸鹽之比率的參考。 實施例6 構築費氏丙酸桿菌cobA/cbiA基因之表現載體及彼在費 氏丙酸桿菌中產生維生素B12以及其前驅物之用途 使用編碼費氏丙酸桿菌麩胺酸鹽1半醛胺基變位酶( hemL ) 46(EMBL寄存編號D 12643)之基因。此基因之 編碼區接著轉錄性hemL之終止子。將內含hemL基因編 碼區以及hemL終止子之DNA片段依下列描述之步驟選 殖入 pBRESP36B2pl6SH。以 PCR 從費氏丙酸桿菌 ATCC6207分離的染色體DNA中放大DNA片段是使用下 列之弓I 子:S^CAgTAgATCTCgACAAggAggAACCCAtgAg —3,以及 5*- CgTAAgATCTCAgTTTCggACATggCAgTg — 3, 。此二引子均含有Bglll限制位點》將得到之PCR片段連 -67- 1328612 結入載體 pCR — Blunt II - ΤΟΡΟ ( Invitrogen )產生 pGBPHEL- l〇轉形大腸桿菌之後得到康黴素抗性菌落。 如此得到之構築體以限制水解分析証實以及片段之DNA 序列經由序列分析証實。 接著將pGBPHEL— 1用Bglll水解,分離內含hemL 基因之片段並連結入先用Bg III水解以及去磷酸化的載體 pBR£SP30B2pl0SH。轉形大腸桿菌之後得到氨比西林抗 性菌落。用限制水解分析選擇以16S啓動子轉錄hemL基 因的建構體。產生的建構體被稱爲PGBP01HEL - 1。 使用編碼費氏丙酸菌尿紫質原III甲基轉移酶之基因 (名稱爲cobA,EMBL寄存編號U 13043) 47»爲了在丙 酸菌過度表現 cobA基因,將基因置於pGBPOIHEL — 1 的16S rRNA啓動子之後以及hemL終止子之前,其步驟 描述如下。以PCR從費氏丙酸桿菌ATCC6207分離的染 色體DNA中放大內含內含cobA編碼區之DNA片段是使 用下列之弓I 子:5’一 CACCACCAACATCgATgAggAAAC-3’ 以及 5,- TCCAATTgggACTCAgTggTCgCTg- 3,。 第一引子含有Clal以及第二引子含有Mfel限制位點 。將得到的PCR片段連結入載體pCR-Blunt II-TOPO ( Invitrogen )。轉形大腸桿菌之後得到康黴素抗性菌落。 經由序列分析証實選殖片段的DNA序列。產生的建構體 稱爲 pGBPCOB - 1。 接者用Clal以及Mfel水解pG13Pcob — 1,分離內含 cobA基因之片段以及連結入分離自pGBPOI HEL-1以 -68- 1328612 相同酵素水解之大的載體片段。轉形大腸桿菌之後得到氨 比西林抗性菌落。以限制分析証實分離自轉形株的質體 DNA,產生的建構體被稱爲P〇BP02COB — 1。 將PGBP02COB— 1轉形入大腸桿菌JM101以及用限 制水解分析証實分離自得到的轉形株的質體DNA。然後 將質體 DNA 如前述之描述轉形入費氏丙酸桿菌 ATCC6207。以前述之方法用內含紅黴素之瓊脂平皿選擇 轉形株。以限制水解分析証實分離自費氏丙酸桿菌轉形株 之質體DNA。 於內含Ml培養液之搖動燒瓶中發酵pGBP02COB-l 轉形株,並用描述於前之實施例中的方法測定維生素B12 、腺苷基鈷啉醇醯胺以及腺苷基鈷啉醇醯胺磷酸鹽之含量 〇 以描述於前之實施例中的方法計算維生素B12、腺苷 基鈷啉醇醯胺以及腺苷基鈷啉醇醯胺磷酸鹽/毫升培養菌 種0D-終點之產例。維生素b12之產率比以前實施例的 pBRESP36B2P16SH轉形株低6%。然而,腺苷基鈷啉醇 醯胺之產率比以前實施例的pBRESP36B2pl6SH轉形株高 227 % ’以及腺苷基鈷啉醇醯胺磷酸鹽之產率比以前實施 例的pBRESP36B2pl6SH轉形株高200%。如此鈷啉醇醯 胺之產率比空的質體(比較實施例5)增加2倍,鈷啉醇 醯胺P之產率比空的質體(比較實施例5)增加3倍。 實施例 7 -69- 1328612 構築編碼費氏丙酸菌蛋白質B(cob u)基因之表現載體 以及彼在費氏丙酸桿菌中產生維生素以及其前驅物之 用途 爲了在丙酸菌過度表現編碼酵素B(序列識別號3) 之基因,將基因置於PGBP0IHEL_1的16S rRNA啓動子 之後以及hemL終止子之前,其步驟描述如下。以PCR從 費氏丙酸桿菌ATCC6207分離的染色體DNA中放大內含 內含B編碼區之 DNA片段是使用下列之引子:5'— CTgATATCAATTggAggACATCAgATgACCCgCATCgTC - 3( 以及 CTgAATTCggCCACgTCAgATCgCgTCC- 。 第一引子含有EcoRV以及Mfel限制位點以及第二引 子含有EcoRI限制位點。將得到的pCR片段連結入載體 pCR- Blunt II- TOPO ( Invitrogen)。轉形大腸桿菌之後 得到康黴素抗性菌落。經由序列分析証實選殖片段的 DNA序列。產生的建構體稱爲pGBPCOU — 1。 接著將pGBPCOU— 1用EcoRV以及EcoRI水解,以 及分離內含基因編碼B片段並連結至分離自pGBPOlHEL _ 1先用Clal水解’然後以克列諾酶鈍化,以及最後用 Mfel水解之大的載體片段。轉形大腸桿菌之後得到氨比 西林抗性菌落。以限制分析証實分離自轉形株的質體 DNA,產生的建構體被稱爲pGBP〇2COU — 1。 將PGBP02COU-1轉形入大腸桿菌JM101以及用限 制水解分析証實分離自得到的轉形株的質體DNA。然後 將質體DNA如前述之描述轉形入費氏丙酸桿菌 -70- 1328612 ATCC0207 〇以前述之方法用內含紅黴素之瓊月旨平皿選擇 轉形株。以限制水解分析証實分離自費氏丙酸桿菌轉形株 之質體DNA。 於內含Ml培養液之搖動燒瓶中發酵pGBP02COU — 1 轉形株,並用描述於前之方法測定維生素B12、腺苷基鈷 啉醇醯胺以及腺苷基鈷啉醇醯胺磷酸鹽之含量。 以描述於前之方法計算維生素B12、腺苷基鈷啉醇醯 胺以及腺苷基鈷啉醇醯胺磷酸鹽/毫升培養菌種0D-終 點之比例。腺苷基鈷啉醇醯胺之產率比 pBRESP36B2pl6SH轉形株低9 6 %,以及腺苷基鈷啉醇醯 胺磷酸鹽之產率比pBRESP36B2pl6SH轉形株高700%。 如此如此中間物鈷啉醇醯胺_ P之產率比空的質體增加7 倍。 實施例 8 構築費氏丙酸桿菌編碼蛋白質B以及C( cob U以及S) 基因之表現載體以及彼在費氏丙酸桿菌中產生維生素Bl2 以及其前驅物之用途 爲了在丙酸菌過度表現編碼酵素B(序列識別號3) 以及C (序列識別號5 )之基因,將基因置於pGBPOIHEL -1的16S rRNA啓動子之後以及hemL終止子之前,其 步驟描述如下。二個因相鄰的位於費氏丙酸桿菌全部染色 體上且在相同之操縱子內。以 PCR從費氏丙酸桿菌 ATCC6207分離的染色體DNA中放大內含此二基因之 -71 - 1328612 DNA片段是使用下列之引子: 5,-CTgATATCAATTggAggACATCAgATgACCCgCATCgTC-3'以及 S^CTgAATTCCggCggCTCAggCgAACAATg- 3*。第 一引子含有EcoRV以及Mfel限制位點以及第二引子含有 EcoRI限制位點。將得到的PCR片段連結入載體!^11-Blunt II - TOPO ( Invitrogen )。轉形大腸桿菌之後得到 康黴素抗性菌落。經由序列分析証實選殖片段的DNA序 列。產生的建構體稱爲PGBPPOB — 1。 接著將pGBPPOB- 1用EcoRV以及EcoRI水解,以 及分離內含基因編碼B以及C之片段並連結至分離自 pGBPOlHEL- 1先用Cl al水解,然後以克列諾酶鈍化, 以及最後用Mfel水解之大的載體片段。轉形大腸桿菌之 後得到氨比西林抗性菌落。以限制分析証實分離自轉形株 的質體DNA,產生的建構體被稱爲pGBP02POB — 1» 將pGBP02POB— 1轉形入大腸桿菌JM101以及用限 制水解分析証實分離自得到的轉形株的質體DNA。然後 將質體 DNA如前述之描述轉形入費氏丙酸桿菌 ATCC6207。以前述之方法用內含紅黴素之瓊脂平皿選擇 轉形株。以限制水解分析証實分離自費氏丙酸桿菌轉形株 之質體DNA。 於內含Ml培養液之搖動燒瓶中發酵pGBP02POB — 1 轉形株,並用描述於前之方法測定維生素B12、腺苷基鈷 啉醇醯胺以及腺苷基鈷啉醇醯胺磷酸鹽之含量β 以描述於前之方法計算維生素Β12、腺苷基鈷啉醇醯 -72- 1328612 胺以及腺苷基鈷啉醇醯胺磷酸鹽/毫升培養菌種0D-終 點之比例。維生素B|2之產率比pBRESP36B2pI6SH轉形 株高 19%。 腺苷基鈷啉醇醯胺之產率比 pBRESP36B2p 16SH 轉形株低 96%,且在 pGBP02POB- ι 轉形株中無法偵測到腺苷基鈷啉醇醯胺磷酸鹽。 實施例 9 構築費氏丙酸桿菌編碼蛋白質B、C以及cobA(c〇b A以及ϋ以及S)基因之表現載體以及彼在費氏丙酸桿菌 中產生維生素Β12和其前驅物上之用途。 爲了在丙酸菌過度表現編碼酵素Β(序列識別號3) 、C (序列識別號5)、以及cobA基因之基因,將基因置 於pGBPOIHEL - 1的16S rRNA啓動子之後以及hemL終 止子之前,其步驟描述如下。用Mfel以及Bg III水解 PGBP02POB — 1以及分離1.6仟驗基之片段。將此片段連 結入以相同酵素水解之PGBP02COB-1載體的9.7仟鹼基 片段。轉形大腸桿菌之後得到康黴素抗性菌落。經由序列 分析証實選殖片段的DNA序列。產生的建構體稱爲 pGBPPOE- 1 * 將pGBP02POE-l轉形入大腸桿菌JM101以及用限 制水解分析証實分離自得到的轉形株的質體DNA。然後 將質體 DNA如前述之描述轉形入費氏丙酸桿菌 ATCC6 207。以前述之方法用內含紅黴素之瓊脂平皿選擇 轉形株。以限制水解分析証實分離自費氏丙酸桿菌轉形株 -73- 1328612 之質體DNA。 於內含Ml培養液之搖動燒瓶中發酵pGBP02POE — 1 轉形株,並用描述於前之方法測定維生素B12、腺苷基鈷 啉醇醯胺以及腺苷基鈷啉醇醯胺磷酸鹽之含量。 以描述於前之方法計算維生素B12、腺苷基鈷啉醇醯 胺以及腺苷基鈷啉醇醯胺磷酸鹽/毫升培養菌種0D—終 點之比例。維生素B12之產率比pBRESP36B2pl6SH轉形 株高45%。腺苷基鈷啉醇醯胺之產率比 pBRESP36B2pl 6SH 轉形株低 65%,且在 pGBP02POE- 1 轉形株中無法偵測到腺苷基鈷啉醇醯胺磷酸鹽。 實施例摘要 表下顯示轉形的質體相對於空的質體對照組之實驗數 據(空質體値設定成100%以供參考)。 實施例 基因 鈷啉醇醯胺 鈷啉醇醯胺p 維生素B12( (量/毫升/〇D) (量/毫升/OD) 量/毫升/OD) 5 空質體 100 100 100 6 cob A 227(+127% ) 300( + 200% ) 94(6% ) 7 cobU 4(-96%) 800( + 700% ) 94(-6% ) 8 cobU以及S 4(-96%) 0 1 19(+19%1_ 9 cobA以及U 35(-65% ) 0 145( + 45% ) 以及s ___ -74- 1328612 參考文獻 1 · Sambrook et al. (1989) "Molecular Cloning: A laboratory manual", 2nd
Edition, Cold Spring Harbor Laboratories, Cold Spring Harbor, New York 2. Innis et al. (1990) "PCR protocols, a guide to methods and applications" Academic Press, San Diego 3. WO-A-99/32617 4. van Zeijl, C. et al. (1998) J. of Biotechnol. 59: 221-224 5. Devereux et al (1984) Nucleic Acids Research 12, p387-395 6. Altschul S. F. (1993) J Mol Evol 36:290-300 7. Altschul, S, F et al (1990) J Mol Biol 215:403-10 8. Henikoff and Henikoff (1992) Proc. Natl. Acad. Sci. USA 89: 10915-10919) 9. Karlin and Altschul (1993) Proc. Natl Acad. Λι. USA 90: 5873-5787 10. Cunningham and Wells, Science, 244+, 1081-1085,1989 11. de Vos et al. (Science, 255, 306-312, 1992) 12. Smith et al. (J. Mol. Biol., 224, 899-904,1992) 13. Wlodaver et a/. (FEBS Lett., 309, 59-6.4,1992) 14. Ford et al, Protein Expression and Purification, 2, 95-107,1991 15. Goosen et al, "Transformation and Gene Manipulation in Filamentous Fungi: an overview" in: Handbook of Applied Mycology, Vol. 4 (1992) 16. Romanos et al, Yeast 8:423-488 (1992) 17. R. E. Rose, Nucleic Acids Research 16(1): 355(1988) 18. WO-A-98/04726 19. WO-A-98/30707 20. Alenkso and Clutterbuck, Fungal Genet. Biol 21: 373-397 (1997) 21. EP-A-0,635,574 22. WO-A-98/46772 -75- 1328612 23. Rapper and Fennell, The Genus Aspergillus, The Williams & Wilkins Company, Baltimore, pp 293-344,19^5. 24. B. Cameron et al., J. Bacteriol 171:547-557 (1989) 25. Blanche et al, Angew Chem. Int. Ed. Engl. 34:383-411 (1995) 26: WO-A-97/43421 27: Kiatpapan et al, Applied & Environmental Microbiology 66(11):4688-4695 (Nov. 2000) 28. Kiatpapan & Murooka, Appl. Microbiol. Biotechnol. 56: 144-149 (2001) 、 29. WO-A-99/67356 (DSM N.V.) 30. Jore et al, Applied and Environmental Microbiol. 67(2):499-503 (February 2001) 31. EP-A-0184483 32. EP-A-0284603 33. EP-A-0134048 34. EP-A-0253455 35. . EP-A-096430 36. EP-A-0301670 37. Bibb et al, Gene 38: 215 (1985). 38. Thompson etal, Gene 20:51 (1982) 39. de Vries et al, J. Gen. Microbiol. 71:515 (1972) 40. Southern, J. Mol: Biol 98: 503 (1975) 41. Roessner et al, Microbiology 148:1845-1853 (2002) 42. Chang et al, Journal of Bacteriology 134(3):1141-1156 (Jime 1978) 43. Blanche et al, Anal. Biochem. 189:24 (1990) 44. Spalla ei a/,“Microbial Production of Vitamin B i'2” in: Biotechnology of vitamins, pigpients and growth factors, E. J. Van Damme ed., Elsevier, London, New York, pages 257-284. 45. WO-A-98/06868 46. Mxirakami K, Hashimoto Y, Murooka Y., 1993, Appl Environ Microbiol. 59: 347-350 47. Sattler I, et al. 1995, J Bacteriol. 177:1564-1569.
All documents are herein incorporated by reference. 所有文件全文在此倂入參考文獻。 -76- 1328612 序列表 <110> DSM IP ASSETS B.V.<120>生物合成途徑中之基因 <130> M.84450A SMW <140> <141> <150> EP 02255203,8 <151> 2002-07-25 <160> 17 <170> 專利送入版本<210> 1 <211> 2586 <212> DNA <213><220> <221> CDS <222> (1) . . (2586) <223> <400> 1 atg gtg acg gcg acg get ett ccg egg gtg etc ate geg gee ccc geg Met Val Thr Ala Thr Ala Leu Pro Arg Val Leu Xle Ala Ala Pro Ala 1 5 10 15 tee age cag gga aag acc acc gtg gee ate ggc ctg atg geg gee ctg Ser Ser Gin Gly Lys Thr Thr Val Ala lie Gly Leu Met Ala Ala Leu- 20 25 30 48 96 egg gee teg ggg ege age gtg gee gga ttc aag gtg ggc ccc gac tac Arg Ala Ser Gly Arg Ser Val Ala Gly'Phe Lys Val Gly Pro Asp Tyr 35 40 45 144 ate gat ccg ggc tat: cac gca ctg gee tgc ggt ege ccc ggc ege aac lie Asp Pro Gly Tyr His Ala Leu Ala Cys Gly Arg Pro- Gly Arg Asn 50 55. 60 ctg gat ccc tat ttg tgc ggg ccc gag ege att geg ccg ttg ttc gee Leu Asp Pro Tyr Leu Cys Gly Pro Glu Arg lie Ala Pro Leu Phe Ala 65 70 75 80 cat ggc geg ctg cat ccc gaa ccc geg gac ate teg gtc gtc gaa ggc H±s Gly Ala Leu His Pro Glu Pro Ala Asp lie Ser Val Val Glu Gly 85 90 95 gtg a^g ggc atg ttc gac ggc aag etc ggp geg t^rg ccc gac ggc acc Val Met Gly Met Phe Asp Gly Lys Leu Gly Ala Trp Pro Asp Gly Thr 100 105 110 gat gac ccc gee ggt ttt ggc tea teg gee cat ate gee agg ctg etc Asp Asp Pro Ala Gly Phe Gly Ser Ser Ala His 工 le Ala Arg Leu Leu 192 240 288 336. 384 115 120 125 gat gcc ccc gtg ctg etc gtg gftc gac ggc tea cac agt gee cgt acc 432
Asp Ala Pro Val Leu Leu Val Val Asp Glv Ser His Ser Ala Arg Thr 130 135 140 gee gca gcc ctg tgc cat ggc ctg gcc age tac gat ccc ege ate cat 480
Ala Ala Ala Leu Cys His Gly Leu Ala Ser Tyr Asp Pro Arg lie His 145 150 155 160 gtg gcc ggc gtc ate etc aat egg gtg atg ggt gcc ege gtg gtc gac 528
Val Ala Gly Val lie Leu Asn Arg Val Met Gly Ala Arg Val Val Asp 165 170 175 gag ate acc egg ggc tgc gca cgt gtc. ggc ctg ccg gtg ctg ggg get. 576
Glu lie Thr Arg Gly Cys Ala Arg Val Gly Leu Pro Val Leu Gly Ala 180 185 190 ctg ccg aaa age aeg egg g-tg gcc gtg ggc t:ca ege cac ctg gga ctg 624
Leu Pro Lys Ser Thr Arg Val Ala Val Glv Ser Arg His Leu Gly Leu 195 200 205 gtc aeg gcc gac gag cag ggt gac geg ate ggc ate gt:g cag cag gcc 672
Val Thr Ala Asp Glu Gin Gly Asp Ala lie Gly lie Val Gin Gin Ala 210 215 220 ggt gag etc gtc gcc gca cac etc gac etc gac gcc ate gcc aeg ate 720
Gly Glu Leu Val Ala Ala His Leu Asp Leu Asp Ala lie Ala Thr lie 225 230 235 240 gcc ggt ggg gcc cct gac ctg gcc gtc gat ccc tgg gat ccc gcc gca 768
Ala Gly Gly Ala Pro Asp Leu Ala Val Asp Pro Trp Asp Pro Ala Ala 245 250 255 - . ·* ' gag gtc gaa ccg gta ccg. ggg cgt ccg gtc ate gcc atg gcc teg ggt Θ16
Glu Val Glu Pro Val Pro Gly Arg Pro Val lie Ala Met Ala Ser Gly 260 265 270 ccc gca ttc acc ttc egg tac acc gaa acc gca gaa ctg ctg gag geg 864
Pro Ala Phe Thr Phe Arg Tyr Thr Glu Thr Ala Glu Leu Leu Glu. Ala 275 280 285 gee ggc tgc egef gtg aeg gcc ttc gat ccg etc acc gcc egg ggc ett 912
Ala Gly Cys Arg Val Thr Λ1& Phe Asp Pro Leu Thr Ala Arg Gly Leu 290 295 300 - *· · . * ccg gcc gat gtg tee ggc ctg tac ctg ggg ggt ggt ttc ccc gag gag 960
Pro Ala Asp Val Ser Gly Leu Tyr Leu Gly Gly Gly Phe Pro Glu Glu 305 310 315 320 • - , cac gcc gag geg ct:c gcc ggc. aac acc tee ctg ggc get gaa ate gcc 1008
His Ala Glu. Ala Leu Ala Gly Asn Thr Ser Leu Gly Ala Glu lie Ala 325 330 335 tea ege gtg tee gag ggc ctg ccg aeg gtg gcc gag tgt geg ggg ctg 1056
Ser Arg Val Ser Glu Gly Leu Pro Thr Val Ala Glu C^s Ala Gly Leu 340 345 350 etc tac ctg tgc ege age ctg gat gga ctg geg atg gcc ggg gtg gtc 1104 -2- 11521328612
Leu Tyr Leu Cys Arg Ser Leu Asp Gly Leu Ala Met Ala Giy Val Val 355 360 365 gac gcc gac teg Asp Ala Asp Ser 370 gcc ege gcc gcc Ala Arg Ala Ala 385 egg gcc cat gag Arg Ala His Glu ege gac ccc gga Arg Asp Pro Gly 420 gtg gag acc ccg Val Glu Thr Pro 435 ccg acc ccc ggt Pro Thr Pro Gly 450 cac tgg gca ggg His Trp Ala Gly 465 age gaa tat ggg Ser Glu Tyr Gly aeg ccg gga gat Thr Pro Gly Asp 500 gat ege gat gtg Asp-Arg Asp Val 515 tee atg aeg ccg Ser Met Thr Pro 375 aac gac age ttc Asn Asp Ser Phe 390 ttc cac ege acc Phe His Arg Thr 405 cca caa egg ctg Fro Gin Arg Leu aeg ggg ggc aac Thr Gly· Gly Asn 440 tee geg ccc age Ser Ala Pro Ser 455 agt ccg gta ctg Ser Pro Val Leu 470 cac acc ggc cat His Thr Gly His 485 geg ttg tee gca Ala Leu Ser Ala ctg ccc ggc ctg Leu Pro Gly Leu 520 ege ctg acc ate Arg Leu Thr lie 380 ctg atg ege gcc Leu Met Arg Ala 395 acc ctg gac aeg Thr Leu Asp Thr 410 ggc gac caa egg Gly Asp Gin Arg 425 ega ccc gag ggg Arg Pro Glu Gly gtc cac gcc tee Val His Ala Ser 460 geg caa ege ttc Ala Gin Arg Phe 475 cac tee ccc egg His Ser Pro Arg 490 geg ccc gac etc Ala Pro Asp Leu 505 gtc gac ttg geg Val Asp Leu Ala ggc tac cac cac Gly Tyr His His ggg gag ege tat Gly Glu Arg Tyr 400 ccc ccc bac gac Pro Pro Tyr Asp 415 ttg geg tgg gac Leu Ala Trp Asp 430 gtg ctg gtc gcc Val Leu Val Ala 445 tac cag cac ctg Tyr Gin His Leu gcc egg geg geg Ala Arg Ala Ala 4Θ0 cct gcc gcc aeg Pro Ala Ala Thr 495 acc cat cac ggg Thr His His Gly 510 gtg aac gtg ege Val Asn Val Azrg 525 1200 1248 1296 1344 1392 1440 1488 1536 1584 1632 gat gtg ega cct ccg gcc tgg etc gtg gag ege ate gtc gcc tee age Asp Val Arg Pro Pro Ala Trp Leu Val Glu Arg lie Val Ala Ser Ser 530 535 540 gac cag tgg gcc cac tac ccc gat cag ege . gaa geg acc cgt geg gtg Asp Gin Trp Ala His Tyr Pro Asp Gin Arg Glu Ala Thr Arg Ala Val 545 550 555 560 gca ctg ege cat ggc gtc aac ccc gac. cag gta c^g etc aeg gcc ggg Ala Leu Arg His Gly Val Asn Pro Asp Gin Val Leu Leu Thr Ala Gly 565 570 575 tee teg gag geg ttc age ctg ate gcc cac ggg ttc tee ccg ege t^g Ser Ser Glu Ma Phe Ser Leu lie Ala His Gly Phe Ser Pro Arg Trp 580 585 590 1680 1728 1776 -3 1328612 9 gcg gtc gtg gtg cat ccc cag ttc acc gaa cca gag gtg gfc6 ctg cgc Ala Val Val Val His Pro Gin Phe Thr Glu Pro Glu Val Ala Leu Arg 595 600 605 1824 aac gcc ggg cgc ccg gtc ggc cgc ctg gtg etc cat gcc teg gat .ggc Asn Ala Gly Arg Pro Val Gly Arg Leu Val Leu His Ala Ser Asp Gly 610 615 620 ttc cag ttc gat cac gaa ctg ctg gac ccc agg gcc gac atg gtg gtc Phe Gin Phe Asp His Glu Leu Leu Asp Pro Arg Ala Asp Met Val Val 625 630 635 640 ate ggc aat ccg acc aat ccc acc ggc gtg ctg cat *bcg gcg gcg age lie Gly Asn Pro Thr Asn Pro Thr Gly Val Leu His Ser Ala Ala Ser 645 650 655 ctg cgc gcg ttg tgc egg ccc gga cgc gtg gtg gtg gtt gac gag gca Leu Arg Ala Leu Cys Arg Pro Gly Arg Val Val Val Val Asp Glu Ala 660 665 670 ttc atg gac gcc gtg ccg ggc gag ccc gag age etc ate ggg gca cgc Fhe Met Asp Ala Val Pro Gly Glu Pro Glu Ser Leu lie Gly Ala Arg 675 680 685 atg gat ggc ctg ttg gtc acc cgc teg ttc aeg aag act tgg age gtc Met Asp Gly Leu Leu Val Thr Arg Ser Phe Thr Lys Thr Trp Ser Val 690 695 700 ccg ggg ctg egg ate gga tat gtg gtc ggg gat ccc gcg etc att cgc Pro Gly Leu Arg lie Gly Tyr Val Val Gly Asp Pro Ala I#eu lie Arg 705 710 715 720 gtc ctg gcg cac gaa cag ccc tgt tgg cc6 ate tcc acc ccc gcc ctg Val Leu Ala His Glu Gin Pro Cys Trp Pro lie Ser Thr Pro Ala. Leu 725 730 735 1872 1920 1968 2016 2064 2112 2160 2208 gtc acc gcc cgc gaa tgc tcc aeg cca cgc gcc gtg gag cag gcc acc Val Thr Ala Arg Glu Cys Ser Thr Pro Arg Ala Val Glu Gin Ala. Thr 740 745 750 tea gat gcc cga. cag gcg gcg cag gac cgc ega cac ctg gtg gcc cgc Ser Asp Ala Arg Gin Ala Ala Gin Asp Arg Arg His Leu Val Ala Arg 755 760 765 ctg gcc ggg ate ggc ate cag acc gtc ggg gag gcc agg gcc ccc ttc Leu Ala Gly lie Gly lie Gin Thr Val Gly Glu Ala* Arg Ala Pro Phe 770 775 780 gtc eta gtc gac ctg cgc gcc cac ccg ccc ggt ggg ett cgt gcg gga Val Leu Val Asp Leu Arg Ala His Pro Pro Gly Gly Leu Arg Ala Gly 785 790 :795 800 ttg egg aeg etc ggc ttc acc gtg cgc age ggc gag age ttc ccc ggc Leu Arg Tlir Leu Gly Phe Thr Val Arg Ser Gly Glu Ser Phe Pro Gly 805 810 815 ctg ggc gcg ggc tgg ttg egg etc gcg gtt cgc cac ccg gac ate age Leu Gly Ala Gly Tzp Leu Arg Leu Ala Val Arg His. Pro Asp lie Ser 820 825 830 2256 2304 2352 2400 2448 2496 -4 gac gcg ttc gtc get gee ctg gee ege acc ate gac gca ctg gac aca
Asp Ala Phe Val Ala Ala Leu Ala Arg Thr lie Asp Ala Leu Asp Thr 835 .840 845 gcg cag cac ccc atg ega cca cca caa gga gac ate aga tga
Ala Gin His Pro Met Arg Pro Pro Gin Gly Asp lie Arg 850 855 860
<210> 2 <211> 861 <212> PRT <213>費氏丙酸桿菌 <400> 2
Met Val Thr Ala Thr Ala Leu Pro Arg Val Leu lie Ala Ala Pro Ala 1 5 10 15
Ser Ser Gin Gly Lys Thr Thr Val Ala lie Gly Leu Met Ala Ala Leu 20 25 30
Arg Ala Ser Gly Arg Ser Val Ala Gly Phe Lys Val Gly Pro Asp Tyr 35 40 45 lie Asp Pro Gly Tyr His Ala Leu Ala Cys Gly Arg Pro Gly Arg Asn 50 55 60
Leu Asp Pro Tyr Leu Cys Gly Pro 61u Arg lie Ala Pro Leu Phe Ala €S 70 75 80
His Gly Ala Leu His Pro Glu Pro Ala Asp lie Ser Val Val Glu Gly 85 90 95
Val Met Gly Met Phe Asp Gly Lys Leu Gly Ala Txp Pro Asp Gly Thr 100 105 110
Asp Asp Pro Ala Gly Phe Gly Ser Ser Ala His lie Ala Arg Leu Leu 115 120 125
Asp Ala Pro Val Leu Leu Val Val Asp Gly Ser Hxs Ser Ala Arg Thr 130 135 140 -Ala Ala Ala Leu Cys His Gly Leu Ala Ser Tyr-Asp Pro Arg lie His 145 150 155 160
Val Ala Gly Val lie Leu Asn Arg Val Met Gly Ala Arg Val Val Asp 165 170 175
Glu lie Thr Arg Gly Cys Ala Arg Val Gly Leu Pro Val Leu Gly Ala 180 185 190
Leu Pro Lys Ser Thr Arg Val Ala Val Gly Ser Arg His Leu Gly Leu 195 200 205
Val Thr Ala Asp Glu Gin Gly Asp Ala lie Gly lie Val Gin Gin Ala 210 215 220
Gly Glu Leu Val Ala Ala His Leu Asp Leu Asp Ala lie Ala Thr lie 2544 2586 -5- 225 230 235 240
Ala Gly Gly Ala Pro Asp Leu Ala Val Asp Pro Trp Asp Pro Ala Ala 245 250 255
Glu Val Glu Pro Val Pro Gly Arg Pro Val lie- Ala Met Ala Ser Gly 260 265 270
Pro Ala Phe Thr Phe Arg Tyr Thr Glu Thr Ala Glu Leu Leu Glu Ala 275 280 285
Ala Gly Cys Arg Val Thr Ala Phe Asp Pro Leu Thr Ala Arg Gly Leu 290 295 300
Pro Ala Asp Val Ser Gly Leu Tyr Leu Gly Gly Gly Phe Pro Glu Glu 305 310 315 320
His Ala Glu Ala Leu Ala Gly Asn Thr Ser Leu Gly Ala Glu lie Ala 325 330 335
Ser Arg Val Ser Glu Gly Leu Pro Thr Val Ala Glu Cys Ala Gly Leu 340 345 350
Leu Tyr Leu Cys Arg Ser Leu Asp Gly Leu Ala Met Ala Gly Val Val 355 360 365
Asp Ala Asp Ser Ser Met Thr Pro Arg Leu Thr lie Gly Tyr His His 370 375 380
Ala Arg Ala Ala Asn Asp Ser Phe Leu Met Arg Ala Gly Glu Arg Tyr 385 390 395 400
Arg Ala His Glu Phe His Arg Thr Thr Leu Asp Thr Pro Pro Tyr Asp 405 410 415
Arg Asp Pro Gly Pro Gin Arg Leu Gly Asp Gin Arg Leu Ala Trp Asp 420 425 430
Val Glu Thr Pro Thr Gly Gly . Asn Arg Pro Glu Gly Val Leu Val Ala 435 440 445
Pro Thr Pro Gly Ser Ala Pro Ser Val His Ala Ser Tyr Gin His Leu 450 455 460
His Trp Ala Gly Ser Pro Val Leu Ala Gin Arg Phe Ala Arg Ala Ala 465 470 475 480
Ser Glu Tyr Gly His Thr Gly His His Ser Pro Arg Pro Ala Ala Thr 485 490 495
Thr Pro Gly Asp Ala Leu Ser Ala Ala Pro Asp Leu Thr His His Gly 500 505 . 510
Asp Arg Asp Val Leu Pro Gly Leu Val Asp Leu Ala Val Asn Val Arg 515 520 525
Asp Val Arg Pro Pro Ala Trp Leu Val Glu Arg lie Val Ala Ser Ser 530 535 540 -6- 1328612
Asp Gin Trp Ala His Tyr Pro Asp Gin Arg Glu Ala Thr Arg Ala Val 545 550 555 560
Ala Leu Arg His Gly Val Asn Pro Asp Gin Val Leu Leu Thr Ala Gly 565 570 575
Ser Ser Glu Ala Phe Ser Leu lie Ala His Gly Phe Ser Pro Arg Trp 580 585 590
Ala Val Val Val His Pro Gin Phe Thr Glu Pro Glu Val Ala Leu Arg 595 600 605
Asn Ala Gly Arg Pro Val Gly Arg Leu Val Leu His Ala Ser Asp Gly 610 615 620
Phe Gin Phe Asp His Glu Leu Leu Asp Pro Ala Asp Met Val Val 625 630 635 640 lie Gly Asn Pro Thr Asn Pro Thr Gly Val Leu His Ser Ala Ala Ser 645 650 655
Leu Arg Ala Leu Cys Arg Pro Gly Arg Val Val Val Val Asp Glu Ala 660 665 670
Phe Met Asp Ala Val Pro Gly Glu Pro Glu Ser Leu lie Gly Ala Arg 675 680 685
Met Asp Gly Leu Leu Val Thr Arg 690 695 Pro Gly Leu Arg lie Gly Tyr Val 705 710 Val Leu Ala His Glu Gin Pro Cys 725 Val Thr Ala Arg Glu Cys Ser Thr 740 Ser Asp Ala Arg Gin Ala Ala Gin 755 760
Ser Phe Thr Lys Thr Trp Ser Val 700 Val Gly Asp Pro Ala Leu lie Arg 715 720 Trp Pro lie Ser Thr Pro Ala Leu 730 735 Pro Arg Ala Vai Glu Gin Ala Thr 745 750 Asp Arg Arg His Leu Val Ala Arg 765
Leu Ala Gly lie Gly lie G.ln Thr Val Gly Glu Ala Arg Ala Pro Phe ' 770 775 780
Val Leu Val Asp Leu Arg Ala His Pro Pro Gly Gly Leu Arg Ala Gly 785 790 795 . 800
Leu Arg Thr Leu Gly Phe Thr Val Arg Ser Gly Glu Ser Phe Pro Gly 805 . 810 815
Leu Gly Ala Gly Trp Leu Arg Leu Ala Val Arg H±s Pro Asp lie Ser 820 825 830
Asp Ala Phe Val Ala Ala Leu Ala Arg Thr He Asp Ala Leu Asp Thr 835 840 845
Ala Gin His Pro Met Arg Pro Pro Gin Gly Asp lie Arg 850 855 860 1328612 <210> 3 <211> 657 <212> DKA <213〉 費氏酿桿菌 <220> <221> CDS <222> <223> (1)..(657) <400> 3 atg gac gtt cci: gac agt ccc gag tcc cga agg ctg etc gat: cag ctg Met Asp Val Pro Asp Ser Pro Glu Ser Arg Arg Leu Leu Asp Gin Leu 1 5 10 15 tea ggc etc ggt gcc egg caa cgt ccg gca cga acc etc gtc acc ggg Ser Gly Leu Gly Ala Arg Gin Arg Pro Ala Arg Thr Leu Val Thr Gly 20 25 30 ggc gcc egg age ggg aag tec age tat gee gag geg ctg ctg ggg teg Gly Λ1& Arg Ser Giy Lys Ser Ser Tyr Ala Glu Ala Leu Leu Gly Ser 35 40 45 ttc gac cac gtc gac tac ate gcc acc teg caa ege aac cct gac gac Phe Asp His Val Asp Tyr lie Ala Thr Ser Gin Arg Asn Pro Asp Asp 50 55 60 ccc gag tgg atg gcc ege ate gee gcc cac g^tc geg ege ege ccg aag Pro Glu Trp Met Ala Arg lie Ala Ala His Val Ala Arg Arg Pro !Lys 65 70 75 80 age tgg aac acc gtg gag acc ett gac gtg geg cag gtg ctg tec gac Ser Trp Asn Thr Val Glu Thr Leu Asp Val Ala Gin Val Leu Ser Asp . 85 90 95 gac ggc tec ccc gcc ctg gtc gat tgc ctg ggc gtg ttgg etc acc ege Asp Gly Ser Pro Ala Leu Val Asp Cys Leu Gly Val Trp Leu Thr Arg 100 105 110 gag ctg gac gtc acc gac gcc tgg cag cac ccg gag cag gcc ege ccc Glu Leu Asp Val Thr Asp Ala Trp Gin His Pro Glu Gin Ala Arg Pro 115 120 125 gag ctg cag cac ege ate gat gag ttg gcc act geg gtc gcc ggc tec Glu Leu Gin His Arg lie Asp Glu Leu Ala Thr Ala Val Ala Gly Ser 130 135 140 ccg ege ege gtg gtg ctg gtc acc aac gag gtc ggt tec ggc gtg gtg Pro Arg Arg Val Val Leu Val Thr Asn Glu Val Gly Ser Gly Val Val 145 .150 155 160 ccc gcc aeg cag gca ggg ege acc ttc cgt gac tgg ctg gga ate etc Pro Ala Thr Gin Ala Gly Arg Thr Phe Arg Asp Trp Leu Gly lie Leu 165 170 175 aac gcc age gtc geg gac gcc tgc gac gag gta ctg ctg tgc gtc gcc Asn Aid Ser Val Ala Asp Ala Cys Asp Glu Val Leu Leu Cys Val ΛΙει 48 96 144 192 240 288 336 384 432 480 528 -8- 576 ιδο 185 190 gga egg geg ctg age ctg cca ccg ega ccg gga ggc cct cat ggc gcc 624 Gly Arg Ala Leu Ser Leu Pro Pro Arg Pro Gly Gly Pro His Gly Ala 195 200 205 ggc aeg gac ccc caa ccg aag gac geg ate tga 657 Gly Thr Asp Pro Gin Pro Lys Asp Ala lie 210 215 <210> 4 <211> 218 <212> PRT <213> 費氏丙酸桿菌 <400> 4 1328612
Me^ Asp Val Pro Asp Ser Pro Glu Ser Arg Arg Leu Leu Asp Gin Leu 1 5 10 15
Ser Gly Leu Gly Ala Arg Gin Arg Pro Ala Arg Thr I#eu Val Thr Gly .20 25 30
Gly Ala Arg Ser Gly Lys Ser Ser Tyr Ala Glu JHa. Leu Leu Gly Ser 35 40 45
Phe Asp His Val Asp Tyr lie Ala Thr Ser Gin Arg Asn Pro Asp Asp 50 55 60
Pro Glu Trp Met Ala Arg lie Ala Ala His Val Ala Arg Arg Pro Lys 65 70 75 80
Ser Trp Asn Thr Val Glu Thr Leu Asp Val Ala Gin Val Leu Ser Asp 85 90 95
Asp Gly Ser Pro Ala Leu Val Asp Cys Leu Gly Val Trp Leu Thr Arg 100 105 110
Glu Leu Asp Val Thr Asp Ala Trp Gin Hxs Pro Glu Gin Ala> Arg Pro 115 120 125
Glu Leu Gin His Arg lie Asp Glu Leu Ala Thr Ala Val Ala Gly Ser 130 135 140
Pro Arg Arg Val Val Leu Val Thr Asn Glu Val Gly Ser Gly Val Val 145 150 155 160
Pro Ala Thr Gin Ala Gly Arg Thr Phe Arg Asp Trp Leu Gly lie Leu 165 170 175
Asn Ala Ser Val Ala Asp Ala Cys Asp Glu Val Leu Leu Cys Val Ala 180 185 190
Gly Arg Ala Leu Ser Leu Pro Pro Arg Pro Gly Gly Pro His Gly Ala 195 200 205
Gly Thr Asp Pro Gin Pro Lys Asp Ala lie 210 215 -9- 1328612 <210> 5 <211〉 780 <212> DNA <213>費氏丙酸桿菌 <220> <221> CDS <222> (1)..(780) <223〉 <400> 5 atg gcc acc cgc aat gga ctg ctg get gee tgg gga ctg ttc aeg gtg Met Ala Thr Arg Asn Gly Leu Leu Ala Ala Trp Gly Leu Phe Thr Val 15 10 15 ctg ccc gca ccc gtg gtg gee gag gtg gat gag ega etc gcc gtg egg Leu Pro Ala Pro Val Val Ala Glu Val Asp Glu Arg . Leu Ala Val Arg 20 25 30 geg ate gcc teg atg ccg tgg gtc ggc etc gga ctg ggc ctg ate gcc Ala lie Ala Ser Me^ Pro Trp Val Gly Leu Gly Leu Gly Leu lie Ala 35 40 45 gga etc ggc tgc gcc ate gtc acc gtc geg ggg ggc ggc cag cca ct:g Gly Leu Gly Cys Ala He Val Thr Val Ala Gly Gly Gly Gin Pro Leu 50 55 60 gca ate gca gca ggc ctg gca ate ctg gee ctg tgc acc ggc ttc ctg Ala lie Ala Ala Gly Leu Ala lie Leu Ala Leu Cys Thr Gly Phe Leu 65 70 75 80 cac etc gac gga. etc gcc gac acc gcc gac ggc ctg ggc tee cgc aag His Leu Asp Gly Leu Ala Asp Thr Ala Asp Gly Leu Gly Ser Ar-g Lys 85 90 95 ccg gee cac gag gcc ctg acc ate atg cgc caa tea gac ate ggg ccc Pro Ala His Glu Ala Leu Thr lie Met Arg Gin Ser Asp He Gly Pro -100 105 110 atg ggc gtc acc gcc. ate ate etc gtg ctg geg ttg gag ate geg gca Met Gly Val Thr Ala lie lie Leu Val Leu Ala Leu Glu lie hla. Ala 115 120 125 . . ggc ggt tea gga cac ett gat ggc tgg cgt ggc gtc tgg ctg ctg gtg Gly Gly Ser Gly His Leu Asp Gly Trp Arg Gly Val Trp Leu Leu Val 130 135 140 . 48 96 X44 192 240 288 336 384 432 aca atg ccc atg gtg geg cgc gtc age gcc ctg tee gee acc gga ega Thr Met Pro Met Val Ala Arg Val Ser Ala Leu Ser Ala Thr Gly Arg 145 150 155 160 tgg att ccg age gcc cac aag aag ggg ttc gga geg etc ttc gee . gga Trp lie Pro Ser Ala His Lys Lys Gly Phe Gly Ala Leu Phe Ala Gly 165 170 175 aag aeg cac cct geg aeg ate gtg gtc gcc tea gtg ate ged geg gtg Lys Thr His Pro Ala Thr lie Val Val Ala Ser Val lie Ala Ala Val 180 185 190 480 526 -10- 576 624 ate gee geg ggc agt gga tgg ctg etc ttc ggc tgg egg gee gee etc lie Ala Ala Gly Ser Gly Trp Leu Leu Phe Gly Trp Arg Ala Ala Leu 195 200 205 gtg geg gtg tgt gee tgc ctg gee age tgg gtc ttc ggc gtg geg tgg
Val Ala Val Cys Ala Cys Leu Ala Ser Trp Val Phe Gly Val Ala Trp 210 215 220 ege ege cat ate ctg geg egg etc gga gga ctg acc ggc gac acc ttc Arg Arg His lie Leu Ala Arg Leu Gly Gly Leu Thr Gly Asp Thr Phe 225 230 235 240 ggg tee ctg gtc gag atg age ggc ctg gee tat ttg ttg acc ctg gca Gly Ser Leu Val Glu Met Ser Gly Leu Ala Tyr Leu Leu Thr Leu Ala 245 250 255 ttg ttc gee tga Leu Phe Ala 6 259
PRT 費氏丙酸桿菌 <400> 6
Met Ala Thr Arg Asn Gly Leu Leu Ala Ala Trp Gly Leu Phe Thr Val 1 5 10 15
Leu Pro Ala Pro Val Val Ala Glu Val Asp Glu Arg Leu Ala Val Arg 20 25 30
Ser Met Pro Trp Val Gly Leu Gly Leu Gly Leu lie Ala 40 45
Gly Leu Gly Cys Ala lie Val Thr Val Ala Gly Gly Gly Gin Pro Leu 50 55 60
Ala lie Ala Ala Gly Leu Ala lie Leu Ala Leu Cys Thr Gly Phe Leu 65 70 . 75 80
His Leu Asp Gly Leu Ala Asp Thr Aia Asp Gly Leu Gly Ser Arg Lys 85 90 95
Pro Ala His Glu Ala Leu Thr lie Met Arg Gin Ser Asp lie Gly Pro 100 105 110
Met Gly Val Thr Ala He lie Leu Val Leu Ala Leu Glu lie Ala Ala 115 120 125
Gly Gly Ser Gly His Leu Asp Gly Trp Arg Gly Val Trp Leu Leu Val 130 135 140
Thr Met. Pro Met Val Ala Arg Val Ser Ala Leu Ser Ala Thr Gly Arg 145 150 155 160
Trp lie Pro Ser Ala His Lys Lys Gly Phe Gly Ala Leu Phe Ala Gly 672 720 768 780 <210> <211> <212> <213>
Ala lie Ala 35 -11 . 1328612 165 170 175
Lys Thr His Pro Ala Thr lie Val Val Ala Ser Val lie Ala Ala Val 180 185 190 lie Ala Ala Gly Ser Gly Trp Leu Leu Phe Gly Trp Arg Ala Ala Leu 195 200 205
Val Ala Val 210
Cys Ala Cys Leu Ala Ser Trp Val Phe. Gly Val Ala 215 220
Trp
Arg Arg His lie Leu Ala Arg Leu Gly Gly Leu Thr Gly Asp Thr 225 230 235 Gly Ser Leu Val Glu Met Ser Gly Leu Ala Tyr Leu Leu Thr Leu 245 250 255 Leu Phe Ala
Phe 240 Ala <210> 7 <211> 60.3 <212〉 DNA <213>費氏丙酸桿菌 <220> <221> CDS <222> ⑴..(603) <223> <400> 7 atg age gga tcc geg ccg cag ege acc gag ccg acc acc gcc gaa ctg Met Ser Gly Ser Ala Pro Gin Arg Thr Glu Pro Thr Thr Ala Glu Leu 1 5 10 15 ege cac ege ccc ega ctg ate gtg aac acc ggg aac ggc aag ggc aag Arg His Arg Pro Arg Leu lie Val Asn Thr Gly Asn Gly Lys Gly . Lys 20 25 30 48 96 tcc acc gcc gca ttc ggc atg gga ctg egg gcc tgg geg cag ggc tgg Ser Thr Ala Ala Phe Gly Met Gly Leu Arg Ala Trp Ala Gin Gly Trp 35 40 45 144 teg ate ggg gtc ttc cag ttc ate aag teg gga cgt tgg cac acc ggc Ser lie Gly Val Phe Gin Phe lie Lys Ser Gly Arg Trp His Thr Gly 50 55 60 192 gag cag cag gcc tat gca cag etc gac cag gcc cat egg aeg acc gga Glu Gin Gin Ala Tyr Ala Gin Leu Asp Gin Ala His Arg Thr Thr Gly 65 70 75 80 gtc ggc gga ccg gtg gaa tgg caa tea etc gga tcc ggc tgg teg tgg Val Gly Gly Pro Val Glu Trp Gin Ser Leu Gly . Ser Gly Trp Ser Trp 85 90 95 240 288 ctg agg geg acc gag ggc acc gac cag gca gcc atg geg gcc geg ggc Leu Arg Ala Thr Glu Gly Thr Asp Gin Ala Ala Met Ala Ala Ala Gly 100 105 110 -12- 336 384 tgg^ gcc cac gtg cgc acc ctg etc gee gca cag acc cac egg etc tac
Trp Ala His Val Arg Thr Leu Leu Ala Ala Gin Thr His Arg Leu Tyr 115 120 125 ate etc gac gaa ttc gcc cat gtg etc aac aag gga tgg ctg gat gtc lie Leu Asp Glu Phe Ala His Val Leu Asn Lys Gly Trp Leu Asp Val 130 135 140 432 gac gag gtc get gac gac ctg gca cat cgt ccc ggc aeg caa cat gtg Asp Glu Val Ala Asp Asp Leu Ala His Arg Pro Gly Thr Gin His Val 145 150 155 160 gtg ate acc gga cgc aac tgc ccc gcc. gga ate ate ggg ate gcc gac Val lie Thr Gly Arg Asn Cys Pro Ala Gly lie lie Gly lie Ala Asp 165 170 175 ate gtc aeg tee atg gac aac gtc aaa cat ccc ttt ggc aag gga gaa lie Val Thr Ser Met Asp Asn Val Lys His Pro Phe Gly Lys Gly Glu 180 185 190 480 528 576 603 ega gga cag geg gg*t ate gaa tgg tga Arg Gly Gin Ala Gly lie Glu Trp 195 200 <210> 8 <211> 200 <212> PRT <213> 費氏丙酸桿菌 <400> θ
Met Ser Gly Ser Ala Pro Gin Arg Thr Glu Pro Thr Thr Ala Glu Leu 15 10 15
Arg His Arg Pro Arg Leu lie Val Asn Thr Gly Asn Gly Lys Gly Lys 20 25 30
Ser Thr Ala Ala Phe Gly Met Gly Leu Arg Ala Trp Ala Gin Gly Trp 35 40 45
Ser lie Gly Val Phe Gin Phe lie LyS Ser Gly Arg Trp His Thr Gly 50 55 60
Glu Gin Gin Ala Tyr Ala Gin Leu Asp Gin Ala His Arg Thr Thr Gly 65 70 75 80
Val Gly Gly Pro Val Glu Trp Gin Ser Leu Gly Ser Gly Trp Ser Trp Θ5 90 95 • · . ·
Leu Arg Ala Thr Glu Gly Thr Asp Gin Ala Ala Met Ala Ala Ala Gly 100 105 110
Trp Ala His Val Arg Thr Leu Leu Ala Ala Gin Thr His Arg Leu Tyr 115 120 125 lie Leu Asp Glu Phe Ala His Val Leu Asn Lys Gly Trp Leu Asp Val 130 135 140
Asp Glu. Val Ala Asp Asp Leu Ala His Arg Pro Gly Thr Gin His Val -13- 1328612 145 150 155 160
Val lie Thr Gly Arg Asn Cys Pro Ala Gly lie lie Gly lie Ala Asp 165 170 175 lie Val Thr Ser Met Asp Asn Val Lys His Pro Phe Gly Lys Gly Glu 180 185 190
Arg Gly Gin Ala Gly lie Glu Trp 195 200 <210> <211> <212> <213> 9 61 DNA ΛΧ的序列 <220> <223> 引子 <400> 9 GGGATCCTCT AGAGCATGCA AGCTTCTCGA GAATCGATAG ATCTCTAAGG AAGCTAAAAT 60 G 61 <211> <212> <213> 31 DNA 人工的序列 <220> <223> 弓[子 <400> 10 CAGTAGATCT CGACAAGGAG GAACCCATGA G 31 <211> <212> <213> 30 DNA ΛΧ的序列 <220> <223> 引子 <400> 11 CGTAAGATCT CAGTTTCGGA CATGGCAGTG 30 <211> <212> <213> 24 DNA. ΛΧ的序列 <220> <223〉 引子 <400> 12 CACCACCAAC ATCGATGAGG ΑΆΛΟ 24 -14- 1328612 <211> 25 <212> DNA <213> ΛΧ的序列 <220> <223〉 引子 <400> 13
TCCAATTGGG ACTCAGTGGT CGCTG <211> 39 <212> DNA <213>人工的序列 <220> <223> 引子 <400> 14
CTGATATCAA TTGGAGGACA TCAGATGACC CGCATCGTC <211> 28 <212> DNA <213>人工的序列 <220> <223> 弓I子 <400> 15
CTGAATTCGG CCACGTCAGA TCGCGTCC <211> 39 <212> DNA <213> 人工的序列 <220> <223> 引子 <400> 16
CTGATATCAA TTGGAGGACA TCAGATGACC CGCATCGTC <211> 29 <212> DNA <213〉ΛΧ的序列 <220> <223> 引子 <400〉 17 CTGAATTCCG GCGGCTCAGG CGAACAATG .
Claims (1)
1328612 -99-^4«------ I卒月R绫(更)正本 拾、申請專利範圍 附件4·· 第92 120267號專利申請案 中文申請專利範圍替換本 民國99年5月21曰修正 1. —種可取得自細菌分歧桿菌科(Mycobacteriaceae )之多肽,其: (i)作用如磷基-、核苷醯基-或芳基轉移酶;或 (1〇具有£0 2.7_7-或£匚2.7.8—之活性;該多肽 係選自下列中: (a )依照序列識別號4或與其有至少85%相同序多 的多肽, (b)依照序列識別號6或與其有至少85%相同序列 的多肽, (c )由依照序列識別號3或在嚴格條件下雜交至彼 之序列所編碼之多肽,且具有磷基-或核苷醯基轉移酶之 活性, (d )由依照序列識別號5或在嚴格條件下雜交至彼 之序列所編碼之多肽,且具有芳基轉移酶之活性, (e) 多肽,其爲具有至少150個胺基酸長度之片段 (a)至(d), (f) 多肽,其爲[(Ο或(c)]與[(b)或(d)]之 二多肽組合體。 2. —種多核苷酸,其編碼如申請專利範圍第1項之 多肽。 1328612 3. —種載體,其係包含如申請專利範圍第2項中定 義之一種或多種多核苷酸序列。 4. 如申請專利範圍第3項之載體,其另包含編碼 CobA蛋白質之核酸序列。 .: 5. 如申請專利範圍第4項之載體,其中編碼Cob A 蛋白質之核酸序列係取自費氏丙酸桿菌(P. freudenreichii ) 〇 6. —種可視需要爲原核的宿主細胞,其係經如申請 專利範圍第2項之多核苷酸序列之一或多種複本或如申請 專利範圍第3、4或5項之載體所轉形。 7. —種生產^隹生素B12或其前驅物之方法,該方法 包含在製作或合成維生素B12或其前驅物之條件下培養或 發酵如申請專利範圍第6項之宿主細胞。 8. —種如申請專利範圍第1項之多肽、如申請專利範 圍第2琿之多核苷酸、如申請專利範圍第3、4或5項之載體 或如申請專利範圍第6項之宿主細胞在製作或合成維生素 b12或其前驅物方面的用途。 -2 -
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02255203 | 2002-07-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200413532A TW200413532A (en) | 2004-08-01 |
TWI328612B true TWI328612B (en) | 2010-08-11 |
Family
ID=30775871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW092120267A TWI328612B (en) | 2002-07-25 | 2003-07-24 | Genes and their encoded polypeptides involved in the biosynthetic pathway of vitamin b12, vectors and host cells comprising the genes, and process for producing vitamin b12 |
Country Status (8)
Country | Link |
---|---|
US (1) | US7527953B2 (zh) |
EP (1) | EP1525303A1 (zh) |
JP (1) | JP4695389B2 (zh) |
CN (1) | CN100590195C (zh) |
AU (1) | AU2003251641B2 (zh) |
CA (1) | CA2492332A1 (zh) |
TW (1) | TWI328612B (zh) |
WO (1) | WO2004011635A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106661543A (zh) * | 2014-06-17 | 2017-05-10 | Xycrobe治疗公司 | 经遗传修饰的细菌和用于细菌的遗传修饰的方法 |
WO2017147507A1 (en) | 2016-02-24 | 2017-08-31 | Xycrobe Therapeutics, Inc. | Skin probiotic formulation |
CN109439553B (zh) * | 2018-12-26 | 2020-08-21 | 华熙生物科技股份有限公司 | 产麦角硫因的菌株及其筛选方法 |
WO2020141168A1 (en) * | 2018-12-31 | 2020-07-09 | Dsm Ip Assets B.V. | Novel acetyl-transferases |
CA3183350A1 (en) | 2020-06-23 | 2021-12-30 | Thomas M. Hitchcock | Probiotic skin formulations |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0096910B1 (en) | 1982-05-19 | 1989-04-19 | Unilever N.V. | Yeast of the genus kluyveromyces modified for the expression of preprothaumatin or its various allelic and modified forms or their maturation forms |
NZ208806A (en) | 1983-07-06 | 1988-07-28 | Gist Brocades Nv | Genetic engineering of industrial microorganism species: readily-transformable host used as intermediate in transfer of dna to the industrial species; plasmids |
FR2573262B1 (fr) | 1984-11-13 | 1987-01-02 | Thomson Csf | Amplificateur a large bande et faible bruit en ondes metriques |
DE3650783T2 (de) | 1985-04-15 | 2004-07-15 | Dsm Ip Assets B.V. | Verwendung des Glucoamylasepromotors aus Apergillus |
IL83192A (en) | 1986-07-18 | 1992-11-15 | Gist Brocades Nv | Method for the preparation of proteins with factor viii activity by microbial host cells;expression vectors,host cells,antibodies |
CA1323850C (en) | 1987-07-28 | 1993-11-02 | Johannes A. Van Den Berg | Kluyveromyces as a host strain |
FR2657622B1 (fr) * | 1990-01-31 | 1994-11-25 | Rhone Poulenc Sante | Polypeptides impliques dans la biosynthese des cobalamines et/ou des cobamides, sequences d'adn codant pour ces polypeptides, procede de preparation, et leur utilisation. |
ATE238425T1 (de) | 1993-07-23 | 2003-05-15 | Dsm Nv | Selektionmarker-genfreie rekombinante stämme: verfahren zur ihrer herstellung und die verwendung dieser stämme |
JPH0856673A (ja) * | 1994-08-29 | 1996-03-05 | Nippon Oil Co Ltd | ウロポルフィリノーゲンiii メチルトランスフェラーゼをコードするdna 及びこれを用いるビタミンb12の生産方法 |
FR2748492B1 (fr) | 1996-05-13 | 1998-06-19 | Rhone Poulenc Rorer Sa | Procede de biosynthese permettant la preparation de cobalamines |
GB9615794D0 (en) | 1996-07-26 | 1996-09-04 | Medical Res Council | Mutant herpes simplex virus strains and uses thereof |
AR022986A1 (es) | 1996-08-12 | 2002-09-04 | Gist Brocades Bv | Produccion y uso de composiciones que comprenden concentraciones altas de actividad de vitamina b12 |
GB9700411D0 (en) | 1997-01-10 | 1997-02-26 | Univ London | Eukaryotic gene expression cassette and uses thereof |
CN1169961C (zh) | 1997-04-11 | 2004-10-06 | Dsm公司 | 基因转变作为工具用于构建重组的工业化丝状真菌 |
AU736111C (en) | 1997-12-22 | 2004-02-19 | Dsm Ip Assets B.V. | Expression cloning in filamentous fungi |
JP2002518039A (ja) | 1998-06-25 | 2002-06-25 | デーエスエム・ナムローゼ・フェンノートシャップ | プロピオニバクテリウムベクター |
WO2001019993A2 (en) * | 1999-09-17 | 2001-03-22 | University Of Maryland, Baltimore | Virulence genes of m. marinum and m. tuberculosis |
-
2003
- 2003-07-24 TW TW092120267A patent/TWI328612B/zh not_active IP Right Cessation
- 2003-07-25 CA CA002492332A patent/CA2492332A1/en not_active Abandoned
- 2003-07-25 CN CN03817858A patent/CN100590195C/zh not_active Expired - Fee Related
- 2003-07-25 US US10/522,389 patent/US7527953B2/en not_active Expired - Fee Related
- 2003-07-25 WO PCT/EP2003/008216 patent/WO2004011635A1/en active Application Filing
- 2003-07-25 JP JP2004523800A patent/JP4695389B2/ja not_active Expired - Fee Related
- 2003-07-25 EP EP03771102A patent/EP1525303A1/en not_active Withdrawn
- 2003-07-25 AU AU2003251641A patent/AU2003251641B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP4695389B2 (ja) | 2011-06-08 |
US20060183188A1 (en) | 2006-08-17 |
TW200413532A (en) | 2004-08-01 |
JP2005533507A (ja) | 2005-11-10 |
AU2003251641B2 (en) | 2008-12-04 |
CN1671838A (zh) | 2005-09-21 |
WO2004011635A1 (en) | 2004-02-05 |
US7527953B2 (en) | 2009-05-05 |
AU2003251641A1 (en) | 2004-02-16 |
CN100590195C (zh) | 2010-02-17 |
CA2492332A1 (en) | 2004-02-05 |
EP1525303A1 (en) | 2005-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5662631B2 (ja) | 酵素 | |
KR101952467B1 (ko) | 변경된 점성 표현형을 갖는 사상균 | |
US9133446B2 (en) | Alkaline phosphatase | |
WO2019086708A1 (en) | A genetically modified bacillus subtilis strain, optimized vectors, and uses thereof | |
JP2008507970A (ja) | アラニン2,3アミノムターゼ | |
CN110592036A (zh) | 一种草铵膦脱氢酶突变体及在氧化-还原多酶偶联生产l-草铵膦中的应用 | |
CN113481185B (zh) | 一种耐盐β-半乳糖苷酶GalNC2-13及其制备方法和应用 | |
AU723380B2 (en) | A method of improving the production of biomass or a desired product from a cell | |
TWI328612B (en) | Genes and their encoded polypeptides involved in the biosynthetic pathway of vitamin b12, vectors and host cells comprising the genes, and process for producing vitamin b12 | |
AU784466B2 (en) | Cyclic depsipeptide synthases, genes thereof and mass production system of cyclic depsipeptide | |
JP2003516112A (ja) | 相同又は非相同タンパク質生産のための組換えペニシリウム フニクロスム | |
KR101185841B1 (ko) | 리파아제를 생산하는 신규 포토박테리움 갯버리코라 Gung47 | |
JP2008005734A (ja) | アルカリホスファターゼ | |
EP2010651B1 (en) | MUTATED TRUNCATED MT-PFKA GENE FOR THE SYNTHESIS OF ACTIVE SHORTER FRAGMENT OF 6-PHOSPHOFRUCTO-l-KINASE | |
CN102787107B (zh) | 嗜热脂环芽孢杆菌来源的羧酸酯酶D-1CarE5及其基因 | |
EP2116136A1 (en) | Novel phytases | |
CN114599778A (zh) | 生产多胺缀合物的酵母 | |
CN118516338A (zh) | 一种提高底物转化率的精氨酸酶突变体及其制备方法和应用 | |
JP2001275669A (ja) | 新規カタラーゼ遺伝子及び該遺伝子を用いた新規カタラーゼの製造方法 | |
CN118147114A (zh) | 用于催化根皮苷制备根皮素的β-葡萄糖苷酶突变体及其编码基因和它们的应用 | |
Sharipova et al. | Localization of alkaline phosphatase in Bacillus intermedius cells | |
JP2015159802A (ja) | エステラーゼ | |
KR20010037359A (ko) | L62 리파제를 생산하는 신균주 스타필로코커스 헤모리티커스 L62(KCTC 8957P) 및 형질전환된 대장균 BL21(DE3)/pSHML(KCTC 8956P)을 이용한 L62 리파제의 대량생산법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |