CN114651066A - 具有4-氨基苯甲酸羟化活性的多肽及其用途 - Google Patents
具有4-氨基苯甲酸羟化活性的多肽及其用途 Download PDFInfo
- Publication number
- CN114651066A CN114651066A CN202080077503.2A CN202080077503A CN114651066A CN 114651066 A CN114651066 A CN 114651066A CN 202080077503 A CN202080077503 A CN 202080077503A CN 114651066 A CN114651066 A CN 114651066A
- Authority
- CN
- China
- Prior art keywords
- amino acid
- ala
- leu
- gly
- arg
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- ALYNCZNDIQEVRV-UHFFFAOYSA-N 4-aminobenzoic acid Chemical compound NC1=CC=C(C(O)=O)C=C1 ALYNCZNDIQEVRV-UHFFFAOYSA-N 0.000 title claims abstract description 203
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 179
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 179
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 179
- 229960004050 aminobenzoic acid Drugs 0.000 title claims abstract description 100
- 230000000694 effects Effects 0.000 title claims description 25
- 230000033444 hydroxylation Effects 0.000 title claims description 25
- 238000005805 hydroxylation reaction Methods 0.000 title claims description 25
- 125000000539 amino acid group Chemical group 0.000 claims abstract description 83
- 230000000640 hydroxylating effect Effects 0.000 claims abstract description 73
- 238000000034 method Methods 0.000 claims abstract description 48
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims abstract description 40
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims abstract description 28
- 150000001413 amino acids Chemical group 0.000 claims description 249
- 229930182817 methionine Natural products 0.000 claims description 71
- 239000012634 fragment Substances 0.000 claims description 68
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 65
- 229940024606 amino acid Drugs 0.000 claims description 60
- 235000001014 amino acid Nutrition 0.000 claims description 60
- NFPYJDZQOKCYIE-UHFFFAOYSA-N 4-amino-3-hydroxybenzoic acid Chemical compound NC1=CC=C(C(O)=O)C=C1O NFPYJDZQOKCYIE-UHFFFAOYSA-N 0.000 claims description 51
- 239000013598 vector Substances 0.000 claims description 43
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 39
- 229960000310 isoleucine Drugs 0.000 claims description 39
- 238000006467 substitution reaction Methods 0.000 claims description 39
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 38
- 108091033319 polynucleotide Proteins 0.000 claims description 37
- 102000040430 polynucleotide Human genes 0.000 claims description 37
- 239000002157 polynucleotide Substances 0.000 claims description 37
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 36
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 claims description 33
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 33
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 claims description 32
- 235000004279 alanine Nutrition 0.000 claims description 32
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 31
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims description 31
- 235000018417 cysteine Nutrition 0.000 claims description 31
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 30
- 239000004474 valine Substances 0.000 claims description 30
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 29
- 239000004473 Threonine Substances 0.000 claims description 29
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims description 27
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 claims description 27
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims description 26
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 24
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims description 24
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 claims description 21
- 238000004519 manufacturing process Methods 0.000 claims description 21
- 125000002887 hydroxy group Chemical group [H]O* 0.000 claims description 20
- 239000004471 Glycine Substances 0.000 claims description 16
- 125000004435 hydrogen atom Chemical group [H]* 0.000 claims description 16
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 claims description 16
- 241000588724 Escherichia coli Species 0.000 claims description 15
- 244000005700 microbiome Species 0.000 claims description 15
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 claims description 12
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 claims description 12
- WKBOTKDWSSQWDR-UHFFFAOYSA-N Bromine atom Chemical group [Br] WKBOTKDWSSQWDR-UHFFFAOYSA-N 0.000 claims description 10
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims description 10
- 229910052801 chlorine Inorganic materials 0.000 claims description 10
- 125000001309 chloro group Chemical group Cl* 0.000 claims description 10
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 claims description 10
- 229910052731 fluorine Inorganic materials 0.000 claims description 10
- 125000001153 fluoro group Chemical group F* 0.000 claims description 10
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 claims description 10
- 230000002708 enhancing effect Effects 0.000 claims description 9
- 150000005416 4-aminobenzoic acids Chemical class 0.000 claims description 8
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical group [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 claims description 8
- 238000012258 culturing Methods 0.000 claims description 8
- 229910052740 iodine Inorganic materials 0.000 claims description 8
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 claims description 7
- 125000003277 amino group Chemical group 0.000 claims description 6
- 150000003839 salts Chemical class 0.000 claims description 5
- ALYNCZNDIQEVRV-PZFLKRBQSA-N 4-amino-3,5-ditritiobenzoic acid Chemical compound [3H]c1cc(cc([3H])c1N)C(O)=O ALYNCZNDIQEVRV-PZFLKRBQSA-N 0.000 claims description 4
- 239000001963 growth medium Substances 0.000 claims description 4
- 150000005418 4-aminobenzoic acid derivatives Chemical class 0.000 claims description 3
- OMXSJMPUFHYPGF-UHFFFAOYSA-N (fluoroamino)oxymethane Chemical compound CONF OMXSJMPUFHYPGF-UHFFFAOYSA-N 0.000 claims description 2
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 claims description 2
- GDTBXPJZTBHREO-UHFFFAOYSA-N bromine Substances BrBr GDTBXPJZTBHREO-UHFFFAOYSA-N 0.000 claims description 2
- 229910052794 bromium Inorganic materials 0.000 claims description 2
- 239000000460 chlorine Substances 0.000 claims description 2
- 241000186254 coryneform bacterium Species 0.000 claims 1
- 125000003275 alpha amino acid group Chemical group 0.000 abstract 3
- 108020004414 DNA Proteins 0.000 description 166
- 239000013612 plasmid Substances 0.000 description 117
- 230000015572 biosynthetic process Effects 0.000 description 106
- 238000003786 synthesis reaction Methods 0.000 description 101
- 108091034117 Oligonucleotide Proteins 0.000 description 94
- 108090000623 proteins and genes Proteins 0.000 description 90
- 210000004027 cell Anatomy 0.000 description 53
- 239000002609 medium Substances 0.000 description 37
- 102000004190 Enzymes Human genes 0.000 description 32
- 108090000790 Enzymes Proteins 0.000 description 32
- 241000282326 Felis catus Species 0.000 description 26
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 20
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 18
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 18
- 108010047495 alanylglycine Proteins 0.000 description 18
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 18
- 230000035772 mutation Effects 0.000 description 18
- 229920001817 Agar Polymers 0.000 description 17
- 239000008272 agar Substances 0.000 description 17
- 238000002360 preparation method Methods 0.000 description 17
- 108010079364 N-glycylalanine Proteins 0.000 description 16
- 239000000047 product Substances 0.000 description 15
- 108010005233 alanylglutamic acid Proteins 0.000 description 14
- 239000007788 liquid Substances 0.000 description 13
- 108020004705 Codon Proteins 0.000 description 12
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 12
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 12
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 12
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 12
- 108010047857 aspartylglycine Proteins 0.000 description 12
- OOYGSFOGFJDDHP-KMCOLRRFSA-N kanamycin A sulfate Chemical compound OS(O)(=O)=O.O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N OOYGSFOGFJDDHP-KMCOLRRFSA-N 0.000 description 12
- 229960002064 kanamycin sulfate Drugs 0.000 description 12
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 12
- FJKROLUGYXJWQN-UHFFFAOYSA-N 4-hydroxybenzoic acid Chemical compound OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 11
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 11
- 239000002773 nucleotide Chemical group 0.000 description 11
- 125000003729 nucleotide group Chemical group 0.000 description 11
- 101150046211 pobA gene Proteins 0.000 description 11
- 238000000746 purification Methods 0.000 description 11
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 11
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 10
- NKDSBBBPGIVWEI-RCWTZXSCSA-N Met-Arg-Thr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NKDSBBBPGIVWEI-RCWTZXSCSA-N 0.000 description 10
- 108010081404 acein-2 Proteins 0.000 description 10
- 108010061238 threonyl-glycine Proteins 0.000 description 10
- 229940041514 candida albicans extract Drugs 0.000 description 9
- 239000012530 fluid Substances 0.000 description 9
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 9
- 239000012138 yeast extract Substances 0.000 description 9
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 8
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 8
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 8
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 8
- 241000880493 Leptailurus serval Species 0.000 description 8
- 238000010367 cloning Methods 0.000 description 8
- 239000000499 gel Substances 0.000 description 8
- 108010081551 glycylphenylalanine Proteins 0.000 description 8
- 238000003780 insertion Methods 0.000 description 8
- 230000037431 insertion Effects 0.000 description 8
- 229910052594 sapphire Inorganic materials 0.000 description 8
- 239000010980 sapphire Substances 0.000 description 8
- 108010073634 Aminodeoxychorismate lyase Proteins 0.000 description 7
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 7
- 102000008109 Mixed Function Oxygenases Human genes 0.000 description 7
- 108010074633 Mixed Function Oxygenases Proteins 0.000 description 7
- 108700005078 Synthetic Genes Proteins 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 239000008103 glucose Substances 0.000 description 7
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 7
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 7
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 7
- 238000002741 site-directed mutagenesis Methods 0.000 description 7
- 229940090248 4-hydroxybenzoic acid Drugs 0.000 description 6
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 6
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 6
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 6
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 6
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 6
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 6
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 6
- 241000186226 Corynebacterium glutamicum Species 0.000 description 6
- LTUVYLVIZHJCOQ-KKUMJFAQSA-N Glu-Arg-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LTUVYLVIZHJCOQ-KKUMJFAQSA-N 0.000 description 6
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 6
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 6
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 6
- GZBZACMXFIPIDX-WHFBIAKZSA-N Gly-Cys-Asp Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN)C(=O)O GZBZACMXFIPIDX-WHFBIAKZSA-N 0.000 description 6
- JBJNKUOMNZGQIM-PYJNHQTQSA-N His-Arg-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JBJNKUOMNZGQIM-PYJNHQTQSA-N 0.000 description 6
- IWXMHXYOACDSIA-PYJNHQTQSA-N His-Ile-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O IWXMHXYOACDSIA-PYJNHQTQSA-N 0.000 description 6
- 239000007836 KH2PO4 Substances 0.000 description 6
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 6
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 6
- NRFGTHFONZYFNY-MGHWNKPDSA-N Leu-Ile-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NRFGTHFONZYFNY-MGHWNKPDSA-N 0.000 description 6
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 6
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 6
- 229910021586 Nickel(II) chloride Inorganic materials 0.000 description 6
- OVJMCXAPGFDGMG-HKUYNNGSSA-N Phe-Gly-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OVJMCXAPGFDGMG-HKUYNNGSSA-N 0.000 description 6
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 6
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 6
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 6
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 6
- RQXDSYQXBCRXBT-GUBZILKMSA-N Ser-Met-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RQXDSYQXBCRXBT-GUBZILKMSA-N 0.000 description 6
- TYIHBQYLIPJSIV-NYVOZVTQSA-N Ser-Trp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)NC(=O)[C@H](CO)N TYIHBQYLIPJSIV-NYVOZVTQSA-N 0.000 description 6
- NLLARHRWSFNEMH-NUTKFTJISA-N Trp-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NLLARHRWSFNEMH-NUTKFTJISA-N 0.000 description 6
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 6
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 6
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 6
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 6
- 229960002685 biotin Drugs 0.000 description 6
- 235000020958 biotin Nutrition 0.000 description 6
- 239000011616 biotin Substances 0.000 description 6
- 239000001110 calcium chloride Substances 0.000 description 6
- 229910001628 calcium chloride Inorganic materials 0.000 description 6
- 239000004202 carbamide Substances 0.000 description 6
- 229910052927 chalcanthite Inorganic materials 0.000 description 6
- 239000012228 culture supernatant Substances 0.000 description 6
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 6
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 6
- 229910052564 epsomite Inorganic materials 0.000 description 6
- 108010050848 glycylleucine Proteins 0.000 description 6
- XLYOFNOQVPJJNP-ZSJDYOACSA-N heavy water Substances [2H]O[2H] XLYOFNOQVPJJNP-ZSJDYOACSA-N 0.000 description 6
- 108010092114 histidylphenylalanine Proteins 0.000 description 6
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 6
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 6
- 108010064235 lysylglycine Proteins 0.000 description 6
- SQQMAOCOWKFBNP-UHFFFAOYSA-L manganese(II) sulfate Chemical compound [Mn+2].[O-]S([O-])(=O)=O SQQMAOCOWKFBNP-UHFFFAOYSA-L 0.000 description 6
- 229910000357 manganese(II) sulfate Inorganic materials 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 239000013028 medium composition Substances 0.000 description 6
- 229910052603 melanterite Inorganic materials 0.000 description 6
- QMMRZOWCJAIUJA-UHFFFAOYSA-L nickel dichloride Chemical compound Cl[Ni]Cl QMMRZOWCJAIUJA-UHFFFAOYSA-L 0.000 description 6
- 108010051242 phenylalanylserine Proteins 0.000 description 6
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 6
- 108010031719 prolyl-serine Proteins 0.000 description 6
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 6
- 108010026333 seryl-proline Proteins 0.000 description 6
- 239000011780 sodium chloride Substances 0.000 description 6
- NWONKYPBYAMBJT-UHFFFAOYSA-L zinc sulfate Chemical compound [Zn+2].[O-]S([O-])(=O)=O NWONKYPBYAMBJT-UHFFFAOYSA-L 0.000 description 6
- 229910000368 zinc sulfate Inorganic materials 0.000 description 6
- 239000011686 zinc sulphate Substances 0.000 description 6
- QPEJHSFTZVMSJH-UHFFFAOYSA-N 3-amino-5-hydroxybenzoic acid Chemical compound NC1=CC(O)=CC(C(O)=O)=C1 QPEJHSFTZVMSJH-UHFFFAOYSA-N 0.000 description 5
- 241001485655 Corynebacterium glutamicum ATCC 13032 Species 0.000 description 5
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 5
- 102000003960 Ligases Human genes 0.000 description 5
- 108090000364 Ligases Proteins 0.000 description 5
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 239000002253 acid Substances 0.000 description 5
- 229910052799 carbon Inorganic materials 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- WJXSWCUQABXPFS-UHFFFAOYSA-N 3-hydroxyanthranilic acid Chemical compound NC1=C(O)C=CC=C1C(O)=O WJXSWCUQABXPFS-UHFFFAOYSA-N 0.000 description 4
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 4
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 4
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 4
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 4
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 4
- NOGFDULFCFXBHB-CIUDSAMLSA-N Ala-Leu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NOGFDULFCFXBHB-CIUDSAMLSA-N 0.000 description 4
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 4
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 4
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 4
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 4
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 4
- MJKBOVWWADWLHV-ZLUOBGJFSA-N Asp-Cys-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)C(=O)O MJKBOVWWADWLHV-ZLUOBGJFSA-N 0.000 description 4
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 4
- CRNKLABLTICXDV-GUBZILKMSA-N Asp-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N CRNKLABLTICXDV-GUBZILKMSA-N 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- VZKXOWRNJDEGLZ-WHFBIAKZSA-N Cys-Asp-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O VZKXOWRNJDEGLZ-WHFBIAKZSA-N 0.000 description 4
- DQUWSUWXPWGTQT-DCAQKATOSA-N Cys-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CS DQUWSUWXPWGTQT-DCAQKATOSA-N 0.000 description 4
- MWLYSLMKFXWZPW-ZPFDUUQYSA-N Gln-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCC(N)=O MWLYSLMKFXWZPW-ZPFDUUQYSA-N 0.000 description 4
- KJRXLVZYJJLUCV-DCAQKATOSA-N Gln-Arg-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KJRXLVZYJJLUCV-DCAQKATOSA-N 0.000 description 4
- WQWMZOIPXWSZNE-WDSKDSINSA-N Gln-Asp-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O WQWMZOIPXWSZNE-WDSKDSINSA-N 0.000 description 4
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 4
- QGWXAMDECCKGRU-XVKPBYJWSA-N Gln-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(N)=O)C(=O)NCC(O)=O QGWXAMDECCKGRU-XVKPBYJWSA-N 0.000 description 4
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 4
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 4
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 4
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 4
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 4
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 4
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 4
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 4
- UMRIXLHPZZIOML-OALUTQOASA-N Gly-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)CN UMRIXLHPZZIOML-OALUTQOASA-N 0.000 description 4
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 4
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 4
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 4
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 4
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 4
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 4
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 4
- VZBIUJURDLFFOE-IHRRRGAJSA-N Leu-His-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VZBIUJURDLFFOE-IHRRRGAJSA-N 0.000 description 4
- YWYQSLOTVIRCFE-SRVKXCTJSA-N Leu-His-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O YWYQSLOTVIRCFE-SRVKXCTJSA-N 0.000 description 4
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 4
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 4
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 4
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 4
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 4
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 4
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 4
- OBVHKUFUDCPZDW-JYJNAYRXSA-N Met-Arg-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OBVHKUFUDCPZDW-JYJNAYRXSA-N 0.000 description 4
- AHZNUGRZHMZGFL-GUBZILKMSA-N Met-Arg-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCNC(N)=N AHZNUGRZHMZGFL-GUBZILKMSA-N 0.000 description 4
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 4
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 4
- HOYQLNNGMHXZDW-KKUMJFAQSA-N Phe-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HOYQLNNGMHXZDW-KKUMJFAQSA-N 0.000 description 4
- SFKOEHXABNPLRT-KBPBESRZSA-N Phe-His-Gly Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)NCC(O)=O SFKOEHXABNPLRT-KBPBESRZSA-N 0.000 description 4
- AAERWTUHZKLDLC-IHRRRGAJSA-N Phe-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O AAERWTUHZKLDLC-IHRRRGAJSA-N 0.000 description 4
- MRWOVVNKSXXLRP-IHPCNDPISA-N Phe-Ser-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MRWOVVNKSXXLRP-IHPCNDPISA-N 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 4
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 4
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 4
- 108010003201 RGH 0205 Proteins 0.000 description 4
- 241000190950 Rhodopseudomonas palustris Species 0.000 description 4
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 4
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 4
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 4
- 241000589196 Sinorhizobium meliloti Species 0.000 description 4
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 4
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 4
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 4
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 4
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 4
- WPAKPLPGQNUXGN-OSUNSFLBSA-N Thr-Ile-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WPAKPLPGQNUXGN-OSUNSFLBSA-N 0.000 description 4
- MICFJCRQBFSKPA-UMPQAUOISA-N Trp-Met-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)=CNC2=C1 MICFJCRQBFSKPA-UMPQAUOISA-N 0.000 description 4
- RNDWCRUOGGQDKN-UBHSHLNASA-N Trp-Ser-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RNDWCRUOGGQDKN-UBHSHLNASA-N 0.000 description 4
- JWGXUKHIKXZWNG-RYUDHWBXSA-N Tyr-Gly-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JWGXUKHIKXZWNG-RYUDHWBXSA-N 0.000 description 4
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 4
- NWEGIYMHTZXVBP-JSGCOSHPSA-N Tyr-Val-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O NWEGIYMHTZXVBP-JSGCOSHPSA-N 0.000 description 4
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 4
- PTFPUAXGIKTVNN-ONGXEEELSA-N Val-His-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N PTFPUAXGIKTVNN-ONGXEEELSA-N 0.000 description 4
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 4
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 4
- HVRRJRMULCPNRO-BZSNNMDCSA-N Val-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 HVRRJRMULCPNRO-BZSNNMDCSA-N 0.000 description 4
- PMKQKNBISAOSRI-XHSDSOJGSA-N Val-Tyr-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N PMKQKNBISAOSRI-XHSDSOJGSA-N 0.000 description 4
- 108010013835 arginine glutamate Proteins 0.000 description 4
- 108010008355 arginyl-glutamine Proteins 0.000 description 4
- 108010068380 arginylarginine Proteins 0.000 description 4
- 108010036533 arginylvaline Proteins 0.000 description 4
- 235000003704 aspartic acid Nutrition 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 4
- 108010077515 glycylproline Proteins 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 238000004128 high performance liquid chromatography Methods 0.000 description 4
- 108010025306 histidylleucine Proteins 0.000 description 4
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 108010057821 leucylproline Proteins 0.000 description 4
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 4
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 4
- 229920002577 polybenzoxazole Polymers 0.000 description 4
- 108010070643 prolylglutamic acid Proteins 0.000 description 4
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 4
- 108010045269 tryptophyltryptophan Proteins 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 229940086681 4-aminobenzoate Drugs 0.000 description 3
- 125000005274 4-hydroxybenzoic acid group Chemical group 0.000 description 3
- 241000186361 Actinobacteria <class> Species 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- 241000186216 Corynebacterium Species 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 3
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 3
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 125000000524 functional group Chemical group 0.000 description 3
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 239000012137 tryptone Substances 0.000 description 3
- 101150099542 tuf gene Proteins 0.000 description 3
- YQUVCSBJEUQKSH-UHFFFAOYSA-N 3,4-dihydroxybenzoic acid Chemical compound OC(=O)C1=CC=C(O)C(O)=C1 YQUVCSBJEUQKSH-UHFFFAOYSA-N 0.000 description 2
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 2
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 2
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 2
- HGRBNYQIMKTUNT-XVYDVKMFSA-N Ala-Asn-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HGRBNYQIMKTUNT-XVYDVKMFSA-N 0.000 description 2
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 2
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 2
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 2
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 2
- NFDVJAKFMXHJEQ-HERUPUMHSA-N Ala-Asp-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N NFDVJAKFMXHJEQ-HERUPUMHSA-N 0.000 description 2
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 2
- OQCPATDFWYYDDX-HGNGGELXSA-N Ala-Gln-His Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O OQCPATDFWYYDDX-HGNGGELXSA-N 0.000 description 2
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 2
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 2
- 108010076441 Ala-His-His Proteins 0.000 description 2
- JEPNLGMEZMCFEX-QSFUFRPTSA-N Ala-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C)N JEPNLGMEZMCFEX-QSFUFRPTSA-N 0.000 description 2
- HUUOZYZWNCXTFK-INTQDDNPSA-N Ala-His-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N HUUOZYZWNCXTFK-INTQDDNPSA-N 0.000 description 2
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 2
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 2
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 2
- MAEQBGQTDWDSJQ-LSJOCFKGSA-N Ala-Met-His Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MAEQBGQTDWDSJQ-LSJOCFKGSA-N 0.000 description 2
- DEWWPUNXRNGMQN-LPEHRKFASA-N Ala-Met-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N DEWWPUNXRNGMQN-LPEHRKFASA-N 0.000 description 2
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 2
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 2
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 2
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 2
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 2
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 2
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 2
- UBTKNYUAMYRMKE-GOPGUHFVSA-N Ala-Trp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N UBTKNYUAMYRMKE-GOPGUHFVSA-N 0.000 description 2
- GCTANJIJJROSLH-GVARAGBVSA-N Ala-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C)N GCTANJIJJROSLH-GVARAGBVSA-N 0.000 description 2
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 2
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 2
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 2
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 2
- 108010052434 Aminodeoxychorismate synthase Proteins 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 2
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 2
- ZTKHZAXGTFXUDD-VEVYYDQMSA-N Arg-Asn-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZTKHZAXGTFXUDD-VEVYYDQMSA-N 0.000 description 2
- FBLMOFHNVQBKRR-IHRRRGAJSA-N Arg-Asp-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FBLMOFHNVQBKRR-IHRRRGAJSA-N 0.000 description 2
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 2
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 2
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 2
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 2
- BMNVSPMWMICFRV-DCAQKATOSA-N Arg-His-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CN=CN1 BMNVSPMWMICFRV-DCAQKATOSA-N 0.000 description 2
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 2
- CFGHCPUPFHWMCM-FDARSICLSA-N Arg-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N CFGHCPUPFHWMCM-FDARSICLSA-N 0.000 description 2
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 2
- IIAXFBUTKIDDIP-ULQDDVLXSA-N Arg-Leu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IIAXFBUTKIDDIP-ULQDDVLXSA-N 0.000 description 2
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 2
- XFXZKCRBBOVJKS-BVSLBCMMSA-N Arg-Phe-Trp Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 XFXZKCRBBOVJKS-BVSLBCMMSA-N 0.000 description 2
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 2
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 2
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 2
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 2
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 2
- VYLVOMUVLMGCRF-ZLUOBGJFSA-N Asn-Asp-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VYLVOMUVLMGCRF-ZLUOBGJFSA-N 0.000 description 2
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 2
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 2
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 2
- SYZWMVSXBZCOBZ-QXEWZRGKSA-N Asn-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N SYZWMVSXBZCOBZ-QXEWZRGKSA-N 0.000 description 2
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 2
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 2
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 2
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 2
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 2
- ICTXFVKYAGQURS-UBHSHLNASA-N Asp-Asn-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ICTXFVKYAGQURS-UBHSHLNASA-N 0.000 description 2
- JGDBHIVECJGXJA-FXQIFTODSA-N Asp-Asp-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JGDBHIVECJGXJA-FXQIFTODSA-N 0.000 description 2
- RSMIHCFQDCVVBR-CIUDSAMLSA-N Asp-Gln-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N RSMIHCFQDCVVBR-CIUDSAMLSA-N 0.000 description 2
- LJRPYAZQQWHEEV-FXQIFTODSA-N Asp-Gln-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O LJRPYAZQQWHEEV-FXQIFTODSA-N 0.000 description 2
- CSEJMKNZDCJYGJ-XHNCKOQMSA-N Asp-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O CSEJMKNZDCJYGJ-XHNCKOQMSA-N 0.000 description 2
- XLILXFRAKOYEJX-GUBZILKMSA-N Asp-Leu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLILXFRAKOYEJX-GUBZILKMSA-N 0.000 description 2
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 2
- YQKYLDVPCOGIRB-SEKJGCFDSA-N Asp-Leu-Thr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YQKYLDVPCOGIRB-SEKJGCFDSA-N 0.000 description 2
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 2
- SARSTIZOZFBDOM-FXQIFTODSA-N Asp-Met-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O SARSTIZOZFBDOM-FXQIFTODSA-N 0.000 description 2
- LIJXJYGRSRWLCJ-IHRRRGAJSA-N Asp-Phe-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LIJXJYGRSRWLCJ-IHRRRGAJSA-N 0.000 description 2
- GPPIDDWYKJPRES-YDHLFZDLSA-N Asp-Phe-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GPPIDDWYKJPRES-YDHLFZDLSA-N 0.000 description 2
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 2
- XUVTWGPERWIERB-IHRRRGAJSA-N Asp-Pro-Phe Chemical compound N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O XUVTWGPERWIERB-IHRRRGAJSA-N 0.000 description 2
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 2
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 2
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 2
- IQCJOIHDVFJQFV-LKXGYXEUSA-N Asp-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O IQCJOIHDVFJQFV-LKXGYXEUSA-N 0.000 description 2
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 2
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 2
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 241000845990 Bradyrhizobium diazoefficiens Species 0.000 description 2
- 241000589174 Bradyrhizobium japonicum Species 0.000 description 2
- 241000863012 Caulobacter Species 0.000 description 2
- 241000252867 Cupriavidus metallidurans Species 0.000 description 2
- IIGHQOPGMGKDMT-SRVKXCTJSA-N Cys-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N IIGHQOPGMGKDMT-SRVKXCTJSA-N 0.000 description 2
- CVLIHKBUPSFRQP-WHFBIAKZSA-N Cys-Gly-Ala Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C)C(O)=O CVLIHKBUPSFRQP-WHFBIAKZSA-N 0.000 description 2
- GGRDJANMZPGMNS-CIUDSAMLSA-N Cys-Ser-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O GGRDJANMZPGMNS-CIUDSAMLSA-N 0.000 description 2
- UKHNKRGNFKSHCG-CUJWVEQBSA-N Cys-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N)O UKHNKRGNFKSHCG-CUJWVEQBSA-N 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 206010059866 Drug resistance Diseases 0.000 description 2
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 2
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 2
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 2
- ZFADFBPRMSBPOT-KKUMJFAQSA-N Gln-Arg-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZFADFBPRMSBPOT-KKUMJFAQSA-N 0.000 description 2
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 2
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 2
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 2
- NROSLUJMIQGFKS-IUCAKERBSA-N Gln-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N NROSLUJMIQGFKS-IUCAKERBSA-N 0.000 description 2
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 2
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 2
- VUVKKXPCKILIBD-AVGNSLFASA-N Gln-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VUVKKXPCKILIBD-AVGNSLFASA-N 0.000 description 2
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 2
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 2
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 2
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 2
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 2
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 2
- BUVMZWZNWMKASN-QEJZJMRPSA-N Glu-Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 BUVMZWZNWMKASN-QEJZJMRPSA-N 0.000 description 2
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 2
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 2
- WPLGNDORMXTMQS-FXQIFTODSA-N Glu-Gln-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O WPLGNDORMXTMQS-FXQIFTODSA-N 0.000 description 2
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 2
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 2
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 2
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 2
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 2
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 2
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 2
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 2
- BRKUZSLQMPNVFN-SRVKXCTJSA-N Glu-His-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BRKUZSLQMPNVFN-SRVKXCTJSA-N 0.000 description 2
- WVTIBGWZUMJBFY-GUBZILKMSA-N Glu-His-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O WVTIBGWZUMJBFY-GUBZILKMSA-N 0.000 description 2
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 2
- BKRQSECBKKCCKW-HVTMNAMFSA-N Glu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N BKRQSECBKKCCKW-HVTMNAMFSA-N 0.000 description 2
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 2
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 2
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 2
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 2
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 2
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 2
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 2
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 2
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 2
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 2
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 2
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 2
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 2
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 2
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 2
- DTRUBYPMMVPQPD-YUMQZZPRSA-N Gly-Gln-Arg Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DTRUBYPMMVPQPD-YUMQZZPRSA-N 0.000 description 2
- JMQFHZWESBGPFC-WDSKDSINSA-N Gly-Gln-Asp Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JMQFHZWESBGPFC-WDSKDSINSA-N 0.000 description 2
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 2
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 2
- NTOWAXLMQFKJPT-YUMQZZPRSA-N Gly-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN NTOWAXLMQFKJPT-YUMQZZPRSA-N 0.000 description 2
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 2
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 2
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 2
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 2
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 2
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 2
- XVYKMNXXJXQKME-XEGUGMAKSA-N Gly-Ile-Tyr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XVYKMNXXJXQKME-XEGUGMAKSA-N 0.000 description 2
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 2
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 2
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 2
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 2
- BBTCXWTXOXUNFX-IUCAKERBSA-N Gly-Met-Arg Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O BBTCXWTXOXUNFX-IUCAKERBSA-N 0.000 description 2
- ICUTTWWCDIIIEE-BQBZGAKWSA-N Gly-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN ICUTTWWCDIIIEE-BQBZGAKWSA-N 0.000 description 2
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 2
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 2
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 2
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 2
- UMBDRSMLCUYIRI-DVJZZOLTSA-N Gly-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN)O UMBDRSMLCUYIRI-DVJZZOLTSA-N 0.000 description 2
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 2
- DCRODRAURLJOFY-XPUUQOCRSA-N His-Ala-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)NCC(O)=O DCRODRAURLJOFY-XPUUQOCRSA-N 0.000 description 2
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 2
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 2
- JFFAPRNXXLRINI-NHCYSSNCSA-N His-Asp-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JFFAPRNXXLRINI-NHCYSSNCSA-N 0.000 description 2
- STWGDDDFLUFCCA-GVXVVHGQSA-N His-Glu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O STWGDDDFLUFCCA-GVXVVHGQSA-N 0.000 description 2
- PYNUBZSXKQKAHL-UWVGGRQHSA-N His-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O PYNUBZSXKQKAHL-UWVGGRQHSA-N 0.000 description 2
- VBOFRJNDIOPNDO-YUMQZZPRSA-N His-Gly-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N VBOFRJNDIOPNDO-YUMQZZPRSA-N 0.000 description 2
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 2
- KAFZDWMZKGQDEE-SRVKXCTJSA-N His-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KAFZDWMZKGQDEE-SRVKXCTJSA-N 0.000 description 2
- SYIPVNMWBZXKMU-HJPIBITLSA-N His-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N SYIPVNMWBZXKMU-HJPIBITLSA-N 0.000 description 2
- ZRSJXIKQXUGKRB-TUBUOCAGSA-N His-Ile-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZRSJXIKQXUGKRB-TUBUOCAGSA-N 0.000 description 2
- HYWZHNUGAYVEEW-KKUMJFAQSA-N His-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HYWZHNUGAYVEEW-KKUMJFAQSA-N 0.000 description 2
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 2
- QTMKFZAYZKBFRC-BZSNNMDCSA-N His-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N)O QTMKFZAYZKBFRC-BZSNNMDCSA-N 0.000 description 2
- KFQDSSNYWKZFOO-LSJOCFKGSA-N His-Val-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KFQDSSNYWKZFOO-LSJOCFKGSA-N 0.000 description 2
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 2
- DPTBVFUDCPINIP-JURCDPSOSA-N Ile-Ala-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DPTBVFUDCPINIP-JURCDPSOSA-N 0.000 description 2
- CWJQMCPYXNVMBS-STECZYCISA-N Ile-Arg-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N CWJQMCPYXNVMBS-STECZYCISA-N 0.000 description 2
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 2
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 2
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 2
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 2
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 2
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 2
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 2
- BBQABUDWDUKJMB-LZXPERKUSA-N Ile-Ile-Ile Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O BBQABUDWDUKJMB-LZXPERKUSA-N 0.000 description 2
- UWLHDGMRWXHFFY-HPCHECBXSA-N Ile-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1CCC[C@@H]1C(=O)O)N UWLHDGMRWXHFFY-HPCHECBXSA-N 0.000 description 2
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 2
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 2
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 2
- BZUOLKFQVVBTJY-SLBDDTMCSA-N Ile-Trp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BZUOLKFQVVBTJY-SLBDDTMCSA-N 0.000 description 2
- NSPNUMNLZNOPAQ-SJWGOKEGSA-N Ile-Tyr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N NSPNUMNLZNOPAQ-SJWGOKEGSA-N 0.000 description 2
- NXRNRBOKDBIVKQ-CXTHYWKRSA-N Ile-Tyr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N NXRNRBOKDBIVKQ-CXTHYWKRSA-N 0.000 description 2
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 2
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 2
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 2
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 2
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- NTRAGDHVSGKUSF-AVGNSLFASA-N Leu-Arg-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NTRAGDHVSGKUSF-AVGNSLFASA-N 0.000 description 2
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 2
- VKOAHIRLIUESLU-ULQDDVLXSA-N Leu-Arg-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VKOAHIRLIUESLU-ULQDDVLXSA-N 0.000 description 2
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 2
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 2
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 2
- ZYLJULGXQDNXDK-GUBZILKMSA-N Leu-Gln-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ZYLJULGXQDNXDK-GUBZILKMSA-N 0.000 description 2
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 2
- YSKSXVKQLLBVEX-SZMVWBNQSA-N Leu-Gln-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 YSKSXVKQLLBVEX-SZMVWBNQSA-N 0.000 description 2
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 2
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 2
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 2
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 2
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 2
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 2
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 2
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 2
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 2
- WXZOHBVPVKABQN-DCAQKATOSA-N Leu-Met-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WXZOHBVPVKABQN-DCAQKATOSA-N 0.000 description 2
- JVTYXRRFZCEPPK-RHYQMDGZSA-N Leu-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)N)O JVTYXRRFZCEPPK-RHYQMDGZSA-N 0.000 description 2
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 2
- XXXXOVFBXRERQL-ULQDDVLXSA-N Leu-Pro-Phe Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XXXXOVFBXRERQL-ULQDDVLXSA-N 0.000 description 2
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 2
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 2
- KIZIOFNVSOSKJI-CIUDSAMLSA-N Leu-Ser-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N KIZIOFNVSOSKJI-CIUDSAMLSA-N 0.000 description 2
- 108010063860 Leu-Ser-Glu-Ala-Leu Proteins 0.000 description 2
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 2
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 2
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 2
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 2
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 2
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 2
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 2
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 2
- MSFITIBEMPWCBD-ULQDDVLXSA-N Leu-Val-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MSFITIBEMPWCBD-ULQDDVLXSA-N 0.000 description 2
- 108090000856 Lyases Proteins 0.000 description 2
- 102000004317 Lyases Human genes 0.000 description 2
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 2
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 2
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 2
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 2
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 2
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 2
- WKUXWMWQTOYTFI-SRVKXCTJSA-N Lys-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N WKUXWMWQTOYTFI-SRVKXCTJSA-N 0.000 description 2
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 2
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 2
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 2
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 2
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- PJWDQHNOJIBMRY-JYJNAYRXSA-N Met-Arg-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PJWDQHNOJIBMRY-JYJNAYRXSA-N 0.000 description 2
- YNOVBMBQSQTLFM-DCAQKATOSA-N Met-Asn-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O YNOVBMBQSQTLFM-DCAQKATOSA-N 0.000 description 2
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 2
- CUICVBQQHMKBRJ-LSJOCFKGSA-N Met-His-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O CUICVBQQHMKBRJ-LSJOCFKGSA-N 0.000 description 2
- JYPITOUIQVSCKM-IHRRRGAJSA-N Met-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCSC)N JYPITOUIQVSCKM-IHRRRGAJSA-N 0.000 description 2
- DBXMFHGGHMXYHY-DCAQKATOSA-N Met-Leu-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O DBXMFHGGHMXYHY-DCAQKATOSA-N 0.000 description 2
- YLBUMXYVQCHBPR-ULQDDVLXSA-N Met-Leu-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YLBUMXYVQCHBPR-ULQDDVLXSA-N 0.000 description 2
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 2
- GWADARYJIJDYRC-XGEHTFHBSA-N Met-Thr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GWADARYJIJDYRC-XGEHTFHBSA-N 0.000 description 2
- QYIGOFGUOVTAHK-ZJDVBMNYSA-N Met-Thr-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QYIGOFGUOVTAHK-ZJDVBMNYSA-N 0.000 description 2
- YGNUDKAPJARTEM-GUBZILKMSA-N Met-Val-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O YGNUDKAPJARTEM-GUBZILKMSA-N 0.000 description 2
- OVTOTTGZBWXLFU-QXEWZRGKSA-N Met-Val-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O OVTOTTGZBWXLFU-QXEWZRGKSA-N 0.000 description 2
- BAVYZALUXZFZLV-UHFFFAOYSA-N Methylamine Chemical compound NC BAVYZALUXZFZLV-UHFFFAOYSA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- 108010065395 Neuropep-1 Proteins 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 2
- LJUUGSWZPQOJKD-JYJNAYRXSA-N Phe-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O LJUUGSWZPQOJKD-JYJNAYRXSA-N 0.000 description 2
- XMPUYNHKEPFERE-IHRRRGAJSA-N Phe-Asp-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMPUYNHKEPFERE-IHRRRGAJSA-N 0.000 description 2
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 2
- ZFVWWUILVLLVFA-AVGNSLFASA-N Phe-Gln-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N ZFVWWUILVLLVFA-AVGNSLFASA-N 0.000 description 2
- WYPVCIACUMJRIB-JYJNAYRXSA-N Phe-Gln-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N WYPVCIACUMJRIB-JYJNAYRXSA-N 0.000 description 2
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 2
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 2
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 2
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 2
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 2
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 2
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 2
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 2
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 2
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 2
- XWYXZPHPYKRYPA-GMOBBJLQSA-N Pro-Asn-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XWYXZPHPYKRYPA-GMOBBJLQSA-N 0.000 description 2
- XKHCJJPNXFBADI-DCAQKATOSA-N Pro-Asp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O XKHCJJPNXFBADI-DCAQKATOSA-N 0.000 description 2
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 2
- GBRUQFBAJOKCTF-DCAQKATOSA-N Pro-His-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O GBRUQFBAJOKCTF-DCAQKATOSA-N 0.000 description 2
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 2
- BCNRNJWSRFDPTQ-HJWJTTGWSA-N Pro-Ile-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BCNRNJWSRFDPTQ-HJWJTTGWSA-N 0.000 description 2
- KLSOMAFWRISSNI-OSUNSFLBSA-N Pro-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 KLSOMAFWRISSNI-OSUNSFLBSA-N 0.000 description 2
- BARPGRUZBKFJMA-SRVKXCTJSA-N Pro-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BARPGRUZBKFJMA-SRVKXCTJSA-N 0.000 description 2
- KLOQCCRTPHPIFN-DCAQKATOSA-N Pro-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 KLOQCCRTPHPIFN-DCAQKATOSA-N 0.000 description 2
- HWLKHNDRXWTFTN-GUBZILKMSA-N Pro-Pro-Cys Chemical compound C1C[C@H](NC1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CS)C(=O)O HWLKHNDRXWTFTN-GUBZILKMSA-N 0.000 description 2
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 2
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 2
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 2
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 2
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 2
- 241000187562 Rhodococcus sp. Species 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 108091081021 Sense strand Proteins 0.000 description 2
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 2
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 2
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 2
- WXWDPFVKQRVJBJ-CIUDSAMLSA-N Ser-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N WXWDPFVKQRVJBJ-CIUDSAMLSA-N 0.000 description 2
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 2
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 2
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 2
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 2
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 2
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 2
- JEHPKECJCALLRW-CUJWVEQBSA-N Ser-His-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEHPKECJCALLRW-CUJWVEQBSA-N 0.000 description 2
- DJACUBDEDBZKLQ-KBIXCLLPSA-N Ser-Ile-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O DJACUBDEDBZKLQ-KBIXCLLPSA-N 0.000 description 2
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 2
- FOOZNBRFRWGBNU-DCAQKATOSA-N Ser-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N FOOZNBRFRWGBNU-DCAQKATOSA-N 0.000 description 2
- XNXRTQZTFVMJIJ-DCAQKATOSA-N Ser-Met-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNXRTQZTFVMJIJ-DCAQKATOSA-N 0.000 description 2
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 2
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 2
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 2
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 2
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 2
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 2
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 2
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 2
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 2
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 2
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 2
- YOSLMIPKOUAHKI-OLHMAJIHSA-N Thr-Asp-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YOSLMIPKOUAHKI-OLHMAJIHSA-N 0.000 description 2
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 2
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 2
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 2
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 2
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 2
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 2
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 2
- YJVJPJPHHFOVMG-VEVYYDQMSA-N Thr-Met-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YJVJPJPHHFOVMG-VEVYYDQMSA-N 0.000 description 2
- XNTVWRJTUIOGQO-RHYQMDGZSA-N Thr-Met-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNTVWRJTUIOGQO-RHYQMDGZSA-N 0.000 description 2
- OLFOOYQTTQSSRK-UNQGMJICSA-N Thr-Pro-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLFOOYQTTQSSRK-UNQGMJICSA-N 0.000 description 2
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 2
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 2
- XZUBGOYOGDRYFC-XGEHTFHBSA-N Thr-Ser-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O XZUBGOYOGDRYFC-XGEHTFHBSA-N 0.000 description 2
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 2
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 2
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 2
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 2
- MVHHTXAUJCIOMZ-WDSOQIARSA-N Trp-Arg-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N MVHHTXAUJCIOMZ-WDSOQIARSA-N 0.000 description 2
- VEYXZZGMIBKXCN-UBHSHLNASA-N Trp-Asp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VEYXZZGMIBKXCN-UBHSHLNASA-N 0.000 description 2
- VUMCLPHXCBIJJB-PMVMPFDFSA-N Trp-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N VUMCLPHXCBIJJB-PMVMPFDFSA-N 0.000 description 2
- YMNSKLWJSOANFS-OYDLWJJNSA-N Trp-Trp-Met Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(O)=O YMNSKLWJSOANFS-OYDLWJJNSA-N 0.000 description 2
- UGFOSENEZHEQKX-PJODQICGSA-N Trp-Val-Ala Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(=O)N[C@@H](C)C(O)=O UGFOSENEZHEQKX-PJODQICGSA-N 0.000 description 2
- WGBFZZYIWFSYER-BVSLBCMMSA-N Trp-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N WGBFZZYIWFSYER-BVSLBCMMSA-N 0.000 description 2
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 2
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 2
- SLCSPPCQWUHPPO-JYJNAYRXSA-N Tyr-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SLCSPPCQWUHPPO-JYJNAYRXSA-N 0.000 description 2
- MVYRJYISVJWKSX-KBPBESRZSA-N Tyr-His-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)NCC(=O)O)N)O MVYRJYISVJWKSX-KBPBESRZSA-N 0.000 description 2
- FDKDGFGTHGJKNV-FHWLQOOXSA-N Tyr-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FDKDGFGTHGJKNV-FHWLQOOXSA-N 0.000 description 2
- ARMNWLJYHCOSHE-KKUMJFAQSA-N Tyr-Pro-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O ARMNWLJYHCOSHE-KKUMJFAQSA-N 0.000 description 2
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 2
- XUIOBCQESNDTDE-FQPOAREZSA-N Tyr-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XUIOBCQESNDTDE-FQPOAREZSA-N 0.000 description 2
- KRXFXDCNKLANCP-CXTHYWKRSA-N Tyr-Tyr-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 KRXFXDCNKLANCP-CXTHYWKRSA-N 0.000 description 2
- UUJHRSTVQCFDPA-UFYCRDLUSA-N Tyr-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 UUJHRSTVQCFDPA-UFYCRDLUSA-N 0.000 description 2
- KLOZTPOXVVRVAQ-DZKIICNBSA-N Tyr-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 KLOZTPOXVVRVAQ-DZKIICNBSA-N 0.000 description 2
- GOPQNCQSXBJAII-ULQDDVLXSA-N Tyr-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GOPQNCQSXBJAII-ULQDDVLXSA-N 0.000 description 2
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 2
- 108091023045 Untranslated Region Proteins 0.000 description 2
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 2
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 2
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 2
- PFNZJEPSCBAVGX-CYDGBPFRSA-N Val-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N PFNZJEPSCBAVGX-CYDGBPFRSA-N 0.000 description 2
- IVXJODPZRWHCCR-JYJNAYRXSA-N Val-Arg-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IVXJODPZRWHCCR-JYJNAYRXSA-N 0.000 description 2
- GNWUWQAVVJQREM-NHCYSSNCSA-N Val-Asn-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GNWUWQAVVJQREM-NHCYSSNCSA-N 0.000 description 2
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 2
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 2
- BWVHQINTNLVWGZ-ZKWXMUAHSA-N Val-Cys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BWVHQINTNLVWGZ-ZKWXMUAHSA-N 0.000 description 2
- KOPBYUSPXBQIHD-NRPADANISA-N Val-Cys-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KOPBYUSPXBQIHD-NRPADANISA-N 0.000 description 2
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 2
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 2
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 2
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 2
- FXVDGDZRYLFQKY-WPRPVWTQSA-N Val-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C FXVDGDZRYLFQKY-WPRPVWTQSA-N 0.000 description 2
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 2
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 2
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 2
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 2
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 2
- QRVPEKJBBRYISE-XUXIUFHCSA-N Val-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N QRVPEKJBBRYISE-XUXIUFHCSA-N 0.000 description 2
- MGVYZTPLGXPVQB-CYDGBPFRSA-N Val-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MGVYZTPLGXPVQB-CYDGBPFRSA-N 0.000 description 2
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 2
- LGXUZJIQCGXKGZ-QXEWZRGKSA-N Val-Pro-Asn Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N LGXUZJIQCGXKGZ-QXEWZRGKSA-N 0.000 description 2
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 2
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 2
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 2
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 2
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 2
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 2
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 238000011088 calibration curve Methods 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000003480 eluent Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 2
- 108010081985 glycyl-cystinyl-aspartic acid Proteins 0.000 description 2
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 2
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 229910001385 heavy metal Inorganic materials 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010068488 methionylphenylalanine Proteins 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 238000002515 oligonucleotide synthesis Methods 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 235000018102 proteins Nutrition 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 2
- 108010084932 tryptophyl-proline Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 2
- NWUYHJFMYQTDRP-UHFFFAOYSA-N 1,2-bis(ethenyl)benzene;1-ethenyl-2-ethylbenzene;styrene Chemical compound C=CC1=CC=CC=C1.CCC1=CC=CC=C1C=C.C=CC1=CC=CC=C1C=C NWUYHJFMYQTDRP-UHFFFAOYSA-N 0.000 description 1
- 125000000355 1,3-benzoxazolyl group Chemical group O1C(=NC2=C1C=CC=C2)* 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- CDAWCLOXVUBKRW-UHFFFAOYSA-N 2-aminophenol Chemical group NC1=CC=CC=C1O CDAWCLOXVUBKRW-UHFFFAOYSA-N 0.000 description 1
- MRBKRZAPGUCWOS-UHFFFAOYSA-N 3-amino-4-hydroxybenzoic acid Chemical compound NC1=CC(C(O)=O)=CC=C1O MRBKRZAPGUCWOS-UHFFFAOYSA-N 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- BWKDAAFSXYPQOS-UHFFFAOYSA-N Benzaldehyde glyceryl acetal Chemical compound O1CC(O)COC1C1=CC=CC=C1 BWKDAAFSXYPQOS-UHFFFAOYSA-N 0.000 description 1
- CMDLYHXLYMIGIH-UHFFFAOYSA-N C.S.S Chemical compound C.S.S CMDLYHXLYMIGIH-UHFFFAOYSA-N 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 241000158764 Murraya Species 0.000 description 1
- 241000186359 Mycobacterium Species 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 241000186429 Propionibacterium Species 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 235000019764 Soybean Meal Nutrition 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 101100378465 Streptomyces griseus pabAB gene Proteins 0.000 description 1
- 101100378467 Streptomyces venezuelae (strain ATCC 10712 / CBS 650.69 / DSM 40230 / JCM 4526 / NBRC 13096 / PD 04745) cmlB gene Proteins 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-N Succinic acid Natural products OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 150000003973 alkyl amines Chemical class 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 239000003957 anion exchange resin Substances 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- KDYFGRWQOYBRFD-NUQCWPJISA-N butanedioic acid Chemical compound O[14C](=O)CC[14C](O)=O KDYFGRWQOYBRFD-NUQCWPJISA-N 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 1
- 108010079058 casein hydrolysate Proteins 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 239000003729 cation exchange resin Substances 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 229920006351 engineering plastic Polymers 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- -1 ethanol Chemical compound 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 238000012262 fermentative production Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000002657 fibrous material Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000007852 inverse PCR Methods 0.000 description 1
- 239000003456 ion exchange resin Substances 0.000 description 1
- 229920003303 ion-exchange polymer Polymers 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- WPBNNNQJVZRUHP-UHFFFAOYSA-L manganese(2+);methyl n-[[2-(methoxycarbonylcarbamothioylamino)phenyl]carbamothioyl]carbamate;n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[S-]C(=S)NCCNC([S-])=S.COC(=O)NC(=S)NC1=CC=CC=C1NC(=S)NC(=O)OC WPBNNNQJVZRUHP-UHFFFAOYSA-L 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000013048 microbiological method Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 235000019796 monopotassium phosphate Nutrition 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 101150070572 pabC gene Proteins 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- PJNZPQUBCPKICU-UHFFFAOYSA-N phosphoric acid;potassium Chemical compound [K].OP(O)(O)=O PJNZPQUBCPKICU-UHFFFAOYSA-N 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 229940107700 pyruvic acid Drugs 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000001953 recrystallisation Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 102220094337 rs876658446 Human genes 0.000 description 1
- 102220215897 rs969611536 Human genes 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000004455 soybean meal Substances 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000005846 sugar alcohols Polymers 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/02—Amides, e.g. chloramphenicol or polyamides; Imides or polyimides; Urethanes, i.e. compounds comprising N-C=O structural element or polyurethanes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1096—Transferases (2.) transferring nitrogenous groups (2.6)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07C—ACYCLIC OR CARBOCYCLIC COMPOUNDS
- C07C229/00—Compounds containing amino and carboxyl groups bound to the same carbon skeleton
- C07C229/52—Compounds containing amino and carboxyl groups bound to the same carbon skeleton having amino and carboxyl groups bound to carbon atoms of six-membered aromatic rings of the same carbon skeleton
- C07C229/54—Compounds containing amino and carboxyl groups bound to the same carbon skeleton having amino and carboxyl groups bound to carbon atoms of six-membered aromatic rings of the same carbon skeleton with amino and carboxyl groups bound to carbon atoms of the same non-condensed six-membered aromatic ring
- C07C229/60—Compounds containing amino and carboxyl groups bound to the same carbon skeleton having amino and carboxyl groups bound to carbon atoms of six-membered aromatic rings of the same carbon skeleton with amino and carboxyl groups bound to carbon atoms of the same non-condensed six-membered aromatic ring with amino and carboxyl groups bound in meta- or para- positions
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
- C07K1/107—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by chemical modification of precursor peptides
- C07K1/1072—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by chemical modification of precursor peptides by covalent attachment of residues or functional groups
- C07K1/1075—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by chemical modification of precursor peptides by covalent attachment of residues or functional groups by covalent attachment of amino acids or peptide residues
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
- C12N1/205—Bacterial isolates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/77—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/10—Cells modified by introduction of foreign genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/005—Amino acids other than alpha- or beta amino acids, e.g. gamma amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y206/00—Transferases transferring nitrogenous groups (2.6)
- C12Y206/01—Transaminases (2.6.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/101—Plasmid DNA for bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/15—Corynebacterium
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/185—Escherichia
- C12R2001/19—Escherichia coli
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Analytical Chemistry (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Cell Biology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明提供具有优异的4‑氨基苯甲酸羟化活性的多肽及其利用方法。其是在序列号2所示的氨基酸序列或与其具有至少47%的同一性的氨基酸序列中序列号2所示的氨基酸序列的47位或与其对应的位置的氨基酸残基为亮氨酸的具有4‑氨基苯甲酸羟化活性的多肽。
Description
技术领域
本发明涉及具有4-氨基苯甲酸羟化活性的多肽及其用途。
背景技术
聚苯并噁唑(PBO)已知能够作为耐热性和力学强度优异的工程塑料被用于纤维材料和半导体元件的绝缘膜等(非专利文献1)。
苯并噁唑骨架通过邻氨基苯酚骨架与羧酸的缩合而生成。因此,期待分子内具有这些官能团的4-氨基-3-羟基苯甲酸(4,3-AHBA)类作为PBO单体是有用的。实际上,研究了使用4,3-AHBA的聚苯并噁唑的合成和物性评价(非专利文献2)。
近年来,面向减轻地球环境负荷等,以可再生能源为原料而利用微生物发酵的化合物制造方法备受瞩目。例如,进行了具有与4,3-AHBA类似结构的3-氨基-4-羟基苯甲酸(3,4-AHBA)利用微生物的生产和聚合物化的研究(专利文献1)。
关于4,3-AHBA的制造,迄今为止已知以化学方式将硝基芳香族还原而进行合成的方法等(专利文献2)。作为能够利用微生物法进行4,3-AHBA发酵生产的策略,可以考虑将能够在微生物内进行生物合成的4-氨基苯甲酸(4-ABA)的3位羟化,但关于这种反应,仅报道了部分4-羟基苯甲酸羟化酶具有微弱的活性(非专利文献3、4)。
专利文献1:日本特许第5445453号公报
专利文献2:日本特许第3821350号公报
非专利文献1:村濑浩贵,SENI GAKKAISHI(纤维与工业),Vol.66,No.6(2010)
非专利文献2:Lon J.Mathias et al.,Macromolecules,Vol.18,No.4,pp.616-622(1985)
非专利文献3:Barrie Entsch et al.The Journal of Biological Chemistry,Vol.262,No.13,pp.6060-6068(1987)
非专利文献4:Domenico L.Gatti et al.,Biochemistry,Vol.35,No.2,pp.567-578(1996)
发明内容
本发明涉及以下的1)~7)。
1)一种以下A)~C)所示的具有4-氨基苯甲酸羟化活性的多肽。
A)其是在序列号2所示的氨基酸序列或与其具有至少47%的同一性的氨基酸序列中序列号2所示的氨基酸序列的47位或与其对应的位置的氨基酸残基为亮氨酸的具有4-氨基苯甲酸羟化活性的多肽。
B)其是在序列号2所示的氨基酸序列或与其具有至少51%的同一性的氨基酸序列中序列号2所示的氨基酸序列的201位或222位、或者与201位或222位对应的位置的氨基酸残基为苯丙氨酸的具有4-氨基苯甲酸羟化活性的多肽。
C)其是在序列号2所示的氨基酸序列或与其具有至少90%的同一性的氨基酸序列中序列号2所示的氨基酸序列的47位、72位、210位、294位或385位、或者与47位、72位、210位、294位或385位对应的位置的氨基酸残基为下列氨基酸的具有4-氨基苯甲酸羟化活性的多肽。
(a)47位或与其对应的位置:异亮氨酸、丝氨酸、苏氨酸、半胱氨酸、蛋氨酸、谷氨酰胺,
(b)72位或与其对应的位置:丙氨酸、蛋氨酸,
(c)210位或与其对应的位置:蛋氨酸,
(d)294位或与其对应的位置:丙氨酸、甘氨酸、半胱氨酸、丝氨酸,
(e)385位或与其对应的位置:缬氨酸、亮氨酸、异亮氨酸、蛋氨酸。
2)一种具有4-氨基苯甲酸羟化活性的突变多肽的制造方法,其包括以下A′)~C′)所示的氨基酸残基的取代。
A′)在由序列号2所示的氨基酸序列或与其具有至少47%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的47位或与其对应的位置的氨基酸残基取代为亮氨酸。
B′)在由序列号2所示的氨基酸序列或与其具有至少51%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的201位或222位、或者与201位或222位对应的位置的氨基酸残基取代为苯丙氨酸。
C′)在由序列号2所示的氨基酸序列或与其具有至少90%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的47位、72位、210位、294位或385位、或者与47位、72位、210位、294位或385位对应的位置的氨基酸残基取代为下列氨基酸。
(a)47位或与其对应的位置:异亮氨酸、丝氨酸、苏氨酸、半胱氨酸、蛋氨酸、谷氨酰胺,
(b)72位或与其对应的位置:丙氨酸、蛋氨酸,
(c)210位或与其对应的位置:蛋氨酸,
(d)294位或与其对应的位置:丙氨酸、甘氨酸、半胱氨酸、丝氨酸,
(e)385位或与其对应的位置:缬氨酸、亮氨酸、异亮氨酸、蛋氨酸。
3)一种提升4-氨基苯甲酸羟化活性的方法,其包括以下A′)~C′)所示的氨基酸残基的取代。
A′)在由序列号2所示的氨基酸序列或与其具有至少47%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的47位或与其对应的位置的氨基酸残基取代为亮氨酸。
B′)在由序列号2所示的氨基酸序列或与其具有至少51%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的201位或222位、或者与201位或222位对应的位置的氨基酸残基取代为苯丙氨酸。
C′)在由序列号2所示的氨基酸序列或与其具有至少90%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的47位、72位、210位、294位或385位、或者与47位、72位、210位、294位或385位对应的位置的氨基酸残基取代为下列氨基酸。
(a)47位或与其对应的位置:异亮氨酸、丝氨酸、苏氨酸、半胱氨酸、蛋氨酸、谷氨酰胺,
(b)72位或与其对应的位置:丙氨酸、蛋氨酸,
(c)210位或与其对应的位置:蛋氨酸,
(d)294位或与其对应的位置:丙氨酸、甘氨酸、半胱氨酸、丝氨酸,
(e)385位或与其对应的位置:缬氨酸、亮氨酸、异亮氨酸、蛋氨酸。
4)一种编码1)或2)的多肽的多核苷酸。
5)一种包含4)的多核苷酸的载体或DNA片段。
6)一种包含5)的载体或DNA片段的转化细胞。
7)一种4-氨基-3-羟基苯甲酸类的制造方法,其包括对6)的转化细胞进行培养的工序。
具体实施方式
本发明涉及提供一种具有优异的4-氨基苯甲酸羟化活性的多肽及其利用方法。
本发明的发明人发现,具有特定的氨基酸序列的4-羟基苯甲酸羟化酶的突变体具有优异的4-氨基苯甲酸羟化活性,能够有效地用于制造4-氨基-3-羟基苯甲酸类。
由于本发明的具有4-氨基苯甲酸羟化活性的多肽具有优异的4-氨基苯甲酸羟化活性,所以通过使用该多肽能够高效地由4-氨基苯甲酸类制造4-氨基-3-羟基苯甲酸类。
在本说明书中,氨基酸序列或核苷酸序列的同一性通过Lipman-Pearson法(Science,1985,227:1435-1441)来计算。具体而言,通过使用遗传信息处理软件GENETYXVer.12的同一性分析(Search Homology)程序,将Unit size to compare(ktup)设为2进行分析来计算。
在本说明书中,氨基酸序列或核苷酸序列上的“对应的位置”可以通过以使目标序列与参照序列(例如序列号2所示的氨基酸序列)具有最大相同性的方式进行排列(alignment,比对)而确定。氨基酸序列或核苷酸序列的比对可以使用公知的算法实行,其步骤是本领域技术人员公知的。例如,比对可以以系统设定使用Clustal W多序列比对程序(Thompson,J.D.et al,1994,Nucleic Acids Res.22:4673-4680)来进行。或者,也可以使用作为Clustal W的修订版的Clustal W2或Clustal omega。Clustal W、Clustal W2和Clustal omega例如可以在欧州生物信息研究所(European Bioinformatics Institute:EBI[www.ebi.ac.uk/index.html])或日本国立遗传学研究所所运营的日本DNA数据库(DDBJ[www.ddbj.nig.ac.jp/searches-j.html])的网页上利用。通过上述比对,与参照序列的任意位置对齐的目标序列的位置被视为与该任意位置“对应的位置”。
本领域技术人员能够进一步进行微调使得上述所得到的氨基酸序列的比对最优化。这种最优比对优选考虑氨基酸序列的类似性和所插入的空位的频率等来确定。在此,氨基酸序列的类似性是指对2个氨基酸序列进行比对时这两个序列中存在相同或类似氨基酸残基的位置数相对于全长氨基酸残基数的比例(%)。类似的氨基酸残基是指在构成蛋白质的20种氨基酸中,在极性和电荷方面具有彼此类似的性质,发生所谓的保守取代的氨基酸残基。由这样的类似氨基酸残基构成的组是本领域技术人员所公知的,例如可以分别举出如下组合:精氨酸与赖氨酸或谷氨酰胺、谷氨酸与天冬氨酸或谷氨酰胺、丝氨酸与苏氨酸或丙氨酸、谷氨酰胺与天冬氨酸或精氨酸、亮氨酸与异亮氨酸等,但并不限定于这些。
在本说明书中,“氨基酸残基”是指构成蛋白质的20种氨基酸残基,丙氨酸(Ala或A)、精氨酸(Arg或R)、天冬氨酸(Asn或N)、天冬氨酸(Asp或D)、半胱氨酸(Cys或C)、谷氨酰胺(Gln或Q)、谷氨酸(Glu或E)、甘氨酸(Gly或G)、组氨酸(His或H)、异亮氨酸(Ile或I)、亮氨酸(Leu或L)、赖氨酸(Lys或K)、蛋氨酸(Met或M)、苯丙氨酸(Phe或F)、脯氨酸(Pro或P)、丝氨酸(Ser或S)、苏氨酸(Thr或T)、色氨酸(Trp或W)、酪氨酸(Tyr或Y)和缬氨酸(Val或V)。
在本说明书中,启动子等控制区域与基因的“可工作地连接”是指基因与控制区域以该基因能够在该控制区域的控制下表达的方式连接。基因与控制区域的“可工作地连接”的步骤是本领域技术人员公知的。
在本说明书中,关于基因的“上游”和“下游”是指该基因的转录方向的上游和下游。例如,“配置于启动子的下游的基因”是指在DNA有义链中该基因存在于启动子的3′侧,基因的上游是指DNA有义链中的该基因的5′侧的区域。
在本说明书中,用于细胞的功能或性状、特性的术语“本来”是为了表示该细胞原本就存在该功能或性状、特性而使用的。对照而言,术语“外来”不是该细胞原本就存在的,而是用于表示从外部导入的功能或性状、特性。例如,“外来”基因或多核苷酸是从外部导入细胞的基因或多核苷酸。外来基因或多核苷酸可以来源于与导入其的细胞同种的生物,也可以来源于不同种的生物(即异种基因或多核苷酸)。<具有4-氨基苯甲酸羟化活性的多肽>
本发明的具有4-氨基苯甲酸羟化活性的多肽(称作“本发明的多肽”)由以下A)~C)表示。
A)其是在序列号2所示的氨基酸序列或与其具有至少47%的同一性的氨基酸序列中序列号2所示的氨基酸序列的47位或与其对应的位置的氨基酸残基为亮氨酸的多肽。
B)其是在序列号2所示的氨基酸序列或与其具有至少51%的同一性的氨基酸序列中序列号2所示的氨基酸序列的201位或222位、或者与201位或222位对应的位置的氨基酸残基为苯丙氨酸的多肽。
C)其是序列号2所示的氨基酸序列或与其具有至少90%的同一性的氨基酸序列中序列号2所示的氨基酸序列的47位、72位、210位、294位或385位、或者与47位、72位、210位、294位或385位对应的位置的氨基酸残基为下列氨基酸的多肽。
(a)47位或与其对应的位置:异亮氨酸、丝氨酸、苏氨酸、半胱氨酸、蛋氨酸、谷氨酰胺,
(b)72位或与其对应的位置:丙氨酸、蛋氨酸,
(c)210位或与其对应的位置:蛋氨酸,
(d)294位或与其对应的位置:丙氨酸、甘氨酸、半胱氨酸、丝氨酸,
(e)385位或与其对应的位置:缬氨酸、亮氨酸、异亮氨酸、蛋氨酸。
A)所示的多肽是在作为基准的多肽、即由序列号2所示的氨基酸序列或与其具有至少47%的同一性的氨基酸序列构成的多肽中,序列号2所示的氨基酸序列的47位或与其对应的位置的氨基酸残基被取代为亮氨酸的、具有4-氨基苯甲酸羟化活性的突变多肽。
B)所示的多肽是在作为基准的多肽、即由序列号2所示的氨基酸序列或与其具有至少51%的同一性的氨基酸序列构成的多肽中,序列号2所示的氨基酸序列的201位或222位、或者与201位或222位对应的位置的氨基酸残基被取代为苯丙氨酸的、具有4-氨基苯甲酸羟化活性的突变多肽。
C)所示的多肽是在作为基准的多肽、即由序列号2所示的氨基酸序列或与其具有至少90%的同一性的氨基酸序列构成的多肽中,序列号2所示的氨基酸序列的47位、72位、210位、294位或385位、或者与47位、72位、210位、294位或385位对应的位置的氨基酸残基被取代为以上(a)~(e)的氨基酸的、具有4-氨基苯甲酸羟化活性的突变多肽。
在本发明中,“4-氨基苯甲酸羟化活性”是指催化4-氨基苯甲酸类的羟化的活性,优选催化4-氨基苯甲酸类的3位的羟化的活性。
4-氨基苯甲酸羟化活性可以如后述实施例所示通过培养产生本发明的多肽的微生物并利用HPLC等测定所生成的4-氨基-3-羟基苯甲酸量来确定。
这种本发明的A)所示的多肽可以通过在由序列号2所示的氨基酸序列或与其具有至少47%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的47位或与其对应的位置的氨基酸残基取代为亮氨酸而制造。
在此,由序列号2所示的氨基酸序列或与其具有至少47%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽是本发明的A)所示的多肽的“亲本”多肽。
该亲本多肽是指因其氨基酸残基发生规定的突变而成为本发明的A)所示的多肽的基准多肽。
另外,本发明的B)所示的多肽可以通过在由序列号2所示的氨基酸序列或与其具有至少51%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的201位或222位、或者与201位或222位对应的位置的氨基酸残基取代为苯丙氨酸而制造。
在此,由序列号2所示的氨基酸序列或与其具有至少51%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽是本发明的B)所示的多肽的“亲本”多肽。
该亲本多肽是指因其氨基酸残基发生规定的突变而成为本发明的B)所示的多肽的基准多肽。
另外,本发明的C)所示的多肽可以通过在由序列号2所示的氨基酸序列或与其具有至少90%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的47位、72位、210位、294位或385位、或者与47位、72位、210位、294位或385位对应的位置的氨基酸残基取代为下列氨基酸而制造。
(a)47位或与其对应的位置:异亮氨酸、丝氨酸、苏氨酸、半胱氨酸、蛋氨酸、谷氨酰胺,
(b)72位或与其对应的位置:丙氨酸、蛋氨酸,
(c)210位或与其对应的位置:蛋氨酸,
(d)294位或与其对应的位置:丙氨酸、甘氨酸、半胱氨酸、丝氨酸,
(e)385位或与其对应的位置:缬氨酸、亮氨酸、异亮氨酸、蛋氨酸。
在此,由序列号2所示的氨基酸序列或与其具有至少90%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽是本发明的C)所示的多肽的“亲本”多肽。
该亲本多肽是指因其氨基酸残基发生规定的突变而成为本发明的C)所示的多肽的基准多肽。
在本发明中,由序列号2所示的氨基酸序列(NCBI Reference Sequence:WP_010920262.1)构成的多肽HFM122作为4-羟基苯甲酸-3-单加氧酶(EC1.14.13.2)是已知的。4-羟基苯甲酸-3-单加氧酶是具有促进将4-羟基苯甲酸的3位羟化而生成原儿茶酸的反应和其逆反应的任一方或双方的催化活性的酶,是催化4-羟基苯甲酸类的羟化的酶(4-羟基苯甲酸羟化酶)的一种。
本申请人发现该HFM122具有4-氨基苯甲酸羟化活性(日本特愿2018-171849)。
<A)所示的多肽中的亲本多肽>
在A)所示的多肽中,作为由与序列号2所示的氨基酸序列具有至少47%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽,可以举出由与序列号2所示的氨基酸序列具有至少47%的同一性、具体为47%以上、更优选为50%以上、更优选为60%以上、更优选为70%以上、更优选为80%以上、更优选为90%以上、更优选为95%以上、更优选为96%以上、进一步优选为97%以上、进一步优选为98%以上、进一步优选为99%以上的同一性的氨基酸序列构成的具有4-氨基苯甲酸羟化活性的多肽。具体可以举出例如HFM388(序列号4:与序列号2的氨基酸序列同一性为62%、NCBI Reference Sequence:WP_010976283.1)、HFM339(序列号6:与序列号2的氨基酸序列同一性为61%、NCBI ReferenceSequence:WP_011157287.1)、HFM77(序列号8:与序列号2的氨基酸序列同一性为51%、NCBIReference Sequence:WP_011089160.1)、HFM737(序列号10:与序列号2的氨基酸序列同一性为51%、NCBI Reference Sequence:WP_011519894.1)、HFMss0-1(序列号12:与序列号2的氨基酸序列同一性为47%、NCBI Reference Sequence:WP_027494688.1)等。其中,从本发明的多肽所具有的4-氨基苯甲酸羟化活性的观点出发,优选HFM737、HFMss0-1。
作为适当的“亲本”多肽,除了序列号2所示的氨基酸序列之外,可以举出由相对于序列号2所示的氨基酸序列具有90%以上、更优选为95%以上、更优选为96%以上、更优选为98%以上的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽。还可以举出由序列号4、序列号6、序列号8、序列号10或序列号12所示的氨基酸序列、或者相对于它们分别具有90%以上、优选为95%以上、更优选为96%以上、更优选为98%以上的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽。
该亲本多肽优选在序列号2所示的氨基酸序列的47位或与其对应的位置均具有缬氨酸残基,本发明的A)所示的多肽更优选将该47位或与其对应的位置的缬氨酸取代为亮氨酸。
<B)所示的多肽中的亲本多肽>
在B)所示的多肽中,作为由与序列号2所示的氨基酸序列具有至少51%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽,可以举出由与序列号2所示的氨基酸序列具有至少51%的同一性、具体为51%以上、优选为60%以上、更优选为70%以上、更优选为80%以上、更优选为90%以上、更优选为95%以上、更优选为96%以上、进一步优选为97%以上、进一步优选为98%以上、进一步优选为99%以上的同一性的氨基酸序列构成的具有4-氨基苯甲酸羟化活性的多肽。具体可以举出例如HFM388(序列号4:与序列号2的氨基酸序列同一性为62%、NCBI Reference Sequence:WP_010976283.1)、HFM339(序列号6:与序列号2的氨基酸序列同一性为61%、NCBI Reference Sequence:WP_011157287.1)、HFM77(序列号8:与序列号2的氨基酸序列同一性为51%、NCBI Reference Sequence:WP_011089160.1)等。其中,从本发明的多肽所具有的4-氨基苯甲酸羟化活性的观点出发,优选HFM388、HFM339。
作为适当的“亲本”多肽,除了序列号2所示的氨基酸序列之外,可以举出由相对于序列号2所示的氨基酸序列具有90%以上、更优选为95%以上、更优选为96%以上、更优选为98%以上的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽。还可以举出由序列号4、序列号6或序列号8所示的氨基酸序列、或者相对于它们分别具有90%以上、优选为95%以上、更优选为96%以上、更优选为98%以上的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽。
该亲本多肽优选在序列号2所示的氨基酸序列的201位或222位、或者与201位或222位对应的位置均具有酪氨酸残基,本发明的B)所示的多肽更优选将该201位或222位、或者与201位或222位对应的位置的酪氨酸取代为苯丙氨酸的突变多肽。作为与序列号2的201位或222位对应的位置,例如,在序列号4时201位和222位对应于这些位置,在序列号6时201位和222位对应于这些位置,在序列号8时203位和224位对应于这些位置。
因此,该亲本多肽优选在序列号4所示的氨基酸序列的201位或222位、或者与201位或222位对应的位置均具有酪氨酸残基,本发明的B)所示的多肽更优选将该201位或222位、或者与201位或222位对应的位置的酪氨酸取代为苯丙氨酸的突变多肽。
另外,该亲本多肽优选在序列号6所示的氨基酸序列的201位或222位、或者与201位或222位对应的位置均具有酪氨酸残基,本发明的B)所示的多肽更优选将该201位或222位、或者与201位或222位对应的位置的酪氨酸取代为苯丙氨酸的突变多肽。
另外,该亲本多肽优选在序列号8所示的氨基酸序列的203位或224位、或者与203位或224位对应的位置均具有酪氨酸残基,本发明的B)所示的多肽更优选将该203位或224位、或者与203位或224位对应的位置的酪氨酸取代为苯丙氨酸的突变多肽。
<C)所示的多肽中的亲本多肽>
在C)所示的多肽中,作为由与序列号2所示的氨基酸序列具有至少90%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽,可以举出由与序列号2所示的氨基酸序列具有至少90%的同一性、具体为90%以上、优选为95%以上、更优选为96%以上、进一步优选为97%以上、进一步优选为98%以上、进一步优选为99%以上的同一性的氨基酸序列构成的具有4-氨基苯甲酸羟化活性的多肽。
该亲本多肽优选在序列号2所示的氨基酸序列的47位或与其对应的位置均具有缬氨酸残基,优选在72位或与其对应的位置均具有组氨酸残基,优选在210位或与其对应的位置均具有亮氨酸残基,优选在294位或与其对应的位置均具有苏氨酸残基,优选在385位或与其对应的位置均具有酪氨酸残基。本发明的C)所示的多肽更优选将该47位或与其对应的位置的缬氨酸取代为异亮氨酸、丝氨酸、苏氨酸、半胱氨酸、蛋氨酸或谷氨酰胺,将72位或与其对应的位置的组氨酸取代为丙氨酸或蛋氨酸,将210位或与其对应的位置的亮氨酸取代为蛋氨酸,将294位或与其对应的位置的苏氨酸取代为丙氨酸、甘氨酸、半胱氨酸或丝氨酸,将385位或与其对应的位置的酪氨酸取代为缬氨酸、亮氨酸、异亮氨酸或蛋氨酸。更优选将294位或与其对应的位置的苏氨酸取代为丝氨酸,将47位或与其对应的位置的缬氨酸取代为异亮氨酸、苏氨酸、蛋氨酸或谷氨酰胺,将72位或与其对应的位置的组氨酸取代为蛋氨酸。进一步优选将294位或与其对应的位置的苏氨酸取代为丝氨酸,将47位或与其对应的位置的缬氨酸取代为异亮氨酸。
<编码本发明的多肽的多核苷酸>
在本发明中,作为使亲本多肽的氨基酸残基突变的手段,可以采用本技术领域中公知的各种突变导入技术。例如,在编码亲本多肽的氨基酸序列的多核苷酸(以下也称为亲本基因)中,使编码应突变的氨基酸残基的核苷酸序列突变为编码突变后的氨基酸残基的核苷酸序列,由此能够得到编码本发明的多肽的多核苷酸。
向亲本基因导入目标突变基本上可以采用本领域技术人员公知的各种定点突变导入法进行。定点突变导入法可以利用例如反向PCR法或退火法等任意方法进行。也可以使用市售的定点突变导入用试剂盒(例如安捷伦科技有限公司的QuikChange II Site-Directed Mutagenesis Kit或QuikChange Multi Site-Directed Mutagenesis Kit等)。
向亲本基因的定点突变导入最通常使用包含应导入的核苷酸突变的突变用引物进行。该突变用引物以对包含编码亲本基因内的应突变的氨基酸残基的核苷酸序列的区域进行退火,并且代替编码该应突变的氨基酸残基的核苷酸序列(密码子)而包含具有编码突变后的氨基酸残基的核苷酸序列(密码子)的核苷酸序列的方式设计即可。编码突变前和突变后的氨基酸残基的核苷酸序列(密码子)是本领域技术人员能够基于通常的教科书等适当识别并选择的。或者,定点突变导入也可以采用利用SOE(重叠延伸剪切技术,splicingby overlap extension)-PCR(Gene,1989,77(1):p61-68)将分开使用包含应导入的核苷酸突变的2个互补引物而分别使突变部位的上游侧和下游侧扩增得到的DNA片段连结为1个整体。
包含亲本基因的模板DNA可通过如下方式制备:利用常规方法从上述的产生4-羟基苯甲酸羟化酶的微生物中提取基因组DNA,或者提取RNA并利用逆转录合成cDNA。或者也可以基于亲本多肽的氨基酸序列化学合成与之对应的核苷酸序列而用作模板DNA。将包含编码已作为具有4-氨基苯甲酸羟化活性的多肽描述的HFM122、HFM388、HFM339、HFM77、HFM737、HFMss0-1的碱基序列的DNA序列分别表示为序列号1、序列号3、序列号5、序列号7、序列号9和序列号11。
突变用引物可以通过亚磷酰胺法(Nucleic Acids R4esearch,1989,17:7059-7071)等公知的寡核苷酸合成法来制备。这样的引物合成也可以使用例如市售的寡核苷酸合成装置(例如ABI公司制造的装置等)来实施。使用包括该突变用引物的引物组,将亲本基因作为模板DNA,进行上述那样的定点突变导入,由此能够得到编码具有目标突变的本发明的多肽的多核苷酸。
编码该本发明多肽的多核苷酸可以包含单链或双链的DNA、cDNA、RNA或其它的人工核酸。该DNA、cDNA和RNA可以通过化学合成得到。并且,该多核苷酸除了开放阅读框(ORF)之外,还可以包含非翻译区(UTR)的核苷酸序列。并且,该多核苷酸可以与产生本发明的突变多肽用的转化体的种类匹配而使密码子最优化。各种生物所使用的密码子的信息可以由Codon Usage Databas([www.kazusa.or.jp/codon/])获取。
<载体或DNA片段>
编码所得到的本发明的多肽的多核苷酸可以重组至载体中。包含该多核苷酸的载体是表达载体。另外,优选该载体是能够将编码本发明的多肽的多核苷酸导入宿主微生物中、且能够在宿主微生物内表达该多核苷酸的表达载体。优选该载体包含编码本发明的多肽的多核苷酸、以及与其可工作地连接的控制区域。该载体可以是质粒等能够在染色体外自我增殖和复制的载体,或者也可以是重组于染色体内的载体。
作为载体的具体例,例如可以举出pBluescript II SK(-)(Stratagene)、pUC18/19、pUC118/119等pUC系载体(Takara Bio)、pET系载体(Takara Bio)、pGEX系载体(GEHealthcare)、pCold系载体(Takara Bio)、pHY300PLK(Takara Bio)、pUB110(Mckenzie,T.et al.,1986,Plasmid 15(2):93-103)、pBR322(Takara Bio)、pRS403(Stratagene)、pMW218/219(Nippon Gene)、pRI909/910等的pRI系载体(Takara Bio)、pBI系载体(Clontech)、IN3系载体(Inplanta Innovations)、pPTR1/2(Takara Bio)、pDJB2(D.J.Ballance et al.,Gene,36,321-331,1985)、pAB4-1(van Hartingsveldt W et al.,Mol Gen Genet,206,71-75,1987)、pLeu4(M.I.G.Roncero et al.,Gene,84,335-343,1989)、pPyr225(C.D.Skory et al.,Mol Genet Genomics,268,397-406,2002)、pFG1(Gruber,F.et al.,Curr Genet,18,447-451,1990)等。
此外,编码本发明的多肽的多核苷酸也可以构建为包含该多核苷酸的DNA片段。作为该DNA片段,例如可以举出PCR扩增DNA片段和限制性内切酶切断DNA片段。优选该DNA片段可以为包含编码本发明的多肽的多核苷酸、和与其可工作地连接的控制区域的表达盒。
上述载体或DNA片段中所包含的控制区域是用于在导入了该载体或DNA片段的宿主细胞内表达编码本发明的多肽的多核苷酸的序列,例如可以举出启动子或终止子等表达调节区域、复制起始点等。该控制区域的种类可以根据导入载体或DNA片段的宿主微生物的种类适当选择。根据需要,该载体或DNA片段还可以具有抗生素抗性基因、氨基酸合成相关基因等选择标记(例如氨苄西林、新霉素、卡那霉素、氯霉素等药物抗性基因)。
上述载体或DNA片段可以包含用于编码生物合成4-氨基苯甲酸类所必需的多肽的多核苷酸序列。作为用于生物合成4-氨基苯甲酸类所必需的多肽,例如可以举出4-氨基-4-脱氧分支酸合成酶(4-amino-4-deoxychorismate synthase,pabAB)或4-氨基-4-脱氧分支酸裂解酶(4-amino-4-deoxychorismate lyase,pabC)等。
编码本发明的多肽的多核苷酸与上述控制区域或标记基因序列的连接可以通过上述的SOE-PCR法等方法进行。基因序列向载体的导入步骤是本领域公知的。启动子区、终止子、分泌信号区等控制区域的种类没有特别限定,可以对应于导入宿主而适当选择通常使用的启动子或分泌信号序列使用。
作为该控制区域的优选例,可以例示与野生型相比能够强化表达的强控制区域,例如作为公知的高表达启动子的T7启动子、lac启动子、tac启动子、trp启动子等,但并不限定于它们<转化细胞>
通过将包含编码本发明的多肽的多核苷酸的载体导入宿主、或者将包含编码本发明的多肽的多核苷酸的DNA片段导入宿主的基因组,能够得到本发明的转化细胞。
该转化细胞是以能够表达的方式导入了编码本发明的多肽的多核苷酸的细胞,可以说是该多核苷酸的表达被强化了的细胞,进而可以说是本发明的多肽的表达被强化了的细胞。
作为宿主细胞,可以使用真菌、酵母、放线菌、大肠杆菌、枯草杆菌等中的任一种,优选大肠杆菌、放线菌。作为放线菌,可以举出棒状杆菌属菌、分枝杆菌属菌、红球菌属菌、链霉菌属菌、丙酸杆菌属菌等,优选棒状杆菌属菌,更优选为谷氨酸棒状杆菌。
其中,优选能够提供成为4-氨基-3-羟基苯甲酸类的生物合成的底物的4-氨基苯甲酸类的微生物,更优选4-氨基苯甲酸类的提供能力被强化了的微生物。作为强化微生物的4-氨基苯甲酸类的提供能力的方法,例如可以举出:向微生物导入包含用于编码生物合成4-氨基苯甲酸类所必需的多肽的多核苷酸以及与其可工作地连接的控制区域的载体的方法;将微生物本来所具有的编码用于生物合成4-氨基苯甲酸类所必需的多肽的多核苷酸的控制区域取代为强表达启动子的方法等。
作为向宿主导入载体或DNA片段的方法,可以使用例如电穿孔法、转化法、转染法、拼接法、原生质体法、粒子枪法、农杆菌法等。
另外,作为将多核苷酸导入宿主的基因组的方法,没有特别限定,例如可以举出使用了包含该多核苷酸的DNA片段的双交换法。该DNA片段可以在上述的宿主细胞中导入到表达量多的基因的启动子序列的下游,或者,也可以预先制作将该DNA片段和上述的控制区域可工作地连接而成的片段,将该连接片段导入宿主的基因组。另外,该DNA片段也可以预先与用于选择正确导入了本发明的多核苷酸的细胞的标记(药物抗性基因或营养缺陷型互补基因等)连接。
导入了目标载体或DNA片段的转化细胞可以利用选择标记进行选择。例如,在选择标记为抗生素抗性基因时,通过利用该抗生素添加培养基进行培养,能够选择导入了目标载体或DNA片段的转化细胞。另外,例如在选择标记为氨基酸合成相关基因时,在该氨基酸要求性的宿主微生物中导入基因之后,可以将该氨基酸要求性的有无作为指标,选择导入了目标载体或DNA片段的转化细胞。或者,通过利用PCR等研究转化细胞的DNA序列,也能够确认目标载体或DNA片段的导入。
这样所得到的转化细胞如果在适当的培养基中对其进行培养,则导入了该细胞的多核苷酸表达,生成本发明的多肽。即,该转化细胞成为具有4-氨基苯甲酸羟化活性的多肽产生菌株。并且,在如后述的实施例所示培养本发明的转化细胞时,与使用产生亲本多肽的转化细胞的情况相比,4-氨基-3-羟基苯甲酸的生产率提高。
即,在由序列号2所示的氨基酸序列或与其具有至少47%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的47位或与其对应的位置的氨基酸残基取代为亮氨酸的突变,对于提升4-氨基苯甲酸羟化活性而言是有用的,进而对于提高4-氨基-3-羟基苯甲酸类的生产率而言是有用的。
另外,在由序列号2所示的氨基酸序列或与其具有至少51%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的201位或222位、或者与201位或222位相应的位置的氨基酸残基取代为苯丙氨酸的突变,对于提升4-氨基苯甲酸羟化活性而言是有用的,进而对于提高4-氨基-3-羟基苯甲酸类的生产率而言是有用的。
另外,在由序列号2所示的氨基酸序列或与其具有至少90%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的47位、72位、210位、294位或385位、或者与47位、72位、210位、294位或385位相应的位置的氨基酸残基取代为下列氨基酸的突变,对于提升4-氨基苯甲酸羟化活性而言是有用的,进而对于提高4-氨基-3-羟基苯甲酸类的生产率而言是有用的。
(a)47位或与其对应的位置:异亮氨酸、丝氨酸、苏氨酸、半胱氨酸、蛋氨酸、谷氨酰胺,
(b)72位或与其对应的位置:丙氨酸、蛋氨酸,
(c)210位或与其对应的位置:蛋氨酸,
(d)294位或与其对应的位置:丙氨酸、甘氨酸、半胱氨酸、丝氨酸,
(e)385位或与其对应的位置:缬氨酸、亮氨酸、异亮氨酸、蛋氨酸。
于是,本发明的转化细胞是4-氨基苯甲酸羟化活性得到了提升的多肽的产生菌株,是有用的4-氨基-3-羟基苯甲酸类的生产株。
<4-氨基-3-羟基苯甲酸类的制造>
本发明的4-氨基-3-羟基苯甲酸类的制造方法包括培养本发明的转化细胞的工序,能够通过从培养基中回收4-氨基-3-羟基苯甲酸类而获得4-氨基-3-羟基苯甲酸类。
在本发明中,作为4-氨基-3-羟基苯甲酸类,具体可以举出以下通式(1)所示的4-氨基-3-羟基苯甲酸衍生物。
〔式中,R1表示氢原子、羟基(-OH)、甲氧基(-OCH3)、氨基(-NH2)、氟原子(-F)、氯原子(-Cl)、溴原子(-Br)、碘原子(-I)、羧基(-COOH)、甲基(-CH3)、乙基(-CH2CH3),R2表示氢原子或羟基(-OH)、甲氧基(-OCH3)、氨基(-NH2)、氟原子(-F)、氯原子(-Cl)、溴原子(-Br)、碘原子(-I)、羧基(-COOH)、甲基(-CH3)或乙基(-CH2CH3),X1和X2为氢原子或羟基且至少一方表示羟基。〕
作为R1所示的官能团,优选氢原子、羟基(-OH)、甲氧基(-OCH3)、氟原子(-F)或甲基(-CH3)。
作为R2所示的官能团,优选氢原子、羟基(-OH)、甲氧基(-OCH3)、氟原子(-F)或甲基(-CH3)。
更优选R1和R2均为氢原子。
另外,X1和X2可以均为羟基,但优选X1和X2的任一方为羟基。
另外,该培养基中可以根据需要存在成为4-氨基-3-羟基苯甲酸类的生物合成底物的4-氨基苯甲酸类。
在此,作为4-氨基苯甲酸类,可以举出以下通式(2)所示的4-氨基苯甲酸衍生物。
〔式中,R1和R2所表示的含义同上。〕
培养转化细胞的培养基只要是含有碳源、氮源、无机盐类等且能够高效地培养本发明的转化细胞的培养基,则可以使用天然培养基、合成培养基的任一种。作为碳源,例如可以使用葡萄糖等糖类、甘油等多元醇类、乙醇等醇类、或丙酮酸、琥珀酸或柠檬酸等有机酸类。此外,作为氮源,例如可以使用蛋白胨、肉提取物、酵母提取物、酪蛋白水解物、大豆粕碱性提取物、甲胺等烷基胺类、或者氨或其盐等。另外,还可以根据需要使用磷酸盐、碳酸盐、硫酸盐、镁、钙、钾、铁、锰、锌等的盐类、特定的氨基酸、特定的维生素、消泡剂等。
培养通常可以在10℃~40℃下根据需要边搅拌或振荡边进行6小时~72小时、优选9小时~60小时、更优选12小时~48小时。此外,培养中也可以根据需要在培养基中添加氨苄西林或卡那霉素等抗生素。
来自培养物的4-氨基-3-羟基苯甲酸类的回收和精制方法没有特别限制。即,可以通过组合公知的离子交换树脂法、沉淀法、晶析法、重结晶法、浓缩法或其它方法来实施。例如,利用离心分离等将菌体除去后,利用阳离子和阴离子交换树脂除去离子性物质,进行浓缩,则能够获得4-氨基-3-羟基苯甲酸类。培养物中蓄积的4-氨基-3-羟基苯甲酸类可以不离析而直接使用。
另外,作为例示的实施方式,本发明包括以下的产品、制造方法、用途、方法等。但本发明并不限定于这些实施方式。
<1>一种以下A)~C)所示的具有4-氨基苯甲酸羟化活性的多肽。
A)其是在序列号2所示的氨基酸序列或与其具有至少47%的同一性的氨基酸序列中序列号2所示的氨基酸序列的47位或与其对应的位置的氨基酸残基为亮氨酸的具有4-氨基苯甲酸羟化活性的多肽。
B)其是在序列号2所示的氨基酸序列或与其具有至少51%的同一性的氨基酸序列中序列号2所示的氨基酸序列的201位或222位、或者与201位或222位相应的位置的氨基酸残基为苯丙氨酸的具有4-氨基苯甲酸羟化活性的多肽。
C)其是在序列号2所示的氨基酸序列或与其具有至少90%的同一性的氨基酸序列中序列号2所示的氨基酸序列的47位、72位、210位、294位或385位、或者与47位、72位、210位、294位或385位相应的位置的氨基酸残基为下列氨基酸的具有4-氨基苯甲酸羟化活性的多肽。
(a)47位或与其对应的位置:异亮氨酸、丝氨酸、苏氨酸、半胱氨酸、蛋氨酸、谷氨酰胺,
(b)72位或与其对应的位置:丙氨酸、蛋氨酸,
(c)210位或与其对应的位置:蛋氨酸,
(d)294位或与其对应的位置:丙氨酸、甘氨酸、半胱氨酸、丝氨酸,
(e)385位或与其对应的位置:缬氨酸、亮氨酸、异亮氨酸、蛋氨酸。
<2>一种以下A″)~C″)所示的具有4-氨基苯甲酸羟化活性的多肽。
A″)在序列号2所示的氨基酸序列或与其具有至少47%的同一性的氨基酸序列中序列号2所示的氨基酸序列的47位或与其对应的位置的氨基酸残基被取代为亮氨酸的具有4-氨基苯甲酸羟化活性的突变多肽。
B″)在序列号2所示的氨基酸序列或与其具有至少51%的同一性的氨基酸序列中序列号2所示的氨基酸序列的201位或222位、或者与201位或222位相应的位置的氨基酸残基被取代为苯丙氨酸的具有4-氨基苯甲酸羟化活性的多肽。
C″)在序列号2所示的氨基酸序列或与其具有至少90%的同一性的氨基酸序列中序列号2所示的氨基酸序列的47位、72位、210位、294位或385位、或者与47位、72位、210位、294位或385位相应的位置的氨基酸残基被取代为下列氨基酸的具有4-氨基苯甲酸羟化活性的多肽。
(a)47位或与其对应的位置:异亮氨酸、丝氨酸、苏氨酸、半胱氨酸、蛋氨酸、谷氨酰胺,
(b)72位或与其对应的位置:丙氨酸、蛋氨酸,
(c)210位或与其对应的位置:蛋氨酸,
(d)294位或与其对应的位置:丙氨酸、甘氨酸、半胱氨酸、丝氨酸,
(e)385位或与其对应的位置:缬氨酸、亮氨酸、异亮氨酸、蛋氨酸。
<3>如<2>所述的突变多肽,其中,A″)所示的氨基酸残基的取代是由缬氨酸向亮氨酸的取代,B″)所示的氨基酸残基的取代是由酪氨酸向苯丙氨酸的取代,C″)所示的氨基酸残基的取代是294位或与其对应的位置的苏氨酸向丝氨酸的取代,47位或与其对应的位置的缬氨酸向异亮氨酸、苏氨酸、蛋氨酸或谷氨酰胺的取代,或者72位或与其对应的位置的组氨酸向蛋氨酸的取代。
<4>一种具有4-氨基苯甲酸羟化活性的突变多肽的制造方法,其包括以下A′)~C′)所示的氨基酸残基的取代。
A′)在由序列号2所示的氨基酸序列或与其具有至少47%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的47位或与其对应的位置的氨基酸残基取代为亮氨酸。
B′)在由序列号2所示的氨基酸序列或与其具有至少51%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的201位或222位、或者与201位或222位相应的位置的氨基酸残基取代为苯丙氨酸。
C′)在由序列号2所示的氨基酸序列或与其具有至少90%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的47位、72位、210位、294位或385位、或者与47位、72位、210位、294位或385位相应的位置的氨基酸残基取代为下列氨基酸。
(a)47位或与其对应的位置:异亮氨酸、丝氨酸、苏氨酸、半胱氨酸、蛋氨酸、谷氨酰胺,
(b)72位或与其对应的位置:丙氨酸、蛋氨酸,
(c)210位或与其对应的位置:蛋氨酸,
(d)294位或与其对应的位置:丙氨酸、甘氨酸、半胱氨酸、丝氨酸,
(e)385位或与其对应的位置:缬氨酸、亮氨酸、异亮氨酸、蛋氨酸。
<5>如<4>所述的方法,其中,A′)所示的氨基酸残基的取代是由缬氨酸向亮氨酸的取代,B′)所示的氨基酸残基的取代是由酪氨酸向苯丙氨酸的取代,C′)所示的氨基酸残基的取代是294位或与其对应的位置的苏氨酸向丝氨酸的取代,47位或与其对应的位置的缬氨酸向异亮氨酸、苏氨酸、蛋氨酸或谷氨酰胺的取代,或者72位或与其对应的位置的组氨酸向蛋氨酸的取代。
<6>一种提升4-氨基苯甲酸羟化活性的方法,其包括以下A′)~C′)所示的氨基酸残基的取代。
A′)在由序列号2所示的氨基酸序列或与其具有至少47%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的47位或与其对应的位置的氨基酸残基取代为亮氨酸。
B′)在由序列号2所示的氨基酸序列或与其具有至少51%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的201位或222位、或者与201位或222位相应的位置的氨基酸残基取代为苯丙氨酸。
C′)在由序列号2所示的氨基酸序列或与其具有至少90%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的47位、72位、210位、294位或385位、或者与47位、72位、210位、294位或385位相应的位置的氨基酸残基取代为下列氨基酸。
(a)47位或与其对应的位置:异亮氨酸、丝氨酸、苏氨酸、半胱氨酸、蛋氨酸、谷氨酰胺,
(b)72位或与其对应的位置:丙氨酸、蛋氨酸,
(c)210位或与其对应的位置:蛋氨酸,
(d)294位或与其对应的位置:丙氨酸、甘氨酸、半胱氨酸、丝氨酸,
(e)385位或与其对应的位置:缬氨酸、亮氨酸、异亮氨酸、蛋氨酸。
<7>如<6>所述的方法,其中,A′)所示的氨基酸残基的取代是由缬氨酸向亮氨酸的取代,B′)所示的氨基酸残基的取代是由酪氨酸向苯丙氨酸的取代,C′)所示的氨基酸残基的取代是294位或与其对应的位置的苏氨酸向丝氨酸的取代,47位或与其对应的位置的缬氨酸向异亮氨酸、苏氨酸、蛋氨酸或谷氨酰胺的取代,或者72位或与其对应的位置的组氨酸向蛋氨酸的取代。
<8>一种提高4-氨基苯甲酸类的生产率的方法,其包括以下A′)~C′)所示的氨基酸残基的取代。
A′)在使用由序列号2所示的氨基酸序列或与其具有至少47%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽制造4-氨基-3-羟基苯甲酸类时,将序列号2所示的氨基酸序列的47位或与其对应的位置的氨基酸残基取代为亮氨酸。
B′)在由序列号2所示的氨基酸序列或与其具有至少51%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的201位或222位、或者与201位或222位相应的位置的氨基酸残基取代为苯丙氨酸。
C′)在由序列号2所示的氨基酸序列或与其具有至少90%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的47位、72位、210位、294位或385位、或者与47位、72位、210位、294位或385位相应的位置的氨基酸残基取代为下列氨基酸。
(a)47位或与其对应的位置:异亮氨酸、丝氨酸、苏氨酸、半胱氨酸、蛋氨酸、谷氨酰胺,
(b)72位或与其对应的位置:丙氨酸、蛋氨酸,
(c)210位或与其对应的位置:蛋氨酸,
(d)294位或与其对应的位置:丙氨酸、甘氨酸、半胱氨酸、丝氨酸,
(e)385位或与其对应的位置:缬氨酸、亮氨酸、异亮氨酸、蛋氨酸。
<9>如<8>所述的方法,其中,A′)所示的氨基酸残基的取代是由缬氨酸向亮氨酸的取代,B′)所示的氨基酸残基的取代是由酪氨酸向苯丙氨酸的取代,C′)所示的氨基酸残基的取代是294位或与其对应的位置的苏氨酸向丝氨酸的取代,47位或与其对应的位置的缬氨酸向异亮氨酸、苏氨酸、蛋氨酸或谷氨酰胺的取代,或者72位或与其对应的位置的组氨酸向蛋氨酸的取代。
<10>一种编码<1>~<3>中任一项所述的多肽的多核苷酸。
<11>一种包含<10>所述的多核苷酸的载体或DNA片段。
<12>一种包含<11>所述的载体或DNA片段的转化细胞。
<13>如<12>所述的转化细胞,其为大肠杆菌或棒状杆菌属菌。
<14>一种<12>或<13>所述的转化细胞,其是能够提供4-氨基苯甲酸类的微生物。
<15>如<12>或<13>所述的转化细胞,该转化细胞的4-氨基苯甲酸类的提供能力得到了提升。
<16>一种4-氨基-3-羟基苯甲酸类的制造方法,其包括培养<12>~<15>中任一项所述的转化细胞的工序。
<17>如<16>所述的方法,利用含有糖类作为碳源的培养基进行培养。
<18>如<16>或<17>所述的方法,其包括从培养基回收4-氨基-3-羟基苯甲酸类的工序。
<19>如<16>~<18>中任一项所述的方法,其中,培养在存在4-氨基苯甲酸类的条件下进行。
<20>如<16>~<19>中任一项所述的方法,其中,4-氨基-3-羟基苯甲酸类为以下通式(1)所示的4-氨基-3-羟基苯甲酸衍生物。
〔式中,R1表示氢原子、羟基、甲氧基、氨基、氟原子、氯原子、溴原子、碘原子、羧基、甲基、乙基,R2表示氢原子或羟基、甲氧基、氨基、氟原子、氯原子、溴原子、碘原子、羧基、甲基或乙基,X1和X2为氢原子或羟基且至少一方表示羟基。〕
<21>如<19>或<20>所述的方法,其中,4-氨基苯甲酸类为以下通式(2)所示的4-氨基苯甲酸衍生物。
〔式中,R1表示氢原子、羟基、甲氧基、氨基、氟原子、氯原子、溴原子、碘原子、羧基、甲基、乙基,R2表示氢原子或羟基、甲氧基、氨基、氟原子、氯原子、溴原子、碘原子、羧基、甲基或乙基。〕
实施例
以下,基于实施例对本发明进行更详细的说明,但本发明并不限定于此。
实施例A1 4-氨基-3-羟基苯甲酸的生产
在以下的实施例中,PCR使用Prime STAR Max Premix(Takara Bio)进行。
(1)包含编码野生型酶的基因的质粒的制作
(a)质粒pECsf_gapS_pabABC的制作
将按照常规方法从谷氨酸棒状杆菌(Corynebacterium glutamicum)ATCC13032株提取的基因组作为模板,使用引物GN14_127(序列号13、TATTAATTAAATGCGCGTTTTAATTATTGATAATTATGATTC)和GN14_133(序列号14、TTGCGGCCGCTTGTTTAAACCTCCTTACAGAAAAATGGTTGGGCG),利用PCR使包含编码4-氨基-4-脱氧分支酸合成酶和4-氨基-4-脱氧分支酸裂解酶的基因的DNA片段扩增,将其插入质粒pECsf_gapS(参照日本特愿2015-25491)的PacI部位与NotI部位之间,由此得到质粒pECsf_gapS_pabABC。
(b)质粒pECsf_gapS_pabABC_HFM122的制作
将上述所得到的质粒pECsf_gapS_pabABC作为模板,使用引物pabABCcory vec R(序列号15、AAATTTAAACCTCCTTTACAGAAAAATGGTTGG)和pabABCcory vec F(序列号16、GGAGGTTTAAACAAGCGGCCGCGATATC)利用PCR合成了载体用DNA片段。接着,通过人工基因合成制作包含编码具有4-氨基苯甲酸羟化活性的多肽HFM122的基因(序列号1)的质粒,将其作为模板,使用引物pECsfDHFM122 F(序列号17、AGGAGGTTTAAATTTATGCGCACTCAGGTGGCTAT)和pECsfD HFM122 R(序列号18、CTTGTTTAAACCTCCTTATACGAGTGGCAGTCCTA)利用PCR合成了插入用DNA片段。对这些PCR产物利用DpnI(Takara Bio)进行处理后,使用NucleoSpin Geland PCR Clean-up(Takara Bio)对各DNA片段进行精制,利用In-Fusion HD Cloning Kit(Takara Bio)连接,由此构建了质粒pECsf_gapS_pabABC_HFM122。使用所得到的质粒溶液对ECOS Competent E.coli DH5α株(Nippon Gene)进行转化,将细胞液涂布于LBKm琼脂培养基(Bacto Trypton 1%、酵母提取物0.5%、NaCl 1%,硫酸卡那霉素50μg/mL、琼脂1.5%)后,以37℃静置一夜,对于所得到的菌落,使用Sapphire Amp(Takara Bio)和引物pabABC+pobA for CPCR F(序列号19,GCTATCAAAACATTCGGCACATTGGTTTTCC)、pabABC+pobAfor CPCR R(序列号20,GGAAGATGCGTGATCTGATCCTTCAACTC)进行PCR反应,选择确认了目标DNA片段导入的转化株。将所得到的转化株接种于LBKm液体培养基(Bacto Trypton 1%、酵母提取物0.5%、NaCl 1%,硫酸卡那霉素50μg/mL)2mL中,以37℃培养一夜。由该培养液使用NucleoSpin Plasmid EasyPure(Takara Bio)进行质粒的精制。
(c)质粒pECsf_gapS_pabABC_tuD_HFM122的制作
将上述所得到的质粒pECsf_gapS_pabABC_HFM122作为模板,使用引物pabC lastR(序列号21、TTACAGAAAAATGGTTGGGCGCAA)和HFM122 F(序列号22、ATGCGCACTCAGGTGGCTATCG)利用PCR合成了载体用DNA片段。接着,通过人工基因合成制作了使用包含谷氨酸棒状杆菌ATCC13032株所具有的tuf基因(cg0587)的启动子(以下称为tu启动子)的DNA片段(序列号23、TACGTACCTGCAGGTAGCGTGTCAGTAGGCGCGTAGGGTAAGTGGGGTAGCGGCTTGTTAGATATCTTGAAATCGGCTTTCAACAGCATTGATTTCGATGTATTTAGCTGGCCGTTACCCTGCGAATGTCCACAGGGTAGCTGGTAGTTTGAAAATCAACGCCGTTGCCCTTAGGATTCAGTAACTGGCACATTTTGTAATGCGCTAGATCTGTGTGCTCAGTCTTCCAGGCTGCTTATCACAGTGAAAGCAAAACCAATTCGTGGCTGCGAAAGTCGTAGCCACCACGAAGTCCAAAGGAGGATCTAAATTATGAATAATATAAAAGGAGGAATTAATTAA),将其作为模板,使用引物pabC-Ptu F(序列号24、ACCATTTTTCTGTAATACGTACCTGCAGGTAGCGTG)和Ptu-HFM122R(序列号25、CACCTGAGTGCGCATTTAATTAATTCCTCCTTTTA)利用PCR合成了插入用DNA片段。对于这些PCR产物利用DpnI(Takara Bio)进行处理后,使用NucleoSpin Gel and PCR Clean-up(Takara Bio)对各DNA片段进行精制,利用In-Fusion HD Cloning Kit(Takara Bio)连接,由此构建了质粒pECsf_gapS_pabABC_tuD_HFM122。使用所得到的质粒溶液对ECOSCompetent E.coli DH5α株(Nippon Gene)进行转化,将细胞液涂布于LBKm琼脂培养基后,以37℃静置一夜,对于所得到的菌落,使用Sapphire Amp(Takara Bio)和引物Ptu seq 1(序列号26,GCTTGTTAGATATCTTGAAATCGGCTTTC)、pabABC+pobA for CPCR R(序列号20,GGAAGATGCGTGATCTGATCCTTCAACTC)进行PCR反应,选择确认了目标DNA片段导入的转化株。将所得到的转化株接种于LBKm液体培养基2ml中,以37℃培养一夜。由该培养液使用NucleoSpin Plasmid EasyPure(Takara Bio)进行质粒的精制。
在所构建的质粒中,在gap启动子的控制下,编码4-氨基-4-脱氧分支酸合成酶和4-氨基-4-脱氧分支酸裂解酶的基因连接,并且在tu启动子的控制下,编码野生型HFM122的基因连接。
(d)其它质粒的制作
将上述所得到的质粒pECsf_gapS_pabABC_tuD_HFM122作为模板,使用引物pGapABA_tu vec F(序列号27、GGAGGTTTAAACAAGCGG)和pGapABA_tu vec R(序列号28、AATTTAGATCCTCCTTTGGACTTCGTG)利用PCR合成了载体用DNA片段。接着,通过人工基因合成制作了包含编码具有4-氨基苯甲酸羟化活性的各多肽的基因(序列号3,5,7,9,11)的质粒,将其作为模板,使用表A1的“引物”一栏所示的引物,利用PCR合成了插入用DNA片段。对于这些PCR产物利用DpnI(Takara Bio)进行处理后,使用NucleoSpin Gel and PCR Clean-up(Takara Bio)对各DNA片段进行精制,利用In-Fusion HD Cloning Kit(Takara Bio)连接,由此构建了表1的“质粒”一栏所示的质粒。使用所得到的质粒对溶液ECOS CompetentE.coli DH5α株(Nippon Gene)进行转化,将细胞液涂布于LBKm琼脂培养基后,以37℃静置过夜,对于所得到的菌落,使用Sapphire Amp(Takara Bio)和引物Ptu seq 1(序列号26,GCTTGTTAGATATCTTGAAATCGGCTTTC)、pabABC+pobA for CPCR R(序列号20,GGAAGATGCGTGATCTGATCCTTCAACTC)进行PCR反应,选择确认了目标DNA片段导入的转化株。将所得到的转化株接种于LBKm液体培养基2ml中,以37℃培养一夜。利用培养液,使用NucleoSpin Plasmid EasyPure(Takara Bio)进行质粒的精制。
在所构建的质粒中,在gap启动子的控制下,编码4-氨基-4-脱氧分支酸合成酶和4-氨基-4-脱氧分支酸裂解酶的基因连接,并且在tu启动子的控制下,编码野生型羟化酶的基因连接。
[表A1]
(2)包含编码突变型酶的基因的质粒的制作
关于包含编码突变型酶的基因的质粒的制作,作为例示,以下表示包含编码HFM77的47位的缬氨酸被取代为亮氨酸的突变型酶的基因的质粒的制作。
将质粒pECsf_gapS_pabABC_tu_HFM77作为模板,使用互补引物HFM77 V47L F(序列号39、GCCGGGCTCCTGGAACAGTCTACGGTT)、HFM77 V47L R(序列号40、TTCCAGGAGCCCGGCGCGGATGGTCTG)利用PCR构建了质粒pECsf_gapS_pabABC_tu_HFM77_V47L。对于PCR产物利用DpnI(Takara Bio)进行处理,使用处理后的液体,对ECOS CompetentE.coli DH5α株(Nippon Gene)进行转化,将细胞液涂布于LBKm琼脂培养基后,以37℃静置一夜,选取所得到的菌落作为转化株。将转化株接种于LBKm液体培养基2mL中,以37℃培养一夜。由该培养液使用NucleoSpin Plasmid EasyPure(Takara Bio)进行质粒的精制。
同样,使用表A2的“模板”所示的质粒代替质粒pECsf_gapS_pabABC_tu_HFM77,使用表A2的“引物”所示的引物代替引物HFM77 V47L F和HFM77 V47L R,利用PCR得到了包含编码各酶突变体的基因的质粒。
[表A2]
(3)将质粒导入宿主细胞
使用上述所得到的各质粒,利用电穿孔法(Bio-rad)对谷氨酸棒状杆菌DRHG145株(参照日本特愿2014-523757)进行转化。将所得到的转化细胞液涂布于LBKm琼脂培养基后,以30℃静置2日,将所得到的菌落作为转化株。
(4)转化株的培养
将上述所得到的转化株分别接种于表A3所示的CGYE培养基(含有硫酸卡那霉素50μg/mL)1mL中,以30℃培养一夜。将所得到的培养液100μL接种于表A4所示的CGXII培养基(含有硫酸卡那霉素50μg/mL)10mL中,以30℃培养约48小时后,将利用离心分离除去菌体后的产物作为培养上清。按照参考例1的方法将所得到的培养上清中的4-氨基-3-羟基苯甲酸浓度定量,按照下式算出4-氨基-3-羟基苯甲酸的生产能力提高率。在此,“WT”表示“导入了包含编码野生型酶的基因的质粒的转化株”,“MT”表示“由包含编码该野生型酶的基因的质粒制成的导入了包含编码突变型酶的基因的质粒的转化株”。
(数学式1)
生产能力提高率=MT的4-氨基-3-羟基苯甲酸生产能力/WT的4-氨基-3-羟基苯甲酸生产能力
[表A3]
CGYE培养基组成(每1L)
葡萄糖 | 50g |
(NH<sub>4</sub>)<sub>2</sub>SO<sub>4</sub> | 20g |
尿素 | 5g |
KH<sub>2</sub>PO<sub>4</sub> | 1g |
K<sub>2</sub>HPO<sub>4</sub> | 1g |
MgSO<sub>4</sub>·7H<sub>2</sub>O | 0.25g |
CaCl<sub>2</sub>·2H<sub>2</sub>O | 10mg |
FeSO<sub>4</sub>·7H<sub>2</sub>O | 10mg |
MnSO<sub>4</sub>·5H<sub>2</sub>O | 10mg |
ZnSO<sub>4</sub>·7H<sub>2</sub>O | 1mg |
CuSO<sub>4</sub>·5H<sub>2</sub>O | 0.2mg |
NiCl<sub>2</sub>·6H<sub>2</sub>O | 0.02mg |
生物素(pH7) | 0.2mg |
酵母提取物 | 1g |
[表A4]
CGXII培养基组成(每1L)
葡萄糖 | 50g |
(NH<sub>4</sub>)<sub>2</sub>SO<sub>4</sub> | 20g |
尿素 | 5g |
KH<sub>2</sub>PO<sub>4</sub> | 1g |
K<sub>2</sub>HPO<sub>4</sub> | 1g |
MgSO<sub>4</sub>·7H<sub>2</sub>O | 0.25g |
CaCl<sub>2</sub>·2H<sub>2</sub>O | 10mg |
FeSO<sub>4</sub>·7H<sub>2</sub>O | 10mg |
MnSO<sub>4</sub>·5H<sub>2</sub>O | 10mg |
ZnSO<sub>4</sub>·7H<sub>2</sub>O | 1mg |
CuSO<sub>4</sub>·5H<sub>2</sub>O | 0.2mg |
NiCl<sub>2</sub>·6H<sub>2</sub>O | 0.02mg |
生物素(pH7) | 0.2mg |
胰蛋白胨 | 10g |
(5)结果
如表A5所示,导入了各突变型酶的菌株与导入了野生型酶的菌株相比,4-氨基-3-羟基苯甲酸的生产能力提高。
[表A5]
实施例B1 4-氨基-3-羟基苯甲酸的生产
在以下的实施例中,PCR使用PrimeSTAR Max Premix(Takara Bio)进行。
(1)包含编码野生型酶的基因的质粒的制作
(a)质粒pECsf_gapS_pabABC的制作
将按照常规方法从谷氨酸棒状杆菌(Corynebacterium glutamicum)ATCC13032株提取的基因组作为模板,使用引物GN14_127(序列号13、TATTAATTAAATGCGCGTTTTAATTATTGATAATTATGATTC)和GN14_133(序列号14、TTGCGGCCGCTTGTTTAAACCTCCTTACAGAAAAATGGTTGGGCG),利用PCR使包含编码4-氨基-4-脱氧分支酸合成酶和4-氨基-4-脱氧分支酸裂解酶的基因的DNA片段扩增,将其插入质粒pECsf_gapS(参照日本特愿2015-25491)的PacI部位与NotI部位之间,由此得到了质粒pECsf_gapS_pabABC。
(b)质粒pECsf_gapS_pabABC_HFM122的制作
将上述所得到的质粒pECsf_gapS_pabABC作为模板,使用引物pabABCcory vec R(序列号15、AAATTTAAACCTCCTTTACAGAAAAATGGTTGG)和pabABCcory vec F(序列号16、GGAGGTTTAAACAAGCGGCCGCGATATC),利用PCR合成了载体用DNA片段。接着,通过人工基因合成了制作包含编码具有4-氨基苯甲酸羟化活性的多肽HFM122的基因(序列号1)的质粒,将其作为模板,使用引物pECsfD HFM122 F(序列号17、AGGAGGTTTAAATTTATGCGCACTCAGGTGGCTAT)和pECsfD HFM122 R(序列号18、CTTGTTTAAACCTCCTTATACGAGTGGCAGTCCTA),利用PCR合成了插入用DNA片段。对于这些PCR产物利用DpnI(Takara Bio)进行处理后,使用NucleoSpin Gel and PCR Clean-up(Takara Bio)对各DNA片段进行精制,利用In-FusionHD Cloning Kit(Takara Bio)连接,由此构建了质粒pECsf_gapS_pabABC_HFM122。使用所得到的质粒溶液对ECOS Competent E.coli DH5α株(Nippon Gene)进行转化,将细胞液涂布于LBKm琼脂培养基(Bacto Trypton 1%、酵母提取物0.5%、NaCl 1%,硫酸卡那霉素50μg/mL、琼脂1.5%)后,以37℃静置一夜,对于所得到的菌落,使用Sapphire Amp(TakaraBio)和引物pabABC+pobA for CPCR F(序列号19,GCTATCAAAACATTCGGCACATTGGTTTTCC)、pabABC+pobA for CPCR R(序列号20,GGAAGATGCGTGAT CTGATCCTTCAACTC)进行PCR反应,选择确认了目标DNA片段导入的转化株。将所得到的转化株接种于LBKm液体培养基(BactoTrypton 1%、酵母提取物0.5%、NaCl 1%、硫酸卡那霉素50μg/mL)2mL中,以37℃培养一夜。由该培养液使用NucleoSpin Plasmid EasyPure(Takara Bio)进行质粒的精制。
(c)质粒pECsf_gapS_pabABC_tuD_HFM122的制作
将上述所得到的质粒pECsf_gapS_pabABC_HFM122作为模板,使用引物pabC lastR(序列号21、TTACAGAAAAATGGTTGGGCGCAA)和HFM122 F(序列号22、ATGCGCACTCAGGTGGCTATCG),利用PCR合成了载体用DNA片段。接着,通过人工基因合成了制作包含谷氨酸棒状杆菌ATCC13032株所具有的tuf基因(cg0587)的启动子(以下称为tu启动子)的DNA片段(序列号23、TACGTACCTGCAGGTAGCGTGTCAGTAGGCGCGTAGGGTAAGTGGGGTAGCGGCTTGTTAGATATCTTGAAATCGGCTTTCAACAGCATTGATTTCGATGTATTTAGCTGGCCGTTACCCTGCGAATGTCCACAGGGTAGCTGGTAGTTTGAAAATCAACGCCGTTGCCCTTAGGATTCAGTAACTGGCACATTTTGTAATGCGCTAGATCTGTGTGCTCAGTCTTCCAGGCTGCTTATCACAGTGAAAGCAAAACCAATTCGTGGCTGCGAAAGTCGTAGCCACCACGAAGTCCAAAGGAGGATCTAAATTATGAATAATATAAAAGGAGGAATTAATTAA),将其作为模板,使用引物pabC-PtuF(序列号24、ACCATTTTTCTGTAATACGTACCTGCAGGTAGCGTG)和Ptu-HFM122 R(序列号25、CACCTGAGTGCGCATTTAATTAATTCCTCCTTTTA),利用PCR合成了插入用DNA片段。对于这些PCR产物利用DpnI(Takara Bio)进行处理后,使用NucleoSpinGel and PCR Clean-up(Takara Bio)对各DNA片段进行精制,利用In-Fusion HD Cloning Kit(Takara Bio)连接,由此构建了质粒pECsf_gapS_pabABC_tuD_HFM122。使用所得到的质粒溶液对ECOS Competent E.coli DH5α株(Nippon Gene)进行转化,将细胞液涂布于LBKm琼脂培养基后,以37℃静置一夜,对于所得到的菌落,使用Sapphire Amp(Takara Bio)和引物Ptu seq 1(序列号26,GCTTGTTAGATATCTTGAAATCGGCTTTC)、pabABC+pobA for CPCR R(序列号20,GGAAGATGCGTGATCTGATCCTTCAACTC),进行PCR反应,选择确认了目标DNA片段导入的转化株。将所得到的转化株接种于LBKm液体培养基2ml中,以37℃培养一夜。由该培养液使用NucleoSpin Plasmid EasyPure(Takara Bio)进行质粒的精制。
在所构建的质粒中,在gap启动子的控制下,编码4-氨基-4-脱氧分支酸合成酶和4-氨基-4-脱氧分支酸裂解酶的基因连接,并且在tu启动子的控制下,编码野生型HFM122的基因连接。
(d)其它质粒的制作
将上述所得到的质粒pECsf_gapS_pabABC_tuD_HFM122作为模板,使用引物pGapABA_tu vec F(序列号27、GGAGGTTTAAACAAGCGG)和pGapABA_tu vec R(序列号28、AATTTAGATCCTCCTTTGGACTTCGTG),利用PCR合成了载体用DNA片段。接着,通过人工基因合成制作包含编码具有4-氨基苯甲酸羟化活性的各多肽的基因(序列号3,5,7)的质粒,将其作为模板,使用表B1的“引物”一栏所示的引物,利用PCR合成了插入用DNA片段。对于这些PCR产物利用DpnI(Takara Bio)进行处理后,使用NucleoSpin Gel and PCR Clean-up(TakaraBio)对各DNA片段进行精制,利用In-Fusion HD Cloning Kit(Takara Bio)连接,由此构建了表B1的“质粒”一栏所示的质粒。使用所得到的质粒溶液对ECOS Competent E.coli DH5α株(Nippon Gene)进行转化,将细胞液涂布于LBKm琼脂培养基后,以37℃静置一夜,对于所得到的菌落,使用Sapphire Amp(Takara Bio)和引物Ptu seq 1(序列号26,GCTTGTTAGATATCTTGAAATCGGCTTTC)、pabABC+pobA for CPCR R(序列号20,GGAAGATGCGTGATCTGATCCTTCAACTC),进行PCR反应,选择确认了目标DNA片段导入的转化株。将所得到的转化株接种于LBKm液体培养基2ml中,以37℃培养一夜。由该培养液使用NucleoSpin Plasmid EasyPure(Takara Bio)进行质粒的精制。
在所构建的质粒中,在gap启动子的控制下,编码4-氨基-4-脱氧分支酸合成酶和4-氨基-4-脱氧分支酸裂解酶的基因连接,并且在tu启动子的控制下,编码野生型羟化酶的基因连接。
[表B1]
(2)包含编码突变型酶的基因的质粒的制作
关于包含编码突变型酶的基因的质粒的制作,作为例示,以下表示包含编码HFM77的201位的酪氨酸被取代为苯丙氨酸的突变型酶的基因的质粒的制作。
将质粒pECsf_gapS_pabABC_tu_HFM77作为模板,使用互补引物HFM77 Y201F F(序列号51、CTCATCTTCGCACATCACGACCGCGGA)、HFM77 Y201F R(序列号52、ATGTGCGAAGATGAGCTCTTCGGATGA)利用PCR构建了质粒pECsf_gapS_pabABC_tu_HFM77_Y201F。对于PCR产物利用DpnI(Takara Bio)进行处理,使用处理后的液体对ECOSCompetent E.coli DH5α株(Nippon Gene)进行转化。将细胞液涂布于LBKm琼脂培养基后,以37℃静置一夜,选取所得到的菌落作为转化株。将转化株接种于LBKm液体培养基2mL中,以37℃培养一夜。由该培养液使用NucleoSpin Plasmid EasyPure(Takara Bio)进行质粒的精制。
同样,使用表B2的“模板”所示的质粒代替质粒pECsf_gapS_pabABC_tu_HFM77,使用表B2的“引物”所示的引物代替引物HFM77 Y201F F和HFM77 Y201F R,利用PCR得到了包含编码各酶突变体的基因的质粒。
[表B2]
(3)将质粒导入宿主细胞
使用上述所得到的各质粒,利用电穿孔法(Bio-rad)对谷氨酸棒状杆菌DRHG145株(参照日本特愿2014-523757)进行转化。将所得到的转化细胞液涂布于LBKm琼脂培养基后,以30℃静置2日,将所得到的菌落作为转化株。
(4)转化株的培养
将上述所得到的转化株分别接种于表B3所示的CGYE培养基(含有硫酸卡那霉素50μg/mL)1mL中,以30℃培养一夜。将所得到的培养液100μL接种于表B4所示的CGXII培养基(含有硫酸卡那霉素50μg/mL)10mL中,以30℃培养约48小时后,将利用离心分离除去菌体后的产物作为培养上清。按照参考例1的方法将所得到的培养上清中的4-氨基-3-羟基苯甲酸浓度定量,按照下式算出4-氨基-3-羟基苯甲酸的生产能力提高率。在此,“WT”表示“导入了包含编码野生型酶的基因的质粒的转化株”,“MT”表示“由包含编码该野生型酶的基因的质粒制成的导入了包含编码突变型酶的基因的质粒的转化株”。
(数学式1)
生产能力提高率=MT的4-氨基-3-羟基苯甲酸生产能力/WT的4-氨基-3-羟基苯甲酸生产能力
[表B3]
CGYE培养基组成(每1L)
葡萄糖 | 50g |
(NH<sub>4</sub>)<sub>2</sub>SO<sub>4</sub> | 20g |
尿素 | 5g |
KH<sub>2</sub>PO<sub>4</sub> | 1g |
K<sub>2</sub>HPO<sub>4</sub> | 1g |
MgSO<sub>4</sub>·7H<sub>2</sub>O | 0.25g |
CaCl<sub>2</sub>·2H<sub>2</sub>O | 10mg |
FeSO<sub>4</sub>·7H<sub>2</sub>O | 10mg |
MnSO<sub>4</sub>·5H<sub>2</sub>O | 10mg |
ZnSO<sub>4</sub>·7H<sub>2</sub>O | 1mg |
CuSO<sub>4</sub>·5H<sub>2</sub>O | 0.2mg |
NiCl<sub>2</sub>·6H<sub>2</sub>O | 0.02mg |
生物素(pH7) | 0.2mg |
酵母提取物 | 1g |
[表B4]
CGXII培养基组成(每1L)
葡萄糖 | 50g |
(NH<sub>4</sub>)<sub>2</sub>SO<sub>4</sub> | 20g |
尿素 | 5g |
KH<sub>2</sub>PO<sub>4</sub> | 1g |
K<sub>2</sub>HPO<sub>4</sub> | 1g |
MgSO<sub>4</sub>·7H<sub>2</sub>O | 0.25g |
CaCl<sub>2</sub>·2H<sub>2</sub>O | 10mg |
FeSO<sub>4</sub>·7H<sub>2</sub>O | 10mg |
MnSO<sub>4</sub>·5H<sub>2</sub>O | 10mg |
ZnSO<sub>4</sub>·7H<sub>2</sub>O | 1mg |
CuSO<sub>4</sub>·5H<sub>2</sub>O | 0.2mg |
NiCl<sub>2</sub>·6H<sub>2</sub>O | 0.02mg |
生物素(pH7) | 0.2mg |
胰蛋白胨 | 10g |
(5)结果
如表B5所示,导入了各突变型酶的菌株与导入了野生型酶的菌株相比,4-氨基-3-羟基苯甲酸的生产能力提高。
[表B5]
羟化酶 | 4-氨基-3-羟基苯甲酸的生产能力(g/L) | 生产能力提高率 |
HFM77 wt | 0.073 | 1.00 |
HFM77 Y201F | 0.114 | 1.56 |
HFM77 Y222F | 0.100 | 1.37 |
HFM122 wt | 0.134 | 1.00 |
HFM122 Y201F | 0.224 | 1.67 |
HFM122 Y222F | 0.256 | 1.90 |
HFM339 wt | 0.016 | 1.00 |
HFM339 Y201F | 0.061 | 3.80 |
HFM339 Y222F | 0.139 | 8.74 |
HFM388 wt | 0.033 | 1.00 |
HFM388 Y201F | 0.079 | 2.38 |
HFM388 Y222F | 0.230 | 6.95 |
实施例C1 4-氨基-3-羟基苯甲酸的生产
在以下的实施例中,PCR使用PrimeSTAR Max Premix(Takara Bio)进行。
(1)包含编码野生型酶的基因的质粒的制作
(a)质粒pECsf_gapS_pabABC的制作
将按照常规方法从谷氨酸棒状杆菌(Corynebacterium glutamicum)ATCC13032株提取的基因组作为模板,使用引物GN14_127(序列号13、TATTAATTAAATGCGCGTTTTAATTATTGATAATTATGATTC)和GN14_133(序列号14、TTGCGGCCGCTTGTTTAAACCTCCTTACAGAAAAATGGTTGGGCG),利用PCR使包含编码4-氨基-4-脱氧分支酸合成酶和4-氨基-4-脱氧分支酸裂解酶的基因的DNA片段扩增,将其插入质粒pECsf_gapS(参照日本特愿2015-25491)的PacI部位与NotI部位之间,由此得到了质粒pECsf_gapS_pabABC。
(b)质粒pECsf_gapS_pabABC_HFM122的制作
将上述所得到的质粒pECsf_gapS_pabABC作为模板,使用引物pabABCcory vec R(序列号15、AAATTTAAACCTCCTTTACAGAAAAATGGTTGG)和pabABCcory vec F(序列号16、GGAGGTTTAAACAAGCGGCCGCGATATC),利用PCR合成了载体用DNA片段。接着,通过人工基因合成制作了包含编码具有4-氨基苯甲酸羟化活性的多肽HFM122的基因(序列号1)的质粒,将其作为模板,使用引物pECsfD HFM122 F(序列号17、AGGAGGTTTAAATTTATGCGCACTCAGGTGGCTAT)和pECsfD HFM122 R(序列号18、CTTGTTTAAACCTCCTTATACGAGTGGCAGTCCTA),利用PCR合成了插入用DNA片段。对于这些PCR产物利用DpnI(Takara Bio)进行处理后,使用NucleoSpin Gel and PCR Clean-up(Takara Bio)对各DNA片段进行精制,利用In-FusionHD Cloning Kit(Takara Bio)连接,由此构建了质粒pECsf_gapS_pabABC_HFM122。使用所得到的质粒溶液对ECOS Competent E.coli DH5α株(Nippon Gene)进行转化,将细胞液涂布于LBKm琼脂培养基(Bacto Trypton 1%、酵母提取物0.5%、NaCl 1%,硫酸卡那霉素50μg/mL、琼脂1.5%)后,以37℃静置一夜,对于所得到的菌落,使用Sapphire Amp(TakaraBio)和引物pabABC+pobA for CPCR F(序列号19,GCTATCAAAACATTCGGCACATTGGTTTTCC)、pabABC+pobA for CPCR R(序列号20,GGAAGATGCGTGATCTGATCCTTCAACTC)进行PCR反应,选择确认了目标DNA片段导入的转化株。将所得到的转化株接种于LBKm液体培养基(BactoTrypton 1%、酵母提取物0.5%、NaCl 1%,硫酸卡那霉素50μg/mL)2mL中,以37℃培养一夜。由培养液使用NucleoSpin Plasmid EasyPure(Takara Bio)进行质粒的精制。
(c)质粒pECsf_gapS_pabABC_tuD_HFM122的制作
将上述所得到的质粒pECsf_gapS_pabABC_HFM122作为模板,使用引物pabC lastR(序列号21、TTACAGAAAAATGGTTGGGCGCAA)和HFM122 F(序列号22、ATGCGCACTCAGGTGGCTATCG),利用PCR合成载体用DNA片段。接着,通过人工基因合成制作包含谷氨酸棒状杆菌ATCC13032株所具有的tuf基因(cg0587)的启动子(以下成为tu启动子)的DNA片段(序列号23、TACGTACCTGCAGGTAGCGTGTCAGTAGGCGCGTAGGGTAAGTGGGGTAGCGGCTTGTTAGATATCTTGAAATCGGCTTTCAACAGCATTGATTTCGATGTATTTAGCTGGCCGTTACCCTGCGAATGTCCACAGGGTAGCTGGTAGTTTGAAAATCAACGCCGTTGCCCTTAGGATTCAGTAACTGGCACATTTTGTAATGCGCTAGATCTGTGTGCTCAGTCTTCCAGGCTGCTTATCACAGTGAAAGCAAAACCAATTCGTGGCTGCGAAAGTCGTAGCCACCACGAAGTCCAAAGGAGGATCTAAATTATGAATAATATAAAAGGAGGAATTAATTAA),将其作为模板,使用引物pabC-Ptu F(序列号24、ACCATTTTTCTGTAATACGTACCTGCAGGTAGCGTG)和Ptu-HFM122 R(序列号25、CACCTGAGTGCGCATTTAATTAATTCCTCCTTTTA),利用PCR合成了插入用DNA片段。对于这些PCR产物进行利用DpnI(Takara Bio)的处理后,使用NucleoSpin Gel and PCR Clean-up(TakaraBio)对各DNA片段进行精制,利用In-Fusion HD Cloning Kit(Takara Bio)连接,由此构建了质粒pECsf_gapS_pabABC_tuD_HFM122。使用所得到的质粒溶液对ECOS CompetentE.coli DH5α株(Nippon Gene)进行转化,将细胞液涂布于LBKm琼脂培养基后,以37℃静置一夜,对于所得到的菌落,使用Sapphire Amp(Takara Bio)和引物Ptu seq 1(序列号26,GCTTGTTAGATATCTTGAAATCGGCTTTC)、pabABC+pobA for CPCR R(序列号20,GGAAGATGCGTGATCTGATCCTTCAACTC)进行PCR反应,选择确认了目标DNA片段导入的转化株。将所得到的转化株接种于LBKm液体培养基2ml中,以37℃培养一夜。由该培养液使用NucleoSpin Plasmid EasyPure(Takara Bio)进行质粒的精制。
在所构建的质粒中,在gap启动子的控制下,编码4-氨基-4-脱氧分支酸合成酶和4-氨基-4-脱氧分支酸裂解酶的基因连接,并且在tu启动子的控制下,编码野生型HFM122的基因连接。
(2)包含编码突变型酶的基因的质粒的制作
关于包含编码突变型酶的基因的质粒的制作,作为例示,以下表示包含编码HFM122的47位的缬氨酸被取代为异亮氨酸的突变型酶的基因的质粒的制作。
将质粒pECsf_gapS_pabABC_tuD_HFM122作为模板,使用互补引物HFM122 V47I F(序列号67、GCTGGTATTCTGGAACGTATCACGGTG)、HFM122 V47I R(序列号68、TTCCAGAATACCAGCCCGAACTCGGCC),利用PCR构建质粒pECsf_gapS_pabABC_tuD_HFM122_V47I。对于PCR产物利用DpnI(Takara Bio)进行处理,使用处理后的液体对ECOS CompetentE.coli DH5α株(Nippon Gene)进行转化,将细胞液涂布于LBKm琼脂培养基后,以37℃静置一夜,选取所得到的菌落作为转化株。将转化株接种于LBKm液体培养基2mL中,以37℃培养一夜。由该培养液使用NucleoSpin Plasmid EasyPure(Takara Bio)进行质粒的精制。
同样,使用表C1的“引物”所示的引物代替引物HFM122 V47I F和HFM122 V47I R,利用PCR得到了包含编码各酶突变体的基因的质粒。
[表C1]
(3)将质粒导入宿主细胞
使用上述所得到的各质粒,利用电穿孔法(Bio-rad)对谷氨酸棒状杆菌DRHG145株(参照日本特愿2014-523757)进行转化。将所得到的转化细胞液涂布于LBKm琼脂培养基后,以30℃静置2日,将所得到的菌落作为转化株。
(4)转化株的培养
将上述所得到的转化株分别接种于表C2所示的CGYE培养基(含有硫酸卡那霉素50μg/mL)1mL,以30℃培养一夜。将所得到的培养液100μL接种于表C3所示的CGXII培养基(含有硫酸卡那霉素50μg/mL)10mL中,以30℃培养48小时后,将利用离心分离除去菌体后的产物作为培养上清。按照参考例1的方法将所得到的培养上清中的4-氨基-3-羟基苯甲酸浓度定量,按照下式算出4-氨基-3-羟基苯甲酸的生产能力提高率。在此,“WT”表示“导入了包含编码野生型酶的基因的质粒的转化株”,“MT”表示“由包含编码该野生型酶的基因的质粒制成的导入了包含编码突变型酶的基因的质粒的转化株”。
(数学式1)
生产能力提高率=MT的4-氨基-3-羟基苯甲酸生产能力/WT的4-氨基-3-羟基苯甲酸生产能力
[表C2]
CGYE培养基组成(每1L)
葡萄糖 | 50g |
(NH<sub>4</sub>)<sub>2</sub>SO<sub>4</sub> | 20g |
尿素 | 5g |
KH<sub>2</sub>PO<sub>4</sub> | 1g |
K<sub>2</sub>HPO<sub>4</sub> | 1g |
MgSO<sub>4</sub>·7H<sub>2</sub>O | 0.25g |
CaCl<sub>2</sub>·2H<sub>2</sub>O | 10mg |
FeSO<sub>4</sub>·7H<sub>2</sub>O | 10mg |
MnSO<sub>4</sub>·5H<sub>2</sub>O | 10mg |
ZnSO<sub>4</sub>·7H<sub>2</sub>O | 1mg |
CuSO<sub>4</sub>·5H<sub>2</sub>O | 0.2mg |
NiCl<sub>2</sub>·6H<sub>2</sub>O | 0.02mg |
生物素(pH7) | 0.2mg |
酵母提取物 | 1g |
[表C3]
CGXII培养基组成(每1L)
葡萄糖 | 50g |
(NH<sub>4</sub>)<sub>2</sub>SO<sub>4</sub> | 20g |
尿素 | 5g |
KH<sub>2</sub>PO<sub>4</sub> | 1g |
K<sub>2</sub>HPO<sub>4</sub> | 1g |
MgSO<sub>4</sub>·7H<sub>2</sub>O | 0.25g |
CaCl<sub>2</sub>·2H<sub>2</sub>O | 10mg |
FeSO<sub>4</sub>·7H<sub>2</sub>O | 10mg |
MnSO<sub>4</sub>·5H<sub>2</sub>O | 10mg |
ZnSO<sub>4</sub>·7H<sub>2</sub>O | 1mg |
CuSO<sub>4</sub>·5H<sub>2</sub>O | 0.2mg |
NiCl<sub>2</sub>·6H<sub>2</sub>O | 0.02mg |
生物素(pH7) | 0.2mg |
胰蛋白胨 | 10g |
(5)结果
如表C4所示,导入了各突变型酶的菌株与导入了野生型酶的菌株相比,4-氨基-3-羟基苯甲酸的生产能力提高。
[表C4]
参考例1 4-氨基-3-羟基苯甲酸的定量
4-氨基-3-羟基苯甲酸的定量通过HPLC进行。供于HPLC分析的反应液利用0.1%磷酸适当稀释后,使用AcroPrep 96孔滤板(0.2μmGHP膜、日本Pall Corporation)除去不溶物。
HPLC装置使用Chromaster(株式会社日立高新技术)。分析柱使用L-柱ODS(4.6mmI.D.×150mm、化学物质评价研究机构),洗脱液A为0.1M磷酸二氢钾的0.1%磷酸溶液,洗脱液B为70%甲醇,以流速1.0mL/分钟、柱温40℃的条件进行梯度洗脱。4-氨基-3-羟基苯甲酸的检出使用UV检测器(检测波长280nm)。使用标准试样〔4-氨基-3-羟基苯甲酸(销售商代码A1194、东京化成工业株式会社)〕制作浓度校准曲线,基于浓度校准曲线进行4-氨基-3-羟基苯甲酸的定量。
序列表
<110> 花王株式会社
<120> 具有4-氨基苯甲酸羟化活性的多肽及其用途
<130> KS1681
<150> JP 2019-203523
<151> 2019-11-08
<150> JP 2019-233484
<151> 2019-12-24
<150> JP 2019-233485
<151> 2019-12-24
<160> 100
<170> PatentIn version 3.5
<210> 1
<211> 1176
<212> DNA
<213> 弧形茎菌(Caulobacter vibrioides)
<220>
<221> CDS
<222> (1)..(1173)
<223> 密码子优化的寡核苷酸
<400> 1
atg cgc act cag gtg gct atc gta gga gca ggc cca gct ggc ctg ttc 48
Met Arg Thr Gln Val Ala Ile Val Gly Ala Gly Pro Ala Gly Leu Phe
1 5 10 15
ttg ggc cat ctc ctc cgt caa gct ggt gtg gac gtc gtg att ctg gaa 96
Leu Gly His Leu Leu Arg Gln Ala Gly Val Asp Val Val Ile Leu Glu
20 25 30
cgc aaa gac cgt gct tat gtc gaa ggc cga gtt cgg gct ggt gtc ctg 144
Arg Lys Asp Arg Ala Tyr Val Glu Gly Arg Val Arg Ala Gly Val Leu
35 40 45
gaa cgt atc acg gtg gag ctg atg gag cgt ctt ggt gtg gat gag cga 192
Glu Arg Ile Thr Val Glu Leu Met Glu Arg Leu Gly Val Asp Glu Arg
50 55 60
atg cgc cga gag ggc ttg gtg cat gct ggc gct aat ctt gcg tct gat 240
Met Arg Arg Glu Gly Leu Val His Ala Gly Ala Asn Leu Ala Ser Asp
65 70 75 80
ggc gag atg ttc cgt atc gac atg gca gag ctc acg ggt ggt tcc acc 288
Gly Glu Met Phe Arg Ile Asp Met Ala Glu Leu Thr Gly Gly Ser Thr
85 90 95
gtc atg gtt tac ggc caa cag gag gtg atg aag gac ctg ttt gat gca 336
Val Met Val Tyr Gly Gln Gln Glu Val Met Lys Asp Leu Phe Asp Ala
100 105 110
gca gag cag cgc gat ctg cga att gtc ttt gac gcc gat gca gtg cgt 384
Ala Glu Gln Arg Asp Leu Arg Ile Val Phe Asp Ala Asp Ala Val Arg
115 120 125
ctg cac gat gtg gaa ggc gaa cgt cct cac atc acc tgg cgc aaa gac 432
Leu His Asp Val Glu Gly Glu Arg Pro His Ile Thr Trp Arg Lys Asp
130 135 140
ggg gca gaa cac cgc ctg gac tgc gat ttc att gcc ggc tgc gac ggc 480
Gly Ala Glu His Arg Leu Asp Cys Asp Phe Ile Ala Gly Cys Asp Gly
145 150 155 160
tac cac gga gtt tct cgt gcg acc att ccc gat aag gtt ctc aag acc 528
Tyr His Gly Val Ser Arg Ala Thr Ile Pro Asp Lys Val Leu Lys Thr
165 170 175
ttc gaa cgg gtg tat ccc ttt ggg tgg ttg gga atc ctg gct gaa gca 576
Phe Glu Arg Val Tyr Pro Phe Gly Trp Leu Gly Ile Leu Ala Glu Ala
180 185 190
cct ccg tgt gac cac gag ttg atc tac tcg aac cat gat cgc ggt ttt 624
Pro Pro Cys Asp His Glu Leu Ile Tyr Ser Asn His Asp Arg Gly Phe
195 200 205
gcc ctg gcg tcg atg cgc tca ccg aca cgc tcc cgc tat tac gtg cag 672
Ala Leu Ala Ser Met Arg Ser Pro Thr Arg Ser Arg Tyr Tyr Val Gln
210 215 220
tgc tca ctc gac gat cgc ctc gag gat tgg tcc gat gaa cgg ttc tgg 720
Cys Ser Leu Asp Asp Arg Leu Glu Asp Trp Ser Asp Glu Arg Phe Trp
225 230 235 240
gat gaa gtt tcg gtt cgc ctg gga ccg gaa gca gcc gct cgg atc gtt 768
Asp Glu Val Ser Val Arg Leu Gly Pro Glu Ala Ala Ala Arg Ile Val
245 250 255
cgc gca cct tcc ttc gag aag agc att gcc cca ctt cgc tcc ttc gtt 816
Arg Ala Pro Ser Phe Glu Lys Ser Ile Ala Pro Leu Arg Ser Phe Val
260 265 270
tcc gag cct atg cgg tat ggc cgc ctt ttc ctc gcg ggt gat gcg gct 864
Ser Glu Pro Met Arg Tyr Gly Arg Leu Phe Leu Ala Gly Asp Ala Ala
275 280 285
cat atc gtt cca ccc act gga gcg aaa ggg atg aac ttg gcc gta tca 912
His Ile Val Pro Pro Thr Gly Ala Lys Gly Met Asn Leu Ala Val Ser
290 295 300
gac gtc atc atg ctg tcc gaa gcc ctg gtc gaa cac tac cac gaa cgc 960
Asp Val Ile Met Leu Ser Glu Ala Leu Val Glu His Tyr His Glu Arg
305 310 315 320
tct tcc gct ggt atc gat ggt tac agc gca cgt gca ctt gcc cgc gtc 1008
Ser Ser Ala Gly Ile Asp Gly Tyr Ser Ala Arg Ala Leu Ala Arg Val
325 330 335
tgg aag gcg gag cgt ttc agc tgg tgg ttt acc tcc ctt act cac cgc 1056
Trp Lys Ala Glu Arg Phe Ser Trp Trp Phe Thr Ser Leu Thr His Arg
340 345 350
ttc cca gac cag gac ggc ttc gac cgc aag atg caa gtc gcc gaa ttg 1104
Phe Pro Asp Gln Asp Gly Phe Asp Arg Lys Met Gln Val Ala Glu Leu
355 360 365
gca tac atc aag ggt tct cgc gct gcc cag gtc acc ctg gcg gag aac 1152
Ala Tyr Ile Lys Gly Ser Arg Ala Ala Gln Val Thr Leu Ala Glu Asn
370 375 380
tac gta gga ctg cca ctc gta taa 1176
Tyr Val Gly Leu Pro Leu Val
385 390
<210> 2
<211> 391
<212> PRT
<213> 弧形茎菌(Caulobacter vibrioides)
<400> 2
Met Arg Thr Gln Val Ala Ile Val Gly Ala Gly Pro Ala Gly Leu Phe
1 5 10 15
Leu Gly His Leu Leu Arg Gln Ala Gly Val Asp Val Val Ile Leu Glu
20 25 30
Arg Lys Asp Arg Ala Tyr Val Glu Gly Arg Val Arg Ala Gly Val Leu
35 40 45
Glu Arg Ile Thr Val Glu Leu Met Glu Arg Leu Gly Val Asp Glu Arg
50 55 60
Met Arg Arg Glu Gly Leu Val His Ala Gly Ala Asn Leu Ala Ser Asp
65 70 75 80
Gly Glu Met Phe Arg Ile Asp Met Ala Glu Leu Thr Gly Gly Ser Thr
85 90 95
Val Met Val Tyr Gly Gln Gln Glu Val Met Lys Asp Leu Phe Asp Ala
100 105 110
Ala Glu Gln Arg Asp Leu Arg Ile Val Phe Asp Ala Asp Ala Val Arg
115 120 125
Leu His Asp Val Glu Gly Glu Arg Pro His Ile Thr Trp Arg Lys Asp
130 135 140
Gly Ala Glu His Arg Leu Asp Cys Asp Phe Ile Ala Gly Cys Asp Gly
145 150 155 160
Tyr His Gly Val Ser Arg Ala Thr Ile Pro Asp Lys Val Leu Lys Thr
165 170 175
Phe Glu Arg Val Tyr Pro Phe Gly Trp Leu Gly Ile Leu Ala Glu Ala
180 185 190
Pro Pro Cys Asp His Glu Leu Ile Tyr Ser Asn His Asp Arg Gly Phe
195 200 205
Ala Leu Ala Ser Met Arg Ser Pro Thr Arg Ser Arg Tyr Tyr Val Gln
210 215 220
Cys Ser Leu Asp Asp Arg Leu Glu Asp Trp Ser Asp Glu Arg Phe Trp
225 230 235 240
Asp Glu Val Ser Val Arg Leu Gly Pro Glu Ala Ala Ala Arg Ile Val
245 250 255
Arg Ala Pro Ser Phe Glu Lys Ser Ile Ala Pro Leu Arg Ser Phe Val
260 265 270
Ser Glu Pro Met Arg Tyr Gly Arg Leu Phe Leu Ala Gly Asp Ala Ala
275 280 285
His Ile Val Pro Pro Thr Gly Ala Lys Gly Met Asn Leu Ala Val Ser
290 295 300
Asp Val Ile Met Leu Ser Glu Ala Leu Val Glu His Tyr His Glu Arg
305 310 315 320
Ser Ser Ala Gly Ile Asp Gly Tyr Ser Ala Arg Ala Leu Ala Arg Val
325 330 335
Trp Lys Ala Glu Arg Phe Ser Trp Trp Phe Thr Ser Leu Thr His Arg
340 345 350
Phe Pro Asp Gln Asp Gly Phe Asp Arg Lys Met Gln Val Ala Glu Leu
355 360 365
Ala Tyr Ile Lys Gly Ser Arg Ala Ala Gln Val Thr Leu Ala Glu Asn
370 375 380
Tyr Val Gly Leu Pro Leu Val
385 390
<210> 3
<211> 1173
<212> DNA
<213> 苜蓿中华根瘤菌(Sinorhizobium meliloti)
<220>
<221> CDS
<222> (1)..(1170)
<223> 密码子优化的寡核苷酸
<400> 3
atg cgc acc caa gtg gtc atc atc ggc tca gga ccg tct ggc ctt ctt 48
Met Arg Thr Gln Val Val Ile Ile Gly Ser Gly Pro Ser Gly Leu Leu
1 5 10 15
ctg gga cag ctt ctg acc gag gca ggg atc gca aac gtc atc ctc gat 96
Leu Gly Gln Leu Leu Thr Glu Ala Gly Ile Ala Asn Val Ile Leu Asp
20 25 30
cgc gct acc aag gcc cac att ctc ggg cga gtt cgc gct gga gtg ttg 144
Arg Ala Thr Lys Ala His Ile Leu Gly Arg Val Arg Ala Gly Val Leu
35 40 45
gaa cag ggc acc gtt cgc ctt atg gaa gag gct ggt tgt ggt gcg cga 192
Glu Gln Gly Thr Val Arg Leu Met Glu Glu Ala Gly Cys Gly Ala Arg
50 55 60
atg cac gca gaa gga ctg cca cac gac ggc ttt tcg ctg gca ttc gac 240
Met His Ala Glu Gly Leu Pro His Asp Gly Phe Ser Leu Ala Phe Asp
65 70 75 80
ggt cgg gat cac cgc att gac ctg ttc ggc ctg act ggt ggc cgt cgc 288
Gly Arg Asp His Arg Ile Asp Leu Phe Gly Leu Thr Gly Gly Arg Arg
85 90 95
gta atg atc tat ggt cag acg gag ctg aca cgg gac ctg atg gat cat 336
Val Met Ile Tyr Gly Gln Thr Glu Leu Thr Arg Asp Leu Met Asp His
100 105 110
cgc gag cgg gtt ggt gca ctc tcc atc tac gaa gcg gct aac gtc atg 384
Arg Glu Arg Val Gly Ala Leu Ser Ile Tyr Glu Ala Ala Asn Val Met
115 120 125
ccc cgc gat ttc gat gga cgg aca cct cac gtt gcg tat gag aag gac 432
Pro Arg Asp Phe Asp Gly Arg Thr Pro His Val Ala Tyr Glu Lys Asp
130 135 140
ggt att gcg caa cgc att gac tgc gac ttc atc gcc ggc tgt gac ggc 480
Gly Ile Ala Gln Arg Ile Asp Cys Asp Phe Ile Ala Gly Cys Asp Gly
145 150 155 160
ttc cat ggc gtg tcc cgt cgt tcc ctg cca gag aaa gcc atc cgg aat 528
Phe His Gly Val Ser Arg Arg Ser Leu Pro Glu Lys Ala Ile Arg Asn
165 170 175
ttc gag aag atc tac cca ttt gga tgg ctc ggc atc ctg gca gat gtc 576
Phe Glu Lys Ile Tyr Pro Phe Gly Trp Leu Gly Ile Leu Ala Asp Val
180 185 190
cca ccg gtc gat cat gaa ctc gtg tac gct aat cac cca cgc ggg ttt 624
Pro Pro Val Asp His Glu Leu Val Tyr Ala Asn His Pro Arg Gly Phe
195 200 205
gca ttg tgc tct atg cgt tcc cat acc cgt tct cgc tac tac atc cag 672
Ala Leu Cys Ser Met Arg Ser His Thr Arg Ser Arg Tyr Tyr Ile Gln
210 215 220
tgc cct ttg gag gaa aag atc gaa gat tgg gat gat cag cgc ttc tgg 720
Cys Pro Leu Glu Glu Lys Ile Glu Asp Trp Asp Asp Gln Arg Phe Trp
225 230 235 240
gat gaa ctc cgc cgt cgt ctg cct gcg cac cat gcg gag cgc gtg gta 768
Asp Glu Leu Arg Arg Arg Leu Pro Ala His His Ala Glu Arg Val Val
245 250 255
acc ggt ccg agc ttc gag aag tcc att gca ccc ttg cgt tcg ttc gtt 816
Thr Gly Pro Ser Phe Glu Lys Ser Ile Ala Pro Leu Arg Ser Phe Val
260 265 270
gcc gaa cca atg cgc ttc aac cgc ctg ttc ttg gcg ggc gat gct gcc 864
Ala Glu Pro Met Arg Phe Asn Arg Leu Phe Leu Ala Gly Asp Ala Ala
275 280 285
cac att gtc cca cct acc ggt gct aaa ggc ctt aac ctc gct gct tcc 912
His Ile Val Pro Pro Thr Gly Ala Lys Gly Leu Asn Leu Ala Ala Ser
290 295 300
gac gtc cac tac ctg ttt gag ggg ttg ctc gaa cac tac cag gat cga 960
Asp Val His Tyr Leu Phe Glu Gly Leu Leu Glu His Tyr Gln Asp Arg
305 310 315 320
agc aac gca ggc atc gac gcc tat tcc gct cgc gca ctg gct cgt gtg 1008
Ser Asn Ala Gly Ile Asp Ala Tyr Ser Ala Arg Ala Leu Ala Arg Val
325 330 335
tgg aaa gcc gtt cgc ttc agc tgg tgg atg acg act atg ctt cac cgt 1056
Trp Lys Ala Val Arg Phe Ser Trp Trp Met Thr Thr Met Leu His Arg
340 345 350
ttt ccc gaa acc tcc gac ttt gac cag cgc att caa gag gcc gaa ctg 1104
Phe Pro Glu Thr Ser Asp Phe Asp Gln Arg Ile Gln Glu Ala Glu Leu
355 360 365
gac tat ctc acc cac tca cga gct gcc gca act gca ctt gcg gaa aac 1152
Asp Tyr Leu Thr His Ser Arg Ala Ala Ala Thr Ala Leu Ala Glu Asn
370 375 380
tac gtg ggt ctg ccg ttc taa 1173
Tyr Val Gly Leu Pro Phe
385 390
<210> 4
<211> 390
<212> PRT
<213> 苜蓿中华根瘤菌(Sinorhizobium meliloti)
<400> 4
Met Arg Thr Gln Val Val Ile Ile Gly Ser Gly Pro Ser Gly Leu Leu
1 5 10 15
Leu Gly Gln Leu Leu Thr Glu Ala Gly Ile Ala Asn Val Ile Leu Asp
20 25 30
Arg Ala Thr Lys Ala His Ile Leu Gly Arg Val Arg Ala Gly Val Leu
35 40 45
Glu Gln Gly Thr Val Arg Leu Met Glu Glu Ala Gly Cys Gly Ala Arg
50 55 60
Met His Ala Glu Gly Leu Pro His Asp Gly Phe Ser Leu Ala Phe Asp
65 70 75 80
Gly Arg Asp His Arg Ile Asp Leu Phe Gly Leu Thr Gly Gly Arg Arg
85 90 95
Val Met Ile Tyr Gly Gln Thr Glu Leu Thr Arg Asp Leu Met Asp His
100 105 110
Arg Glu Arg Val Gly Ala Leu Ser Ile Tyr Glu Ala Ala Asn Val Met
115 120 125
Pro Arg Asp Phe Asp Gly Arg Thr Pro His Val Ala Tyr Glu Lys Asp
130 135 140
Gly Ile Ala Gln Arg Ile Asp Cys Asp Phe Ile Ala Gly Cys Asp Gly
145 150 155 160
Phe His Gly Val Ser Arg Arg Ser Leu Pro Glu Lys Ala Ile Arg Asn
165 170 175
Phe Glu Lys Ile Tyr Pro Phe Gly Trp Leu Gly Ile Leu Ala Asp Val
180 185 190
Pro Pro Val Asp His Glu Leu Val Tyr Ala Asn His Pro Arg Gly Phe
195 200 205
Ala Leu Cys Ser Met Arg Ser His Thr Arg Ser Arg Tyr Tyr Ile Gln
210 215 220
Cys Pro Leu Glu Glu Lys Ile Glu Asp Trp Asp Asp Gln Arg Phe Trp
225 230 235 240
Asp Glu Leu Arg Arg Arg Leu Pro Ala His His Ala Glu Arg Val Val
245 250 255
Thr Gly Pro Ser Phe Glu Lys Ser Ile Ala Pro Leu Arg Ser Phe Val
260 265 270
Ala Glu Pro Met Arg Phe Asn Arg Leu Phe Leu Ala Gly Asp Ala Ala
275 280 285
His Ile Val Pro Pro Thr Gly Ala Lys Gly Leu Asn Leu Ala Ala Ser
290 295 300
Asp Val His Tyr Leu Phe Glu Gly Leu Leu Glu His Tyr Gln Asp Arg
305 310 315 320
Ser Asn Ala Gly Ile Asp Ala Tyr Ser Ala Arg Ala Leu Ala Arg Val
325 330 335
Trp Lys Ala Val Arg Phe Ser Trp Trp Met Thr Thr Met Leu His Arg
340 345 350
Phe Pro Glu Thr Ser Asp Phe Asp Gln Arg Ile Gln Glu Ala Glu Leu
355 360 365
Asp Tyr Leu Thr His Ser Arg Ala Ala Ala Thr Ala Leu Ala Glu Asn
370 375 380
Tyr Val Gly Leu Pro Phe
385 390
<210> 5
<211> 1173
<212> DNA
<213> 沼泽红假单胞菌(Rhodopseudomonas palustris)
<220>
<221> CDS
<222> (1)..(1170)
<223> 密码子优化的寡核苷酸
<400> 5
atg cgc act cag gtg gca atc att ggt gcc ggt cca tcc ggt ctg ctt 48
Met Arg Thr Gln Val Ala Ile Ile Gly Ala Gly Pro Ser Gly Leu Leu
1 5 10 15
ctc gga cag ctc ctt cac aag tac ggg atc gac gcc gtc atc gtt gag 96
Leu Gly Gln Leu Leu His Lys Tyr Gly Ile Asp Ala Val Ile Val Glu
20 25 30
cgc aaa gat ccc gat tac gtg ctt tcc cgc atc cgt gca ggc gtt ctg 144
Arg Lys Asp Pro Asp Tyr Val Leu Ser Arg Ile Arg Ala Gly Val Leu
35 40 45
gag cag ggc atg gtt gac ctc ctg gac gaa gct ggc gta agc gct cgg 192
Glu Gln Gly Met Val Asp Leu Leu Asp Glu Ala Gly Val Ser Ala Arg
50 55 60
ttg cat cag gaa gcg ctt gtt cac ggt ggt ttc gaa atc gcg ttc gca 240
Leu His Gln Glu Ala Leu Val His Gly Gly Phe Glu Ile Ala Phe Ala
65 70 75 80
ggc caa cgg cat ccc att gat ctg cgt ggt gca acc gga ggc aag tct 288
Gly Gln Arg His Pro Ile Asp Leu Arg Gly Ala Thr Gly Gly Lys Ser
85 90 95
gtc acc gtc tat ggt cag acc gag gta acc cga gat ctc atg gag gct 336
Val Thr Val Tyr Gly Gln Thr Glu Val Thr Arg Asp Leu Met Glu Ala
100 105 110
cga tct gca gct ggc ctt acg acg atc tat gac gct gcg gat gtt tcg 384
Arg Ser Ala Ala Gly Leu Thr Thr Ile Tyr Asp Ala Ala Asp Val Ser
115 120 125
ctg cat gac ttt gaa ggc gca cac cct aag gtg cgt tac gtc aaa gac 432
Leu His Asp Phe Glu Gly Ala His Pro Lys Val Arg Tyr Val Lys Asp
130 135 140
ggc acc act cgc gag atc gtg tgc gat ttc att gcg gga tgt gac ggg 480
Gly Thr Thr Arg Glu Ile Val Cys Asp Phe Ile Ala Gly Cys Asp Gly
145 150 155 160
ttc cac gga att tcg cgc caa tct gtg cca gcg tct gcc gtt cag tcc 528
Phe His Gly Ile Ser Arg Gln Ser Val Pro Ala Ser Ala Val Gln Ser
165 170 175
ttc gaa cgc gtg tat ccg ttc ggc tgg ttg gga ctt ctg tcc gat acc 576
Phe Glu Arg Val Tyr Pro Phe Gly Trp Leu Gly Leu Leu Ser Asp Thr
180 185 190
cct ccc gtc agc cca gaa ctg atc tac gtc aac cac gac cga ggc ttt 624
Pro Pro Val Ser Pro Glu Leu Ile Tyr Val Asn His Asp Arg Gly Phe
195 200 205
gct ctc tgc tcg atg cgc tcc atg cac cgt tca cgg tac tac gtc caa 672
Ala Leu Cys Ser Met Arg Ser Met His Arg Ser Arg Tyr Tyr Val Gln
210 215 220
tgc cct ttg acc gac gat gtc gct gat tgg tct gat gat cgc ttc tgg 720
Cys Pro Leu Thr Asp Asp Val Ala Asp Trp Ser Asp Asp Arg Phe Trp
225 230 235 240
gac gaa ctg aag tcc cgc ctc gac ccg gaa aca gcg ggg aaa ctc gtg 768
Asp Glu Leu Lys Ser Arg Leu Asp Pro Glu Thr Ala Gly Lys Leu Val
245 250 255
aca ggc ccg tca atc gag aag tca atc gca cca ctg cgt tcc ttt gtc 816
Thr Gly Pro Ser Ile Glu Lys Ser Ile Ala Pro Leu Arg Ser Phe Val
260 265 270
gct gaa cca atg cgc ttt ggt cgc ctt ttc ctg gcc ggt gat gcc gct 864
Ala Glu Pro Met Arg Phe Gly Arg Leu Phe Leu Ala Gly Asp Ala Ala
275 280 285
cac att gtt ccg cct acc gga gca aag ggc ttg aat ctg gcg gct tca 912
His Ile Val Pro Pro Thr Gly Ala Lys Gly Leu Asn Leu Ala Ala Ser
290 295 300
gac gtg tac tac ctg agc cgt gca atg cgg gag tac tat gcc gag aag 960
Asp Val Tyr Tyr Leu Ser Arg Ala Met Arg Glu Tyr Tyr Ala Glu Lys
305 310 315 320
tcc gaa gcc ggt atc gac gct tac tcg gca tcc gcc ttg cgc cgt gtt 1008
Ser Glu Ala Gly Ile Asp Ala Tyr Ser Ala Ser Ala Leu Arg Arg Val
325 330 335
tgg aag gcg gaa cgt ttc tcc tgg tgg atg act tct cag ctg cac cgc 1056
Trp Lys Ala Glu Arg Phe Ser Trp Trp Met Thr Ser Gln Leu His Arg
340 345 350
ttt cca gat tcc gac gca ttc agc caa cgc atc cag act gct gag ctc 1104
Phe Pro Asp Ser Asp Ala Phe Ser Gln Arg Ile Gln Thr Ala Glu Leu
355 360 365
gat tat ctg gtg aac tcc aaa gca gcc att acc tcc ttg gcc gag aac 1152
Asp Tyr Leu Val Asn Ser Lys Ala Ala Ile Thr Ser Leu Ala Glu Asn
370 375 380
tac gta ggc ctg cca tac taa 1173
Tyr Val Gly Leu Pro Tyr
385 390
<210> 6
<211> 390
<212> PRT
<213> 沼泽红假单胞菌(Rhodopseudomonas palustris)
<400> 6
Met Arg Thr Gln Val Ala Ile Ile Gly Ala Gly Pro Ser Gly Leu Leu
1 5 10 15
Leu Gly Gln Leu Leu His Lys Tyr Gly Ile Asp Ala Val Ile Val Glu
20 25 30
Arg Lys Asp Pro Asp Tyr Val Leu Ser Arg Ile Arg Ala Gly Val Leu
35 40 45
Glu Gln Gly Met Val Asp Leu Leu Asp Glu Ala Gly Val Ser Ala Arg
50 55 60
Leu His Gln Glu Ala Leu Val His Gly Gly Phe Glu Ile Ala Phe Ala
65 70 75 80
Gly Gln Arg His Pro Ile Asp Leu Arg Gly Ala Thr Gly Gly Lys Ser
85 90 95
Val Thr Val Tyr Gly Gln Thr Glu Val Thr Arg Asp Leu Met Glu Ala
100 105 110
Arg Ser Ala Ala Gly Leu Thr Thr Ile Tyr Asp Ala Ala Asp Val Ser
115 120 125
Leu His Asp Phe Glu Gly Ala His Pro Lys Val Arg Tyr Val Lys Asp
130 135 140
Gly Thr Thr Arg Glu Ile Val Cys Asp Phe Ile Ala Gly Cys Asp Gly
145 150 155 160
Phe His Gly Ile Ser Arg Gln Ser Val Pro Ala Ser Ala Val Gln Ser
165 170 175
Phe Glu Arg Val Tyr Pro Phe Gly Trp Leu Gly Leu Leu Ser Asp Thr
180 185 190
Pro Pro Val Ser Pro Glu Leu Ile Tyr Val Asn His Asp Arg Gly Phe
195 200 205
Ala Leu Cys Ser Met Arg Ser Met His Arg Ser Arg Tyr Tyr Val Gln
210 215 220
Cys Pro Leu Thr Asp Asp Val Ala Asp Trp Ser Asp Asp Arg Phe Trp
225 230 235 240
Asp Glu Leu Lys Ser Arg Leu Asp Pro Glu Thr Ala Gly Lys Leu Val
245 250 255
Thr Gly Pro Ser Ile Glu Lys Ser Ile Ala Pro Leu Arg Ser Phe Val
260 265 270
Ala Glu Pro Met Arg Phe Gly Arg Leu Phe Leu Ala Gly Asp Ala Ala
275 280 285
His Ile Val Pro Pro Thr Gly Ala Lys Gly Leu Asn Leu Ala Ala Ser
290 295 300
Asp Val Tyr Tyr Leu Ser Arg Ala Met Arg Glu Tyr Tyr Ala Glu Lys
305 310 315 320
Ser Glu Ala Gly Ile Asp Ala Tyr Ser Ala Ser Ala Leu Arg Arg Val
325 330 335
Trp Lys Ala Glu Arg Phe Ser Trp Trp Met Thr Ser Gln Leu His Arg
340 345 350
Phe Pro Asp Ser Asp Ala Phe Ser Gln Arg Ile Gln Thr Ala Glu Leu
355 360 365
Asp Tyr Leu Val Asn Ser Lys Ala Ala Ile Thr Ser Leu Ala Glu Asn
370 375 380
Tyr Val Gly Leu Pro Tyr
385 390
<210> 7
<211> 1179
<212> DNA
<213> 大豆慢生型根瘤菌(Bradyrhizobium diazoefficiens)
<220>
<221> CDS
<222> (1)..(1176)
<223> 密码子优化的寡核苷酸
<400> 7
atg cgt act cag gtg gga atc gtg gga gcc gga cca gcc ggt ctg ctc 48
Met Arg Thr Gln Val Gly Ile Val Gly Ala Gly Pro Ala Gly Leu Leu
1 5 10 15
ctc tcg cac atg ctg tat ctg tcc ggc att gag tcg atc atc atc gag 96
Leu Ser His Met Leu Tyr Leu Ser Gly Ile Glu Ser Ile Ile Ile Glu
20 25 30
tca cgt tcg cag gcg gaa atc gag cag acc atc cgc gcc ggg gta ctg 144
Ser Arg Ser Gln Ala Glu Ile Glu Gln Thr Ile Arg Ala Gly Val Leu
35 40 45
gaa cag tct acg gtt gac ctg atg acc gag att ggg gct ggc gat cgc 192
Glu Gln Ser Thr Val Asp Leu Met Thr Glu Ile Gly Ala Gly Asp Arg
50 55 60
atg aag cgg gaa ggc ttt gtc cat ggt ggc ttt gag ctc cgc ttt gca 240
Met Lys Arg Glu Gly Phe Val His Gly Gly Phe Glu Leu Arg Phe Ala
65 70 75 80
ggg cat ggg cac cgg atc gat ctg cag aac ctt gct aat ggc cgc acg 288
Gly His Gly His Arg Ile Asp Leu Gln Asn Leu Ala Asn Gly Arg Thr
85 90 95
atc aca gtc tat cca cag cac gaa gtc ctc aag gac ctg att gcc ttg 336
Ile Thr Val Tyr Pro Gln His Glu Val Leu Lys Asp Leu Ile Ala Leu
100 105 110
cgc ttg cgt act ggt ggt caa atc cac ttt gag gct aaa gct acc tcc 384
Arg Leu Arg Thr Gly Gly Gln Ile His Phe Glu Ala Lys Ala Thr Ser
115 120 125
att gac ggt ctg acc agc gat cag cca gtt gtg cgc ttc att acc aag 432
Ile Asp Gly Leu Thr Ser Asp Gln Pro Val Val Arg Phe Ile Thr Lys
130 135 140
caa ggt gaa acc cgt gaa ttg tcc tgc gac ttt gtg gct ggc tgt gac 480
Gln Gly Glu Thr Arg Glu Leu Ser Cys Asp Phe Val Ala Gly Cys Asp
145 150 155 160
ggt ggc tat gga gcc tca cga gct gcg att ccg gag gat ctg gtt cgc 528
Gly Gly Tyr Gly Ala Ser Arg Ala Ala Ile Pro Glu Asp Leu Val Arg
165 170 175
cgc gat tac ttc cga gtg tac ccg ttc ggt tgg ttc ggc atc ctg gca 576
Arg Asp Tyr Phe Arg Val Tyr Pro Phe Gly Trp Phe Gly Ile Leu Ala
180 185 190
aaa gcc cca ccc tca tcc gaa gag ctc atc tac gca cat cac gac cgc 624
Lys Ala Pro Pro Ser Ser Glu Glu Leu Ile Tyr Ala His His Asp Arg
195 200 205
gga ttc gcg ctc atc agc aca cgc tct ccg aat atc cag cgc atg tac 672
Gly Phe Ala Leu Ile Ser Thr Arg Ser Pro Asn Ile Gln Arg Met Tyr
210 215 220
ttc cag tgc gca cct acc gat tcc gtt gac aac tgg agc gat gat cgc 720
Phe Gln Cys Ala Pro Thr Asp Ser Val Asp Asn Trp Ser Asp Asp Arg
225 230 235 240
att tgg aac gag ttg cag act cgg gtt ggt ggc gat ggc ttc gag ctc 768
Ile Trp Asn Glu Leu Gln Thr Arg Val Gly Gly Asp Gly Phe Glu Leu
245 250 255
aag act ggc cct atc ttc cag aag ggt atc att cct ctt cgc tcc ttc 816
Lys Thr Gly Pro Ile Phe Gln Lys Gly Ile Ile Pro Leu Arg Ser Phe
260 265 270
gtt tgc gaa ccc atg caa cac gga cgg ctt ttc ctt gca ggc gat gct 864
Val Cys Glu Pro Met Gln His Gly Arg Leu Phe Leu Ala Gly Asp Ala
275 280 285
gca cac tct gtc cct ccc aca ggt gca aaa ggc ctc aac ctg gca gct 912
Ala His Ser Val Pro Pro Thr Gly Ala Lys Gly Leu Asn Leu Ala Ala
290 295 300
gca gac gtg tac gtc ctt gcc cgt gca ctt gcg agc tac tac gct aag 960
Ala Asp Val Tyr Val Leu Ala Arg Ala Leu Ala Ser Tyr Tyr Ala Lys
305 310 315 320
cga tcc acc acc ctg ttg gac gcg tat tcc tct acc gca ttg cgt cgc 1008
Arg Ser Thr Thr Leu Leu Asp Ala Tyr Ser Ser Thr Ala Leu Arg Arg
325 330 335
gtg tgg cgt gcc caa cac ttc tcc tgg tgg atg acc tct atg ctg cat 1056
Val Trp Arg Ala Gln His Phe Ser Trp Trp Met Thr Ser Met Leu His
340 345 350
tgg ttt cac gaa gga acc gaa ttc gac ctg aag cgt caa ctg gcg gag 1104
Trp Phe His Glu Gly Thr Glu Phe Asp Leu Lys Arg Gln Leu Ala Glu
355 360 365
ctc gaa ttg gtc acg tcc tcc aaa gcg gct gca acc act ctg gcc gaa 1152
Leu Glu Leu Val Thr Ser Ser Lys Ala Ala Ala Thr Thr Leu Ala Glu
370 375 380
aac tac gta ggc atg cca ctt gct taa 1179
Asn Tyr Val Gly Met Pro Leu Ala
385 390
<210> 8
<211> 392
<212> PRT
<213> 大豆慢生型根瘤菌(Bradyrhizobium diazoefficiens)
<400> 8
Met Arg Thr Gln Val Gly Ile Val Gly Ala Gly Pro Ala Gly Leu Leu
1 5 10 15
Leu Ser His Met Leu Tyr Leu Ser Gly Ile Glu Ser Ile Ile Ile Glu
20 25 30
Ser Arg Ser Gln Ala Glu Ile Glu Gln Thr Ile Arg Ala Gly Val Leu
35 40 45
Glu Gln Ser Thr Val Asp Leu Met Thr Glu Ile Gly Ala Gly Asp Arg
50 55 60
Met Lys Arg Glu Gly Phe Val His Gly Gly Phe Glu Leu Arg Phe Ala
65 70 75 80
Gly His Gly His Arg Ile Asp Leu Gln Asn Leu Ala Asn Gly Arg Thr
85 90 95
Ile Thr Val Tyr Pro Gln His Glu Val Leu Lys Asp Leu Ile Ala Leu
100 105 110
Arg Leu Arg Thr Gly Gly Gln Ile His Phe Glu Ala Lys Ala Thr Ser
115 120 125
Ile Asp Gly Leu Thr Ser Asp Gln Pro Val Val Arg Phe Ile Thr Lys
130 135 140
Gln Gly Glu Thr Arg Glu Leu Ser Cys Asp Phe Val Ala Gly Cys Asp
145 150 155 160
Gly Gly Tyr Gly Ala Ser Arg Ala Ala Ile Pro Glu Asp Leu Val Arg
165 170 175
Arg Asp Tyr Phe Arg Val Tyr Pro Phe Gly Trp Phe Gly Ile Leu Ala
180 185 190
Lys Ala Pro Pro Ser Ser Glu Glu Leu Ile Tyr Ala His His Asp Arg
195 200 205
Gly Phe Ala Leu Ile Ser Thr Arg Ser Pro Asn Ile Gln Arg Met Tyr
210 215 220
Phe Gln Cys Ala Pro Thr Asp Ser Val Asp Asn Trp Ser Asp Asp Arg
225 230 235 240
Ile Trp Asn Glu Leu Gln Thr Arg Val Gly Gly Asp Gly Phe Glu Leu
245 250 255
Lys Thr Gly Pro Ile Phe Gln Lys Gly Ile Ile Pro Leu Arg Ser Phe
260 265 270
Val Cys Glu Pro Met Gln His Gly Arg Leu Phe Leu Ala Gly Asp Ala
275 280 285
Ala His Ser Val Pro Pro Thr Gly Ala Lys Gly Leu Asn Leu Ala Ala
290 295 300
Ala Asp Val Tyr Val Leu Ala Arg Ala Leu Ala Ser Tyr Tyr Ala Lys
305 310 315 320
Arg Ser Thr Thr Leu Leu Asp Ala Tyr Ser Ser Thr Ala Leu Arg Arg
325 330 335
Val Trp Arg Ala Gln His Phe Ser Trp Trp Met Thr Ser Met Leu His
340 345 350
Trp Phe His Glu Gly Thr Glu Phe Asp Leu Lys Arg Gln Leu Ala Glu
355 360 365
Leu Glu Leu Val Thr Ser Ser Lys Ala Ala Ala Thr Thr Leu Ala Glu
370 375 380
Asn Tyr Val Gly Met Pro Leu Ala
385 390
<210> 9
<211> 1179
<212> DNA
<213> 耐重金属贪铜菌(Cupriavidus metallidurans)
<220>
<221> CDS
<222> (1)..(1176)
<223> 密码子优化的寡核苷酸
<400> 9
atg cgc act cag gtt ggt atc att gga gct ggt cca gca ggc ttg ctc 48
Met Arg Thr Gln Val Gly Ile Ile Gly Ala Gly Pro Ala Gly Leu Leu
1 5 10 15
ctt tcc cat ctc ctg cac ctc aag ggt atc gat tct gtc gtc atc gaa 96
Leu Ser His Leu Leu His Leu Lys Gly Ile Asp Ser Val Val Ile Glu
20 25 30
tct cgg aca cgc gaa gag atc gag tcc acg att cgg gcg ggt gta ctg 144
Ser Arg Thr Arg Glu Glu Ile Glu Ser Thr Ile Arg Ala Gly Val Leu
35 40 45
gaa cag ggc acc atg gac ctc ttg cag gat gtt ggc ctt ggg aat cgc 192
Glu Gln Gly Thr Met Asp Leu Leu Gln Asp Val Gly Leu Gly Asn Arg
50 55 60
atg gtc gcc gag ggc gca ctt cac caa ggc ttc gaa ttg acc ttt gag 240
Met Val Ala Glu Gly Ala Leu His Gln Gly Phe Glu Leu Thr Phe Glu
65 70 75 80
ggc gaa cgg cat cgt atc gat ctc acc gac ctg acg ggc cat gcg atc 288
Gly Glu Arg His Arg Ile Asp Leu Thr Asp Leu Thr Gly His Ala Ile
85 90 95
acc gta tac gca cag cac gaa gtg atc aag gat ctt gtg gca gca cga 336
Thr Val Tyr Ala Gln His Glu Val Ile Lys Asp Leu Val Ala Ala Arg
100 105 110
gtg gca gct ggt ggg aaa ctg gtt ttc ggc gtt tcg aac act tct ctc 384
Val Ala Ala Gly Gly Lys Leu Val Phe Gly Val Ser Asn Thr Ser Leu
115 120 125
cac gat gtg gaa tcc acc aaa ccg tcg att cgc tac gag aag gac gac 432
His Asp Val Glu Ser Thr Lys Pro Ser Ile Arg Tyr Glu Lys Asp Asp
130 135 140
gac acg tgc gaa att cac tgc gac ttc gtc atc ggg tgt gat ggc tca 480
Asp Thr Cys Glu Ile His Cys Asp Phe Val Ile Gly Cys Asp Gly Ser
145 150 155 160
caa gga cca tca cgc tct gca att ccc gaa gca gtc cgc aaa gac cat 528
Gln Gly Pro Ser Arg Ser Ala Ile Pro Glu Ala Val Arg Lys Asp His
165 170 175
cag cgc ttg tac ccc ttt ggc tgg ttt ggc att ctg gtc gaa gct ccg 576
Gln Arg Leu Tyr Pro Phe Gly Trp Phe Gly Ile Leu Val Glu Ala Pro
180 185 190
cct tca tcc gac gag ctg atc tac gca cga cat gac cgc gga ttt gcc 624
Pro Ser Ser Asp Glu Leu Ile Tyr Ala Arg His Asp Arg Gly Phe Ala
195 200 205
ctg atc tcg act cgt agc cct acc gtc caa cgt atg tac ttc cag tgc 672
Leu Ile Ser Thr Arg Ser Pro Thr Val Gln Arg Met Tyr Phe Gln Cys
210 215 220
gat cca cgg gat agc gtt gag aac tgg tcc gac gat cgc atc tgg tcc 720
Asp Pro Arg Asp Ser Val Glu Asn Trp Ser Asp Asp Arg Ile Trp Ser
225 230 235 240
gag ctc cac gca cga ttg gat caa gcc gat ggt tgg cgt gta act gag 768
Glu Leu His Ala Arg Leu Asp Gln Ala Asp Gly Trp Arg Val Thr Glu
245 250 255
ggc cgc att ttc cag aag aac atc gtt ggt atg cgc tcc ttc gtg agc 816
Gly Arg Ile Phe Gln Lys Asn Ile Val Gly Met Arg Ser Phe Val Ser
260 265 270
aat gtg atg cag cac ggt cgc ctg ttt ctg gct ggg gat tct gcc cac 864
Asn Val Met Gln His Gly Arg Leu Phe Leu Ala Gly Asp Ser Ala His
275 280 285
atc gtt ccg cct act ggc gcg aaa gga atg aac ctc gcc gtg aac gat 912
Ile Val Pro Pro Thr Gly Ala Lys Gly Met Asn Leu Ala Val Asn Asp
290 295 300
gtc aag atc ctg gct gaa ggt ctg gac tcc ttc tac aag aac ggt acc 960
Val Lys Ile Leu Ala Glu Gly Leu Asp Ser Phe Tyr Lys Asn Gly Thr
305 310 315 320
gag gac aag ctg aat gcg tat acc gcc acc gcc ctg cag cgt atc tgg 1008
Glu Asp Lys Leu Asn Ala Tyr Thr Ala Thr Ala Leu Gln Arg Ile Trp
325 330 335
cgt gcg gag cac ttc tcc tgg tgg atg acc tcc atg ttg cac cgc ttc 1056
Arg Ala Glu His Phe Ser Trp Trp Met Thr Ser Met Leu His Arg Phe
340 345 350
gct gat gcg acc cca ttc gac cag caa ctt cag gtg tcc gaa ctg cgc 1104
Ala Asp Ala Thr Pro Phe Asp Gln Gln Leu Gln Val Ser Glu Leu Arg
355 360 365
tat gtc acc tcg tcc cgt gct ggc gct aca gct ctt gcc gag aac tat 1152
Tyr Val Thr Ser Ser Arg Ala Gly Ala Thr Ala Leu Ala Glu Asn Tyr
370 375 380
gtg gga atg gtt gga ctg agc cac taa 1179
Val Gly Met Val Gly Leu Ser His
385 390
<210> 10
<211> 392
<212> PRT
<213> 耐重金属贪铜菌(Cupriavidus metallidurans)
<400> 10
Met Arg Thr Gln Val Gly Ile Ile Gly Ala Gly Pro Ala Gly Leu Leu
1 5 10 15
Leu Ser His Leu Leu His Leu Lys Gly Ile Asp Ser Val Val Ile Glu
20 25 30
Ser Arg Thr Arg Glu Glu Ile Glu Ser Thr Ile Arg Ala Gly Val Leu
35 40 45
Glu Gln Gly Thr Met Asp Leu Leu Gln Asp Val Gly Leu Gly Asn Arg
50 55 60
Met Val Ala Glu Gly Ala Leu His Gln Gly Phe Glu Leu Thr Phe Glu
65 70 75 80
Gly Glu Arg His Arg Ile Asp Leu Thr Asp Leu Thr Gly His Ala Ile
85 90 95
Thr Val Tyr Ala Gln His Glu Val Ile Lys Asp Leu Val Ala Ala Arg
100 105 110
Val Ala Ala Gly Gly Lys Leu Val Phe Gly Val Ser Asn Thr Ser Leu
115 120 125
His Asp Val Glu Ser Thr Lys Pro Ser Ile Arg Tyr Glu Lys Asp Asp
130 135 140
Asp Thr Cys Glu Ile His Cys Asp Phe Val Ile Gly Cys Asp Gly Ser
145 150 155 160
Gln Gly Pro Ser Arg Ser Ala Ile Pro Glu Ala Val Arg Lys Asp His
165 170 175
Gln Arg Leu Tyr Pro Phe Gly Trp Phe Gly Ile Leu Val Glu Ala Pro
180 185 190
Pro Ser Ser Asp Glu Leu Ile Tyr Ala Arg His Asp Arg Gly Phe Ala
195 200 205
Leu Ile Ser Thr Arg Ser Pro Thr Val Gln Arg Met Tyr Phe Gln Cys
210 215 220
Asp Pro Arg Asp Ser Val Glu Asn Trp Ser Asp Asp Arg Ile Trp Ser
225 230 235 240
Glu Leu His Ala Arg Leu Asp Gln Ala Asp Gly Trp Arg Val Thr Glu
245 250 255
Gly Arg Ile Phe Gln Lys Asn Ile Val Gly Met Arg Ser Phe Val Ser
260 265 270
Asn Val Met Gln His Gly Arg Leu Phe Leu Ala Gly Asp Ser Ala His
275 280 285
Ile Val Pro Pro Thr Gly Ala Lys Gly Met Asn Leu Ala Val Asn Asp
290 295 300
Val Lys Ile Leu Ala Glu Gly Leu Asp Ser Phe Tyr Lys Asn Gly Thr
305 310 315 320
Glu Asp Lys Leu Asn Ala Tyr Thr Ala Thr Ala Leu Gln Arg Ile Trp
325 330 335
Arg Ala Glu His Phe Ser Trp Trp Met Thr Ser Met Leu His Arg Phe
340 345 350
Ala Asp Ala Thr Pro Phe Asp Gln Gln Leu Gln Val Ser Glu Leu Arg
355 360 365
Tyr Val Thr Ser Ser Arg Ala Gly Ala Thr Ala Leu Ala Glu Asn Tyr
370 375 380
Val Gly Met Val Gly Leu Ser His
385 390
<210> 11
<211> 1176
<212> DNA
<213> 红球菌属(Rhodococcus sp.)
<220>
<221> CDS
<222> (1)..(1173)
<223> 密码子优化的寡核苷酸
<400> 11
atg cgt acc caa gtg gcc atc att gga gcg ggt cca gct ggg ctg ctg 48
Met Arg Thr Gln Val Ala Ile Ile Gly Ala Gly Pro Ala Gly Leu Leu
1 5 10 15
ctc agc cac ctc ctg gat gaa cag gga atc gac tca atc ctg atc gaa 96
Leu Ser His Leu Leu Asp Glu Gln Gly Ile Asp Ser Ile Leu Ile Glu
20 25 30
tct cgc act cag gaa tac gtt ctg tca cgc atc cgt gcc ggt gtc ctg 144
Ser Arg Thr Gln Glu Tyr Val Leu Ser Arg Ile Arg Ala Gly Val Leu
35 40 45
gag cac tcc acg gtg caa ctt ctg gat gag cat ggg ttg ggt gag cgc 192
Glu His Ser Thr Val Gln Leu Leu Asp Glu His Gly Leu Gly Glu Arg
50 55 60
ctg cat cgc gaa ggt gat gaa cat cgc ggc atc tac ttg cag tgg ccc 240
Leu His Arg Glu Gly Asp Glu His Arg Gly Ile Tyr Leu Gln Trp Pro
65 70 75 80
gaa gaa cga cac cac atc gac ttc cgg gac ctg gtc gat cgt tcc gtc 288
Glu Glu Arg His His Ile Asp Phe Arg Asp Leu Val Asp Arg Ser Val
85 90 95
tgg gtg tat ggt cag acc gag gtg aca aag gat ctg gtc gtc gca cgc 336
Trp Val Tyr Gly Gln Thr Glu Val Thr Lys Asp Leu Val Val Ala Arg
100 105 110
gag aaa gcg ggt caa cag atc tac tac gat gtg tcc gac acc gcg ctt 384
Glu Lys Ala Gly Gln Gln Ile Tyr Tyr Asp Val Ser Asp Thr Ala Leu
115 120 125
cac gac gta gaa tcc gac gca ccc tac gtt acc ttc act gac gca tcg 432
His Asp Val Glu Ser Asp Ala Pro Tyr Val Thr Phe Thr Asp Ala Ser
130 135 140
ggc aat gcg gtt cgc att gat gca acc gtt gtt gcg ggc tgt gat ggc 480
Gly Asn Ala Val Arg Ile Asp Ala Thr Val Val Ala Gly Cys Asp Gly
145 150 155 160
tct ttc ggt cca tca cgg gct gca atg cct gac tcg gtt cgt aac acc 528
Ser Phe Gly Pro Ser Arg Ala Ala Met Pro Asp Ser Val Arg Asn Thr
165 170 175
tgg gag cgt gtg tac cca tat tcc tgg ttg ggc gtg ctt gca gat gtg 576
Trp Glu Arg Val Tyr Pro Tyr Ser Trp Leu Gly Val Leu Ala Asp Val
180 185 190
gct cct tct acc gac gag ctg atc tat gcc tgg cat cag gac ggt ttt 624
Ala Pro Ser Thr Asp Glu Leu Ile Tyr Ala Trp His Gln Asp Gly Phe
195 200 205
gca atg cac tcc atg cga tcc tcg acc gtt tct cgc ctg tac ctc cag 672
Ala Met His Ser Met Arg Ser Ser Thr Val Ser Arg Leu Tyr Leu Gln
210 215 220
gtt cct aac ggg act gac att gac acc tgg tcc gac gac cgc atc tgg 720
Val Pro Asn Gly Thr Asp Ile Asp Thr Trp Ser Asp Asp Arg Ile Trp
225 230 235 240
gat gct ctg gcc ctc cgt ctt gga cac gga caa gat ggc tgg acc ctg 768
Asp Ala Leu Ala Leu Arg Leu Gly His Gly Gln Asp Gly Trp Thr Leu
245 250 255
aat ccc ggc ccg att acc gag aag tcg gtg ttg cca atg cgc tct tac 816
Asn Pro Gly Pro Ile Thr Glu Lys Ser Val Leu Pro Met Arg Ser Tyr
260 265 270
gtc cag act cca atg cgc cat ggc aac ctt tat ctg gct ggt gat gca 864
Val Gln Thr Pro Met Arg His Gly Asn Leu Tyr Leu Ala Gly Asp Ala
275 280 285
gct cac atc gtc ccg cct act ggc gct aag ggt ctg aac ctg gct gta 912
Ala His Ile Val Pro Pro Thr Gly Ala Lys Gly Leu Asn Leu Ala Val
290 295 300
gca gat gtc gca ctc ctc gca cca gcc ttg gcg caa aag ctc aaa ggc 960
Ala Asp Val Ala Leu Leu Ala Pro Ala Leu Ala Gln Lys Leu Lys Gly
305 310 315 320
aac gac tcc cgt gcc gcg gat agc tac agc gat gat gcc ttg cga cgg 1008
Asn Asp Ser Arg Ala Ala Asp Ser Tyr Ser Asp Asp Ala Leu Arg Arg
325 330 335
gta tgg cgc tgc acc cac ttc agc tgg tgg atg acg acg atg ctt cac 1056
Val Trp Arg Cys Thr His Phe Ser Trp Trp Met Thr Thr Met Leu His
340 345 350
aca gga gat gac ccg ttt gat gcc cag ctc cag ctt tcc cag ctc aag 1104
Thr Gly Asp Asp Pro Phe Asp Ala Gln Leu Gln Leu Ser Gln Leu Lys
355 360 365
tgg gtc gca tcc tcc gaa gcc gga gct atg ggc ttg gct gag aac tac 1152
Trp Val Ala Ser Ser Glu Ala Gly Ala Met Gly Leu Ala Glu Asn Tyr
370 375 380
gct ggc ctt ccg att ggc ttc taa 1176
Ala Gly Leu Pro Ile Gly Phe
385 390
<210> 12
<211> 391
<212> PRT
<213> 红球菌属(Rhodococcus sp.)
<400> 12
Met Arg Thr Gln Val Ala Ile Ile Gly Ala Gly Pro Ala Gly Leu Leu
1 5 10 15
Leu Ser His Leu Leu Asp Glu Gln Gly Ile Asp Ser Ile Leu Ile Glu
20 25 30
Ser Arg Thr Gln Glu Tyr Val Leu Ser Arg Ile Arg Ala Gly Val Leu
35 40 45
Glu His Ser Thr Val Gln Leu Leu Asp Glu His Gly Leu Gly Glu Arg
50 55 60
Leu His Arg Glu Gly Asp Glu His Arg Gly Ile Tyr Leu Gln Trp Pro
65 70 75 80
Glu Glu Arg His His Ile Asp Phe Arg Asp Leu Val Asp Arg Ser Val
85 90 95
Trp Val Tyr Gly Gln Thr Glu Val Thr Lys Asp Leu Val Val Ala Arg
100 105 110
Glu Lys Ala Gly Gln Gln Ile Tyr Tyr Asp Val Ser Asp Thr Ala Leu
115 120 125
His Asp Val Glu Ser Asp Ala Pro Tyr Val Thr Phe Thr Asp Ala Ser
130 135 140
Gly Asn Ala Val Arg Ile Asp Ala Thr Val Val Ala Gly Cys Asp Gly
145 150 155 160
Ser Phe Gly Pro Ser Arg Ala Ala Met Pro Asp Ser Val Arg Asn Thr
165 170 175
Trp Glu Arg Val Tyr Pro Tyr Ser Trp Leu Gly Val Leu Ala Asp Val
180 185 190
Ala Pro Ser Thr Asp Glu Leu Ile Tyr Ala Trp His Gln Asp Gly Phe
195 200 205
Ala Met His Ser Met Arg Ser Ser Thr Val Ser Arg Leu Tyr Leu Gln
210 215 220
Val Pro Asn Gly Thr Asp Ile Asp Thr Trp Ser Asp Asp Arg Ile Trp
225 230 235 240
Asp Ala Leu Ala Leu Arg Leu Gly His Gly Gln Asp Gly Trp Thr Leu
245 250 255
Asn Pro Gly Pro Ile Thr Glu Lys Ser Val Leu Pro Met Arg Ser Tyr
260 265 270
Val Gln Thr Pro Met Arg His Gly Asn Leu Tyr Leu Ala Gly Asp Ala
275 280 285
Ala His Ile Val Pro Pro Thr Gly Ala Lys Gly Leu Asn Leu Ala Val
290 295 300
Ala Asp Val Ala Leu Leu Ala Pro Ala Leu Ala Gln Lys Leu Lys Gly
305 310 315 320
Asn Asp Ser Arg Ala Ala Asp Ser Tyr Ser Asp Asp Ala Leu Arg Arg
325 330 335
Val Trp Arg Cys Thr His Phe Ser Trp Trp Met Thr Thr Met Leu His
340 345 350
Thr Gly Asp Asp Pro Phe Asp Ala Gln Leu Gln Leu Ser Gln Leu Lys
355 360 365
Trp Val Ala Ser Ser Glu Ala Gly Ala Met Gly Leu Ala Glu Asn Tyr
370 375 380
Ala Gly Leu Pro Ile Gly Phe
385 390
<210> 13
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 13
tattaattaa atgcgcgttt taattattga taattatgat tc 42
<210> 14
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 14
ttgcggccgc ttgtttaaac ctccttacag aaaaatggtt gggcg 45
<210> 15
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 15
aaatttaaac ctcctttaca gaaaaatggt tgg 33
<210> 16
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 16
ggaggtttaa acaagcggcc gcgatatc 28
<210> 17
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 17
aggaggttta aatttatgcg cactcaggtg gctat 35
<210> 18
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 18
cttgtttaaa cctccttata cgagtggcag tccta 35
<210> 19
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 19
gctatcaaaa cattcggcac attggttttc c 31
<210> 20
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 20
ggaagatgcg tgatctgatc cttcaactc 29
<210> 21
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 21
ttacagaaaa atggttgggc gcaa 24
<210> 22
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 22
atgcgcactc aggtggctat cg 22
<210> 23
<211> 342
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 23
tacgtacctg caggtagcgt gtcagtaggc gcgtagggta agtggggtag cggcttgtta 60
gatatcttga aatcggcttt caacagcatt gatttcgatg tatttagctg gccgttaccc 120
tgcgaatgtc cacagggtag ctggtagttt gaaaatcaac gccgttgccc ttaggattca 180
gtaactggca cattttgtaa tgcgctagat ctgtgtgctc agtcttccag gctgcttatc 240
acagtgaaag caaaaccaat tcgtggctgc gaaagtcgta gccaccacga agtccaaagg 300
aggatctaaa ttatgaataa tataaaagga ggaattaatt aa 342
<210> 24
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 24
accatttttc tgtaatacgt acctgcaggt agcgtg 36
<210> 25
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 25
cacctgagtg cgcatttaat taattcctcc tttta 35
<210> 26
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 26
gcttgttaga tatcttgaaa tcggctttc 29
<210> 27
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 27
ggaggtttaa acaagcgg 18
<210> 28
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 28
aatttagatc ctcctttgga cttcgtg 27
<210> 29
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 29
aggaggatct aaattatgcg tactcaggtg ggaatc 36
<210> 30
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 30
cttgtttaaa cctccttaag caagtggcat gc 32
<210> 31
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 31
aggaggatct aaattatgcg cactcaggtg gcaatc 36
<210> 32
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 32
cttgtttaaa cctccttagt atggcaggcc tacg 34
<210> 33
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 33
aggaggatct aaattatgcg cacccaagtg gtcatc 36
<210> 34
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 34
cttgtttaaa cctccttaga acggcagacc cacgtag 37
<210> 35
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 35
aggaggatct aaattatgcg cactcaggtt ggtatc 36
<210> 36
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 36
cttgtttaaa cctccttagt ggctcagtcc aaccattc 38
<210> 37
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 37
aggaggatct aaattatgcg tacccaagtg gccatcattg 40
<210> 38
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 38
cttgtttaaa cctccttaga agccaatcgg aaggcc 36
<210> 39
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 39
gccgggctcc tggaacagtc tacggtt 27
<210> 40
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 40
ttccaggagc ccggcgcgga tggtctg 27
<210> 41
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 41
gctggtctcc tggaacgtat cacggtg 27
<210> 42
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 42
ttccaggaga ccagcccgaa ctcggcc 27
<210> 43
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 43
gcaggcctcc tggagcaggg catggtt 27
<210> 44
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 44
ctccaggagg cctgcacgga tgcggga 27
<210> 45
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 45
gctggactct tggaacaggg caccgtt 27
<210> 46
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 46
ttccaagagt ccagcgcgaa ctcgccc 27
<210> 47
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 47
gcgggtctcc tggaacaggg caccatg 27
<210> 48
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 48
ttccaggaga cccgcccgaa tcgtgga 27
<210> 49
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 49
gccggtctcc tggagcactc cacggtg 27
<210> 50
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 50
ctccaggaga ccggcacgga tgcgtga 27
<210> 51
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 51
ctcatcttcg cacatcacga ccgcgga 27
<210> 52
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 52
atgtgcgaag atgagctctt cggatga 27
<210> 53
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 53
cgcatgttct tccagtgcgc acctacc 27
<210> 54
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 54
ctggaagaac atgcgctgga tattcgg 27
<210> 55
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 55
ttgatcttct cgaaccatga tcgcggt 27
<210> 56
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 56
gttcgagaag atcaactcgt ggtcaca 27
<210> 57
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 57
cgctatttcg tgcagtgctc actcgac 27
<210> 58
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 58
ctgcacgaaa tagcgggagc gtgtcgg 27
<210> 59
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 59
ctgatcttcg tcaaccacga ccgaggc 27
<210> 60
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 60
gttgacgaag atcagttctg ggctgac 27
<210> 61
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 61
cggtacttcg tccaatgccc tttgacc 27
<210> 62
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 62
ttggacgaag taccgtgaac ggtgcat 27
<210> 63
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 63
ctcgtgttcg ctaatcaccc acgcggg 27
<210> 64
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 64
attagcgaac acgagttcat gatcgac 27
<210> 65
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 65
cgctacttca tccagtgccc tttggag 27
<210> 66
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 66
ctggatgaag tagcgagaac gggtatg 27
<210> 67
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 67
gctggtattc tggaacgtat cacggtg 27
<210> 68
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 68
ttccagaata ccagcccgaa ctcggcc 27
<210> 69
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 69
gctggttctc tggaacgtat cacggtg 27
<210> 70
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 70
ttccagagaa ccagcccgaa ctcggcc 27
<210> 71
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 71
gctggtacac tggaacgtat cacggtg 27
<210> 72
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 72
ttccagtgta ccagcccgaa ctcggcc 27
<210> 73
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 73
gctggttgtc tggaacgtat cacggtg 27
<210> 74
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 74
ttccagacaa ccagcccgaa ctcggcc 27
<210> 75
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 75
gctggtatgc tggaacgtat cacggtg 27
<210> 76
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 76
ttccagcata ccagcccgaa ctcggcc 27
<210> 77
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 77
gctggtcaac tggaacgtat cacggtg 27
<210> 78
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 78
ttccagttga ccagcccgaa ctcggcc 27
<210> 79
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 79
ttggtggcag ctggcgctaa tcttgcg 27
<210> 80
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 80
gccagctgcc accaagccct ctcggcg 27
<210> 81
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 81
ttggtgatgg ctggcgctaa tcttgcg 27
<210> 82
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 82
gccagccatc accaagccct ctcggcg 27
<210> 83
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 83
tttgccatgg cgtcgatgcg ctcaccg 27
<210> 84
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 84
cgacgccatg gcaaaaccgc gatcatg 27
<210> 85
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 85
ccacccgcag gagcgaaagg gatgaac 27
<210> 86
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 86
cgctcctgcg ggtggaacga tatgagc 27
<210> 87
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 87
ccacccggtg gagcgaaagg gatgaac 27
<210> 88
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 88
cgctccaccg ggtggaacga tatgagc 27
<210> 89
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 89
ccaccctgtg gagcgaaagg gatgaac 27
<210> 90
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 90
cgctccacag ggtggaacga tatgagc 27
<210> 91
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 91
ccaccctctg gagcgaaagg gatgaac 27
<210> 92
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 92
cgctccagag ggtggaacga tatgagc 27
<210> 93
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 93
gagaacgttg taggactgcc actcgta 27
<210> 94
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 94
tcctacaacg ttctccgcca gggtgac 27
<210> 95
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 95
gagaacctcg taggactgcc actcgta 27
<210> 96
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 96
tcctacgagg ttctccgcca gggtgac 27
<210> 97
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 97
gagaacattg taggactgcc actcgta 27
<210> 98
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 98
tcctacaatg ttctccgcca gggtgac 27
<210> 99
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 99
gagaacatgg taggactgcc actcgta 27
<210> 100
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成寡核苷酸
<400> 100
tcctaccatg ttctccgcca gggtgac 27
Claims (13)
1.一种具有4-氨基苯甲酸羟化活性的多肽,其由以下A)~C)表示:
A)其是在序列号2所示的氨基酸序列或与其具有至少47%的同一性的氨基酸序列中序列号2所示的氨基酸序列的47位或与其对应的位置的氨基酸残基为亮氨酸的具有4-氨基苯甲酸羟化活性的多肽;
B)其是在序列号2所示的氨基酸序列或与其具有至少51%的同一性的氨基酸序列中序列号2所示的氨基酸序列的201位或222位、或者与201位或222位对应的位置的氨基酸残基为苯丙氨酸的具有4-氨基苯甲酸羟化活性的多肽;
C)其是在序列号2所示的氨基酸序列或与其具有至少90%的同一性的氨基酸序列中序列号2所示的氨基酸序列的47位、72位、210位、294位或385位、或者与47位、72位、210位、294位或385位对应的位置的氨基酸残基为下列氨基酸的具有4-氨基苯甲酸羟化活性的多肽,
(a)47位或与其对应的位置:异亮氨酸、丝氨酸、苏氨酸、半胱氨酸、蛋氨酸、谷氨酰胺,
(b)72位或与其对应的位置:丙氨酸、蛋氨酸,
(c)210位或与其对应的位置:蛋氨酸,
(d)294位或与其对应的位置:丙氨酸、甘氨酸、半胱氨酸、丝氨酸,
(e)385位或与其对应的位置:缬氨酸、亮氨酸、异亮氨酸、蛋氨酸。
2.一种具有4-氨基苯甲酸羟化活性的突变多肽的制造方法,其包括以下A′)~C′)所示的氨基酸残基的取代:
A′)在由序列号2所示的氨基酸序列或与其具有至少47%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的47位或与其对应的位置的氨基酸残基取代为亮氨酸;
B′)在由序列号2所示的氨基酸序列或与其具有至少51%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的201位或222位、或者与201位或222位对应的位置的氨基酸残基取代为苯丙氨酸;
C′)在由序列号2所示的氨基酸序列或与其具有至少90%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的47位、72位、210位、294位或385位、或者与47位、72位、210位、294位或385位对应的位置的氨基酸残基取代为下列氨基酸,
(a)47位或与其对应的位置:异亮氨酸、丝氨酸、苏氨酸、半胱氨酸、蛋氨酸、谷氨酰胺,
(b)72位或与其对应的位置:丙氨酸、蛋氨酸,
(c)210位或与其对应的位置:蛋氨酸,
(d)294位或与其对应的位置:丙氨酸、甘氨酸、半胱氨酸、丝氨酸,
(e)385位或与其对应的位置:缬氨酸、亮氨酸、异亮氨酸、蛋氨酸。
3.一种提升4-氨基苯甲酸羟化活性的方法,其包括以下A′)~C′)所示的氨基酸残基的取代:
A′)在由序列号2所示的氨基酸序列或与其具有至少47%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的47位或与其对应的位置的氨基酸残基取代为亮氨酸;
B′)在由序列号2所示的氨基酸序列或与其具有至少51%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的201位或222位、或者与201位或222位对应的位置的氨基酸残基取代为苯丙氨酸;
C′)在由序列号2所示的氨基酸序列或与其具有至少90%的同一性的氨基酸序列构成、且具有4-氨基苯甲酸羟化活性的多肽中,将序列号2所示的氨基酸序列的47位、72位、210位、294位或385位、或者与47位、72位、210位、294位或385位对应的位置的氨基酸残基取代为下列氨基酸,
(a)47位或与其对应的位置:异亮氨酸、丝氨酸、苏氨酸、半胱氨酸、蛋氨酸、谷氨酰胺,
(b)72位或与其对应的位置:丙氨酸、蛋氨酸,
(c)210位或与其对应的位置:蛋氨酸,
(d)294位或与其对应的位置:丙氨酸、甘氨酸、半胱氨酸、丝氨酸,
(e)385位或与其对应的位置:缬氨酸、亮氨酸、异亮氨酸、蛋氨酸。
4.如权利要求2或3所述的方法,其中,
A′)所示的氨基酸残基的取代是由缬氨酸向亮氨酸的取代,B′)所示的氨基酸残基的取代是由酪氨酸向苯丙氨酸的取代。
5.一种编码权利要求1所述的多肽的多核苷酸。
6.一种包含权利要求5所述的多核苷酸的载体或DNA片段。
7.一种包含权利要求6所述的载体或DNA片段的转化细胞。
8.如权利要求7所述的转化细胞,其中,
所述转化细胞是大肠杆菌或棒状杆菌属菌。
9.如权利要求7或8所述的转化细胞,其中,
所述转化细胞是能够供给4-氨基苯甲酸类的微生物。
10.一种4-氨基-3-羟基苯甲酸类的制造方法,其包括对权利要求7~9中任一项所述的转化细胞进行培养的工序。
11.如权利要求10所述的方法,其包括从培养基中回收4-氨基-3-羟基苯甲酸类的工序。
12.如权利要求10或11所述的方法,其中,
培养在存在4-氨基苯甲酸类的条件下进行。
13.如权利要求10~12中任一项所述的方法,其中,
4-氨基-3-羟基苯甲酸类为以下通式(1)所示的4-氨基-3-羟基苯甲酸衍生物,4-氨基苯甲酸类为以下通式(2)所示的4-氨基苯甲酸衍生物,
式(1)中,R1表示氢原子、羟基、甲氧基、氨基、氟原子、氯原子、溴原子、碘原子、羧基、甲基、乙基,R2表示氢原子或羟基、甲氧基、氨基、氟原子、氯原子、溴原子、碘原子、羧基、甲基或乙基,X1和X2为氢原子或羟基且至少一方表示羟基,
式(2)中,R1表示氢原子、羟基、甲氧基、氨基、氟原子、氯原子、溴原子、碘原子、羧基、甲基、乙基,R2表示氢原子或羟基、甲氧基、氨基、氟原子、氯原子、溴原子、碘原子、羧基、甲基或乙基。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019203523A JP7502852B2 (ja) | 2019-11-08 | 2019-11-08 | 4-アミノ安息香酸水酸化活性を有するポリペプチド及びその利用 |
JP2019-203523 | 2019-11-08 | ||
JP2019233485A JP7488649B2 (ja) | 2019-12-24 | 2019-12-24 | 4-アミノ安息香酸水酸化活性を有するポリペプチド及びその利用 |
JP2019233484A JP7502858B2 (ja) | 2019-12-24 | 2019-12-24 | 4-アミノ安息香酸水酸化活性を有するポリペプチド及びその利用 |
JP2019-233485 | 2019-12-24 | ||
JP2019-233484 | 2019-12-24 | ||
PCT/JP2020/041581 WO2021090925A1 (ja) | 2019-11-08 | 2020-11-06 | 4-アミノ安息香酸水酸化活性を有するポリペプチド及びその利用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114651066A true CN114651066A (zh) | 2022-06-21 |
Family
ID=75849077
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080077503.2A Pending CN114651066A (zh) | 2019-11-08 | 2020-11-06 | 具有4-氨基苯甲酸羟化活性的多肽及其用途 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220411831A1 (zh) |
CN (1) | CN114651066A (zh) |
WO (1) | WO2021090925A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7223480B2 (ja) * | 2020-09-14 | 2023-02-16 | 花王株式会社 | 4-アミノ安息香酸水酸化活性を有するポリペプチド及びその利用 |
WO2024161513A1 (ja) * | 2023-01-31 | 2024-08-08 | 花王株式会社 | 4-アセチルアミノ-3-ヒドロキシ安息香酸の製造方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109477066A (zh) * | 2016-03-28 | 2019-03-15 | 公益财团法人地球环境产业技术研究机构 | 转化体及使用其的原儿茶酸或其盐的制造方法 |
CN112673108A (zh) * | 2018-09-13 | 2021-04-16 | 花王株式会社 | 3-羟基-4-氨基苯甲酸类的制造方法 |
-
2020
- 2020-11-06 CN CN202080077503.2A patent/CN114651066A/zh active Pending
- 2020-11-06 US US17/775,331 patent/US20220411831A1/en active Pending
- 2020-11-06 WO PCT/JP2020/041581 patent/WO2021090925A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109477066A (zh) * | 2016-03-28 | 2019-03-15 | 公益财团法人地球环境产业技术研究机构 | 转化体及使用其的原儿茶酸或其盐的制造方法 |
CN112673108A (zh) * | 2018-09-13 | 2021-04-16 | 花王株式会社 | 3-羟基-4-氨基苯甲酸类的制造方法 |
Non-Patent Citations (3)
Title |
---|
BARRIE ENTSCH等: "para-Hydroxybenzoate Effective Enzyme with Hydroxylase Containing 6-Hydroxy Modified Reaction Mechanisms", 《THEJOURNAL OF BIOLOGICAL CHEMISTRY》, vol. 262, no. 13, 5 May 1987 (1987-05-05), pages 6060 - 6068, XP055694381 * |
匿名: "Entry ID:A0A2S0NEB7", 《UNIPROTKB》, 18 July 2018 (2018-07-18), pages 4 * |
匿名: "Entry ID:Q9A5P3", 《UNIPROTKB》, 1 June 2004 (2004-06-01), pages 4 * |
Also Published As
Publication number | Publication date |
---|---|
WO2021090925A1 (ja) | 2021-05-14 |
US20220411831A1 (en) | 2022-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101950141B1 (ko) | 신규 아데닐로석시네이트 신세타아제 및 이를 이용한 퓨린 뉴클레오티드 생산방법 | |
CN110343150B (zh) | 新型多肽及使用其产生imp的方法 | |
CN108884449B (zh) | 新型异丙基苹果酸合酶变异体及使用其生产l-亮氨酸的方法 | |
KR101956510B1 (ko) | 신규 5'-이노신산 디하이드로게나아제 및 이를 이용한 5'-이노신산 제조방법 | |
CN110831959B (zh) | 新型多肽及使用其产生imp的方法 | |
JP2001046067A (ja) | 好熱性バチルス属細菌由来のl−リジン生合成系遺伝子 | |
CN112673108A (zh) | 3-羟基-4-氨基苯甲酸类的制造方法 | |
CN114651066A (zh) | 具有4-氨基苯甲酸羟化活性的多肽及其用途 | |
CN110079516B (zh) | 改良型腈水合酶 | |
JP7502852B2 (ja) | 4-アミノ安息香酸水酸化活性を有するポリペプチド及びその利用 | |
CN116113703A (zh) | 具有4-氨基苯甲酸羟基化活性的多肽及其利用 | |
JP7488649B2 (ja) | 4-アミノ安息香酸水酸化活性を有するポリペプチド及びその利用 | |
KR102589135B1 (ko) | 3-메틸-2-옥소뷰타노에이트 하이드록시 메틸트랜스퍼라아제의 활성이 강화된 미생물, 및 이의 용도 | |
JP7531311B2 (ja) | 没食子酸合成酵素 | |
JP7502858B2 (ja) | 4-アミノ安息香酸水酸化活性を有するポリペプチド及びその利用 | |
JP2024014569A (ja) | 4-アミノ安息香酸水酸化活性を有するポリペプチド及びその利用 | |
JP7475866B2 (ja) | 2,5-ピリジンジカルボン酸類生産能を有する形質転換細胞 | |
KR102527102B1 (ko) | 이소프로필말레이트 신타제 변이체 및 이를 이용한 l-류신의 생산 방법 | |
WO2022210228A1 (ja) | 改変型α-イソプロピルマレートシンターゼ | |
KR20160118172A (ko) | L-라이신 생산능이 향상된 미생물 및 이를 이용한 l-라이신 생산방법 | |
KR20160117393A (ko) | L-라이신 생산능이 향상된 미생물 및 이를 이용한 l-라이신 생산방법 | |
JP2024095297A (ja) | 2-インドールカルボン酸脱炭酸活性を有するポリペプチド及びその利用 | |
CN113913401A (zh) | 经修饰的谷氨酸脱氢酶及其应用 | |
KR20210143591A (ko) | 신규한 폴리펩티드 및 이를 이용한 l-류신의 생산 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |