KR20180028532A - 식물에서 제초제 내성을 위한 방법 및 조성물 - Google Patents
식물에서 제초제 내성을 위한 방법 및 조성물 Download PDFInfo
- Publication number
- KR20180028532A KR20180028532A KR1020187005699A KR20187005699A KR20180028532A KR 20180028532 A KR20180028532 A KR 20180028532A KR 1020187005699 A KR1020187005699 A KR 1020187005699A KR 20187005699 A KR20187005699 A KR 20187005699A KR 20180028532 A KR20180028532 A KR 20180028532A
- Authority
- KR
- South Korea
- Prior art keywords
- herbicide
- plant
- ala
- leu
- arg
- Prior art date
Links
- 239000004009 herbicide Substances 0.000 title claims abstract description 193
- 230000002363 herbicidal effect Effects 0.000 title claims abstract description 151
- 238000000034 method Methods 0.000 title claims abstract description 61
- 239000000203 mixture Substances 0.000 title description 4
- 230000009261 transgenic effect Effects 0.000 claims abstract description 106
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 103
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 83
- 108020004511 Recombinant DNA Proteins 0.000 claims abstract description 62
- 241000196324 Embryophyta Species 0.000 claims description 273
- 108020001991 Protoporphyrinogen Oxidase Proteins 0.000 claims description 224
- 102000005135 Protoporphyrinogen oxidase Human genes 0.000 claims description 206
- 108020004414 DNA Proteins 0.000 claims description 110
- 102000053602 DNA Human genes 0.000 claims description 62
- 230000001580 bacterial effect Effects 0.000 claims description 46
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 46
- 239000003112 inhibitor Substances 0.000 claims description 41
- 230000000694 effects Effects 0.000 claims description 38
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 38
- 229920001184 polypeptide Polymers 0.000 claims description 33
- 150000001413 amino acids Chemical group 0.000 claims description 32
- 241000588724 Escherichia coli Species 0.000 claims description 29
- 230000012010 growth Effects 0.000 claims description 28
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 20
- 230000008685 targeting Effects 0.000 claims description 18
- 102000004316 Oxidoreductases Human genes 0.000 claims description 13
- 108090000854 Oxidoreductases Proteins 0.000 claims description 13
- 150000007523 nucleic acids Chemical group 0.000 claims description 11
- 239000002773 nucleotide Substances 0.000 claims description 11
- 125000003729 nucleotide group Chemical group 0.000 claims description 11
- 239000013604 expression vector Substances 0.000 claims description 9
- 238000012216 screening Methods 0.000 claims description 9
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims description 8
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims description 8
- 108010020183 3-phosphoshikimate 1-carboxyvinyltransferase Proteins 0.000 claims description 7
- USIUVYZYUHIAEV-UHFFFAOYSA-N diphenyl ether Chemical group C=1C=CC=CC=1OC1=CC=CC=C1 USIUVYZYUHIAEV-UHFFFAOYSA-N 0.000 claims description 7
- 230000008635 plant growth Effects 0.000 claims description 7
- NUFNQYOELLVIPL-UHFFFAOYSA-N acifluorfen Chemical compound C1=C([N+]([O-])=O)C(C(=O)O)=CC(OC=2C(=CC(=CC=2)C(F)(F)F)Cl)=C1 NUFNQYOELLVIPL-UHFFFAOYSA-N 0.000 claims description 6
- 239000000758 substrate Substances 0.000 claims description 6
- 239000005588 Oxadiazon Substances 0.000 claims description 5
- CHNUNORXWHYHNE-UHFFFAOYSA-N Oxadiazon Chemical compound C1=C(Cl)C(OC(C)C)=CC(N2C(OC(=N2)C(C)(C)C)=O)=C1Cl CHNUNORXWHYHNE-UHFFFAOYSA-N 0.000 claims description 5
- 239000005605 Pyraflufen-ethyl Substances 0.000 claims description 5
- 101100339555 Zymoseptoria tritici HPPD gene Proteins 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 claims description 5
- 238000011161 development Methods 0.000 claims description 5
- 238000003209 gene knockout Methods 0.000 claims description 5
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims description 5
- 150000004668 long chain fatty acids Chemical class 0.000 claims description 5
- 230000029553 photosynthesis Effects 0.000 claims description 5
- 238000010672 photosynthesis Methods 0.000 claims description 5
- APTZNLHMIGJTEW-UHFFFAOYSA-N pyraflufen-ethyl Chemical group C1=C(Cl)C(OCC(=O)OCC)=CC(C=2C(=C(OC(F)F)N(C)N=2)Cl)=C1F APTZNLHMIGJTEW-UHFFFAOYSA-N 0.000 claims description 5
- 238000003786 synthesis reaction Methods 0.000 claims description 5
- 230000001131 transforming effect Effects 0.000 claims description 5
- MFUPLJQNEXUUDW-UHFFFAOYSA-N 2-phenylisoindole-1,3-dione Chemical compound O=C1C2=CC=CC=C2C(=O)N1C1=CC=CC=C1 MFUPLJQNEXUUDW-UHFFFAOYSA-N 0.000 claims description 4
- 239000005562 Glyphosate Substances 0.000 claims description 4
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 claims description 4
- 244000038559 crop plants Species 0.000 claims description 4
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical group OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 claims description 4
- 229940097068 glyphosate Drugs 0.000 claims description 4
- FNQJDLTXOVEEFB-UHFFFAOYSA-N 1,2,3-benzothiadiazole Chemical compound C1=CC=C2SN=NC2=C1 FNQJDLTXOVEEFB-UHFFFAOYSA-N 0.000 claims description 3
- 229930192334 Auxin Natural products 0.000 claims description 3
- 229940100389 Sulfonylurea Drugs 0.000 claims description 3
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 3
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 claims description 3
- 239000002363 auxin Substances 0.000 claims description 3
- 150000001732 carboxylic acid derivatives Chemical class 0.000 claims description 3
- VXIVSQZSERGHQP-UHFFFAOYSA-N chloroacetamide Chemical group NC(=O)CCl VXIVSQZSERGHQP-UHFFFAOYSA-N 0.000 claims description 3
- OILAIQUEIWYQPH-UHFFFAOYSA-N cyclohexane-1,2-dione Chemical compound O=C1CCCCC1=O OILAIQUEIWYQPH-UHFFFAOYSA-N 0.000 claims description 3
- 230000002950 deficient Effects 0.000 claims description 3
- IZBNNCFOBMGTQX-UHFFFAOYSA-N etoperidone Chemical compound O=C1N(CC)C(CC)=NN1CCCN1CCN(C=2C=C(Cl)C=CC=2)CC1 IZBNNCFOBMGTQX-UHFFFAOYSA-N 0.000 claims description 3
- 229960005437 etoperidone Drugs 0.000 claims description 3
- ZCNQYNHDVRPZIH-UHFFFAOYSA-N fluthiacet-methyl Chemical group C1=C(Cl)C(SCC(=O)OC)=CC(N=C2N3CCCCN3C(=O)S2)=C1F ZCNQYNHDVRPZIH-UHFFFAOYSA-N 0.000 claims description 3
- 150000002825 nitriles Chemical class 0.000 claims description 3
- 230000001172 regenerating effect Effects 0.000 claims description 3
- GNHDVXLWBQYPJE-UHFFFAOYSA-N saflufenacil Chemical compound C1=C(Cl)C(C(=O)NS(=O)(=O)N(C)C(C)C)=CC(N2C(N(C)C(=CC2=O)C(F)(F)F)=O)=C1F GNHDVXLWBQYPJE-UHFFFAOYSA-N 0.000 claims description 3
- 150000007659 semicarbazones Chemical class 0.000 claims description 3
- JYEUMXHLPRZUAT-UHFFFAOYSA-N 1,2,3-triazine Chemical group C1=CN=NN=C1 JYEUMXHLPRZUAT-UHFFFAOYSA-N 0.000 claims description 2
- QMNWYGTWTXOQTP-UHFFFAOYSA-N 1h-triazin-6-one Chemical compound O=C1C=CN=NN1 QMNWYGTWTXOQTP-UHFFFAOYSA-N 0.000 claims description 2
- IQWMUTFHGXREBR-UHFFFAOYSA-N 2-[5-(5-tert-butyl-2-oxo-1,3,4-oxadiazol-3-yl)-2,4-dichlorophenoxy]acetonitrile Chemical group O=C1OC(C(C)(C)C)=NN1C1=CC(OCC#N)=C(Cl)C=C1Cl IQWMUTFHGXREBR-UHFFFAOYSA-N 0.000 claims description 2
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical compound O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 claims description 2
- 239000005964 Acibenzolar-S-methyl Substances 0.000 claims description 2
- 239000005711 Benzoic acid Substances 0.000 claims description 2
- 229940123561 Fatty acid inhibitor Drugs 0.000 claims description 2
- WTKZEGDFNFYCGP-UHFFFAOYSA-N Pyrazole Chemical compound C=1C=NNC=1 WTKZEGDFNFYCGP-UHFFFAOYSA-N 0.000 claims description 2
- 235000010233 benzoic acid Nutrition 0.000 claims description 2
- 239000004202 carbamide Substances 0.000 claims description 2
- 229930182478 glucoside Natural products 0.000 claims description 2
- 125000000842 isoxazolyl group Chemical group 0.000 claims description 2
- 239000013459 phenoxy herbicide Substances 0.000 claims description 2
- JEXVQSWXXUJEMA-UHFFFAOYSA-N pyrazol-3-one Chemical compound O=C1C=CN=N1 JEXVQSWXXUJEMA-UHFFFAOYSA-N 0.000 claims description 2
- MCJGNVYPOGVAJF-UHFFFAOYSA-N quinolin-8-ol Chemical compound C1=CN=C2C(O)=CC=CC2=C1 MCJGNVYPOGVAJF-UHFFFAOYSA-N 0.000 claims description 2
- OORLZFUTLGXMEF-UHFFFAOYSA-N sulfentrazone Chemical compound O=C1N(C(F)F)C(C)=NN1C1=CC(NS(C)(=O)=O)=C(Cl)C=C1Cl OORLZFUTLGXMEF-UHFFFAOYSA-N 0.000 claims description 2
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical class OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 claims description 2
- 238000011426 transformation method Methods 0.000 claims description 2
- 102100029028 Protoporphyrinogen oxidase Human genes 0.000 claims 18
- IPPAUTOBDWNELX-UHFFFAOYSA-N (2-ethoxy-2-oxoethyl) 5-[2-chloro-4-(trifluoromethyl)phenoxy]-2-nitrobenzoate Chemical group C1=C([N+]([O-])=O)C(C(=O)OCC(=O)OCC)=CC(OC=2C(=CC(=CC=2)C(F)(F)F)Cl)=C1 IPPAUTOBDWNELX-UHFFFAOYSA-N 0.000 claims 1
- 239000005492 Carfentrazone-ethyl Substances 0.000 claims 1
- 239000005590 Oxyfluorfen Substances 0.000 claims 1
- OQMBBFQZGJFLBU-UHFFFAOYSA-N Oxyfluorfen Chemical compound C1=C([N+]([O-])=O)C(OCC)=CC(OC=2C(=CC(=CC=2)C(F)(F)F)Cl)=C1 OQMBBFQZGJFLBU-UHFFFAOYSA-N 0.000 claims 1
- XOEMATDHVZOBSG-UHFFFAOYSA-N azafenidin Chemical compound C1=C(OCC#C)C(Cl)=CC(Cl)=C1N1C(=O)N2CCCCC2=N1 XOEMATDHVZOBSG-UHFFFAOYSA-N 0.000 claims 1
- 238000012258 culturing Methods 0.000 claims 1
- MLKCGVHIFJBRCD-UHFFFAOYSA-N ethyl 2-chloro-3-{2-chloro-5-[4-(difluoromethyl)-3-methyl-5-oxo-4,5-dihydro-1H-1,2,4-triazol-1-yl]-4-fluorophenyl}propanoate Chemical group C1=C(Cl)C(CC(Cl)C(=O)OCC)=CC(N2C(N(C(F)F)C(C)=N2)=O)=C1F MLKCGVHIFJBRCD-UHFFFAOYSA-N 0.000 claims 1
- FOUWCSDKDDHKQP-UHFFFAOYSA-N flumioxazin Chemical compound FC1=CC=2OCC(=O)N(CC#C)C=2C=C1N(C1=O)C(=O)C2=C1CCCC2 FOUWCSDKDDHKQP-UHFFFAOYSA-N 0.000 claims 1
- BGZZWXTVIYUUEY-UHFFFAOYSA-N fomesafen Chemical compound C1=C([N+]([O-])=O)C(C(=O)NS(=O)(=O)C)=CC(OC=2C(=CC(=CC=2)C(F)(F)F)Cl)=C1 BGZZWXTVIYUUEY-UHFFFAOYSA-N 0.000 claims 1
- 125000004395 glucoside group Chemical group 0.000 claims 1
- CONWAEURSVPLRM-UHFFFAOYSA-N lactofen Chemical compound C1=C([N+]([O-])=O)C(C(=O)OC(C)C(=O)OCC)=CC(OC=2C(=CC(=CC=2)C(F)(F)F)Cl)=C1 CONWAEURSVPLRM-UHFFFAOYSA-N 0.000 claims 1
- UHSGPDMIQQYNAX-UHFFFAOYSA-N protoporphyrinogen Chemical compound C1C(=C(C=2C=C)C)NC=2CC(=C(C=2CCC(O)=O)C)NC=2CC(N2)=C(CCC(O)=O)C(C)=C2CC2=C(C)C(C=C)=C1N2 UHSGPDMIQQYNAX-UHFFFAOYSA-N 0.000 abstract description 5
- 229940087098 Oxidase inhibitor Drugs 0.000 abstract 1
- 230000006378 damage Effects 0.000 description 59
- 210000004027 cell Anatomy 0.000 description 54
- 230000014509 gene expression Effects 0.000 description 31
- 240000008042 Zea mays Species 0.000 description 30
- 238000003556 assay Methods 0.000 description 27
- 244000068988 Glycine max Species 0.000 description 24
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 24
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 21
- 238000011282 treatment Methods 0.000 description 20
- 108700019146 Transgenes Proteins 0.000 description 18
- 230000009466 transformation Effects 0.000 description 17
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 16
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 16
- 235000010469 Glycine max Nutrition 0.000 description 16
- 108010079364 N-glycylalanine Proteins 0.000 description 16
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 16
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 16
- 239000013598 vector Substances 0.000 description 16
- 230000000813 microbial effect Effects 0.000 description 15
- 239000000243 solution Substances 0.000 description 15
- 238000012360 testing method Methods 0.000 description 14
- 108010062796 arginyllysine Proteins 0.000 description 13
- 101100113088 Bacillus subtilis (strain 168) cgoX gene Proteins 0.000 description 11
- 241000894006 Bacteria Species 0.000 description 11
- 101100409079 Dictyostelium discoideum ppox gene Proteins 0.000 description 11
- 101150102931 hemG gene Proteins 0.000 description 11
- 108010051242 phenylalanylserine Proteins 0.000 description 11
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 10
- BDISFWMLMNBTGP-NUMRIWBASA-N Glu-Thr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O BDISFWMLMNBTGP-NUMRIWBASA-N 0.000 description 10
- 101001081180 Homo sapiens Humanin-like 10 Proteins 0.000 description 10
- 102100027734 Humanin-like 10 Human genes 0.000 description 10
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 10
- UUBKSZNKJUJQEJ-JRQIVUDYSA-N Tyr-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UUBKSZNKJUJQEJ-JRQIVUDYSA-N 0.000 description 10
- 239000000284 extract Substances 0.000 description 10
- 239000002609 medium Substances 0.000 description 10
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 9
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 9
- QMQZYILAWUOLPV-JYJNAYRXSA-N Arg-Tyr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)CC1=CC=C(O)C=C1 QMQZYILAWUOLPV-JYJNAYRXSA-N 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 9
- 108090000790 Enzymes Proteins 0.000 description 9
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 9
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 9
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 9
- 235000005822 corn Nutrition 0.000 description 9
- 210000001519 tissue Anatomy 0.000 description 9
- 108010020532 tyrosyl-proline Proteins 0.000 description 9
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 8
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 8
- VUUFXXGKMPLKNH-BZSNNMDCSA-N His-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N VUUFXXGKMPLKNH-BZSNNMDCSA-N 0.000 description 8
- CUXRXAIAVYLVFD-ULQDDVLXSA-N Leu-Arg-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUXRXAIAVYLVFD-ULQDDVLXSA-N 0.000 description 8
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 8
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 8
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 8
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 8
- -1 e. G. Proteins 0.000 description 8
- 150000003278 haem Chemical class 0.000 description 8
- 108010026333 seryl-proline Proteins 0.000 description 8
- 108010005652 splenotritin Proteins 0.000 description 8
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 7
- SYIFFFHSXBNPMC-UWJYBYFXSA-N Ala-Ser-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N SYIFFFHSXBNPMC-UWJYBYFXSA-N 0.000 description 7
- 108020004705 Codon Proteins 0.000 description 7
- 241001473317 Eupatorium cannabinum Species 0.000 description 7
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 7
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 7
- 241000880493 Leptailurus serval Species 0.000 description 7
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 7
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 7
- DXHHCIYKHRKBOC-BHYGNILZSA-N Trp-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O DXHHCIYKHRKBOC-BHYGNILZSA-N 0.000 description 7
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 7
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 7
- 108010047495 alanylglycine Proteins 0.000 description 7
- 150000002148 esters Chemical class 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000035784 germination Effects 0.000 description 7
- 108010057821 leucylproline Proteins 0.000 description 7
- 235000009973 maize Nutrition 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 7
- 150000003839 salts Chemical class 0.000 description 7
- 238000006467 substitution reaction Methods 0.000 description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 7
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 6
- DHONNEYAZPNGSG-UBHSHLNASA-N Ala-Val-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DHONNEYAZPNGSG-UBHSHLNASA-N 0.000 description 6
- HAFCJCDJGIOYPW-WDSKDSINSA-N Asp-Gly-Gln Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O HAFCJCDJGIOYPW-WDSKDSINSA-N 0.000 description 6
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 6
- OACQOWPRWGNKTP-AVGNSLFASA-N Gln-Tyr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O OACQOWPRWGNKTP-AVGNSLFASA-N 0.000 description 6
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 6
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 6
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 6
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 6
- UFRXVQGGPNSJRY-CYDGBPFRSA-N Ile-Met-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N UFRXVQGGPNSJRY-CYDGBPFRSA-N 0.000 description 6
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 6
- UNPGTBHYKJOCCZ-DCAQKATOSA-N Met-Lys-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O UNPGTBHYKJOCCZ-DCAQKATOSA-N 0.000 description 6
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 6
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 6
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 6
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 6
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 6
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 6
- VUKVQVNKIIZBPO-HOUAVDHOSA-N Thr-Asp-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VUKVQVNKIIZBPO-HOUAVDHOSA-N 0.000 description 6
- 108091036066 Three prime untranslated region Proteins 0.000 description 6
- YLHFIMLKNPJRGY-BVSLBCMMSA-N Tyr-Arg-Trp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O YLHFIMLKNPJRGY-BVSLBCMMSA-N 0.000 description 6
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 6
- MGVYZTPLGXPVQB-CYDGBPFRSA-N Val-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MGVYZTPLGXPVQB-CYDGBPFRSA-N 0.000 description 6
- 108010013835 arginine glutamate Proteins 0.000 description 6
- 230000006735 deficit Effects 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 6
- 108010009298 lysylglutamic acid Proteins 0.000 description 6
- 230000035772 mutation Effects 0.000 description 6
- 108010031719 prolyl-serine Proteins 0.000 description 6
- 238000010561 standard procedure Methods 0.000 description 6
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 6
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 5
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 5
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 5
- OBIHEDRRSMRKLU-ACZMJKKPSA-N Glu-Cys-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OBIHEDRRSMRKLU-ACZMJKKPSA-N 0.000 description 5
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 5
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 5
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 5
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 5
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 5
- RJEFZSIVBHGRQJ-SRVKXCTJSA-N Met-Arg-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O RJEFZSIVBHGRQJ-SRVKXCTJSA-N 0.000 description 5
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 5
- XZONQWUEBAFQPO-HJGDQZAQSA-N Pro-Gln-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZONQWUEBAFQPO-HJGDQZAQSA-N 0.000 description 5
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 5
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 5
- LKJCABTUFGTPPY-HJGDQZAQSA-N Thr-Pro-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O LKJCABTUFGTPPY-HJGDQZAQSA-N 0.000 description 5
- GQEXFCQNAJHJTI-IHPCNDPISA-N Trp-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GQEXFCQNAJHJTI-IHPCNDPISA-N 0.000 description 5
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 5
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 5
- PMXBARDFIAPBGK-DZKIICNBSA-N Val-Glu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PMXBARDFIAPBGK-DZKIICNBSA-N 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 229930002875 chlorophyll Natural products 0.000 description 5
- 235000019804 chlorophyll Nutrition 0.000 description 5
- ATNHDLDRLWWWCB-AENOIHSZSA-M chlorophyll a Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 ATNHDLDRLWWWCB-AENOIHSZSA-M 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 230000002255 enzymatic effect Effects 0.000 description 5
- 238000010353 genetic engineering Methods 0.000 description 5
- 108010015792 glycyllysine Proteins 0.000 description 5
- 108010000761 leucylarginine Proteins 0.000 description 5
- 244000005700 microbiome Species 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 102000040430 polynucleotide Human genes 0.000 description 5
- 108091033319 polynucleotide Proteins 0.000 description 5
- 239000002157 polynucleotide Substances 0.000 description 5
- 108010070643 prolylglutamic acid Proteins 0.000 description 5
- 230000035945 sensitivity Effects 0.000 description 5
- 108010071635 tyrosyl-prolyl-arginine Proteins 0.000 description 5
- 108010073969 valyllysine Proteins 0.000 description 5
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 4
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 4
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 4
- WTUZDHWWGUQEKN-SRVKXCTJSA-N Arg-Val-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O WTUZDHWWGUQEKN-SRVKXCTJSA-N 0.000 description 4
- AAIUGNSRQDGCDC-ZLUOBGJFSA-N Asp-Cys-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)C(=O)O AAIUGNSRQDGCDC-ZLUOBGJFSA-N 0.000 description 4
- MJJIHRWNWSQTOI-VEVYYDQMSA-N Asp-Thr-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MJJIHRWNWSQTOI-VEVYYDQMSA-N 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- JRZMCSIUYGSJKP-ZKWXMUAHSA-N Cys-Val-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JRZMCSIUYGSJKP-ZKWXMUAHSA-N 0.000 description 4
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 4
- 241000588697 Enterobacter cloacae Species 0.000 description 4
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 4
- ZPASCJBSSCRWMC-GVXVVHGQSA-N Glu-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N ZPASCJBSSCRWMC-GVXVVHGQSA-N 0.000 description 4
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 4
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 4
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 4
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 4
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 4
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 4
- ZALAVHVPPOHAOL-XUXIUFHCSA-N Leu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N ZALAVHVPPOHAOL-XUXIUFHCSA-N 0.000 description 4
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 4
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 4
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 4
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 4
- OYEUSRAZOGIDBY-JYJNAYRXSA-N Pro-Arg-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OYEUSRAZOGIDBY-JYJNAYRXSA-N 0.000 description 4
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 4
- PCMZJFMUYWIERL-ZKWXMUAHSA-N Ser-Val-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMZJFMUYWIERL-ZKWXMUAHSA-N 0.000 description 4
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 4
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 4
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 4
- XDARBNMYXKUFOJ-GSSVUCPTSA-N Thr-Asp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDARBNMYXKUFOJ-GSSVUCPTSA-N 0.000 description 4
- FHHYVSCGOMPLLO-IHPCNDPISA-N Trp-Tyr-Asp Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 FHHYVSCGOMPLLO-IHPCNDPISA-N 0.000 description 4
- ITDWWLTTWRRLCC-KJEVXHAQSA-N Tyr-Thr-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ITDWWLTTWRRLCC-KJEVXHAQSA-N 0.000 description 4
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 4
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 4
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 4
- 108010047857 aspartylglycine Proteins 0.000 description 4
- 210000003763 chloroplast Anatomy 0.000 description 4
- 238000009402 cross-breeding Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000001952 enzyme assay Methods 0.000 description 4
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 4
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 210000001161 mammalian embryo Anatomy 0.000 description 4
- 229930182817 methionine Natural products 0.000 description 4
- 102000039446 nucleic acids Human genes 0.000 description 4
- 108020004707 nucleic acids Proteins 0.000 description 4
- 239000008188 pellet Substances 0.000 description 4
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 4
- 210000002706 plastid Anatomy 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 3
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 3
- JAQNUEWEJWBVAY-WBAXXEDZSA-N Ala-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 JAQNUEWEJWBVAY-WBAXXEDZSA-N 0.000 description 3
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 3
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 3
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 3
- RATVAFHGEFAWDH-JYJNAYRXSA-N Arg-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCN=C(N)N)N RATVAFHGEFAWDH-JYJNAYRXSA-N 0.000 description 3
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 3
- AKEBUSZTMQLNIX-UWJYBYFXSA-N Asn-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N AKEBUSZTMQLNIX-UWJYBYFXSA-N 0.000 description 3
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 3
- WCRQQIPFSXFIRN-LPEHRKFASA-N Asn-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N WCRQQIPFSXFIRN-LPEHRKFASA-N 0.000 description 3
- SUIJFTJDTJKSRK-IHRRRGAJSA-N Asn-Pro-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUIJFTJDTJKSRK-IHRRRGAJSA-N 0.000 description 3
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 3
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 3
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 3
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 3
- 238000009010 Bradford assay Methods 0.000 description 3
- KSFOVUSSGSKXFI-GAQDCDSVSA-N CC1=C/2NC(\C=C3/N=C(/C=C4\N\C(=C/C5=N/C(=C\2)/C(C=C)=C5C)C(C=C)=C4C)C(C)=C3CCC(O)=O)=C1CCC(O)=O Chemical compound CC1=C/2NC(\C=C3/N=C(/C=C4\N\C(=C/C5=N/C(=C\2)/C(C=C)=C5C)C(C=C)=C4C)C(C)=C3CCC(O)=O)=C1CCC(O)=O KSFOVUSSGSKXFI-GAQDCDSVSA-N 0.000 description 3
- 229920000742 Cotton Polymers 0.000 description 3
- ORYFTECKJZTNQP-DCAQKATOSA-N Cys-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N ORYFTECKJZTNQP-DCAQKATOSA-N 0.000 description 3
- MQJKPEGWNLWLTK-UHFFFAOYSA-N Dapsone Chemical compound C1=CC(N)=CC=C1S(=O)(=O)C1=CC=C(N)C=C1 MQJKPEGWNLWLTK-UHFFFAOYSA-N 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 241000206602 Eukaryota Species 0.000 description 3
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 3
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 3
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 3
- DOQUICBEISTQHE-CIUDSAMLSA-N Gln-Pro-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O DOQUICBEISTQHE-CIUDSAMLSA-N 0.000 description 3
- UXXIVIQGOODKQC-NUMRIWBASA-N Gln-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UXXIVIQGOODKQC-NUMRIWBASA-N 0.000 description 3
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 3
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 3
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 3
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 3
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 3
- 241000219146 Gossypium Species 0.000 description 3
- 102000001554 Hemoglobins Human genes 0.000 description 3
- 108010054147 Hemoglobins Proteins 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 3
- KYFGGRHWLFZXPU-KKUMJFAQSA-N His-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N KYFGGRHWLFZXPU-KKUMJFAQSA-N 0.000 description 3
- FBCURAVMSXNOLP-JYJNAYRXSA-N His-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N FBCURAVMSXNOLP-JYJNAYRXSA-N 0.000 description 3
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 3
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 3
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 3
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 3
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 3
- IASQBRJGRVXNJI-YUMQZZPRSA-N Leu-Cys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)NCC(O)=O IASQBRJGRVXNJI-YUMQZZPRSA-N 0.000 description 3
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 3
- HQXSFFSLXFHWOX-IXOXFDKPSA-N Lys-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N)O HQXSFFSLXFHWOX-IXOXFDKPSA-N 0.000 description 3
- ALEVUGKHINJNIF-QEJZJMRPSA-N Lys-Phe-Ala Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ALEVUGKHINJNIF-QEJZJMRPSA-N 0.000 description 3
- AEQVPPGEJJBFEE-CYDGBPFRSA-N Met-Ile-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEQVPPGEJJBFEE-CYDGBPFRSA-N 0.000 description 3
- VBGGTAPDGFQMKF-AVGNSLFASA-N Met-Lys-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O VBGGTAPDGFQMKF-AVGNSLFASA-N 0.000 description 3
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 3
- AJOKKVTWEMXZHC-DRZSPHRISA-N Phe-Ala-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 AJOKKVTWEMXZHC-DRZSPHRISA-N 0.000 description 3
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 3
- XMPUYNHKEPFERE-IHRRRGAJSA-N Phe-Asp-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMPUYNHKEPFERE-IHRRRGAJSA-N 0.000 description 3
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 3
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 3
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 3
- IDQFQFVEWMWRQQ-DLOVCJGASA-N Ser-Ala-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IDQFQFVEWMWRQQ-DLOVCJGASA-N 0.000 description 3
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 3
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 3
- FDALPRWYVKJCLL-PMVVWTBXSA-N Thr-His-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O FDALPRWYVKJCLL-PMVVWTBXSA-N 0.000 description 3
- USYGMBIIUDLYHJ-GVARAGBVSA-N Tyr-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 USYGMBIIUDLYHJ-GVARAGBVSA-N 0.000 description 3
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 3
- BZMIYHIJVVJPCK-QSFUFRPTSA-N Val-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N BZMIYHIJVVJPCK-QSFUFRPTSA-N 0.000 description 3
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 3
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 108010044940 alanylglutamine Proteins 0.000 description 3
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 3
- 108010038633 aspartylglutamate Proteins 0.000 description 3
- 108010092854 aspartyllysine Proteins 0.000 description 3
- 230000010165 autogamy Effects 0.000 description 3
- 229940098773 bovine serum albumin Drugs 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 230000001747 exhibiting effect Effects 0.000 description 3
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 3
- 108010020688 glycylhistidine Proteins 0.000 description 3
- 108010050848 glycylleucine Proteins 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 239000011539 homogenization buffer Substances 0.000 description 3
- 238000009399 inbreeding Methods 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 230000002438 mitochondrial effect Effects 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 108010073101 phenylalanylleucine Proteins 0.000 description 3
- 239000000419 plant extract Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 229950003776 protoporphyrin Drugs 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 239000010414 supernatant solution Substances 0.000 description 3
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 3
- AUXMWYRZQPIXCC-KNIFDHDWSA-N (2s)-2-amino-4-methylpentanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.CC(C)C[C@H](N)C(O)=O AUXMWYRZQPIXCC-KNIFDHDWSA-N 0.000 description 2
- 241000589158 Agrobacterium Species 0.000 description 2
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 2
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 2
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 2
- KVWLTGNCJYDJET-LSJOCFKGSA-N Ala-Arg-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KVWLTGNCJYDJET-LSJOCFKGSA-N 0.000 description 2
- YWWATNIVMOCSAV-UBHSHLNASA-N Ala-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YWWATNIVMOCSAV-UBHSHLNASA-N 0.000 description 2
- GFBLJMHGHAXGNY-ZLUOBGJFSA-N Ala-Asn-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GFBLJMHGHAXGNY-ZLUOBGJFSA-N 0.000 description 2
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 2
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 2
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 2
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 2
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- 241000219318 Amaranthus Species 0.000 description 2
- 241000482638 Amaranthus tuberculatus Species 0.000 description 2
- ITVINTQUZMQWJR-QXEWZRGKSA-N Arg-Asn-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ITVINTQUZMQWJR-QXEWZRGKSA-N 0.000 description 2
- FIQKRDXFTANIEJ-ULQDDVLXSA-N Arg-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FIQKRDXFTANIEJ-ULQDDVLXSA-N 0.000 description 2
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 2
- VJIQPOJMISSUPO-BVSLBCMMSA-N Arg-Trp-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VJIQPOJMISSUPO-BVSLBCMMSA-N 0.000 description 2
- XKRFYHLGVUSROY-UHFFFAOYSA-N Argon Chemical compound [Ar] XKRFYHLGVUSROY-UHFFFAOYSA-N 0.000 description 2
- DXZNJWFECGJCQR-FXQIFTODSA-N Asn-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N DXZNJWFECGJCQR-FXQIFTODSA-N 0.000 description 2
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 2
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 2
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 108091033409 CRISPR Proteins 0.000 description 2
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 2
- RRIJEABIXPKSGP-FXQIFTODSA-N Cys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CS RRIJEABIXPKSGP-FXQIFTODSA-N 0.000 description 2
- HYKFOHGZGLOCAY-ZLUOBGJFSA-N Cys-Cys-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O HYKFOHGZGLOCAY-ZLUOBGJFSA-N 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 241000318001 Erwinia toletana Species 0.000 description 2
- 241001646716 Escherichia coli K-12 Species 0.000 description 2
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 2
- JHPFPROFOAJRFN-IHRRRGAJSA-N Gln-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O JHPFPROFOAJRFN-IHRRRGAJSA-N 0.000 description 2
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 2
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 2
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 2
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 2
- HTTSBEBKVNEDFE-AUTRQRHGSA-N Glu-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N HTTSBEBKVNEDFE-AUTRQRHGSA-N 0.000 description 2
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 2
- MZZSCEANQDPJER-ONGXEEELSA-N Gly-Ala-Phe Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MZZSCEANQDPJER-ONGXEEELSA-N 0.000 description 2
- FEUPVVCGQLNXNP-IRXDYDNUSA-N Gly-Phe-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FEUPVVCGQLNXNP-IRXDYDNUSA-N 0.000 description 2
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- 240000002024 Gossypium herbaceum Species 0.000 description 2
- 235000004341 Gossypium herbaceum Nutrition 0.000 description 2
- 108091070688 HemG family Proteins 0.000 description 2
- 241000258937 Hemiptera Species 0.000 description 2
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 2
- PZUZIHRPOVVHOT-KBPBESRZSA-N His-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CN=CN1 PZUZIHRPOVVHOT-KBPBESRZSA-N 0.000 description 2
- QTMKFZAYZKBFRC-BZSNNMDCSA-N His-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N)O QTMKFZAYZKBFRC-BZSNNMDCSA-N 0.000 description 2
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 2
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 2
- YPWHUFAAMNHMGS-QSFUFRPTSA-N Ile-Ala-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YPWHUFAAMNHMGS-QSFUFRPTSA-N 0.000 description 2
- WZPIKDWQVRTATP-SYWGBEHUSA-N Ile-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 WZPIKDWQVRTATP-SYWGBEHUSA-N 0.000 description 2
- ZDNORQNHCJUVOV-KBIXCLLPSA-N Ile-Gln-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O ZDNORQNHCJUVOV-KBIXCLLPSA-N 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- 125000000174 L-prolyl group Chemical group [H]N1C([H])([H])C([H])([H])C([H])([H])[C@@]1([H])C(*)=O 0.000 description 2
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 2
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 2
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 2
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 2
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 2
- 241000209510 Liliopsida Species 0.000 description 2
- VHFFQUSNFFIZBT-CIUDSAMLSA-N Lys-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N VHFFQUSNFFIZBT-CIUDSAMLSA-N 0.000 description 2
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 2
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 2
- JQSIGLHQNSZZRL-KKUMJFAQSA-N Lys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N JQSIGLHQNSZZRL-KKUMJFAQSA-N 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 2
- 241000520272 Pantoea Species 0.000 description 2
- 241000588696 Pantoea ananatis Species 0.000 description 2
- 241000588701 Pectobacterium carotovorum Species 0.000 description 2
- 240000007377 Petunia x hybrida Species 0.000 description 2
- YRKFKTQRVBJYLT-CQDKDKBSSA-N Phe-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 YRKFKTQRVBJYLT-CQDKDKBSSA-N 0.000 description 2
- OWCLJDXHHZUNEL-IHRRRGAJSA-N Phe-Cys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O OWCLJDXHHZUNEL-IHRRRGAJSA-N 0.000 description 2
- FXPZZKBHNOMLGA-HJWJTTGWSA-N Phe-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FXPZZKBHNOMLGA-HJWJTTGWSA-N 0.000 description 2
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 2
- APMXLWHMIVWLLR-BZSNNMDCSA-N Phe-Tyr-Ser Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(O)=O)C1=CC=CC=C1 APMXLWHMIVWLLR-BZSNNMDCSA-N 0.000 description 2
- 239000004793 Polystyrene Substances 0.000 description 2
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 2
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 2
- ZYBUKTMPPFQSHL-JYJNAYRXSA-N Pro-Asp-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZYBUKTMPPFQSHL-JYJNAYRXSA-N 0.000 description 2
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 2
- GNFHQWNCSSPOBT-ULQDDVLXSA-N Pro-Trp-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCC(=O)N)C(=O)O GNFHQWNCSSPOBT-ULQDDVLXSA-N 0.000 description 2
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 2
- VDVYTKZBMFADQH-AVGNSLFASA-N Ser-Gln-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VDVYTKZBMFADQH-AVGNSLFASA-N 0.000 description 2
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 2
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 2
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 2
- HKHCTNFKZXAMIF-KKUMJFAQSA-N Ser-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=C(O)C=C1 HKHCTNFKZXAMIF-KKUMJFAQSA-N 0.000 description 2
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 2
- 241000588717 Shimwellia blattae Species 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- UTSWGQNAQRIHAI-UNQGMJICSA-N Thr-Arg-Phe Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UTSWGQNAQRIHAI-UNQGMJICSA-N 0.000 description 2
- RCEHMXVEMNXRIW-IRIUXVKKSA-N Thr-Gln-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N)O RCEHMXVEMNXRIW-IRIUXVKKSA-N 0.000 description 2
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 2
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 2
- VDUJEEQMRQCLHB-YTQUADARSA-N Trp-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O VDUJEEQMRQCLHB-YTQUADARSA-N 0.000 description 2
- KXFYAQUYJKOQMI-QEJZJMRPSA-N Trp-Ser-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 KXFYAQUYJKOQMI-QEJZJMRPSA-N 0.000 description 2
- IJUTXXAXQODRMW-KBPBESRZSA-N Tyr-Gly-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O IJUTXXAXQODRMW-KBPBESRZSA-N 0.000 description 2
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 2
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 2
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 2
- 239000004480 active ingredient Substances 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 2
- 238000009395 breeding Methods 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 235000013877 carbamide Nutrition 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- XPEVJXBWHXAUDR-UHFFFAOYSA-N epyrifenacil Chemical compound CCOC(=O)COC1=NC=CC=C1OC1=CC(N2C(N(C)C(=CC2=O)C(F)(F)F)=O)=C(F)C=C1Cl XPEVJXBWHXAUDR-UHFFFAOYSA-N 0.000 description 2
- 241001233957 eudicotyledons Species 0.000 description 2
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 2
- 238000003306 harvesting Methods 0.000 description 2
- 238000013537 high throughput screening Methods 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 238000011081 inoculation Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 239000004570 mortar (masonry) Substances 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 238000010899 nucleation Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 229920002223 polystyrene Polymers 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000005507 spraying Methods 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 2
- AXFMEGAFCUULFV-BLFANLJRSA-N (2s)-2-[[(2s)-1-[(2s,3r)-2-amino-3-methylpentanoyl]pyrrolidine-2-carbonyl]amino]pentanedioic acid Chemical compound CC[C@@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AXFMEGAFCUULFV-BLFANLJRSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- PKRSYEPBQPFNRB-UHFFFAOYSA-N 2-phenoxybenzoic acid Chemical compound OC(=O)C1=CC=CC=C1OC1=CC=CC=C1 PKRSYEPBQPFNRB-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- HQQTZCPKNZVLFF-UHFFFAOYSA-N 4h-1,2-benzoxazin-3-one Chemical class C1=CC=C2ONC(=O)CC2=C1 HQQTZCPKNZVLFF-UHFFFAOYSA-N 0.000 description 1
- OEDUIFSDODUDRK-UHFFFAOYSA-N 5-phenyl-1h-pyrazole Chemical compound N1N=CC=C1C1=CC=CC=C1 OEDUIFSDODUDRK-UHFFFAOYSA-N 0.000 description 1
- ZGXJTSGNIOSYLO-UHFFFAOYSA-N 88755TAZ87 Chemical compound NCC(=O)CCC(O)=O ZGXJTSGNIOSYLO-UHFFFAOYSA-N 0.000 description 1
- 108010044087 AS-I toxin Proteins 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 239000002890 Aclonifen Substances 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- SSSROGPPPVTHLX-FXQIFTODSA-N Ala-Arg-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSROGPPPVTHLX-FXQIFTODSA-N 0.000 description 1
- STACJSVFHSEZJV-GHCJXIJMSA-N Ala-Asn-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STACJSVFHSEZJV-GHCJXIJMSA-N 0.000 description 1
- SHYYAQLDNVHPFT-DLOVCJGASA-N Ala-Asn-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SHYYAQLDNVHPFT-DLOVCJGASA-N 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 1
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 1
- NKJBKNVQHBZUIX-ACZMJKKPSA-N Ala-Gln-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKJBKNVQHBZUIX-ACZMJKKPSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- ZDYNWWQXFRUOEO-XDTLVQLUSA-N Ala-Gln-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDYNWWQXFRUOEO-XDTLVQLUSA-N 0.000 description 1
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 1
- IXTPACPAXIOCRG-ACZMJKKPSA-N Ala-Glu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N IXTPACPAXIOCRG-ACZMJKKPSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 1
- KMGOBAQSCKTBGD-DLOVCJGASA-N Ala-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CN=CN1 KMGOBAQSCKTBGD-DLOVCJGASA-N 0.000 description 1
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- NOGFDULFCFXBHB-CIUDSAMLSA-N Ala-Leu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NOGFDULFCFXBHB-CIUDSAMLSA-N 0.000 description 1
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 1
- BLTRAARCJYVJKV-QEJZJMRPSA-N Ala-Lys-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](Cc1ccccc1)C(O)=O BLTRAARCJYVJKV-QEJZJMRPSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- BFMIRJBURUXDRG-DLOVCJGASA-N Ala-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 BFMIRJBURUXDRG-DLOVCJGASA-N 0.000 description 1
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 1
- OSRZOHXQCUFIQG-FPMFFAJLSA-N Ala-Phe-Pro Chemical compound C([C@H](NC(=O)[C@@H]([NH3+])C)C(=O)N1[C@H](CCC1)C([O-])=O)C1=CC=CC=C1 OSRZOHXQCUFIQG-FPMFFAJLSA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 1
- PEFFAAKJGBZBKL-NAKRPEOUSA-N Arg-Ala-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PEFFAAKJGBZBKL-NAKRPEOUSA-N 0.000 description 1
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 1
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- OCDJOVKIUJVUMO-SRVKXCTJSA-N Arg-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N OCDJOVKIUJVUMO-SRVKXCTJSA-N 0.000 description 1
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 1
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 1
- OKKMBOSPBDASEP-CYDGBPFRSA-N Arg-Ile-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O OKKMBOSPBDASEP-CYDGBPFRSA-N 0.000 description 1
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 1
- DIIGDGJKTMLQQW-IHRRRGAJSA-N Arg-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N DIIGDGJKTMLQQW-IHRRRGAJSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- ZRNWJUAQKFUUKV-SRVKXCTJSA-N Arg-Met-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O ZRNWJUAQKFUUKV-SRVKXCTJSA-N 0.000 description 1
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- AUZAXCPWMDBWEE-HJGDQZAQSA-N Arg-Thr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O AUZAXCPWMDBWEE-HJGDQZAQSA-N 0.000 description 1
- QHUOOCKNNURZSL-IHRRRGAJSA-N Arg-Tyr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O QHUOOCKNNURZSL-IHRRRGAJSA-N 0.000 description 1
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 1
- ZWASIOHRQWRWAS-UGYAYLCHSA-N Asn-Asp-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZWASIOHRQWRWAS-UGYAYLCHSA-N 0.000 description 1
- QPTAGIPWARILES-AVGNSLFASA-N Asn-Gln-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QPTAGIPWARILES-AVGNSLFASA-N 0.000 description 1
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 1
- COUZKSSMBFADSB-AVGNSLFASA-N Asn-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N COUZKSSMBFADSB-AVGNSLFASA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 1
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 1
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- PLTGTJAZQRGMPP-FXQIFTODSA-N Asn-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O PLTGTJAZQRGMPP-FXQIFTODSA-N 0.000 description 1
- SZNGQSBRHFMZLT-IHRRRGAJSA-N Asn-Pro-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SZNGQSBRHFMZLT-IHRRRGAJSA-N 0.000 description 1
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 1
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 1
- ZNYKKCADEQAZKA-FXQIFTODSA-N Asn-Ser-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O ZNYKKCADEQAZKA-FXQIFTODSA-N 0.000 description 1
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 1
- MYTHOBCLNIOFBL-SRVKXCTJSA-N Asn-Ser-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYTHOBCLNIOFBL-SRVKXCTJSA-N 0.000 description 1
- YHXNKGKUDJCAHB-PBCZWWQYSA-N Asn-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O YHXNKGKUDJCAHB-PBCZWWQYSA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- MLJZMGIXXMTEPO-UBHSHLNASA-N Asn-Trp-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O MLJZMGIXXMTEPO-UBHSHLNASA-N 0.000 description 1
- LGCVSPFCFXWUEY-IHPCNDPISA-N Asn-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N LGCVSPFCFXWUEY-IHPCNDPISA-N 0.000 description 1
- XZFONYMRYTVLPL-NHCYSSNCSA-N Asn-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N XZFONYMRYTVLPL-NHCYSSNCSA-N 0.000 description 1
- OERMIMJQPQUIPK-FXQIFTODSA-N Asp-Arg-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O OERMIMJQPQUIPK-FXQIFTODSA-N 0.000 description 1
- ICAYWNTWHRRAQP-FXQIFTODSA-N Asp-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N ICAYWNTWHRRAQP-FXQIFTODSA-N 0.000 description 1
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 1
- CNKAZIGBGQIHLL-GUBZILKMSA-N Asp-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N CNKAZIGBGQIHLL-GUBZILKMSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 1
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 1
- ZEDBMCPXPIYJLW-XHNCKOQMSA-N Asp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O ZEDBMCPXPIYJLW-XHNCKOQMSA-N 0.000 description 1
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 1
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- AITKTFCQOBRJTG-CIUDSAMLSA-N Asp-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N AITKTFCQOBRJTG-CIUDSAMLSA-N 0.000 description 1
- JTRDJYIZIKCIRC-AJNGGQMLSA-N Asp-Leu-Leu-Gln Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JTRDJYIZIKCIRC-AJNGGQMLSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- UZFHNLYQWMGUHU-DCAQKATOSA-N Asp-Lys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UZFHNLYQWMGUHU-DCAQKATOSA-N 0.000 description 1
- FQHBAQLBIXLWAG-DCAQKATOSA-N Asp-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N FQHBAQLBIXLWAG-DCAQKATOSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- UEFODXNXUAVPTC-VEVYYDQMSA-N Asp-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UEFODXNXUAVPTC-VEVYYDQMSA-N 0.000 description 1
- LLRJPYJQNBMOOO-QEJZJMRPSA-N Asp-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N LLRJPYJQNBMOOO-QEJZJMRPSA-N 0.000 description 1
- BOXNGMVEVOGXOJ-UBHSHLNASA-N Asp-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N BOXNGMVEVOGXOJ-UBHSHLNASA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 239000005484 Bifenox Substances 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 240000000385 Brassica napus var. napus Species 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 241000254173 Coleoptera Species 0.000 description 1
- 241000254171 Curculionidae Species 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- SFRQEQGPRTVDPO-NRPADANISA-N Cys-Gln-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O SFRQEQGPRTVDPO-NRPADANISA-N 0.000 description 1
- KCPOQGRVVXYLAC-KKUMJFAQSA-N Cys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CS)N KCPOQGRVVXYLAC-KKUMJFAQSA-N 0.000 description 1
- OZHXXYOHPLLLMI-CIUDSAMLSA-N Cys-Lys-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OZHXXYOHPLLLMI-CIUDSAMLSA-N 0.000 description 1
- GDNWBSFSHJVXKL-GUBZILKMSA-N Cys-Lys-Gln Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O GDNWBSFSHJVXKL-GUBZILKMSA-N 0.000 description 1
- ZXGDAZLSOSYSBA-IHRRRGAJSA-N Cys-Val-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZXGDAZLSOSYSBA-IHRRRGAJSA-N 0.000 description 1
- ALTQTAKGRFLRLR-GUBZILKMSA-N Cys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N ALTQTAKGRFLRLR-GUBZILKMSA-N 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 241001493237 Enterobacter mori Species 0.000 description 1
- 241000065379 Epedanellus tuberculatus Species 0.000 description 1
- IRECWLYBCAZIJM-UHFFFAOYSA-N Flumiclorac pentyl Chemical group C1=C(Cl)C(OCC(=O)OCCCCC)=CC(N2C(C3=C(CCCC3)C2=O)=O)=C1F IRECWLYBCAZIJM-UHFFFAOYSA-N 0.000 description 1
- DTCCMDYODDPHBG-ACZMJKKPSA-N Gln-Ala-Cys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O DTCCMDYODDPHBG-ACZMJKKPSA-N 0.000 description 1
- LTLXPHKSQQILNF-CIUDSAMLSA-N Gln-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N LTLXPHKSQQILNF-CIUDSAMLSA-N 0.000 description 1
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 1
- ZFADFBPRMSBPOT-KKUMJFAQSA-N Gln-Arg-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZFADFBPRMSBPOT-KKUMJFAQSA-N 0.000 description 1
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 1
- CYTSBCIIEHUPDU-ACZMJKKPSA-N Gln-Asp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O CYTSBCIIEHUPDU-ACZMJKKPSA-N 0.000 description 1
- JKPGHIQCHIIRMS-AVGNSLFASA-N Gln-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N JKPGHIQCHIIRMS-AVGNSLFASA-N 0.000 description 1
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 1
- RRBLZNIIMHSHQF-FXQIFTODSA-N Gln-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N RRBLZNIIMHSHQF-FXQIFTODSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- LFIVHGMKWFGUGK-IHRRRGAJSA-N Gln-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N LFIVHGMKWFGUGK-IHRRRGAJSA-N 0.000 description 1
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 1
- DQPOBSRQNWOBNA-GUBZILKMSA-N Gln-His-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O DQPOBSRQNWOBNA-GUBZILKMSA-N 0.000 description 1
- IWUFOVSLWADEJC-AVGNSLFASA-N Gln-His-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IWUFOVSLWADEJC-AVGNSLFASA-N 0.000 description 1
- JXBZEDIQFFCHPZ-PEFMBERDSA-N Gln-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JXBZEDIQFFCHPZ-PEFMBERDSA-N 0.000 description 1
- FYAULIGIFPPOAA-ZPFDUUQYSA-N Gln-Ile-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O FYAULIGIFPPOAA-ZPFDUUQYSA-N 0.000 description 1
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- WHVLABLIJYGVEK-QEWYBTABSA-N Gln-Phe-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WHVLABLIJYGVEK-QEWYBTABSA-N 0.000 description 1
- UKKNTTCNGZLJEX-WHFBIAKZSA-N Gln-Ser Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(O)=O UKKNTTCNGZLJEX-WHFBIAKZSA-N 0.000 description 1
- MFHVAWMMKZBSRQ-ACZMJKKPSA-N Gln-Ser-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N MFHVAWMMKZBSRQ-ACZMJKKPSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 1
- SYTFJIQPBRJSOK-NKIYYHGXSA-N Gln-Thr-His Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 SYTFJIQPBRJSOK-NKIYYHGXSA-N 0.000 description 1
- NSEKYCAADBNQFE-XIRDDKMYSA-N Gln-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 NSEKYCAADBNQFE-XIRDDKMYSA-N 0.000 description 1
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 1
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 1
- ZMXZGYLINVNTKH-DZKIICNBSA-N Gln-Val-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZMXZGYLINVNTKH-DZKIICNBSA-N 0.000 description 1
- ZJICFHQSPWFBKP-AVGNSLFASA-N Glu-Asn-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZJICFHQSPWFBKP-AVGNSLFASA-N 0.000 description 1
- FKGNJUCQKXQNRA-NRPADANISA-N Glu-Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(O)=O FKGNJUCQKXQNRA-NRPADANISA-N 0.000 description 1
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 1
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 1
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 1
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 1
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 1
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 1
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 1
- UJMNFCAHLYKWOZ-DCAQKATOSA-N Glu-Lys-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UJMNFCAHLYKWOZ-DCAQKATOSA-N 0.000 description 1
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 1
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 1
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- BKMOHWJHXQLFEX-IRIUXVKKSA-N Glu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N)O BKMOHWJHXQLFEX-IRIUXVKKSA-N 0.000 description 1
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 1
- 108010063907 Glutathione Reductase Proteins 0.000 description 1
- 102100036442 Glutathione reductase, mitochondrial Human genes 0.000 description 1
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 1
- DUYYPIRFTLOAJQ-YUMQZZPRSA-N Gly-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN DUYYPIRFTLOAJQ-YUMQZZPRSA-N 0.000 description 1
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 1
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 1
- JUBDONGMHASUCN-IUCAKERBSA-N Gly-Glu-His Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O JUBDONGMHASUCN-IUCAKERBSA-N 0.000 description 1
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 1
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- IFHJOBKVXBESRE-YUMQZZPRSA-N Gly-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN IFHJOBKVXBESRE-YUMQZZPRSA-N 0.000 description 1
- ZKJZBRHRWKLVSJ-ZDLURKLDSA-N Gly-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)O ZKJZBRHRWKLVSJ-ZDLURKLDSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 1
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- 101150054796 Hem gene Proteins 0.000 description 1
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 1
- VOKCBYNCZVSILJ-KKUMJFAQSA-N His-Asn-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)O VOKCBYNCZVSILJ-KKUMJFAQSA-N 0.000 description 1
- BPOHQCZZSFBSON-KKUMJFAQSA-N His-Leu-His Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BPOHQCZZSFBSON-KKUMJFAQSA-N 0.000 description 1
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 1
- BSVLMPMIXPQNKC-KBPBESRZSA-N His-Phe-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O BSVLMPMIXPQNKC-KBPBESRZSA-N 0.000 description 1
- ALPXXNRQBMRCPZ-MEYUZBJRSA-N His-Thr-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ALPXXNRQBMRCPZ-MEYUZBJRSA-N 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- JXUGDUWBMKIJDC-NAKRPEOUSA-N Ile-Ala-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JXUGDUWBMKIJDC-NAKRPEOUSA-N 0.000 description 1
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 1
- DPTBVFUDCPINIP-JURCDPSOSA-N Ile-Ala-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DPTBVFUDCPINIP-JURCDPSOSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- YPQDTQJBOFOTJQ-SXTJYALSSA-N Ile-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N YPQDTQJBOFOTJQ-SXTJYALSSA-N 0.000 description 1
- REJKOQYVFDEZHA-SLBDDTMCSA-N Ile-Asp-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N REJKOQYVFDEZHA-SLBDDTMCSA-N 0.000 description 1
- GECLQMBTZCPAFY-PEFMBERDSA-N Ile-Gln-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GECLQMBTZCPAFY-PEFMBERDSA-N 0.000 description 1
- BALLIXFZYSECCF-QEWYBTABSA-N Ile-Gln-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N BALLIXFZYSECCF-QEWYBTABSA-N 0.000 description 1
- JRYQSFOFUFXPTB-RWRJDSDZSA-N Ile-Gln-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N JRYQSFOFUFXPTB-RWRJDSDZSA-N 0.000 description 1
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 1
- JXMSHKFPDIUYGS-SIUGBPQLSA-N Ile-Glu-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N JXMSHKFPDIUYGS-SIUGBPQLSA-N 0.000 description 1
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 1
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 1
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 1
- ZUPJCJINYQISSN-XUXIUFHCSA-N Ile-Met-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUPJCJINYQISSN-XUXIUFHCSA-N 0.000 description 1
- XMYURPUVJSKTMC-KBIXCLLPSA-N Ile-Ser-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XMYURPUVJSKTMC-KBIXCLLPSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 1
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 1
- HZVRQFKRALAMQS-SLBDDTMCSA-N Ile-Trp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZVRQFKRALAMQS-SLBDDTMCSA-N 0.000 description 1
- WIYDLTIBHZSPKY-HJWJTTGWSA-N Ile-Val-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WIYDLTIBHZSPKY-HJWJTTGWSA-N 0.000 description 1
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- 240000007049 Juglans regia Species 0.000 description 1
- 235000009496 Juglans regia Nutrition 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 244000207740 Lemna minor Species 0.000 description 1
- 235000006439 Lemna minor Nutrition 0.000 description 1
- 244000242291 Lemna paucicostata Species 0.000 description 1
- 241000255777 Lepidoptera Species 0.000 description 1
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 1
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 1
- GBDMISNMNXVTNV-XIRDDKMYSA-N Leu-Asp-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GBDMISNMNXVTNV-XIRDDKMYSA-N 0.000 description 1
- GZAUZBUKDXYPEH-CIUDSAMLSA-N Leu-Cys-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N GZAUZBUKDXYPEH-CIUDSAMLSA-N 0.000 description 1
- DXYBNWJZJVSZAE-GUBZILKMSA-N Leu-Gln-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N DXYBNWJZJVSZAE-GUBZILKMSA-N 0.000 description 1
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 1
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 1
- WMTOVWLLDGQGCV-GUBZILKMSA-N Leu-Glu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WMTOVWLLDGQGCV-GUBZILKMSA-N 0.000 description 1
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 1
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 1
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 1
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- GGAPIOORBXHMNY-ULQDDVLXSA-N Lys-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)O GGAPIOORBXHMNY-ULQDDVLXSA-N 0.000 description 1
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 1
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- VQXAVLQBQJMENB-SRVKXCTJSA-N Lys-Glu-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O VQXAVLQBQJMENB-SRVKXCTJSA-N 0.000 description 1
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 1
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 1
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 1
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 1
- KZJQUYFDSCFSCO-DLOVCJGASA-N Lys-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N KZJQUYFDSCFSCO-DLOVCJGASA-N 0.000 description 1
- OWRUUFUVXFREBD-KKUMJFAQSA-N Lys-His-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O OWRUUFUVXFREBD-KKUMJFAQSA-N 0.000 description 1
- CBNMHRCLYBJIIZ-XUXIUFHCSA-N Lys-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N CBNMHRCLYBJIIZ-XUXIUFHCSA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- YXPJCVNIDDKGOE-MELADBBJSA-N Lys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N)C(=O)O YXPJCVNIDDKGOE-MELADBBJSA-N 0.000 description 1
- MSSJJDVQTFTLIF-KBPBESRZSA-N Lys-Phe-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O MSSJJDVQTFTLIF-KBPBESRZSA-N 0.000 description 1
- LOGFVTREOLYCPF-RHYQMDGZSA-N Lys-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-RHYQMDGZSA-N 0.000 description 1
- LKDXINHHSWFFJC-SRVKXCTJSA-N Lys-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N LKDXINHHSWFFJC-SRVKXCTJSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- VWJFOUBDZIUXGA-AVGNSLFASA-N Lys-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N VWJFOUBDZIUXGA-AVGNSLFASA-N 0.000 description 1
- SUSRORUBZHMPCO-UHFFFAOYSA-N MC-4379 Chemical compound C1=C([N+]([O-])=O)C(C(=O)OC)=CC(OC=2C(=CC(Cl)=CC=2)Cl)=C1 SUSRORUBZHMPCO-UHFFFAOYSA-N 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 1
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 1
- ZEDVFJPQNNBMST-CYDGBPFRSA-N Met-Arg-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZEDVFJPQNNBMST-CYDGBPFRSA-N 0.000 description 1
- OLWAOWXIADGIJG-AVGNSLFASA-N Met-Arg-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(O)=O OLWAOWXIADGIJG-AVGNSLFASA-N 0.000 description 1
- UKUMISIRZAVYOG-CIUDSAMLSA-N Met-Glu-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O UKUMISIRZAVYOG-CIUDSAMLSA-N 0.000 description 1
- WWWGMQHQSAUXBU-BQBZGAKWSA-N Met-Gly-Asn Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O WWWGMQHQSAUXBU-BQBZGAKWSA-N 0.000 description 1
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 1
- HOZNVKDCKZPRER-XUXIUFHCSA-N Met-Lys-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HOZNVKDCKZPRER-XUXIUFHCSA-N 0.000 description 1
- NTYQUVLERIHPMU-HRCADAONSA-N Met-Phe-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N NTYQUVLERIHPMU-HRCADAONSA-N 0.000 description 1
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 1
- CIIJWIAORKTXAH-FJXKBIBVSA-N Met-Thr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O CIIJWIAORKTXAH-FJXKBIBVSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 229920002274 Nalgene Polymers 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- JVTMTFMMMHAPCR-UBHSHLNASA-N Phe-Ala-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JVTMTFMMMHAPCR-UBHSHLNASA-N 0.000 description 1
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 1
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 1
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 1
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 1
- LLGTYVHITPVGKR-RYUDHWBXSA-N Phe-Gln-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O LLGTYVHITPVGKR-RYUDHWBXSA-N 0.000 description 1
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 1
- YZJKNDCEPDDIDA-BZSNNMDCSA-N Phe-His-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CN=CN1 YZJKNDCEPDDIDA-BZSNNMDCSA-N 0.000 description 1
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 1
- KPEIBEPEUAZWNS-ULQDDVLXSA-N Phe-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KPEIBEPEUAZWNS-ULQDDVLXSA-N 0.000 description 1
- HQPWNHXERZCIHP-PMVMPFDFSA-N Phe-Leu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 HQPWNHXERZCIHP-PMVMPFDFSA-N 0.000 description 1
- RYQWALWYQWBUKN-FHWLQOOXSA-N Phe-Phe-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RYQWALWYQWBUKN-FHWLQOOXSA-N 0.000 description 1
- DSXPMZMSJHOKKK-HJOGWXRNSA-N Phe-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DSXPMZMSJHOKKK-HJOGWXRNSA-N 0.000 description 1
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 1
- GOUWCZRDTWTODO-YDHLFZDLSA-N Phe-Val-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O GOUWCZRDTWTODO-YDHLFZDLSA-N 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 235000001855 Portulaca oleracea Nutrition 0.000 description 1
- FELJDCNGZFDUNR-WDSKDSINSA-N Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FELJDCNGZFDUNR-WDSKDSINSA-N 0.000 description 1
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 1
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 1
- LSIWVWRUTKPXDS-DCAQKATOSA-N Pro-Gln-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LSIWVWRUTKPXDS-DCAQKATOSA-N 0.000 description 1
- YSUZKYSRAFNLRB-ULQDDVLXSA-N Pro-Gln-Trp Chemical compound N([C@@H](CCC(=O)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C(=O)[C@@H]1CCCN1 YSUZKYSRAFNLRB-ULQDDVLXSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 1
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 1
- XYAFCOJKICBRDU-JYJNAYRXSA-N Pro-Phe-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O XYAFCOJKICBRDU-JYJNAYRXSA-N 0.000 description 1
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 1
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 1
- FYXCBXDAMPEHIQ-FHWLQOOXSA-N Pro-Trp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCCCN)C(=O)O FYXCBXDAMPEHIQ-FHWLQOOXSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 1
- XBDQKXXYIPTUBI-UHFFFAOYSA-M Propionate Chemical compound CCC([O-])=O XBDQKXXYIPTUBI-UHFFFAOYSA-M 0.000 description 1
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 1
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 1
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 1
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 1
- KNCJWSPMTFFJII-ZLUOBGJFSA-N Ser-Cys-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KNCJWSPMTFFJII-ZLUOBGJFSA-N 0.000 description 1
- UCOYFSCEIWQYNL-FXQIFTODSA-N Ser-Cys-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCSC)C(O)=O UCOYFSCEIWQYNL-FXQIFTODSA-N 0.000 description 1
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 1
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- FOOZNBRFRWGBNU-DCAQKATOSA-N Ser-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N FOOZNBRFRWGBNU-DCAQKATOSA-N 0.000 description 1
- VIIJCAQMJBHSJH-FXQIFTODSA-N Ser-Met-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O VIIJCAQMJBHSJH-FXQIFTODSA-N 0.000 description 1
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 1
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 1
- WNDUPCKKKGSKIQ-CIUDSAMLSA-N Ser-Pro-Gln Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O WNDUPCKKKGSKIQ-CIUDSAMLSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 1
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- RTXKJFWHEBTABY-IHPCNDPISA-N Ser-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CO)N RTXKJFWHEBTABY-IHPCNDPISA-N 0.000 description 1
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 1
- RCOUFINCYASMDN-GUBZILKMSA-N Ser-Val-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O RCOUFINCYASMDN-GUBZILKMSA-N 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- NHUHCSRWZMLRLA-UHFFFAOYSA-N Sulfisoxazole Chemical compound CC1=NOC(NS(=O)(=O)C=2C=CC(N)=CC=2)=C1C NHUHCSRWZMLRLA-UHFFFAOYSA-N 0.000 description 1
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 1
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 1
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 description 1
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 1
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 1
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 1
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 1
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 1
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 1
- BWUHENPAEMNGQJ-ZDLURKLDSA-N Thr-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O BWUHENPAEMNGQJ-ZDLURKLDSA-N 0.000 description 1
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 1
- DKDHTRVDOUZZTP-IFFSRLJSSA-N Thr-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DKDHTRVDOUZZTP-IFFSRLJSSA-N 0.000 description 1
- SIMKLINEDYOTKL-MBLNEYKQSA-N Thr-His-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C)C(=O)O)N)O SIMKLINEDYOTKL-MBLNEYKQSA-N 0.000 description 1
- FKIGTIXHSRNKJU-IXOXFDKPSA-N Thr-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CN=CN1 FKIGTIXHSRNKJU-IXOXFDKPSA-N 0.000 description 1
- ZBKDBZUTTXINIX-RWRJDSDZSA-N Thr-Ile-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZBKDBZUTTXINIX-RWRJDSDZSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- KPNSNVTUVKSBFL-ZJDVBMNYSA-N Thr-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KPNSNVTUVKSBFL-ZJDVBMNYSA-N 0.000 description 1
- GXDLGHLJTHMDII-WISUUJSJSA-N Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(O)=O GXDLGHLJTHMDII-WISUUJSJSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 1
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 1
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 1
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 1
- VIWQOOBRKCGSDK-RYQLBKOJSA-N Trp-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O VIWQOOBRKCGSDK-RYQLBKOJSA-N 0.000 description 1
- LAIUAVGWZYTBKN-VHWLVUOQSA-N Trp-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O LAIUAVGWZYTBKN-VHWLVUOQSA-N 0.000 description 1
- DQDXHYIEITXNJY-BPUTZDHNSA-N Trp-Gln-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N DQDXHYIEITXNJY-BPUTZDHNSA-N 0.000 description 1
- VTHNLRXALGUDBS-BPUTZDHNSA-N Trp-Gln-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VTHNLRXALGUDBS-BPUTZDHNSA-N 0.000 description 1
- AWYXDHQQFPZJNE-QEJZJMRPSA-N Trp-Gln-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N AWYXDHQQFPZJNE-QEJZJMRPSA-N 0.000 description 1
- OENGVSDBQHHGBU-QEJZJMRPSA-N Trp-Glu-Asn Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OENGVSDBQHHGBU-QEJZJMRPSA-N 0.000 description 1
- PHNBFZBKLWEBJN-BPUTZDHNSA-N Trp-Glu-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PHNBFZBKLWEBJN-BPUTZDHNSA-N 0.000 description 1
- CZWIHKFGHICAJX-BPUTZDHNSA-N Trp-Glu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 CZWIHKFGHICAJX-BPUTZDHNSA-N 0.000 description 1
- HLDFBNPSURDYEN-VHWLVUOQSA-N Trp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N HLDFBNPSURDYEN-VHWLVUOQSA-N 0.000 description 1
- KBKTUNYBNJWFRL-UBHSHLNASA-N Trp-Ser-Asn Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O)=CNC2=C1 KBKTUNYBNJWFRL-UBHSHLNASA-N 0.000 description 1
- MBFJIHUHHCJBSN-AVGNSLFASA-N Tyr-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MBFJIHUHHCJBSN-AVGNSLFASA-N 0.000 description 1
- GAYLGYUVTDMLKC-UWJYBYFXSA-N Tyr-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GAYLGYUVTDMLKC-UWJYBYFXSA-N 0.000 description 1
- BARBHMSSVWPKPZ-IHRRRGAJSA-N Tyr-Asp-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BARBHMSSVWPKPZ-IHRRRGAJSA-N 0.000 description 1
- BBSPTGPYIPGTKH-JYJNAYRXSA-N Tyr-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N BBSPTGPYIPGTKH-JYJNAYRXSA-N 0.000 description 1
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 1
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 1
- XUIOBCQESNDTDE-FQPOAREZSA-N Tyr-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XUIOBCQESNDTDE-FQPOAREZSA-N 0.000 description 1
- RIVVDNTUSRVTQT-IRIUXVKKSA-N Tyr-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O RIVVDNTUSRVTQT-IRIUXVKKSA-N 0.000 description 1
- JHDZONWZTCKTJR-KJEVXHAQSA-N Tyr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JHDZONWZTCKTJR-KJEVXHAQSA-N 0.000 description 1
- KHPLUFDSWGDRHD-SLFFLAALSA-N Tyr-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O KHPLUFDSWGDRHD-SLFFLAALSA-N 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- GXAZTLJYINLMJL-LAEOZQHASA-N Val-Asn-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GXAZTLJYINLMJL-LAEOZQHASA-N 0.000 description 1
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 1
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 1
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 1
- RKIGNDAHUOOIMJ-BQFCYCMXSA-N Val-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 RKIGNDAHUOOIMJ-BQFCYCMXSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- OPGWZDIYEYJVRX-AVGNSLFASA-N Val-His-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OPGWZDIYEYJVRX-AVGNSLFASA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 1
- MLADEWAIYAPAAU-IHRRRGAJSA-N Val-Lys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MLADEWAIYAPAAU-IHRRRGAJSA-N 0.000 description 1
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 1
- IEBGHUMBJXIXHM-AVGNSLFASA-N Val-Lys-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N IEBGHUMBJXIXHM-AVGNSLFASA-N 0.000 description 1
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 1
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- TVGWMCTYUFBXAP-QTKMDUPCSA-N Val-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N)O TVGWMCTYUFBXAP-QTKMDUPCSA-N 0.000 description 1
- YLBNZCJFSVJDRJ-KJEVXHAQSA-N Val-Thr-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O YLBNZCJFSVJDRJ-KJEVXHAQSA-N 0.000 description 1
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- DDBMQDADIHOWIC-UHFFFAOYSA-N aclonifen Chemical compound C1=C([N+]([O-])=O)C(N)=C(Cl)C(OC=2C=CC=CC=2)=C1 DDBMQDADIHOWIC-UHFFFAOYSA-N 0.000 description 1
- 238000012867 alanine scanning Methods 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 229910052786 argon Inorganic materials 0.000 description 1
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 230000010310 bacterial transformation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000010256 biochemical assay Methods 0.000 description 1
- 238000007622 bioinformatic analysis Methods 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- 238000010352 biotechnological method Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000030570 cellular localization Effects 0.000 description 1
- 229920002301 cellulose acetate Polymers 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- NNKKTZOEKDFTBU-YBEGLDIGSA-N cinidon ethyl Chemical compound C1=C(Cl)C(/C=C(\Cl)C(=O)OCC)=CC(N2C(C3=C(CCCC3)C2=O)=O)=C1 NNKKTZOEKDFTBU-YBEGLDIGSA-N 0.000 description 1
- 239000000571 coke Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 235000011655 cotton Nutrition 0.000 description 1
- 238000012272 crop production Methods 0.000 description 1
- 238000012364 cultivation method Methods 0.000 description 1
- 108010004073 cysteinylcysteine Proteins 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 238000006356 dehydrogenation reaction Methods 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000011536 extraction buffer Substances 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- WFZSZAXUALBVNX-UHFFFAOYSA-N flufenpyr Chemical compound O=C1C(C)=C(C(F)(F)F)C=NN1C1=CC(OCC(O)=O)=C(Cl)C=C1F WFZSZAXUALBVNX-UHFFFAOYSA-N 0.000 description 1
- DNUAYCRATWAJQE-UHFFFAOYSA-N flufenpyr-ethyl Chemical group C1=C(Cl)C(OCC(=O)OCC)=CC(N2C(C(C)=C(C=N2)C(F)(F)F)=O)=C1F DNUAYCRATWAJQE-UHFFFAOYSA-N 0.000 description 1
- 239000011888 foil Substances 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 108091008053 gene clusters Proteins 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 230000037442 genomic alteration Effects 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- ODXMIHPUPFEYDB-UHFFFAOYSA-N germin a Chemical compound OC1=C(O)C(O)=CC(C(=O)OC2C(C3OC(=O)C4=CC(O)=C(O)C(O)=C4C4=C(O)C(O)=C(O)C=C4C(=O)OCC3OC2OC(=O)C=2C=C(OC=3C(=CC(O)=C(O)C=3O)C(=O)OC3C4OC(=O)C5=CC(O)=C(O)C(O)=C5C5=C(O)C(O)=C(O)C=C5C(=O)OC4C4OC(=O)C5=CC(O)=C(O)C(O)=C5C5=C(O)C(O)=C(O)C=C5C(=O)OCC4O3)C(O)=C(O)C=2)OC(=O)C=2C=C(O)C(O)=C(O)C=2)=C1 ODXMIHPUPFEYDB-UHFFFAOYSA-N 0.000 description 1
- 150000008131 glucosides Chemical group 0.000 description 1
- 108010008118 glutamyl-leucyl-valyl-isoleucyl-serine Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 238000000227 grinding Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- YAMHXTCMCPHKLN-UHFFFAOYSA-N imidazolidin-2-one Chemical compound O=C1NCCN1 YAMHXTCMCPHKLN-UHFFFAOYSA-N 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000002015 leaf growth Effects 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- MJGFBOZCAJSGQW-UHFFFAOYSA-N mercury sodium Chemical compound [Na].[Hg] MJGFBOZCAJSGQW-UHFFFAOYSA-N 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 108010085203 methionylmethionine Proteins 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- PQLXHQMOHUQAKB-UHFFFAOYSA-N miltefosine Chemical compound CCCCCCCCCCCCCCCCOP([O-])(=O)OCC[N+](C)(C)C PQLXHQMOHUQAKB-UHFFFAOYSA-N 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 210000003739 neck Anatomy 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- WCPAKWJPBJAGKN-UHFFFAOYSA-N oxadiazole Chemical compound C1=CON=N1 WCPAKWJPBJAGKN-UHFFFAOYSA-N 0.000 description 1
- 150000004866 oxadiazoles Chemical class 0.000 description 1
- COWNFYYYZFRNOY-UHFFFAOYSA-N oxazolidinedione Chemical compound O=C1COC(=O)N1 COWNFYYYZFRNOY-UHFFFAOYSA-N 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- JZPKLLLUDLHCEL-UHFFFAOYSA-N pentoxazone Chemical compound O=C1C(=C(C)C)OC(=O)N1C1=CC(OC2CCCC2)=C(Cl)C=C1F JZPKLLLUDLHCEL-UHFFFAOYSA-N 0.000 description 1
- 239000000575 pesticide Substances 0.000 description 1
- 125000000951 phenoxy group Chemical group [H]C1=C([H])C([H])=C(O*)C([H])=C1[H] 0.000 description 1
- 230000000243 photosynthetic effect Effects 0.000 description 1
- 210000000745 plant chromosome Anatomy 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920000053 polysorbate 80 Polymers 0.000 description 1
- 150000004032 porphyrins Chemical class 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- FKLQIONHGSFYJY-UHFFFAOYSA-N propan-2-yl 5-[4-bromo-1-methyl-5-(trifluoromethyl)pyrazol-3-yl]-2-chloro-4-fluorobenzoate Chemical compound C1=C(Cl)C(C(=O)OC(C)C)=CC(C=2C(=C(N(C)N=2)C(F)(F)F)Br)=C1F FKLQIONHGSFYJY-UHFFFAOYSA-N 0.000 description 1
- 239000011546 protein dye Substances 0.000 description 1
- 230000026447 protein localization Effects 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- YXIIPOGUBVYZIW-UHFFFAOYSA-N pyraflufen Chemical compound ClC1=C(OC(F)F)N(C)N=C1C1=CC(OCC(O)=O)=C(Cl)C=C1F YXIIPOGUBVYZIW-UHFFFAOYSA-N 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 230000006950 reactive oxygen species formation Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 238000009331 sowing Methods 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 239000008174 sterile solution Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 150000004867 thiadiazoles Chemical class 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 231100000027 toxicology Toxicity 0.000 description 1
- 150000003918 triazines Chemical class 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 150000003672 ureas Chemical class 0.000 description 1
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 235000020234 walnut Nutrition 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 239000012463 white pigment Substances 0.000 description 1
- 239000000230 xanthan gum Substances 0.000 description 1
- 229920001285 xanthan gum Polymers 0.000 description 1
- 229940082509 xanthan gum Drugs 0.000 description 1
- 235000010493 xanthan gum Nutrition 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H5/00—Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8274—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/04—Plant cells or tissues
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/001—Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/26—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving oxidoreductase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/26—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving oxidoreductase
- C12Q1/32—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving oxidoreductase involving dehydrogenase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y103/00—Oxidoreductases acting on the CH-CH group of donors (1.3)
- C12Y103/03—Oxidoreductases acting on the CH-CH group of donors (1.3) with oxygen as acceptor (1.3.3)
- C12Y103/03004—Protoporphyrinogen oxidase (1.3.3.4)
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2333/00—Assays involving biological materials from specific organisms or of a specific nature
- G01N2333/90—Enzymes; Proenzymes
- G01N2333/902—Oxidoreductases (1.)
- G01N2333/90206—Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2430/00—Assays, e.g. immunoassays or enzyme assays, involving synthetic organic compounds as analytes
- G01N2430/20—Herbicides, e.g. DDT
Abstract
본 발명은 생명 공학에 관한 것이고, 프로토포르피리노겐 옥시다제-저해제 제초제에 대한 내성을 부여하기 위한 신규한 재조합 DNA 분자 및 조작된 단백질을 제공한다. 본 발명은 또한, 재조합 DNA 분자를 함유하는 제초제 내성 형질전환 식물, 종자, 세포, 및 식물 부분뿐만 아니라 이를 사용하는 방법을 제공한다.
Description
관련 출원에 대한 상호 참조
본 출원은 2015년 8월 3일자로 출원된 미국 가출원 제62/200,428호의 우선권의 이익을 주장하며, 이러한 문헌의 개시 내용은 전문이 본 명세서에 참고로 포함된다.
서열 목록의 포함
69.4 KB(MS-윈도우즈에서 측정됨)이고 2016년 7월 27일자로 생성된 파일명 MONS383WO_ST25.txt에 포함된 서열 목록은 본 명세서와 함께 전자식 제출에 의해 제출되고 본 명세서에 참고로 포함된다.
발명의 분야
본 발명은 생명 공학 분야에 관한 것이다. 더욱 상세하게는, 본 발명은 프로토포르피리노겐 옥시다제(protoporphyrinogen oxidase)를 억제하는 제초제에 대한 내성을 제공하는 효소를 엔코딩하는 재조합 DNA 분자에 관한 것이다.
농작물 생산은 종종 생명 공학의 방법을 이용하여 생성된 형질전환 형질(transgenic trait)을 이용한다. 이식 유전자(transgene)로서도 알려진 이종 유전자(heterologous gene)는 형질전환 형질을 생성하기 위해 식물에 도입될 수 있다. 식물에서 이식 유전자의 발현은 식물 상에 제초제 내성과 같은 형질을 부여한다. 형질전환 제초제 내성 형질의 예는 글리포세이트 내성, 글루포시네이트 내성, 및 디캄바 내성을 포함한다. 통사적으로 사용되는 제초제에 대해 내성이 있는 잡초 종이 증가하면서, 새로운 제초제 내성 형질이 본 분야에서 요구된다. 특별히 고려되는 제초제는 PPO 제초제로서 지칭되는, 프로토포르피리노겐 옥시다제(PPO)를 억제하는 제초제를 포함한다. PPO 제초제는 광범위한 제초제-내성 잡초의 방제(control)를 제공하고, 이에 따라, 이러한 제초제에 대한 내성을 부여하는 형질을, 하나 이상의 제초제-내성 형질(들)과 조합된 작물 체계(cropping system)에서 특히 유용하게 만든다.
프로토포르피리노겐 옥시다제는 엽록소 및 헴(heme) 생합성 경로 둘 모두에서 기능하며, 여기서, 이는 프로토포르피리노겐 IX를 프로토포르피린 IX로 변환시킨다. 프로토포르피린 IX의 생산 후에, 엽록소 및 헴 생합성 경로는 도입되는 상이한 금속 이온(헴의 경우에 철, 및 엽록소의 경우에 마그네슘)에 따라 나누어진다. 이러한 경로의 세그먼트는 원핵생물 및 진핵생물에 걸쳐 보존되며, 원핵생물 및 진핵생물에 걸쳐 발견된 다수의 PPO 효소는 비교적 유사하다. 일부 원핵생물(예를 들어, 시아노박테리아)은 엽록소 및 헴 생산을 위해 이러한 경로를 사용하는 반면, 다른 원핵생물(예를 들어, 에스체리치아 콜라이(Escherichia coli))은 헴 생산을 위해 이러한 경로를 사용한다.
제초제-비민감성 프로토포르피리노겐 옥시다제("iPPO"; herbicide-insensitive protoporphyrinogen oxidase)는 다수의 원핵생물 및 진핵생물로부터 단리되었다. 구조 기준으로, 적어도 세 개의 별개의 PPO 효소 서브클래스가 존재하는 것으로 여겨진다: HemY[Hansson and Hederstedt, "Cloning and characterization of the Bacillus subtilis hemEHY gene cluster, which encodes protoheme IX biosynthetic enzymes" Journal of Bacteriology 174(24):8081-8093 (1992)], HemG[Sasarman, et al.,, "Mapping of a new hem gene in Escherichia coli K12" Microbiology 113:297-303 (1979)], 및 HemJ[Boynton, et al.,, "Discovery of a gene involved in a third bacterial protoporphyrinogen oxidase activity through comparative genomic analysis and functional complementation" Applied and Environmental Microbiology 77(14):4795-4801 (2011)]. 본 발명은 HemG 패밀리의 구성원인 신규한 재조합 iPPO를 제공한다. 20년 간의 연구 및 현재까지 확인된 iPPO의 수에도 불구하고, 재조합 iPPO를 포함하는 형질전환 작물 식물은 아직 상용화되지 않았다. 강력한 잡초 방제 플랫폼은 부분적으로, 제초제 내성 형질 패키지의 지속적인 개발에 의존한다. 이에 따라, 형질전환 작물 형질을 생성시키기 위해 iPPO를 동정하고 사용하는 것은 농업 발전을 나타낸다.
일 양태에서, 본 발명은 서열번호 1 내지 서열번호 20으로부터 선택된 폴리펩타이드 서열과 적어도 85%의 서열 동일성을 갖는 폴리펩타이드를 엔코딩하는 핵산 서열에 작동 가능하게 연결된 이종 프로모터를 포함하는 재조합 DNA 분자로서, 폴리펩타이드는 제초제-비민감성 프로토포르피리노겐 옥시다제 활성을 갖는, 재조합 DNA 분자를 제공한다. 특정 구현예에서, 폴리펩타이드는 서열번호 1 내지 서열번호 20으로부터 선택된 폴리펩타이드 서열과 적어도 약 85%의 서열 동일성, 적어도 약 90%의 서열 동일성, 적어도 95%의 서열 동일성, 적어도 96%의 서열 동일성, 적어도 97%의 서열 동일성, 적어도 98%의 서열 동일성, 또는 적어도 99%의 서열 동일성을 가지고, 제초제-비민감성 프로토포르피리노겐 옥시다제 활성을 갖는다. 일부 구현예에서, 핵산 서열이 서열번호 22 내지 서열번호 63으로 이루어진 군으로부터 선택된, 재조합 DNA 분자가 제공된다. 특정 구현예에서, 재조합 DNA 분자는 서열번호 1 내지 서열번호 20으로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 폴리펩타이드를 엔코딩한다. 이에 따라, 서열번호 1 내지 서열번호 20으로부터 선택된 아미노산 서열의 전장과 적어도 85%의 서열 동일성을 포함하는 재조합 폴리펩타이드로서, 제초제-비민감성 프로토포르피리노겐 옥시다제 활성을 갖는 재조합 폴리펩타이드는 본 발명에 의해 제공된다.
특정 구현예에서, 이종 프로모터, 예를 들어, 식물 세포에서 기능적인 프로모터는 본 발명의 폴리펩타이드 서열과 적어도 85%의 서열 동일성을 갖는 폴리펩타이드, 예를 들어, 서열번호 1 내지 서열번호 20으로부터 선택된 폴리펩타이드 서열을 엔코딩하는 핵산 서열에 작동 가능하게 연결되며, 여기서, 폴리펩타이드는 제초제-비민감성 프로토포르피리노겐 옥시다제 활성을 갖는다. 이러한 얻어진 DNA 분자는 세포 내에 폴리펩타이드를 위치시키도록 기능하는 표적화 서열을 더 포함할 수 있다.
일 양태에서, 본 발명은 본 발명의 재조합 DNA 분자를 포함하는 DNA 작제물을 제공한다. 일 구현예에서, 이러한 DNA 작제물은 본 발명의 핵산 서열에 작동 가능한 연결에서, 세포 내에 폴리펩타이드를 위치시키도록 기능하는 표적화 서열을 포함한다. DNA 분자는 형질전환 식물, 종자, 또는 세포의 게놈에 존재할 수 있다. 특정 구현예에서, 폴리펩타이드는 세포, 식물, 종자, 또는 식물 부분에 제초제 내성을 부여한다.
본 발명의 다른 양태는 본 발명의 재조합 DNA 분자 또는 본 발명의 재조합 폴리펩타이드를 포함하는, 형질전환 식물, 종자, 세포, 또는 식물 부분을 제공한다. 이에 따라, 형질전환 식물, 종자, 세포, 또는 식물 부분은 적어도 하나의 PPO 제초제에 대한 내성을 포함할 수 있고, 즉, 이러한 내성을 나타낼 수 있다. 일부 구현예에서, 형질전환 식물, 종자, 세포, 또는 식물 부분은 추가적인 형질전환 제초제 내성 형질을 포함한다.
본 발명의 다른 양태는 식물, 종자, 세포, 또는 식물 부분에서 본 발명의 재조합 폴리펩타이드를 이종으로 발현하는 것을 포함하는, 식물, 종자, 세포, 또는 식물 부분에 제초제 내성을 부여하는 방법을 제공한다. 본 방법의 일부 구현예에서, 식물, 종자, 세포, 또는 식물 부분은 재조합 폴리펩타이드에 의해 부여되는 프로토포르피리노겐 옥시다제 활성을 포함한다. 일부 구현예에서, 제초제 내성은 아시플루오르펜, 포메사펜, 락토펜, 플루오로글리코펜-에틸, 옥시플루오르펜, 플루미옥사진, 아자페니딘, 카펜트라존-에틸, 설펜트라존, 플루티아세트-메틸, 옥사다이아르길, 옥사다이아존, 피라플루펜-에틸, 사플루페나실 및 S-3100으로 이루어진 군으로부터 선택된 적어도 하나의 PPO 제초제에 대한 것이다.
본 발명의 다른 양태는 a) 식물 세포에 본 발명의 재조합 DNA 분자를 도입하는 단계; 및 b) 이로부터 재조합 DNA 분자를 포함하는 형질전환 식물을 재생시키는 단계를 포함하는, 식물 변형 방법에 관한 것이다. 본 방법은 적어도 하나의 PPO 제초제에 대해 내성이 있는 식물을 선택하는 단계를 더 포함할 수 있다. 본 방법은 또한, 재생된 식물을 그 자체와 또는 제2 식물과 교배시키고 교배로부터 종자를 수집하는 단계를 더 포함할 수 있다.
본 발명의 또 다른 양태는 형질전환 식물 또는 종자를 포함하는 식물 성장 구역을 적어도 하나의 PPO 제초제와 접촉시키는 것을 포함하되, 형질전환 식물 또는 종자는 PPO 제초제에 대해 내성이 있으며, 잡초는 식물 성장 구역에서 방제되는, 식물 성장 구역에서 잡초를 방제하는 방법을 제공한다.
또한, a) 천연 이. 콜라이(E. coli) PPO 효소를 위한 유전자 넉아웃(gene knockout)을 갖는 이. 콜라이 균주를, 후보 제초제 내성 단백질을 엔코딩하는 재조합 DNA 분자를 포함하는 박테리아 발현 벡터로 변형시키고; b) 상기 변형된 이. 콜라이를 헴-무함유(heme-free) 박테리아 배지를 이용하여 성장시키되, 상기 박테리아 배지를 사용한 성장은 프로토포르피리노겐 옥시다제 활성을 갖는 단백질을 동정하는 것을 포함하는, 프로토포르피리노겐 옥시다제 활성을 갖는 단백질을 엔코딩하는 뉴클레오타이드 서열을 동정하는 방법이 제공된다.
또한, 본 발명에 의해, a) 천연 이. 콜라이 PPO 효소를 위한 유전자 넉아웃을 갖는 이. 콜라이 균주를, 재조합 단백질을 엔코딩하는 재조합 DNA 분자를 포함하는 박테리아 발현 벡터로 변형시키고; b) 상기 변형된 이. 콜라이를 적어도 하나의 PPO 제초제를 함유한 박테리아 배지를 사용하여 성장시키되, 박테리아의 성장은 제초제-비민감성 프로토포르피리노겐 옥시다제 활성을 갖는 단백질을 동정하는 것을 포함하는, 제초제-비민감성 프로토포르피리노겐 옥시다제 활성을 갖는 단백질을 엔코딩하는 뉴클레오타이드 서열을 동정하는 방법이 제공된다.
본 발명의 다른 양태는 a) 식물 세포에서 본 발명의 재조합 DNA 분자를 발현시키고; b) PPO 제초제에 대한 내성을 나타내는 식물 세포를 동정하는 것을 포함하는, 제초제 내성 유전자를 스크리닝하는 방법에 관한 것이다.
또한, 본 발명은 a) HemG가 결핍된 박테리아 세포에서 본 발명의 재조합 DNA 분자를 발현시키되, 박테리아 세포는 PPO 제초제의 존재 하에 헴-무함유 배지 중에서 성장되고; b) PPO 제초제에 대한 내성을 나타내는 박테리아 세포를 동정하는 것을 포함하는 제초제 내성 유전자를 스크리닝하는 방법을 제공한다.
다른 양태에서, 본 발명은 a) 본 발명의 재조합 DNA 분자를 포함하는 식물을 얻고; b) 적어도 하나의 다른 제초제에 대한 내성을 포함하는 제2 식물과 형질전환 식물을 교배하고; c) PPO 제초제 및 적어도 하나의 다른 제초제에 대한 내성을 포함하는 상기 교배로부터 형성되는 자손 식물을 선택하되, 적어도 하나의 다른 제초제는 본 발명의 다른 양태인 것을 포함하는, PPO 제초제 및 적어도 하나의 다른 제초제에 대해 내성이 있는 식물을 생산하는 방법을 제공한다.
본 발명은 또한, 다른 양태에서, a) 예를 들어, 본 발명의 DNA 분자를 포함함으로써 PPO 제초제에 대한 내성을 포함하고, 적어도 하나의 다른 제초제에 대한 내성을 포함하는, 본 발명의 식물을 작물 성장 환경에서 재배하고; b) 작물 성장 환경에 PPO 제초제 및 적어도 하나의 다른 제초제를 적용하되, 작물 식물은 PPO 제초제 및 적어도 하나의 다른 제초제에 대해 내성이 있는 것을 포함하는, 제초제 내성 잡초의 발달을 감소시키는 방법을 제공한다. 본 방법의 특정 구현예에서, PPO 제초제는 아시플루오르펜, 포메사펜, 락토펜, 플루오로글리코펜-에틸, 옥시플루오르펜, 플루미옥사진, 아자페니딘, 카펜트라존-에틸, 설펜트라존, 플루티아세트-메틸, 옥사다이아르길, 옥사다이아존, 피라플루펜-에틸, 사플루페나실 및 S-3100으로 이루어진 군으로부터 선택될 수 있다. 본 방법의 일부 구현예에서, 적어도 하나의 다른 제초제는 ACCase 저해제, ALS 저해제, EPSPS 저해제, 합성 옥신(auxin), 광합성 저해제, 글루타민 합성 저해제, HPPD 저해제, PPO 저해제, 및 장쇄 지방산 저해제로 이루어진 군으로부터 선택된다. 특정 구현예에서, ACCase 저해제는 아릴옥시페녹시 프로피오네이트 또는 시클로헥산다이온이거나; ALS 저해제는 설포닐유레아, 이미다졸리논, 트라이아졸로이리미딘, 또는 트라이아졸리논이거나; EPSPS 저해제는 글리포세이트이거나; 합성 옥신은 페녹시 제초제, 벤조산, 카르복실산, 또는 세미카바존이거나; 광합성 저해제는 트리아진, 트라이아지논, 나이트릴, 벤조티아다이아졸, 또는 유레아이거나; 글루타민 합성 저해제는 글루포시네이트이거나; HPPD 저해제는 아이소옥사졸, 피라졸론, 또는 트라이케톤이거나; PPO 저해제는 다이페닐에터, N-페닐프탈이미드, 아릴 트라이아지논, 또는 피리미딘다이온이거나; 장쇄 지방산 저해제는 클로로아세트아마이드, 옥시아세트아마이드, 또는 피라졸이다.
도 1. 하기에 공통 위치(consensus position)를 나타낸, H_N90, H_N20, H_N60, H_N10, H_N30, H_N40, H_N50, H_N70, H_N100, 및 H_N110 단백질 서열(서열번호 1 내지 서열번호 10)의 정렬.
도 2. 시험된 iPPO를 함유한 이. 콜라이의 8시간의 성장에서 측정된 PPO 제초제를 갖는 PPO 박테리아 스크리닝 시스템으로부터의 검정 결과.
도 2. 시험된 iPPO를 함유한 이. 콜라이의 8시간의 성장에서 측정된 PPO 제초제를 갖는 PPO 박테리아 스크리닝 시스템으로부터의 검정 결과.
서열의 간단한 설명
서열번호 1은 H_N90의 아미노산 서열이다.
서열번호 2는 H_N20의 아미노산 서열이다.
서열번호 3은 H_N60의 아미노산 서열이다.
서열번호 4는 H_N10의 아미노산 서열로서, 이는 이. 콜라이 야생형 HemG 프로토포르피리노겐 옥시다제(NCBI 유전자은행 등록번호 WP_021498199)이다.
서열번호 5는 H_N30의 아미노산 서열이다.
서열번호 6은 H_N40의 아미노산 서열이다.
서열번호 7은 H_N50의 아미노산 서열이다.
서열번호 8은 H_N70의 아미노산 서열이다.
서열번호 9는 H_N100의 아미노산 서열이다.
서열번호 10은 H_N110의 아미노산 서열이다.
서열번호 11 내지 서열번호 17은 각각 서열번호 1, 2, 4, 5, 6, 7, 및 9에 상응하는 출발 메티오닌이 결핍된 아미노산 서열이다.
서열번호 18 및 서열번호 19는 서열번호 11의 아미노산 변이체이다.
서열번호 20은 서열번호 17의 아미노산 변이체이다.
서열번호 21은 아마란투스 투베르쿨라투스(Amaranthus tuberculatus)(워터헴프(waterhemp))로부터부터의 야생형 프로토포르피리노겐 옥시다제인, WH의 아미노산 서열이다.
서열번호 22 내지 서열번호 31은 각각, 이. 콜라이 발현을 위해 코돈 최적화된, 서열번호 1 내지 서열번호 10을 엔코딩하는 뉴클레오타이드 서열이다.
서열번호 32 내지 서열번호 41은 각각, 디코트(dicot) 발현을 위해 코돈 최적화된, 서열번호 1 내지 서열번호 10을 엔코딩하는 뉴클레오타이드 서열이다.
서열번호 42 내지 서열번호 48은 각각, 디코트 발현을 위해 코돈 최적화된, 서열번호 11 내지 서열번호 17을 엔코딩하는 뉴클레오타이드 서열이다.
서열번호 49 및 서열번호 52는 각각, 서열번호 11 및 서열번호 12의 뉴클레오타이드 변이체이다.
서열번호 50, 51 및 53은 서열번호 18, 19, 및 20을 엔코딩하는 뉴클레오타이드 서열이다.
서열번호 54 내지 서열번호 63은 각각, 모노코트(monocot) 발현을 위해 코돈 최적화된, 서열번호 1 내지 서열번호 10을 엔코딩하는 뉴클레오타이드 서열이다.
상세한 설명
본 발명의 보다 잘 정의하고 본 발명의 실무에서 당업자를 안내하기 위해 하기 설명 및 정의가 제공된다. 달리 주지하지 않는 한, 용어들은 관련된 분야의 당업자에 의한 통상적인 어법에 따라 이해되어야 한다.
본 발명은 제초제-비민감성 프로토포르피리노겐 옥시다제(iPPO)를 엔코딩하는 신규한, 재조합 DNA 분자 및 단백질을 제공한다. 예를 들어, 본 발명은 일 구현예에서, 세포 및 식물에서 발현을 위한 미생물적으로 유도된 iPPO를 엔코딩하는 벡터 및 발현 카세트를 제공한다. PPO 제초제에 대해 내성이 있는 세포 및 식물을 생산하는 방법이 또한 제공된다. 본 발명은 또한, iPPO를 수득하고 개선시키기 위한 단백질 공학 및 생물정보 툴을 사용하기 위한 방법 및 조성물을 제공한다.
특정 양태에서, 본 발명은 재조합 DNA 분자 및 단백질을 제공한다. 본 명세서에서 사용되는 용어 "재조합"은 유전 공학의 결과이고, 이로써 일반적으로 자연에서 발견되지 않는, 비-천연 발생 DNA, 단백질, 세포, 종자, 또는 유기체를 지칭한다. "재조합 DNA 분자"는 자연에서 자연적으로 발생하지 않고 이로써 인간 개입의 결과인 DNA 서열을 포함하는 DNA 분자, 예를 들어, 서로에 대해 이종인 적어도 두 개의 DNA 분자로 이루어진 DNA 분자이다. 재조합 DNA 분자의 예는 이종 조절 또는 다른 엘리먼트, 예를 들어, 이종 프로모터에 작동 가능하게 연결된 제초제-비민감성 프로토포르피리노겐 옥시다제를 엔코딩하는 본 명세서에 제공된 DNA 분자이다. "재조합 단백질"은 천연으로 발생하지 않고 이로써 인간 개입의 결과인 아미노산 서열을 포함하는 단백질, 예를 들어, 조작된 단백질 또는 키메라 단백질이다. 재조합 세포, 종자, 또는 유기체는 형질전환 DNA를 포함하는 세포, 종자 또는 유기체, 예를 들어, 재조합 DNA 분자를 포함하고 이에 따라, 식물 변형의 결과로서 생산된 형질전환 세포, 종자, 식물, 또는 식물 부분이다.
본 명세서에서 사용되는 용어 "유전 공학(genetic engineering)"은 일반적으로 자연에서 발견되지 않고 이에 따라, 인간 개입을 적용하는 것을 수반하는, 비-천연 DNA, 단백질, 또는 유기체의 생성을 지칭한다. 유전 공학은, 분자 생물학, 단백질 생화학, 박테리아 변형, 및 식물 변형과 같은, 생명 공학의 기술들 중 하나 이상을 사용하여 고안되고 생성된 조작된 DNA, 단백질, 또는 유기체를 생산하기 위해, 사용될 수 있다. 예를 들어, 유전 공학은, 유전자 클로닝, DNA 결찰, 및 DNA 합성과 같은, 분자 생물학의 기술들 중 하나 이상을 사용하여 서로 이종인 적어도 두 개의 DNA 분자를 포함하는 키메라 유전자를 생성시키기 위해 사용될 수 있다. 키메라 유전자는 작동 가능하게 연결된 둘 이상의 이종 DNA 분자, 예를 들어, 유전자 발현 요소에 작동 가능하게 연결된 단백질-코딩 서열, 예를 들어, 운반 펩타이드-코딩 서열 또는 이종 프로모터로 이루어질 수 있다. 유전 공학은, 폴리펩타이드 서열이 부위-유도된 돌연변이 유발을 사용한 단백질 설계 및 무작위 돌연변이 유발 및 DNA 셔플링(shuffling)을 이용한 유도 진화(directed evolution)와 같은, 단백질 공학의 기술들 중 하나 이상을 이용하여 생성된, 조작된 단백질을 생성시키기 위해 사용될 수 있다. 조작된 단백질은 야생형 단백질의 코딩 서열에 대해 하나 이상의 결실, 삽입 또는 치환을 가질 수 있으며, 각 결실, 삽입, 또는 치환은 하나 이상의 아미노산으로 이루어질 수 있다. 다른 구현예에서, 조작된 단백질은 작동 가능하게 연결된 두 개의 이종 펩타이드, 예를 들어, 운반 펩타이드에 작동 가능하게 연결된 효소로 이루어질 수 있다.
본 명세서에서 사용되는 "제초제-비민감성"은 하나 이상의 PPO 제초제(들)의 존재 하에 이의 효소 활성 중 적어도 일부를 유지시키는 프로토포르피리노겐 옥시다제(PPO)의 능력을 의미한다. 프로토포르피리노겐 옥시다제의 효소 활성은 예를 들어, 효소 검정에 의해 당해 분야에 공지된 임의의 수단에 의해 측정될 수 있으며, 여기서, 프로토포르피리노겐 옥시다제의 생성물의 생산 또는 하나 이상의 PPO 제초제(들)의 존재 하에서의 프로토포르피리노겐 옥시다제의 기질의 소비는 형광, 고성능 액체 크로마토그래피(HPLC; high performance liquid chromatography), 또는 질량 분석법(MS; mass spectrometry)을 통해 측정된다. 프로토포르피리노겐 옥시다제의 효소 활성을 측정하기 위한 검정의 다른 예는 박테리아 검정, 예를 들어, 본 명세서에 기술된 성장 검정이며, 이에 의해, 재조합 프로토포르피리노겐 옥시다제는 달리 PPO 활성이 결핍된 박테리아 세포에서 발현되며, 이러한 넉아웃 표현형을 보완하는 재조합 프로토포르피리노겐 옥시다제의 능력이 측정된다. 제초제-비민감성은 특정 제초제의 완전 또는 부분 비민감성일 수 있고, 특정 PPO 제초제에 대한 내성 또는 비민감성의 백분율(%)로서 표현될 수 있다. 본 명세서에서 사용되는 "제초제-비민감성 프로토포르피리노겐 옥시다제" 또는 "iPPO"는 하나 이상의 PPO 제초제(들)의 존재 하에서 제초제-비민감성을 나타낸다.
본 명세서에서 사용되는 "hemG 넉아웃 균주(hemG knockout strain)"는 헴-무함유 성장 배지 상에서 성장할 수 없을 정도로 HemG 활성이 결여되거나 이의 성장이 그밖의 기능성 HemG를 포함하는 동종원성 균주(isogenic strain)에 비해 헴 부재 하에서 검출 가능하게 손상되는, 유기체 또는 유기체의 세포, 예를 들어, 이. 콜라이를 의미한다. 예를 들어, 이. 콜라이의 hemG 넉아웃 균주는 당해 분야의 지식을 고려하여, 예를 들어, 이. 콜라이 hemG 서열을 고려하여 제조될 수 있다[Ecogene Accession No. EG11485; Sasarman et al., "Nucleotide sequence of the hemG gene involved in the protoporphyrinogen oxidase activity of Escherichia coli K12" Can J Microbiol 39:1155-1161, 1993].
본 명세서에서 사용되는 용어 "형질전환 유전자"는 식물 변형 방법과 같은 인간 개입으로 인하여, 유기체의 게놈에 인공적으로 도입된 DNA 분자를 지칭한다. 본 명세서에서 사용되는 용어 "형질전환(transgenic)"은 형질전환 유전자를 포함하는 것을 의미하며, 예를 들어, "형질전환 식물"은 이의 게놈에 형질전환 유전자를 포함하는 식물을 지칭하며, "형질전환 형질(transgenic trait)"은 식물 게놈에 도입된 형질전환 유전자의 존재에 의해 전달되거나 부여되는 특징 또는 표현형을 지칭한다. 이러한 게놈 변경으로 인하여, 형질전환 식물은 관련된 야생형 식물과 명확하게 다른 것이며, 형질전환 형질은 야생형 식물에서 자연적으로 발견되지 않는 형질이다. 본 발명의 형질전환 식물은 본 발명에 의해 제공된 재조합 DNA 분자 및 조작된 단백질을 포함한다.
본 명세서에서 사용되는 용어 "이종(heterologous)"은 다른 공급원로부터 유래되고 이에 따라 일반적으로 본질적으로 관련이 없는, 둘 이상의 항목(item)들 간의 관계를 지칭한다. 예를 들어, 단백질-코딩 재조합 DNA 분자는, 그러한 조합이 일반적으로 자연에서 발견되지 않는 경우에, 작동 가능하게 연결된 프로모터와 관련하여 이종이다. 또한, 특정 재조합 DNA 분자는 특정 세포, 종자 또는 유기체에서 자연적으로 발생하지 않을 때 삽입되는 세포, 종자 또는 유기체와 관련하여 이종일 수 있다.
본 명세서에서 사용되는 용어 "단리된(isolated)"은 이의 자연적인 상태에서 통상적으로 관련이 있는 다른 분자로부터 분자를 적어도 일부 분리하는 것을 지칭한다. 일 구현예에서, 용어 "단리된"은 일반적으로 DNA 분자를 이의 자연적인 상태로 측면에 위치한 핵산으로부터 분리된 DNA 분자를 지칭한다. 예를 들어, 자연적으로 박테리아에 존재하는 단백질을 엔코딩하는 DNA 분자는, 단백질을 엔코딩하는 DNA 분자가 자연적으로 발견되는 박테리아의 DNA 내에 존재하지 않는 경우에, 단리된 DNA 분자일 것이다. 이에 따라, 예를 들어, 재조합 DNA 또는 식물 변형 기술의 결과로서, 본질적으로 관련되지 않은 하나 이상의 다른 DNA 분자(들)에 융합되거나 작동 가능하게 연결된 DNA 분자는 본 명세서에서 단리된 것으로 여겨진다. 이러한 분자는 숙주 세포의 염색체에 통합되거나 다른 DNA 분자와 함께 핵산 용액에 존재하는 경우에도 단리된 것으로 여겨진다.
본 명세서에서 사용되는 용어 "단백질-코딩 DNA 분자"는 단백질을 엔코딩하는 뉴클레오타이드 서열을 포함하는 DNA 분자를 지칭한다. "단백질-코딩 서열"은 단백질을 엔코딩하는 DNA 서열을 의미한다. "서열"은 뉴클레오타이드 또는 아미노산의 순차적 배열을 의미한다. 단백질-코딩 서열의 경계는 5'-말단에서의 번역 출발 코돈 및 3'-말단에서의 번역 정지 코돈에 의해 결정될 수 있다. 단백질-코딩 분자는 단백질 서열을 엔코딩하는 DNA 서열을 포함할 수 있다. 본 명세서에서 사용되는 "형질전환 유전자 발현", "형질전환 유전자를 발현하는", "단백질 발현", 및 "단백질을 발현하는"은 DNA 분자를 메신저 RNA(mRNA)로 전사하고 mRNA를 궁극적으로 단백질로 폴딩되는 폴리펩타이드 사슬로 번역하는 공정을 통한 단백질의 생산을 의미한다. 단백질-코딩 DNA 분자는 재조합 DNA 분자와 함께 변형된 세포에서 단백질을 발현하는데 사용하기 위한 DNA 작제물에서 이종 프로모터에 작동 가능하게 연결될 수 있다. 본 명세서에서 사용되는 "작동 가능하게 연결된"은, 하나가 다른 하나의 기능에 영향을 미칠 수 있게 하는 방식으로 연결된 두 개의 DNA 분자를 의미한다. 작동 가능하게 연결된 DNA 분자는 단일 인접 분자의 일부일 수 있고, 인접할 수 있거나 인접하지 않을 수 있다. 예를 들어, 프로모터는 DNA 작제물에서 단백질-코딩 DNA 분자와 작동 가능하게 연결되며, 여기서, 두 개의 DNA 분자는 프로모터가 형질전환 유전자의 발현에 영향을 미칠 수 있도록 배열된다.
본 명세서에서 사용되는 "DNA 작제물"은 둘 이상의 이종 DNA 서열을 포함하는 재조합 DNA 분자이다. DNA 작제물은 형질전환 유전자 발현을 위해 유용하고, 벡터 및 플라스미드에 포함될 수 있다. DNA 작제물은 형질전환 식물 및 세포를 생산하기 위해 변형, 즉, 숙주 세포에 이종 DNA의 도입의 목적을 위한 벡터에서 사용될 수 있으며, 이로서 또한, 형질전환 식물, 종자, 세포, 또는 식물 부분의 플라스티드 DNA 또는 게놈 DNA에 함유될 수 있다. 본 명세서에서 사용되는 "벡터"는 박테리아 또는 식물 변형의 목적을 위해 사용될 수 있는 임의의 재조합 DNA 분자를 의미한다. 서열 목록에 기술된 바와 같은 재조합 DNA 분자는 예를 들어, 재조합 DNA 분자에 의해 엔코딩된 조작된 단백질의 발현에 영향을 미치도록 식물에서 기능하는, 유전자 발현 요소에 작동 가능하게 연결된 재조합 DNA 분자를 갖는 작제물의 일부로서 벡터에 삽입될 수 있다. 재조합 DNA 작제물 및 식물 변형 벡터를 제조하고 사용하기 위한 DNA 분자를 조작하는데 유용한 일반적인 방법은 당해 분야에 널리 공지되어 있고, 예를 들어, 문헌[handbooks and laboratory manuals including MR Green and J Sambrook, "Molecular Cloning: A Laboratory Manual" (Fourth Edition) ISBN:978-1-936113-42-2, Cold Spring Harbor Laboratory Press, NY (2012)]에 상세히 기술되어 있다. DNA 작제물을 위한 성분, 또는 DNA 작제물을 포함하는 벡터는 전사 가능한 DNA 서열에 작동 가능하게 연결된 하나 이상의 유전자 발현 구성요소, 예를 들어, 작동 가능하게 연결된 DNA의 발현을 위한 프로모터, 작동 가능하게 연결된 단백질-코딩 DNA 분자, 및 작동 가능하게 연결된 3' 번역되지 않은 영역(UTR; untranslated region)을 포함한다. 본 발명을 실행하는데 유용한 유전자 발현 구성요소는 하기 타입의 구성요소들 중 하나 이상을 포함하지만, 이로 제한되지 않는다: 프로모터, 5' UTR, 인헨서(enhancer), 리더(leader), 시스-작용 구성요소, 인트론(intron), 표적화 서열, 3' UTR, 및 하나 이상의 선택 가능한 마커 형질전환 유전자.
본 발명의 DNA 작제물은 본 발명에 의해 제공된 단백질-코딩 DNA 분자에 작동 가능하게 연결된 프로모터를 포함할 수 있으며, 이에 의해, 프로모터는 재조합 단백질 분자의 발현을 유도한다. 본 발명을 실행하는데 유용한 프로모터는 작동 가능하게 연결된 폴리뉴클레오타이드의 발현을 위한 세포에서 기능하는 것, 예를 들어, 박테리아 또는 식물 프로모터를 포함한다. 식물 프로모터는 다양하고, 당해 분야에 널리 공지되어 있고, 예를 들어, 유도성, 바이러스성, 합성, 구성성, 일시적으로 조절된, 및/또는 시공간적으로 조절된 것을 포함한다.
본 발명의 일 구현예에서, 본 명세서에 제공된 DNA 작제물은 제초제-비민감성 프로토포르피리노겐 옥시다제 활성을 갖는 폴리펩타이드 분자를 엔코딩하는 이종 핵산에 작동 가능하게 연결된 표적화 서열을 포함하며, 이에 의해, 표적화 서열은 세포 내에서 폴리펩타이드 분자를 위치시키는 것을 용이하게 한다. 표적화 서열은 당해 분야에서 신호 서열, 표적화 펩타이드, 위치화 서열, 및 운반 펩타이드로서 알려져 있다. 표적화 서열의 일 예는 엽록체 운반 펩타이드(CTP), 미토콘드리아 표적화 서열(MTS), 또는 이중 엽록체 및 미토콘드리아 표적화 펩타이드이다. 세포 내에 단백질 위치화를 용이하게 함으로써, 표적화 서열은 재조합 단백질의 축적을 증가시키고/거나, 단백질을 단백질 분해로부터 보호하고/하거나, 제초제 내성의 수준을 향상시킬 수 있고, 이에 의해, 제초제 적용 후 형질전환 세포, 종자 또는 유기체에서 손상 수준을 감소시킬 수 있다.
본 발명과 관련하여 사용될 수 있는 CTP 및 다른 표적화 분자는 당해 분야에 공지되어 있고, 아라비도프시스 탈리아나(Arabidopsis thaliana) EPSPS CTP(Klee et al., Mol Gen Genet. 210:437-442, 1987), 페투니아 히브리다(Petunia hybrida) EPSPS CTP(della-Cioppa et al., PNAS 83:6873-6877, 1986), 옥수수 cab-m7 신호 서열(Becker et al., Plant Mol Biol . 20:49-60, 1992; PCT WO 97/41228), 미토콘드리아 예비-서열(예를 들어, Silva Filho et al., Plant Mol Biol 30:769-780, 1996), 및 완두콩 글루타티온 환원효소 신호 서열(Creissen et al., Plant J. 8:167-175, 1995; PCT WO 97/41228)을 포함하지만, 이로 제한되지 않는다.
본 발명의 재조합 DNA 분자는 당해 분야에 공지된 방법에 의해, 완전히 또는 부분적으로, 합성되고 개질될 수 있으며, 여기서, DNA 조작을 위해 유용한 서열(예를 들어, 제한 효소 인식 부위 또는 재조합-기반 클로닝 부위), 식물-선호 서열(예를 들어, 식물-코돈 사용 또는 쿠작(Kozak) 공통 서열), 또는 DNA 작제물 설계를 위해 유용한 서열(예를 들어, 스페이서 또는 링커 서열)을 제공하는 것이 바람직하다. 본 발명은 본 명세서에 제공된 임의의 재조합 DNA 분자 또는 폴리펩타이드 서열과 적어도 70%의 서열 동일성, 적어도 80%의 서열 동일성, 적어도 85%의 서열 동일성, 적어도 90%의 서열 동일성, 적어도 95%의 서열 동일성, 적어도 96%의 서열 동일성, 적어도 97%의 서열 동일성, 적어도 98%의 서열 동일성, 및 적어도 99%의 서열 동일성을 가지고 제초제-비민감성 프로토포르피리노겐 옥시다제 활성을 갖는, 재조합 DNA 분자 및 조작된 단백질을 포함한다. 본 명세서에서 사용되는 용어 "퍼센트 서열 동일성" 또는 "%의 서열 동일성"은, 두 개의 서열이 최적으로 정렬될 때(적절한 뉴클레오타이드 또는 아미노산 삽입, 결실, 또는 비교 윈도우에 대해 총 참조 서열의 20% 미만의 갭(gap)을 가짐), 시험("대상") 서열(또는 이의 상보적인 가닥)과 비교하여, 참조("질의(query)") 서열(또는 이의 상보적인 갇가)의 선형 폴리뉴클레오타이드 또는 폴리펩타이드 서열에서 동일한 뉴클레오타이드 또는 아미노산의 백분율을 지칭한다. 비교 윈도우를 정렬하기 위한 서열의 최적 정렬은 당업자들에게 널리 알려져 있으며 스미스 및 워터먼(Smith and Waterman)의 국소 상동성 알고리즘, 니들먼 및 번치(Needleman and Wunsch)의 상동성 정렬 알고리즘과 같은 도구, 피어슨 및 리프만(Pearson and Lipman)의 유사성 방법에 대한 검색에 의해, 및 디폴트 파라미터를 갖는 GCG® Wisconsin Package®(Accelrys Inc., 미국 샌디에고 소재), MEGAlign (DNAStar, Inc., 위스콘신주 53715, 매디슨 세이트 파크 스트리트 1228), 및 MUSCLE(버전 3.6)(RC Edgar, "MUSCLE: multiple sequence alignment with high accuracy and high throughput" Nucleic Acids Research 32(5):1792-7 (2004))의 서열 분석 소프트웨어 패키지의 일부로서 이용 가능한 GAP, BESTFIT, FASTA, 및 TFASTA와 같은 이러한 알고리즘의 컴퓨터화된 구현에 의해 수행될 수 있다. 시험 서열 및 참조 서열의 정렬된 세그먼트에 대한 "동일성 분율"은 두 개의 정렬된 서열에 의해 공유된 동일 성분의 수를 참조 서열 세그먼트의 성분, 즉, 전체 참조 서열 또는 참조 서열의 보다 작은 정의된 부분의 총 수로 나눈 것이다. 서열 동일성 퍼센트는 동일성 분율에 100을 곱한 것으로서 나타내어진다. 하나 이상의 서열의 비교는 전장 서열 또는 이의 일부에 대해, 또는 더 긴 서열에 대해서 일 수 있다.
조작된 단백질은 야생형 단백질을 변화(즉, 변형)시켜 변형된 특징(들), 예를 들어, 엽록체 또는 미토콘드리아에 대해 표적화된 것과 같은, 특정 세포 위치화 패턴, 또는 유용한 단백질 특징들, 예를 들어, 다른 것들 중에서, 변형된 Vmax, Km, Ki, IC50, 기질 특이성, 저해제/제초제 특이성, 기질 선택성, 파트너 단백질 또는 막과 같은 세포에서 다른 성분들과 상호작용하는 능력, 및 단백질 안정성의 신규한 조합을 가진 신규한 단백질을 생산함으로써 생산될 수 있다. 변형은 단백질의 특정 아미노산 위치에서 이루어질 수 있으며 천연에서(즉, 야생형 단백질에서) 그 위치에서 발견되는 아미노산의 상이한 아미노산으로의 치환일 수 있다. 이에 따라, 본 발명에 의해 제공된 조작된 단백질은 자연에서 발견된 유사한 단백질과 비교하여 하나 이상의 변화된 단백질 특징을 갖는 신규한 단백질을 제공한다. 본 발명의 일 구현예에서, 조작된 단백질은 변화된 단백질 특징, 예를 들어, 유사한 야생형 단백질과 비교하여 하나 이상의 제초제에 대한 감수성 감소를 야기시키거나, 하나 이상의 제초제에 대해 조작된 단백질을 발현시키는 형질전환 식물 상에 제초제 내성을 부여하는 개선된 능력을 야기시키는 특징을 갖는다. 일 구현예에서, 본 발명은 표 1로부터 선택된 적어도 하나의 아미노산 치환을 포함하고, 서열번호 1 내지 서열번호 20을 포함하지만, 이로 제한되지 않는, 본 명세서에 제공된 임의의 조작된 단백질 서열과 적어도 약 70%의 서열 동일성, 약 80%의 서열 동일성, 약 85%의 서열 동일성, 약 90%의 서열 동일성, 약 95%의 서열 동일성, 약 96%의 서열 동일성, 약 97%의 서열 동일성, 약 98%의 서열 동일성, 및 약 99%의 서열 동일성을 갖는, 조작된 단백질, 및 이를 엔코딩하는 재조합 DNA 분자를 제공한다. 아미노산 돌연변이는 단백질에서 단일 아미노산 치환으로서 또는 하나 이상의 다른 돌연변이(들), 예를 들어, 하나 이상의 다른 아미노산 치환(들), 결실들, 또는 첨가들과 조합하여 이루어질 수 있다. 돌연변이는 당업자에게 공지된 임의의 방법에 의해 이루어질 수 있다.
본 명세서에서 사용되는 "야생형"은 자연적으로 발생하는 유사한, 그러나 동일하지 않은 버전(version)을 의미한다. "야생형 DNA 분자" 또는 "야생형 단백질"은 자연-발생적 DNA 분자 또는 단백질의 버전, 즉, 자연에 이미 존재하는 DNA 분자 또는 단백질의 버전이다. 본 발명에 의해 제공된 조작된 단백질과 비교하는데 유용한 야생형 단백질의 예는 아라비도프시스 탈리아나(Arabidopsis thaliana)로부터의 프로토포르피리노겐 옥시다제이다. "야생형 식물"은 형질전환 식물과 동일한 타입의 비-형질전환 식물이며, 그 자체는 제초제 내성 형질을 포함하는 형질전환 식물과는 유전적으로 구별된다. 형질전환 옥수수 식물과의 비교를 위해 유용한 야생형 식물의 예는 비-형질전환 LH244 옥수수(ATCC 수탁번호 PTA-1173) 및 01DKD2 근친교배 옥수수(I294213)(ATCC 수탁번호 PTA-7859)이다. 형질전환 대두 식물에 대하여, 예시적인 비교선은 비-형질전환 A3555 대두(ATCC 수탁번호 PTA-10207)일 것이고, 형질전환 면 식물에 대하여, 예시적인 비교선은 비-형질전환 Coker 130(식물 품종 보호 번호(Plant Variety Protection Number) 8900252)일 것이다.
형질전환 식물 및 제초제
본 발명의 일 양태는 본 발명에 의해 제공된 재조합 DNA 분자 및 조작된 단백질을 포함하는 형질전환 식물 세포, 형질전환 식물 조직, 형질전환 식물, 및 형질전환 종자를 포함한다. 재조합 DNA 분자 및 조작된 단백질을 포함하는 이러한 세포, 조직, 식물 및 종자는 하나 이상의 PPO 제초제(들)에 대한 제초제 내성, 및 선택적으로, 하나 이상의 추가적인 제초제(들)에 대한 내성을 나타낸다.
본 발명과 함께 사용하기 위한 숙주 식물 세포의 변형을 위한 적합한 방법은 DNA를 세포에 도입할 수 있는 거의 모든 방법(예를 들어, 여기서, 재조합 DNA 작제물은 식물 염색체에 안정적으로 통합된다)을 포함하며 당업계에 널리 공지되어 있다. 재조합 DNA 작제물을 식물에 도입하기 위한 예시적이고 널리 사용되는 방법은 아그로박테리움(Agrobacterium) 변형 시스템이며, 이것은 당업자들에게 널리 공지되어 있다. 식물에 재조합 DNA 작제물을 도입하기 위한 다른 예시적인 방법은 부위-지향 통합(site-directed integration)의 방법에 의해 이미 결정된 부위에서 식물 게놈에 재조합 DNA 작제물의 삽입이다. 부위-지향 통합은 예를 들어, 아연-핑거 뉴클레아제, 조작된 또는 천연의 메가뉴클레아제, TALE-엔도뉴클레아제, 또는 RNA-유도 엔도뉴클레아제(예를 들어, CRISPR/Cas9 시스템)에 의해, 당해 분야에 공지된 임의의 방법에 의해 달성될 수 있다. 형질전환 식물은 식물 세포 배양의 방법에 의해 변형된 식물 세포로부터 재생될 수 있다. 이식유전자(즉, 이식유전자의 두 개의 대립형질 카피)에 대해 동형접합성인 형질전환 식물은 단일 이식유전자 대립형질을 함유하는 형질전환 식물, 예를 들어 R0 식물을 자신과 자가 수분(자가 수정)시켜 R1 종자를 생산함으로써 수득될 수 있다. 생산된 R1 종자의 4분의 1은 이식유전자에 대해 동형접합성일 것이다. R1 종자를 발아시키는 것으로부터 성장된 식물은, SNP 검정, DNA 시퀀싱, 또는 접합성 검정이라고 하는 이종접합체와 동형접합체 간의 구별을 가능케 하는 열증폭 검정을 사용하여, 접합성에 대해 시험할 수 있다.
본 명세서에서 사용되는 "PPO 저해제 제초제" 또는 "PPO 제초제"는 헴 및 엽록소에 대한 전구체인 프로토포르피린 IX를 형성시키기 위해 프로토포르피리노겐 IX의 탈수소화를 촉매화하는 프로토포르피리노겐 옥시다제(PPO)의 효소 활성을 표적화하고 억제하는 화학물질이다. 프로토포르피리노겐 옥시다제의 억제는 반응성 산소 종의 형성을 야기시켜, 세포막 파괴를 초래하고, 궁극적으로 민감한 세포의 사망을 초래한다. PPO 제초제는 당해 분야에 널리 공지되어 있고 상업적으로 입수 가능하다. PPO 제초제의 예는 다이페닐에터(예를 들어, 아시플루오르펜, 이의 염 및 에스터, 아클로니펜, 비페녹스, 이의 염 및 에스터, 에톡시펜, 이의 염 및 에스터, 플루오로니트로펜, 푸릴옥시펜, 할로사펜, 클로메톡시펜, 플루오로글리코펜, 이의 염 및 에스터, 락토펜, 이의 염 및 에스터, 옥시플루오르펜, 및 포메사펜, 이의 염 및 에스터); 티아다이아졸(예를 들어, 플루티아세트-메틸 및 티다이아지민); 피리미딘다이온 또는 페닐유라실(예를 들어, 벤즈펜디존, 부타페나실, 에틸 [3-2-클로로-4-플루오로-5-(1-메틸-6-트라이플루오로메틸-2,4-다이옥소-1,2,3,4-테트라하이드로피리미딘-3-일)페녹시]-2-피리딜옥시]아세테이트(CAS 등록 번호 353292-31-6 및 본 명세서에서 S-3100으로서 지칭됨), 플루프로파실, 사플루페나실, 및 티아페나실); 페닐피라졸(예를 들어, 플루아졸레이트, 피라플루펜 및 피라플루펜-에틸); 옥사다이아졸(예를 들어, 옥사다이아르길 및 옥사다이아존); 트라이아졸리논(예를 들어, 아자페니딘, 벤카바존, 카펜트라존, 이의 염 및 에스터, 및 설펜트라존); 옥사졸리딘다이온(예를 들어, 펜톡사존); N-페닐프탈이미드(예를 들어, 시니돈-에틸, 플루미클로라크, 플루미클로라크-펜틸, 및 플루미옥사진); 벤즈옥사지논 유도체(예를 들어, 1,5-다이메틸-6-티옥소-3-(2,2,7-트라이플루오로-3,4-다이하이드로-3-옥소-4-프로프-2-이닐-2H-1,4-벤즈옥사진-6-일)-1,3,5-트리아지난-2,4-다이온); 플루펜피르 및 플루펜피르-에틸; 피라클로닐; 및 프로플루아졸을 포함하지만, 이로 제한되지 않는다. 프로토포르피리노겐 옥시다제 및 본 발명에 의해 제공된 세포, 종자, 식물, 및 식물 부분은 하나 이상의 PPO 제초제(들)에 대한 제초제 내성을 나타낸다.
제초제는 잡초를 방제하기 위한 방법으로서 본 발명에 의해 제공된 식물 및 종자를 포함하는 식물 성장 구역에 적용될 수 있다. 본 발명에 의해 제공된 식물 및 종자는 제초제 내성 형질을 포함하며 그 자체는 하나 이상의 PPO 제초제의 적용에 대해 내성이 있다. 제초제 살포는 권장되는 상업적 비율(1X) 또는 이의 일부 또는 배수, 예를 들어, 권장되는 상업적 비율의 두 배(2X)일 수 있다. 제초제 비율은 제초제 및 포뮬레이션에 따라, 에이커당 파운드당 산 당량(lb ae/에이커) 또는 헥타아르 당 그램 당 산 당량(g ae/ha)으로서, 또는 에이커당 활성 성분 파운드(lb ai/에이커) 또는 헥타아르 당 활성 성분 그램(g ai/ha)으로서 표현될 수 있다. 제초제 적용은 적어도 하나의 PPO 제초제를 포함한다. 식물 성장 구역은 제초제 적용 시 잡초 식물을 포함할 수 있거나 포함하지 않을 수 있다. 잡초를 방제하기 위해 구역에 사용하기 위한 PPO 제초제(들)의 제초 유효량은 성장 시기에 걸쳐 약 0.1X 내지 약 30X 라벨율(label rate)(들)의 범위로 이루어질 수 있다. 일부 예시적인 PPO 제초제에 대한 1X 라벨율은 표 2에 제공된다. 1 에이커는 2.47105 헥타아르에 해당하며, 1 파운드는 453.592 그램에 해당한다. 제초율은 (lb ai/ac) × 1.12 = (kg ai/ha) 및 (kg ai/ha) × 0.89 = (lb ai/ac)로서 영국식과 미터법 간에 변환될 수 있다.
제초제 적용은 순차적일 수 있거나, 수종의 PPO 제초제 또는 임의의 다른 상용성 제초제 중 하나, 둘 또는 조합물과 탱크 혼합될 수 있다. 하나의 제초제 또는 둘 이상의 제초제의 조합한 또는 단독의 다중 적용, 예를 들어, 2회 적용(예를 들어, 파종전 적용 및 발아후 적용 또는 발아전 적용 및 발아후 적용) 또는 3회 적용(예를 들어, 파종전 적용, 발아전 적용, 및 발아후 적용 또는 발아전 적용과 2회의 발아후 적용)가 광범위한 스펙트럼의 쌍자엽 식물 잡초, 단자엽 식물 잡초, 또는 이들 둘 다의 방제를 위해 본 발명의 형질전환 식물을 포함하는 구역에 성장 시기에 걸쳐 사용될 수 있다.
본 명세서에서 사용되는 "내성" 또는 "제초제 내성"은 적용 시에, 제초제의 독성 효과에 저항하는 식물, 종자 또는 세포의 능력을 의미한다. 제초제 내성 작물은 지속적으로 성장하고 적용된 화학물질의 존재에 의해 영향을 받지 않거나 최소로 영향을 받을 수 있다. 본 명세서에서 사용되는 "제초제 내성 형질"은 야생형 식물과 비교하여 식물에 대한 개선된 제초제 내성을 제공하는 형질전환 형질이다. 본 발명의 제초제 내성 형질을 갖도록 생산될 수 있는 고려되는 식물은 예를 들어, 작물 식물, 예를 들어, 다른 것들 중에서 대두(예를 들어, Glycine max), 옥수수(maize), 목화(Gossypium sp.), 및 카놀라를 포함하는 임의의 식물을 포함할 수 있다.
본 발명의 형질전환 식물, 자손, 종자, 식물 세포, 및 식물 부분은 또한 하나 이상의 추가의 형질전환 형질을 함유할 수 있다. 추가의 형질전환 형질은 본 발명에 의해 제공된 재조합 DNA 분자를 포함하는 이식유전자를 함유하는 식물을 추가의 형질전환 형질(들)을 함유하는 다른 식물과 교배함으로써 도입될 수 있다. 본 명세서에서 사용되는 바와 같이, "교배"는 두 개의 개별 식물을 재배하여 자손 식물을 생산함을 의미한다. 이에 따라, 두 개의 식물은 고배되어, 각 부모(parent)로부터 요망되는 형질을 함유하는 자손(progeny)을 생산할 수 있다. 본 명세서에서 사용되는 바와 같이 "자손"은 임의의 세대의 모 식물의 새끼를 의미하며, 형질전환 자손은 본 발명에 의해 제공되고 적어도 하나의 모 식물로부터 유전된 DNA 작제물을 포함한다. 추가의 형질전환 형질(들)은 그 추가의 형질전환 형질(들)을 위한 DNA 작제물을 본 발명에 의해 제공된 재조합 DNA 분자를 포함하는 DNA 작제물(예를 들어, 식물 변형에 사용된 동일한 벡터의 일부로서 존재하는 모든 DNA 작제물)과 공동-변형시킴으로써 또는 추가의 형질(들)을 본 발명에 의해 제공된 DNA 작제물을 포함하는 형질전환 식물에 도입하거나 또는 그 반대로 함으로써(예를 들어, 식물 변형 또는 형질전환 식물 또는 식물 세포 상의 게놈 편집(genome editing)의 임의의 방법을 사용함으로써) 도입될 수 있다. 이러한 추가의 형질전환 형질은 증가된 내충성, 증가된 용수 효율, 증가된 수율 성능, 증가된 내건성, 증가된 종자 품질, 개선된 영양 품질, 혼성 종자 생산, 및 제초제 내성을 포함하지만, 이에 제한되지 않으며, 여기서 형질은 야생형 식물과 비교하여 측정된다. 예시적인 추가적인 제초제 내성 형질은 하나 이상의 제초제, 예를 들어, 다른 것들 중에서, ACCase 저해제(예를 들어, 아릴옥시페녹시 프로피오네이트 및 시클로헥산다이온), ALS 저해제(예를 들어, 설포닐유레아, 이미다졸리논, 트라이아졸로이리미딘, 및 트라이아졸리논), EPSPS 저해제(예를 들어, 글리포세이트), 합성 옥신(예를 들어, 페녹시, 벤조산, 카르복실산, 세미카바존), 광합성 저해제(예를 들어, 트리아진, 트라이아지논, 나이트릴, 벤조티아다이아졸, 및 유레아), 글루타민 합성 저해제(예를 들어, 글루포시네이트), HPPD 저해제(예를 들어, 아이소옥사졸, 피라졸론, 및 트라이케톤), PPO 저해제(예를 들어, 다이페닐에터, N-페닐프탈이미드, 아릴 트라이아지논, 및 피리미딘다이온), 및 장쇄 지방산 저해제(예를 들어, 클로로아세트아마이드, 옥시아세트아마이드, 및 피라졸)에 대한 형질전환 또는 비-형질전환 내성을 포함할 수 있다. 예시적인 곤충 내성 형질은 다른 것들 중에서, 나비목(Lepidoptera), 딱정벌레목(Coleoptera), 반시목(Hemiptera), 및 동시아목(Homoptera)의 목들 중 하나 이상 내의 하나 이상의 곤충 일원에 대한 내성을 포함할 수 있다. 이러한 추가적인 형질은 당업자에게 널리 알려져 있으며, 예를 들어, 이러한 형질전환 형질의 목록은 미국 농무부(USDA; United States Department of Agriculture)의 동식물 검역소(APHIS; Animal and Plant Health Inspection Service)에 의해 제공된다.
본 발명의 폴리뉴클레오타이드로 변형된 세포, 예를 들어, 발현 작제물은 폴리뉴클레오타이드의 존재 또는 이러한 세포를 형질전환 식물로 재생하기 전 또는 후 이의 엔코딩된 효소 활성에 대해 선택될 수 있다. 이에 따라, 이러한 폴리뉴클레오타이드를 포함하는 형질전환 식물은 예를 들어, 폴리뉴클레오타이드 또는 엔코딩된 효소 활성을 포함하는 형질전환 식물을 동정하고/하거나 그밖에 동정의 대조 식물에 비해 변화된 형질을 나타내기 위해 선택될 수 있다. 이러한 형질은 예를 들어, PPO 제초제에 대해 내성이 있을 수 있다.
본 발명에 의해 제공된 형질전환 형질을 함유하는 형질전환 식물 및 자손은 당업계에 통상적으로 공지된 임의의 재배 방법에서 사용될 수 있다. 둘 이상의 형질전환 형질을 포함하는 식물주에서, 형질전환 형질은 셋 이상의 형질전환 형질을 포함하는 식물주에서 독립적으로 분리되거나, 연결되거나, 둘 다 될 수 있다. 영양 번식과 같이, 모 식물에의 역교배 및 비-형질전환 식물과의 이종교배가 또한 고려된다. 상이한 형질 및 작물에 통상적으로 사용되는 육종 방법의 설명은 당업자들에게 널리 공지되어 있다. 특정 식물 또는 종자에서 이식유전자(들)의 존재를 확인하기 위해, 각종 검정이 수행될 수 있다. 이러한 검정은, 예를 들어, 분자 생물학 검정, 예를 들어, 서던 및 노던 블롯팅, PCR, 및 DNA 시퀀싱; 생화학 검정, 예를 들어, 면역학적 수단(ELISA 및 웨스턴 블롯)에 의한 또는 효소 작용에 의한 단백질 산물의 존재 검출; 식물 부분 검정, 예를 들어, 잎 또는 뿌리 검정; 및 또한, 전체 식물의 표현형 분석을 포함한다.
식물 유전자형에 형질전환 형질의 유전자이입(introgression)은 역교배 전환의 과정의 결과로서 달성된다. 형질전환 형질이 유전자이입되는 식물 유전자형을 역교배 전환된 유전자형, 라인, 근친교배, 또는 혼성이라고 할 수 있다. 유사하게, 요망되는 형질전환 형질이 결핍된 식물 유전자형을 비전환 유전자형, 라인, 근친교배, 또는 혼성이라고 할 수 있다.
본 발명을 상세히 설명하였지만, 첨부된 청구범위에서 정의된 본 발명의 범위를 벗어나지 않으면서, 수정, 변형, 및 균등한 구현예들이 가능하다는 것이 명백할 것이다. 또한, 본 개시내용의 실시예가 비-제한적인 예로서 제공되는 것으로 이해되어야 한다.
실시예
하기 실시예는 본 발명의 구현예를 입증하기 위해 포함된다. 하기 실시예에 개시된 기술은 본 발명의 실행에 있어서 잘 작동하는 것으로 본 발명자들에 의해 밝혀진 기술을 나타내며, 따라서 이의 실행을 위한 바람직한 방식을 구성하는 것으로 간주될 수 있다고 당업자에 의해 인식되어야 한다. 그러나, 당업자는, 본 개시에 비추어, 다수의 변화가 개시된 특정 구현예에서 이루어질 수 있으며 본 발명의 개념, 취지 및 범주로부터 벗어나지 않으면서 비슷하거나 유사한 결과를 여전히 얻을 수 있다는 것을 인식하여야 한다. 보다 구체적으로, 화학적 및 생리학적 둘 다로 관련된 특정 제제는 동일하거나 유사한 결과를 달성하는 것으로 본 명세서에 기재된 제제로 치환될 수 있음을 인지할 것이다. 당업자에게 자명한 이러한 모든 유사한 치환체 및 변형은 첨부된 청구항에 의해 정의된 바와 같이 발명의 취지, 범위 및 개념 내에 있는 것으로 여겨진다.
실시예 1: 미생물
프로토포르피리노겐
옥시다제 발견
신규한 프로토포르피리노겐 옥시다제를 생물정보학 방법 및 신규한 프로토포르피리노겐 옥시다제 박테리아 스크리닝 시스템을 이용하여 미생물 서열 데이터베이스로부터 확인하였다. 이. 콜라이 HemG의 서열(서열번호 4)을 미생물 서열 데이터베이스의 생물정보학적 분석을 위한 출발 서열로서 사용하였다. 생물정보학적 분석은 별개의 박테리아 공급원로부터 HemG PPO 패밀리의 33개의 신규한 추정된 프로토포르피리노겐 옥시다제를 동정하였다. 이러한 추정된 HemG PPO 효소를 엔코딩하는 서열을 계통발생 트리 맵핑(phylogenetic tree mapping)을 이용하여 비교하였고, 상대적으로 다양한 것으로 밝혀졌다. 계통발생 트리에서 개별적으로 독특한 클러스터링된 구성원의 이의 표현으로 인하여 이러한 33개의 그룹으로부터 추가 분석을 위해 10개를 선택하였다.
선택된 10개의 HemG PPO 효소에 대한 코딩 서열을 야생형 DNA 서열에서 발견된 임의의 희귀 코돈을 제거하기 위해 이. 콜라이 발현에 대해 최적화하였다. 10개의 HemG PPO 효소에 대한 이. 콜라이 최적화된 코딩 서열을 이후에, 박테리아 발현 벡터에 클로닝하였다. 워터헴프(waterhemp)(Amaranthus tuberculatus)에서 자연적으로 발견되는 제초제-민감성 PPO 효소를 PPO 기능 및 제초제-민감성 둘 모두에 대한 대조군으로서 사용하기 위해 박테리아 발현 벡터에 클로닝하였다("WH"로서 지칭되고, 서열번호 21로서 제공됨; NCBI 유전자은행 등록번호 ABD52326; Patzoldt, et al. "A codon deletion confers resistance to herbicides inhibiting protoporphyrinogen oxidase" Proceedings of the National Academy of Science USA. 103(33):12329-12334 (2006)). 워터헴프 PPO 효소는 HemG 패밀리 구성원이 아니다. 이. 콜라이에서 자연적으로 발견되는 HemG PPO 효소를 PPO 활성, 및 제초제-민감성에 대한 이의 검정 둘 모두를 위한 대조군으로서 사용하기 위해 박테리아 발현 벡터에 클로닝하였다(H_N10으로서 지칭되고, 서열번호 4로서 제공됨).
프로토포르피리노겐 옥시다제 활성에 대해 재조합 단백질을 시험하고, 이에 따라 ,이러한 것이 기능성 PPO 효소인 것을 확인하기 위해 프로토포르피리노겐 옥시다제 박테리아 스크리닝 시스템을 생성하였다. 이러한 스크리닝 시스템은 이. 콜라이 PPO 효소(서열번호 4)에 대한 유전자 넉아웃을 함유한 이. 콜라이 균주에서 기능적 구조 분석(functional rescue assay)을 사용하였다. 사용된 hemG 넉아웃 이. 콜라이 균주는 헴-무함유 박테리아 배지(예를 들어, LB 배지) 상에서 매우 최소한의 성장을 나타내었지만, 박테리아 배지에 자유 헴이 보충될 때 또는 활성 재조합 프로토포르피리노겐 옥시다제를 이. 콜라이에서 발현시켰을 때, 성장이 회복되었다. 이에 따라, hemG 넉아웃 이. 콜라이 균주는, 프로토포르피리노겐 옥시다제 활성에 대해 단백질을 빠르고 용이하게 검정하기 위해 재조합 단백질 발현과 함께 사용될 수 있다.
hemG 넉아웃 이. 콜라이 균주를 10개의 추정된 HemG PPO 효소, 이. 콜라이 HemG PPO 효소, 및 워터헴프 PPO 효소를 엔코딩하는 유전자를 함유하는 박테리아 발현 벡터로 변형시켰다. 이후에, 박테리아를 헴-무함유 박테리아 배지인 LB 배지 플레이트 상에 스트리킹하였다(streak). 재조합 PPO 효소의 발현은 이. 콜라이의 성장을 회복시켜, LB 플레이트 상에서 성장시켰다. LB 플레이트 상에서의 변형된 hemG 넉아웃 이. 콜라이 균주의 성장은, 단백질 서열이 프로토포르피리노겐 옥시다제로서 기능한다는 것을 나타내었다. 10개의 HemG PPO 효소(서열번호 1 내지 서열번호 10), 및 워터헴프 PPO 효소(서열번호 21)는 이러한 검정에서 변형된 hemG 넉아웃 이. 콜라이 균주의 성장을 회복할 수 있고, 이에 따라, 이의 PPO 활성을 확인할 수 있다. 공통 위치(consensus position)를 갖는, PPO 효소의 단백질 서열의 정렬은 도 1에 제공된다. 이러한 검정을 이용하여, 다수의 신규한 또는 조작된 단백질은 프로토포르피리노겐 옥시다제 활성을 확인하고 측정하기 위해 스크리닝될 수 있다.
실시예
2:
프로토포르피리노겐
옥시다제 저해제 비민감성
PPO 제초제에 대해 내성이 있는 신규한 프로토포르피리노겐 옥시다제를 제초제 박테리아 스크리닝 시스템을 이용하여 동정하였다. 이러한 스크리닝 시스템은 PPO 제초제에 대해 민감하지 않은 프로토포르피리노겐 옥시다제를 동정하기 위해 PPO 제초제를 함께 LB 액체 배지 중에서의 hemG 넉아웃 이. 콜라이 균주의 성장 검정을 사용하였다.
hemG 넉아웃 이. 콜라이 균주를 확인된 프로토포르피리노겐 옥시다제 활성을 함유한 박테리아 발현 벡터로 변형시키고, LB 액체 배지에서 배양하였다. 세 가지의 상이한 PPO 화학 서브클래스를 나타내는, 5개의 상이한 PPO 제초제(아시플루오르펜(1 mM), 플루미옥사진(0.5 mM), 락토펜(0.5 mM), 포메사펜(1 mM), 및 S-3100(100 uM)) 중 하나의 정제된 결정질 형태를 배지에 첨가하였다. 재조합 단백질을 발현시키고, 이. 콜라이 성장률을 측정하였다. 성장 곡선(OD600)을 0 내지 24시간까지의 선택된 시점에서 PPO 제초제의 존재 및 부재 하에서 상이한 변이체에 대해 측정하였다. PPO 제초제의 존재 하, LB 배지에서 변형된 hemG 넉아웃 이. 콜라이 균주의 성장은, 이. 콜라이를 변형시키기 위해 사용되는 유전자가 제초제-비민감성 프로토포르피리노겐 옥시다제(iPPO)를 엔코딩하였다는 것을 지시하였다.
PPO 제초제에 대한 비민감성을 시험하기 위해 이러한 검정과 함께 신규한 프로토포르피리노겐 옥시다제를 사용하였다. 서열번호 1 내지 서열번호 10으로서 제공된 10개의 프로토포르피리노겐 옥시다제 모두는 PPO 제초제의 존재 하, LB 배지에서 hemG 넉아웃 이. 콜라이 균주에 대한 일반 성장률을 제공하는 것으로 확인되었는데, 이는 이러한 단백질이 제초제-비민감성 프로토포르피리노겐 옥시다제(iPPO)임을 지시하는 것이다(도 2). 워터헴프 PPO(서열번호 21)를 발현시키는 hemG 넉아웃 이. 콜라이 균주는 5개의 PPO 제초제 모두에 대해 민감하였으며, 이는, 검정이 제초제 각각에 대한 민감한 프로토포르피리노겐 옥시다제와 비민감성인 프로토포르피리노겐 옥시다제를 구별할 수 있음을 확인하였다. 이러한 검정을 이용하여, 다수의 신규한 또는 조작된 단백질은 PPO 제초제(들)의 존재 하에서 프로토포르피리노겐 옥시다제 활성을 확인하기 위해 스크리닝될 수 있다.
실시예 3:
프로토포르피리노겐
옥시다제(
PPO
) 효소 검정
각 PPO 효소의 기질 결합 친화력(Km) 및 PPO 제초제의 민감성(IC50)을 측정하기 위해, 프로토포르피리노겐 옥시다제를 효소적으로 특징분석하였다. 워터헴프, 대두, 및 옥수수로부터의 야생형 식물 PPO 효소를 미생물 HemG 프로토포르피리노겐 옥시다제에 대한 비교를 위해 사용하였다(서열번호 1 내지 서열번호 10로서 제공됨).
일반적으로 문헌[Grossmann et al., ("The Herbicide Saflufenacil (Kixor™) is a New Inhibitor of Protoporphyrinogen IX Oxidase Activity" Weed Science, 58(1):1-9 (2010)]에 의해 기술된 절차에 의해 백화된 자엽(etiolated cotyledon)(대두, Glycine max), 백화된 잎/초엽(옥수수, Zea mays) 및 접히지 않는 정단 잎(워터헴프, Amaranthus tuberculata)으로부터 황백화 색소체 및 엽록체를 제조하였다. 대두(A3555) 및 옥수수(LH244) 종자를 8 내지 10일 동안 계속 어두운 곳에서 물 비이커에서 촉촉한 발아 페이퍼(Anchor Paper Company, 미국 미네소타 세인트 폴 소재)의 두 개의 시트 사이에 배치하였다. 워터헴프 식물을 온실에서 30일 동안 성장시켰다. 조직을 수거하고, 액체 질소 중에서 몰타르 및 막자로 미세 분말로 그라인딩할 때까지 페이퍼 타월의 촉촉한 시트 사이에 배치하였다. 균질화 완충제(50 mM Tris-HCl, pH 7.4, 500 mM 수크로오스, 1 mM EDTA, 1 mM 마그네슘 클로라이드, 및 2 g/리터 소 혈청 알부민)를 냉동 분말에 4:1(균질화 완충액의 ml 대 새로운 중량 조직의 g)으로 첨가하고, 격렬하게 혼합하고, 4개 층의 미리 습윤화된 Miracloth™(Merck-Millipore, 독일 다름슈타트(Darmstadt, Germany) 소재)을 통해 여과하였다. 여액을 9299 g에서 5분 동안 원심분리하였다. 펠렛을 균질화 완충액 중에서 재현탁하고, 150 g에서 2분 동안 원심분리하였다. 상청액 용액을 4000 g에서 15분 동안 원심분리하였다. 모든 원심분리 단계를 4℃에서 수행하였다. 펠렛(손상되지 않은 플라스티드 분획)을 50 mM Tris-HCl(pH 7.4), 2 mM EDTA 및 20%(v/v) 글리세린에 재현탁하고, -80℃에서 분취액 중에 저장하였다. 플라스티드 제조물에서 전체 단백질을 표준물로서 소 혈청 알부민과 함께 브래드포드 방법(Bradford method)(MM Bradford, "A rapid and sensitive method for the quantitation of microgram quantities of protein utility the principle of protein-dye binding" Analytical Biochemistry, 72:248-254 (1976))에 의해 측정하였다.
선택된 PPO 효소를 이. 콜라이 hemG 넉아웃 세포주에서 발현시켰다. 밤샘 배양물로부터의 박테리아 세포를 사용하여 20 ml의 새로운 배지를 접종하였다. 이러한 배양물을 20℃에서 대략 48시간 동안 진한 배양물로 성장시켰다. 박테리아 세포를 원심분리에 의해 수거하고, 효소 검정이 수행될 때까지 세포 펠렛을 -80℃에서 저장하였다. 냉동된 박테리아 펠렛을 추출 완충액(50 mM Tris-HCl, pH 7.6, 1 mM EDTA & 1 mM MgCl2)에 재현탁하고, 얼음 배쓰에서 사이클 사이에 1분의 휴지 시간을 가지면서 3회의 30초 사이클 동안 초음파처리하였다(Sonics VibraCell™, 미국 코네티컷 뉴타운 소재). 파괴된 세포를 4℃에서 2분 동안 200 g으로 원심분리하고, 추출 완충액으로의 희석 후 PPO 검정을 위해 상청액 용액을 사용하였다. 전체 단백질을 표준물로서 소 혈청 알부민과 함께 브래드포드 방법(1976)에 의해 측정하였다.
프로토포르포리노겐 IX(프로토겐)를 문헌[JM Jacobs and NJ Jacobs("Measurement of Protoporphyrinogen Oxidase Activity" in Current Protocols in Toxicology (1999) 8.5.1-8.5.13, John Wiley & Sons, Inc.]에 기술된 바와 같이 소듐 수은 아말감으로 상업적으로 입수 가능한 프로토포르피린의 환원에 의해 합성하였다. 프로토포르피린(Proto)을 20% 에탄올 중 0.01 N 칼륨 히드록사이드에 첨가하고, 용해될 때까지(약 40분) 어두운 곳에서 교반하였다. 0.8 ml의 부피를 O-링을 포함한 스크류-톱 캡을 구비한 2-ml 폴리프로필렌 바이알에 배치시키고, 약 1 g(스패튤라 팁풀(spatula tipful), 오일 제거)의 소듐 수은 아말감(제품 번호 451908, Sigma-Aldrich, 미주리 세인트 루이스 소재, 오일 중에 저장됨)을 첨가하였다. 튜브를 바로 캡핑하고, 와류 혼합기로 격렬하게 혼합하고, 용액이 UV 광 하에서 더 이상 적색 형광을 나타내지 않을 때까지(약 5분) 캡을 풀어줌으로써 약 30초마다 배출하였다. 반응 바이알에 아르곤을 흘려 보내고, 간단하게 원심분리하여 잔류하는 소듐 아말감을 펠렛화하였다. 상청액 용액을 0.1 M DTT 및 0.5 M Tris-HCl의 용액(pH 7.5)으로 1:1(v/v)로 바로 희석하고, 바이알에 아르곤을 흘려 보내었다. 얻어진 용액을, 분취액이 첨가된 직후에 아르곤을 흘려 보낸 0.5 ml 폴리프로필렌 캡핑된 튜브에 보다 작은 분취액으로 분할하였다. 캡핑된 튜브를 알루미늄 호일로 덮고, -80℃에서 저장하였다. 효소 검정을 위하여, 프로토겐 분취액을 해동시키고, 얼음 상에서 덮어서 저장하고, 같은 날에 사용하였다. 형광 HPLC(문헌[Matsumoto et al, "Porphyrin Intermediate Involved in Herbicidal Action of delta-Aminolevulinic Acid on Duckweed (Lemna paucicostata Hegelm.)" Pesticide Biochem. and Phys. 48:214-221 (1994)]에 기술된 방법)에 의해 측정하는 경우에, 최종 프로토겐 용액(통상적으로 약 1%의 출발 물질) 중 프로토 농도에서 출발 물질 중 프로토 농도를 빼고, 어느 하나의 샘플 중에 유의미한 불순물이 존재하지 않다고 가정함으로써 제조물 중의 프로토겐의 농도를 계산하였다. 이러한 조건 하에서 제조되고 저장된 프로토겐은 적어도 6달 동안 안정하였다.
식물 플라스티드 추출물 및 박테리아 추출물 제조물에서의 PPO 활성을 일반적으로, 문헌[Grossmann. et al. (2010)]에 기술된 바와 같이 측정하였다. 10 마이크로리터의 플라스티드 추출물(40 ㎍ 전체 단백질) 또는 박테리아 추출물(상이한 박테리아 추출물에 대해 16 내지 35 ㎍ 전체 단백질)을 검정 완충액(100 mM Tris-HCl, pH 7.4, 5 mM DTT, 1 mM EDTA 및 0.085% (v/v) Tween 80)에 첨가하였다. S-3100(또한 "SYN-523"으로서 알려짐; 예를 들어, 미국특허공개 US20100062941 A1호)을 아세톤 중에서 제조된 100X 모용액으로부터 2-마이크로리터 부피로서 첨가하였다. 분석-등급 S-3100은 Sumitomo Chemical Company에 의해 제공되었다. 모든 검정을 1%(v/v) 아세톤의 최종 농도로 진행하였다. 추출물(플라스티드 또는 박테리아), 완충액 및 S-3100을, 검정을 개시하기 위해 2 마이크로리터의 프로토겐의 첨가 전에 30℃(식물 추출물) 또는 37℃(박테리아 추출물)에서 5분 동안 인큐베이션하였다. 모든 검정을 96-웰 검정색 폴리스티렌 미세적정 플레이트(Costar® 3925, Corning, Inc., 뉴욕 코닝 소재)에서 200 마이크로리터의 최종 부피로 수행하였다. 모든 웰에 프로토겐 첨가 후(IC50 측정의 위해 3 μM; Km 측정을 위한 변수), 플레이트를 데이터 수집을 개시하기 전에, 30℃(식물 추출물) 또는 37℃(박테리아 추출물)에서 인큐베이션하였다. 시간에 따른 형광을 SpectraMax® M5 다중-모드 마이크로플레이트 판독기(Multi-Mode Microplate Reader)(Molecular Devices, 캘리포니아 서니베일 소재)에서 각각 405 mm 및 630 mm의 여기 파장 및 방출 파장으로 30℃(식물 추출물) 또는 37℃(박테리아 추출물)에서 측정하였다. 검정 혼합물에 열-불활성화된(100℃에서 5분) 추출물을 첨가함으로써 검정 블랭크를 수행하였다.
프로토포르피리노겐 옥시다제의 기질(프로토포르피리노겐) 결합 친화력을 Km으로서 측정하였다. 평가된 각 PPO에 대한 겉보기 Km 값을 SoftPro® 동력학 소프트웨어 패키지(Molecular Devices, 캘리포니아 서니베일 소재)를 이용한 사각 쌍곡선 곡선-피팅(rectangular hyperbola curve-fitting)을 이용하여 계산하였다. PPO 제초제 S-3100에 대한 효소 활성 민감성을 대조 활성의 50% 억제를 제공하는 농도(IC50)로서 측정하였다. 평가된 각 PPO에 대한 S-3100 IC50 값을 PPO 활성에 대한 S-3100 농도의 반 로그 플롯(semi logarithmic plot)으로부터 그래프로 결정하였다.
식물 공급원(워터헴프, 대두, 또는 옥수수)로부터의 PPO 효소 및 미생물 HemG PPO 효소(서열번호 1 내지 서열번호 10)에 대한 Km은 0.3 uM 내지 2.0 uM 범위로, 유사한 것으로 확인되었다. 시험된 세 가지 식물 PPO 효소는 S-3100에 대해 민감하였으며, IC50 값은 각각 0.009, 0.004, 및 0.003 uM이다. 대조적으로, 박테리아 공급원로부터의 PPO 효소(서열번호 1 내지 서열번호 10)는 S-3100에 대해 민감하지 않았으며, IC50 값은 100 uM보다 높다. 데이터는 표 3에 제공된다.
실시예
4:
프로토포르피리노겐 옥시다제의 효소 최적화
신규한 프로토포르피리노겐 옥시다제의 효소 성질을 개선시키거나 변경시키기 위해 단백질 최적화를 사용하였다. 효소를 최적화하기 위해 하나 이상의 단백질 조작 방법을 이용하였다. 단백질 조작 방법의 비-제한적인 예는 알라닌-스캐닝 돌연변이; 상동성-스캐닝 돌연변이; Pro/Gly 스캐닝 돌연변이; 영역 교체 또는 돌연변이; 및 이러한 다양한 기술들의 조합을 포함한다[문헌[M Lehmann and M Wyss, Current Opinion in Biotechnology 12(4):371-375 (2001); B Van den Burg and VGH Eijsink, Current Opinion in Biotechnology 13(4):333-337 (2002); 및 Weiss et al., Proceedings of the National Academy of Sciences USA 97(16):8950-8954 (2000)] 참조]. 조작된 프로토포르피리노겐 옥시다제를 엔코딩하는 DNA 서열을 합성하고, 박테리아 발현 벡터에 클로닝하였다. 실시예 1에 기술된 바와 같이 초기 고-처리량 박테리아 구조 스크린에 대해 hemG 넉아웃 이. 콜라이 균주를 변형시키기 위해 벡터를 사용하였다. hemG 넉아웃 이. 콜라이 균주를 구조하는 조작된 프로토포르피리노겐 옥시다제를 실시예 2에 기술된 바와 같이 박테리아 성장 검정을 이용하여 하나 이상의 PPO 제초제(들)에 대한 민감성에 대해 스크리닝하였다. 대안적으로, 변형된 hemG 넉아웃 이. 콜라이 균주를 PPO 제초제를 함유한 및 이를 함유하지 않는 배지 상에서 플레이팅하였다. PPO 제초제에 대한 내성을 나타내는 조작된 변이체는 박테리아 발현 시스템에서 발현되며, 상세한 생화학적 특징분석은 실시예 3에 기술된 바와 같은 연속 형광측정 검정(continuous fluorimetric assay)으로 정제된 단백질을 사용하여 수행된다. PPO 제초제에 대해 민감하지 않은 조작된 변이체는 식물 변형 벡터에 클로닝, 식물 변형, 및 식물 시험을 위해 선택된다.
실시예
5: 옥수수에서 HemG
PPO
효소의 발현 및 시험
미생물 HemG PPO 효소를 형질전환 옥수수 식물에서 발현시키고, 형질전환 식물을 PPO 제초제 내성에 대해 분석하였다. 서열번호 1 내지 서열번호 20으로서 제공된 미생물 HemG PPO 효소들 중 하나를 엔코딩하는 재조합 DNA 분자를 포함하는 식물 변형 벡터를 작제하였다. PPO 효소를 엔코딩하는 DNA 서열은 5' 단부에, 일반적으로 출발 코돈으로서 알려진, 메티오닌에 대한 코돈을 포함할 수 있거나, 이러한 코돈은 코딩 서열의 5' 단부에 운반 펩타이드 서열의 작동 가능한 연결을 촉진시키기 위해 제거될 수 있다. 아미노-말단에서 메티오닌을 함유한 PPO 효소 단백질 서열의 예는 서열번호 1 내지 서열번호 10으로서 제공된다. 아미노-말단에서 메티오닌이 없는 PPO 효소 단백질 서열의 예는 서열번호 11 내지 서열번호 20으로서 제공된다. 식물 변형을 위하여, 추정된 PPO 효소를 엔코딩하는 뉴클레오타이드 서열은 디코트(dicot) 또는 모노코트(monocot) 발현 중 어느 하나를 위해 최적화된 코돈이다. 표 4는 변형 벡터에서 미생물 HemG PPO 효소의 단백질 및 뉴클레오타이드 서열에 해당하는 서열번호를 제공한다.
두 개의 상이한 표적화 펩타이드(TP; targeting peptide) 서열 및 두 개의 상이한 3' UTR 서열을 갖는 프로모터 플러스(plus) 리더(leader) 플러스 인트론(intron)의 두 가지 상이한 조합을 사용하여 HemG PPO H_N10(서열번호 4)을 발현시키기 위해 4가지의 식물 변형 벡터를 생성하였다. 식물 변형 작제조물은 작제물 1, 6, 11 및 16으로 주석을 달았다. 플란타 시험에서의 옥수수에 대하여, 미성숙 옥수수(LH244) 배아를 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) 및 당해 분야에 공지된 표준 방법을 이용하여 변형시켰다.
형질전환 옥수수 식물을 HemG PPO H_N10(서열번호 4)을 엔코딩하는 유전자를 함유한 식물 변형 작제물 6 및 16을 사용하여 생산하였다. 잎 샘플을 R0 식물로부터 수거하고, PCR에 의해 스크리닝하여 식물 게놈에 삽입된 형질전환 유전자의 복사체의 수를 결정하였다. 단일 복사체(single copy)를 함유한 식물을 자가 수정(selfed)하고 이종교배하여 미래 시험을 위해 각각 R1 및 F1 종자를 생성하였다. 다수의 복사체(다중-복사체)를 함유한 식물을 하기와 같이 살포하였다: (1) 15 g/ha S-3100의 전체 살포를 위해, 대략 V5 성장 스테이지에서 5 g/ha S-3100, 이후, 대략 V7 성장 스테이지에서 10 g/ha S-3100 또는 (2) 대략 V5 성장 스테이지에서 10 g/ha S-3100. 0 내지 100의 스케일(0은 손상이 없음, 및 100은 완전한 작물 사망)의 손상의 평균 백분율을, 각 배치에 대한 최종 처리 후 7일간 평가하였다. 살포된 비-형질전환 LH244 옥수수를 대조군으로서 사용하고, 총 15 g/ha S-3100으로 처리할 때(처리 1) 평균 43.3% 손상, 및 총 10 g/ha S-3100으로 처리할 때(처리 2) 평균 26.7% 손상을 나타내었다. HemG H_N10(서열번호 4)을 발현시키는 형질전환 옥수수 식물은 총 15 g/ha S-3100으로 처리할 때(처리 1) 평균 28.9% 손상, 및 총 10 g/ha S-3100으로 처리할 때(처리 2) 평균 24.2% 손상을 갖는 대조 식물을 능가하였다. 데이터는 표 5에 제공된다.
형질전환 옥수수 식물을 각각 HemG PPO 효소 H_N90(서열번호 1), H_N10(서열번호 4), H_N60(서열번호 3), H_N110(서열번호 10), 및 H_N40(서열번호 6)을 엔코딩하는 유전자를 함유한 식물 변형 작제물 6, 20, 21, 22, 및 23을 사용하여 생산하였다. 이러한 5가지의 작제물은 두 개의 상이한 표적화 펩타이드(TP) 서열, 및 동일한 3' UTR 서열을 갖는, 동일한 프로모터 플러스 리더 플러스 인트론 조합을 갖는다. 잎 샘플을 R0 식물로부터 취하고, PCR에 의해 분석하여 형질전환 유전자 복사체 수를 결정하였다. 작제물당 12개 이하의 독특한 이벤트를 위한 단일 복사체 식물을 포트에 이식하고, 자가 수정하고, 이종 교배하여, 미래 시험을 위해 각각 R1 및 F1 종자를 생산하였다. 다중-복사체 식물 및 추가 단일 복사체 식물을 대략 V5 성장 스테이지에서 40 그램/ha S-3100으로 살포하고, 손상 등급을 처리하고 7일 후에 취하였다. 각 PPO 효소를 발현시키는 모든 식물에 대한 평균 백분율(%) 손상, 및 고도로 내성이 있는 것으로 여겨지는(10% 미만의 손상) 식물의 수는 주지되었으며, 여기서, 각 식물은 독특한 단일 또는 다중-복사체 변형체이다. H_N10(서열번호 4)을 발현시키는 형질전환 옥수수 식물은 39.5%의 전체 평균 손상을 가지고, 시험된 139개의 식물로부터 31개의 고도로 내성이 있는 식물을 생산하였다. H_N60(서열번호 3)을 발현시키는 형질전환 옥수수 식물은 55.8%의 전체 평균 손상을 가지고, 시험된 86개의 식물로부터 19개의 고도로 내성이 있는 식물을 생산하였다. H_N90(서열번호 1)을 발현시키는 형질전환 옥수수 식물은 31.4%의 가장 낮은 전체 평균 손상을 가지고, 시험된 99개의 식물로부터 44개의 고도로 내성이 있는 식물을 생산하였다. H_N40(서열번호 6)을 발현시키는 형질전환 옥수수 식물은 47.0%에서 전체 평균 손상을 가지고, 시험된 98개의 식물로부터 53개의 고도로 내성이 있는 식물과 함께 가장 높은 비율의 고도로 내성이 있는 식물을 생산하였다. H_N110(서열번호 10)을 발현시키는 형질전환 옥수수 식물은 43.0%의 평균 손상을 갖지만, 임의의 고도로 내성이 있는 식물을 생산하지 못한다. 데이터는 표 6에 제공된다.
R0 형질전환 옥수수 데이터는 형질전환 식물에서 발현될 때 5가지의 미생물 HemG PPO 효소s H_N90(서열번호 1), H_N10(서열번호 4), H_N60(서열번호 3), H_N40(서열번호 6), 및 H_N110(서열번호 10)이 감소된 손상률을 생성시키고 되고 이에 따라, PPO 제초제에 작물 내성을 부여함을 나타내었다.
두 개의 작제물 구성들 중 하나에서 H_N10(서열번호 4)을 발현시키는 단일 복사체 R0 식물을 이종 교배시키는 것으로부터 생산된 형질전환 F1 식물을 제초제 내성에 대해 온실에서 시험하였다. 식물을 V3 성장 스테이지에서 40 그램/ha S-3100으로 처리하고, 치료하고 7일 후에 손상 등급을 얻었다. 작제물 6 구성에서 H_N10(서열번호 4)을 발현시키는 형질전환 옥수수 식물은 고도로 내성이 있는 식물(10% 이하 손상)을 생산하는 18개의 이벤트로부터 13개를 야기시켰지만, 작제물 16 구성은 고도로 내성이 있는 식물을 생산하는 이벤트를 야기시키지 않았다.
두 개의 작제물 구성(작제물 6 및 16) 중 하나에서 H_N10(서열번호 4)을 발현시키는 단일 복사체 R0 식물을 이종 교배하는 것으로부터 생산된 형질전환 F1 식물을 제초제 내성에 대한 분야에서 시험하였다. 이러한 F1 집단을 분리하였고(50% 반접합체 및 50% 가치없음(null)), 손상 등급화 이전에 형질전환 식물을 위한 선택을 수행하지 않았다. 이러한 집단에 대한 전체 평균 손상 등급화를 균일 형질전환 집단 보다 더욱 높은 것으로 예상되는데, 왜냐하면, 형질전환 식물로부터 비-형질전환 식물을 식별하기가 어렵기 때문이다. 시험을 2회의 반복 및 작제물당 3회 처리로 2개의 위치에서 수행하였다. 비-형질전환 옥수수 식물을 음성 대조군으로서 사용하였다. 제초제 적용 처리는 하기와 같다: 처리 1은 V2, 이후 (fb) V4 이후(fb) V8에서 0.036 lb ai/에이커 S-3100 적용되었다. 처리 2는 V2 이후 V4 이후 V8에서 0.072 lb ai/에이커 S-3100 적용되었다. 처리 3은 V2 이후 V4 이후 V8에서 0.144 lb ai/에이커 S-3100 적용되었다. 작물 손상 백분율 등급을 처리하고 5 내지 7일 후에 V2 성장 스테이지(CIPV2) 및 V4 성장 스테이지(CIPV4)에서 평가하였다(오류(error) V2 및 오류 V4는 최소 유의성 차이(LSD; the least significant difference)의 절반이다. 작물 손상 등급은 두 위치 모두에 대해 합산되었다. 모든 비-형질전환 식물 및 작제물 16을 사용하여 생성된 이벤트(event)를 갖는 식물은 3회의 처리 각각에 대해 V2 및 V4 제초제 적용 둘 모두 이후에 94.6 내지 99.5% 손상을 나타내었다. 작제물 6을 사용하여 생성된 이벤트를 갖는 식물은 V2 제초제 적용 후 단지 30% 내지 50% 손상을 나타내었고, V4 제초제 적용 이후 손상을 나타내지 않았다. 데이터는 표 7에 제공된다.
F1 형질전환 옥수수 온실(greenhouse) 및 필드(field) 데이터는, 형질전환 식물에서 발현될 때, 미생물 HemG PPO 효소 H_N10(서열번호 4)이 감소된 손상률을 생성시켰고, 이에 따라, 작물에 PPO 제초에 대한 내성을 부여함을 나타내었다.
실시예
6: 대두 식물에서
HemG PPO 효소의 발현 및 시험
미생물 HemG PPO 효소를 형질전환 대두 식물에서 발현시키고, 형질전환 식물을 PPO 제초제 내성에 대해 분석하였다. H_N10(서열번호 4 및 서열번호 13); H_N20(서열번호 12); H_N30(서열번호 14); H_N40(서열번호 15); H_N50(서열번호 16); H_N90(서열번호 11, 18, 19); 및 H_N100(서열번호 17, 20)으로 제공되는 미생물 HemG PPO 효소들 중 하나를 엔코딩하는 재조합 DNA 분자를 포함하는 식물 변형 벡터를 작제화하였다.
대두에서, 절개된 배아(A3555)를 A. 투메파시엔스(A. tumefaciens) 및 당해 분야에 공지된 표준 방법을 이용하여 변형 작제물 1 및 변형 작제물 11로 변형시켰다. 변형 작제물 1 및 변형 작제물 11은 동일한 프로모터 플러스 리더 플러스 인트론 조합, 동일한 3' UTR 서열, 동일한 미생물 HemG PPO H_N10(서열번호 4)을 가지지만, 표적화 펩타이드(TP)서열에 있어서 상이하다. 재생된 R0 형질전환 묘목을 온실에서 성장시켰다. 작제물 11로부터 생산되고 미생물 PPO 효소 H_N10(서열번호 4)을 발현시키는 20개의 단일 복사체 R0 대두 이벤트를 나타내는 식물에 210 g/ha 플루미옥사진(Valor®, Valent U.S.A. Corporation, 캘리포니아 월넛 크릭 소재)을 살포하였다. 제초제를 V3 발달 스테이지에서 3개의 완전히 발달된 삼엽류 잎에 살포하고, 손상 등급을 처리하고 8일 후에 평가하였다. 고도로 내성이 있는(15% 이하 손상) 것으로 여겨지는 식물의 백분율이 주지되었다. 210 g/ha 플루미옥사진의 적용 후에, 비-형질전환 대두 대조 식물은 30%의 평균 손상 등급 및 내성이 없는 식물을 갖는다. 미생물 PPO 효소 H_N10(서열번호 4)을 발현시키는 대두 식물은 22%의 평균 손상 등급을 가지며, 시험된 식물의 9%는 제초제에 대해 고도로 내성이 있었다.
작제물 11로부터 생산되고 미생물 PPO 효소 H_N10(서열번호 4)을 발현시키는 10개의 다중-복사체 R0 대두 이벤트를 나타내는 식물에 5 g/ha S-3100을 살포하였다. 제초제를 V3 발달 스테이지에서 완전히 발달된 삼엽류 잎에 살포하고 손상 등급을 처리하고 8일 후에 획득하였다. 고도로 내성이 있는 것으로 여겨지는(25% 이하 손상) 식물의 백분율을 주지하였다. S-3100(5 g/ha)의 적용 후에, 비-형질전환 대두 대조 식물은 60%의 평균 손상 등급을 가지고, 고도로 내성이 있는 식물은 아니다. 미생물 PPO 효소 H_N10(서열번호 4)을 발현시키는 대두 식물은 47%의 평균 손상 등급을 가지며, 시험된 식물의 30%는 제초제에 대해 고도로 내성이 있었다.
온실에서 단일-복사체 형질전환 R1 대두 식물에 3개의 제초제 적용률 중 하나로 살포하였다: 처리 1은 V4 이후 (fb) R1에서 5 그램 ai/ha S-3100을 적용하였으며; 처리 2는 V4 이후 R1에서 10 그램 ai/ha S-3100을 적하였으며; 처리 3은 V4 이후 R1에서 30 그램 ai/ha S-3100을 적하였다. V2에서 작물 손상 백분율(CIPV2) 등급을 처리하고 10일 후에 평가하였다. 비-형질전환 식물은 89% 내지 100%의 평균 손상 등급을 가지고, R1 성장 스테이지에서 등급에 대해 사용되지 못하였다. 작제물 1로부터 생산되고 미생물 PPO 효소 H_N10(서열번호 4)을 발현시키는 식물은 3% 내지 15.7% 범위의 손상 등급을 가졌다. 데이터는 표 8에 제공된다.
조기 변형 묘목 조직에서 제초제 내성에 대해 형질전환 식물에서 다수의 작제물을 평가하기 위해 고처리량 식물 변형 및 스크리닝 방법을 사용하였다. 이는 작제물 구성 및 PPO 효소의 보다 빠르고 고용량의 스크리닝을 가능하게 하였다.
7개의 미생물 HemG PPO 효소 H_N10(서열번호 13); H_N20(서열번호 12); H_N30(서열번호 14); H_N40(서열번호 15); H_N50(서열번호 16); H_N90(서열번호 11, 18, 19); 및 H_N100(서열번호 17, 20)을 엔코딩하는 유전자를 37개의 상이한 표적화 펩타이드에 작동 가능하게 연결하고, 베이스 식물 변형 벡터에 클로닝하였다. 이것은 유전자 발현을 위해 동일한 프로모터 및 3' UTR 구성요소를 사용하여 37개의 상이한 표적화 펩타이드과 7개의 상이한 HemG PPO 효소의 병렬 비교(side-by-side comparison)를 가능하게 하였다. A. 투메파시엔스 및 당해 분야에 공지된 표준 방법을 사용하여 대두 절개 배아(생식질 A3555)를 변형시키기 위해 이러한 식물 변형 작제물을 사용하였다. 400개의 이식편을 각 작제물에 대해 접종하여 작제물당 12개의 용기를 형성하였다. 멸균 PPO 제초제 용액을 제초제 내성 시험을 위해 사용하였다. 제초제 용액은 작물 오일 농축물(5.0 mL) 중 0.3 g의 S-3100 및 495 mL의 탈이온수로 이루어졌다. 이를 0.45 마이크론 Nalgene® Rapid-Flow™ 조직 배양 필터 유닛(Tissue Culture Filter Unit) 및 계면활성제-부재 셀룰로오스 아세테이트 막 필터 유닛(Surfactant-Free Cellulose Acetate membrane filter unit)(VWR, 미국 펜실베니아 래드너 소재)을 통해 여과하였다. 얻어진 멸균 용액을 적용 전에 흔들어 주었다.
변형하고 5주 후에, 작제물당 12개의 식물 용액 중 4개에 멸균 PPO 제초제 용액을 2회 살포하였다. 이후에, 처리된 묘목을 용기에 넣고, 4일 동안 매일 살포 후 적어도 15시간의 광 노출을 수용하였다. S-3100을 적용하고 4일 종료 후, 처리된 묘목을 사진찍고, 손상에 대한 녹색 착색의 시각적 스케일로 스코어링하였다(녹색 착색은 광-표백된 조직과 비교하여 건강한 광합성 식물 조직의 예시이다). 스코어링 값은 불량한 내성, 높은 손상, 낮은 녹색 착색의 경우에 0이며, 일부 내성, 평균 손상, 중간 정도의 녹색 착색의 경우에 1이며, 양호한 내성, 낮은 손상, 높은 녹색 착색의 경우에 2이다. 각 작제물에 대한 스코어링은 표 9에 제시되어 있으며, 여기서, n.d.는 분석이 수행되지 않음을 지시하는 것이다. 결과는, 고처리량 스크리닝에서, 다수의 작제물이 PPO 제초제에 대한 내성을 제공하였음을 나타낸다.
2의 스코어를 갖는 작제물에 해당하는 살포되지 않은 용기에서의 묘목을 변형 후 대략 7주에 이식하고, 당해 분야에 공지된 표준 방법을 이용하여 R0 식물로서 성장시켰다. 0 및 1의 비-내성 스코어에 해당하는 묘목을 또한, 음성 대조군으로 역할을 하기 위해 성장시켰다. R0 식물을 온실에서 장일 묘포 조건(80℉에서 18시간 낮, 이후 74℉에서 6시간 밤) 하에서 대략 4주 동안 성장시켰다. 11주에, R0 식물에 상술된 동일한 제초제 용액(0.3g의 S-3100)을 2회 살포하였다. 제초제 손상 등급을 처리 후 7일째에 얻었다.
R0 식물에 대한 11주에서의 제초제 내성 적용의 결과는 5주에 고처리량 스크린에서 관찰된 낮은 백분율 손상 등급 스코어를 확인하였다. 30% 이상의 임의의 손상 등급은 비-형질전환 대두 손상 등급과 동일하였다. 몇몇 작제물은 제초제 적용에 대한 매우 양호한 내성을 제공하는 것으로서 나타났다. 예를 들어, PPO H_N90(서열번호 11)을 갖는 TP1은 단지 3% 손상을 가졌으며, PPO H_N30(서열번호 14) 또는 PPO H_N40(서열번호 15)을 갖는 TP1은 단지 5% 손상을 가졌으며; PPO H_N90(서열번호 11)을 갖는 TP20은 단지 5% 손상을 가졌다. 상반되게, PPO H_N90(서열번호 11)을 갖는 TP32는 50% 손상 스코어를 갖는다. 데이터는 표 10에 제공되며, 여기서, n.d.는 분석이 수행되지 않았음을 지시한다.
대두에서 식물 변형 작제물을 추가로 평가하기 위하여, 절개된 배아(A3555)를 A. 투메파시엔스를 갖는 식물 변형 벡터 및 당해 분야에 공지된 표준 방법을 이용하여 변형시켰다. 재생된 R0 형질전환 묘목을 온실에서 성장시키고, 그룹으로 분할하였다. 제초제 내성을 평가하기 위하여 그룹에 그룹당 하나 이상의 PPO 제초제를 살포하였다. 예를 들어, R0 형질전환 식물에 대략 V2-V4 성장 스테이지에서 락토펜을 110g ai/ha(0.09 lb ai/에이커) 또는 220g ai/ha(0.19 lb ai/에이커)의 속도로 살포하였다. 식물을 처리 후 1 내지 14일에 손상에 대해 평가하고, 손상 스코어를 기록하였다. 형질전환 DNA 인서트의 단일 복사체를 갖는 형질전환 식물을 확인하기 위해 잎 샘플을 사용하고, 단지 단일 복사체를 함유하고 제초제 살포 시험을 통과한 R0 식물을 자가 수정하여 R1 종자를 생산하였다.
R1 식물을 온실에서 성장시키고, 그룹으로 분할하였다. 제초제 내성을 평가하기 위해 그룹에 그룹당 하나 이상의 PPO 제초제를 살포하였다. 예를 들어, PPO 제초제 락토펜을 잡초 발아전에(pre-emergent) 및/또는 V2 내지 V6 성장 스테이지에서 220g ai/ha(0.19 lb ai/에이커)의 속도로 적용하였다. 식물을 처리 후 1일 내지 14일 동안 손상에 대해 평가하고, 손상 스코어를 기록하였다. 살포되지 않은 형질전환 식물을 살포되지 않은 야생형 식물과 표현형 비교를 위해 사용하였다.
동종 형질전환 R1 식물을 자가 수정하고 종자를 수집함으로써 R2 식물을 생산하였다. R2 식물을 하나 이상의 필드 위치 또는 온실 검정에서 평가하였다. 제초제 처리를 적용하고, 플롯(plot) 또는 식물을 제초제 적용 후 1일 내지 14일째에 작물 손상에 대해 0 내지 100의 스케일로 등급화하였으며, 0은 손상 없음이며, 100은 완전 작물 사멸이다.
실시예
7: 잎 디스크 검정
잎-디스크 검정을 재조합 PPO 효소를 발현시키는 형질전환 식물에서 제초제 내성의 빠른 및 최소 손상 평가를 위해 사용하였다. 잎 조직을 옥수수 및 대두 식물의 가장 어린 전체-녹색 잎으로부터 샘플링하였다. 5개의 4-mm 직경의 잎 디스크를 플런저(plunger)를 구비한 일회용 생검 펀치(Integra® Miltex®, Inc., 펜실베니아 욕크 소재)를 이용하여 잎 샘플로부터 절단하고, 잎 디스크를 뚜껑을 갖는 24-웰 폴리스티렌 플레이트에서 1 ml의 접종 용액(1 mM MES, pH 6.5, 1% w/v 수크로오스, 1% (v/v) 아세톤) 중에 배치하였다. 제초제 내성 분석을 위하여, S-3100을 접종 용액에, 1 마이크로몰의 최종 농도까지 첨가하였다. 진공 침투를 적용하고, 잎 디스크의 플레이트를 계속 어두운 곳에서 실온(23 내지 24℃)에서 1일 동안 인큐베이션하고, 이후에, 26 내지 27℃에서 오버헤드 형광 및 백열 전구(520 uE) 아래에서 1일(대두) 또는 2일(옥수수) 연속 광 인큐베이션을 수행하였다. 잎 디스크 손상을 이후에, 0(가장 적은 손상) 내지 4(가장 높은 손상)의 스케일로 시각적으로 스코어링하였으며, 보다 낮은 스코어는 PPO 제초제에 대해 보다 양호한 내성을 지시하는 것이다.
작제물 6을 사용하여 생산되고 PPO 효소 H_N10(서열번호 4)을 발현시키는 형질전환 옥수수 식물로부터의 잎 디스크는 0.4의 평균 잎 디스크 스코어를 기초로 하여 상당한 제초제 내성을 나타내었다. 이러한 결과는 작제물 6으로 변형되고 PPO 효소 H_N10(서열번호 4)을 발현시키는 전체 식물에서 관찰된 PPO 제초제 내성과 일치하였다. 작제물 1 및 작제물 11을 사용하여 생산되고 PPO 효소 H_N10(서열번호 4)을 발현시키는 형질전환 대두 식물로부터의 잎 디스크는 작제물 1을 갖는 식물이 0의 손상 등급을 갖는 상당한 제초제 내성을 갖는 반면, 작제물 11을 갖는 식물이 1.6의 손상 등급을 가지며 비-형질전환 식물이 2.6의 손상 등급을 가짐을 나타내었다.
실시예
8: 면화(cotton)에서
HemG PPO 효소의 발현 및 시험
형질전환 면화 식물에서 미생물 HemG PPO 효소를 발현시키며, 형질전환 식물을 PPO 제초제 내성에 대해 분석하였다. 목화에서, 절개된 배아(Coker 130)를 A. 투메파시엔스 및 당해 분야에 공지된 표준 방법을 사용하여 이러한 벡터로 변형시켰다. 재생된 R0 형질전환 묘목을 온실에서 성장시키고, 그룹으로 분할하였다. PPO 제초제(그룹당 하나의 PPO 제초제)를 살포하기 위해 그룹을 사용하여 내성을 평가하였다. 예를 들어, R0 형질전환 묘목에 락토펜에 110g ai/ha(0.09 lb ai/에이커) 또는 220g ai/ha(0.19 lb ai/에이커)의 속도로, 대략 2 내지 4개의 실제 잎 성장 스테이지에서 살포하였다. 식물을 처리하고 1일 내지 14일에 손상에 대해 평가하고, 손상 스코어를 기록하였다. 형질전환 인서트의 단일 복사체를 갖는 형질전환 식물을 확인하기 위해 잎 샘플을 사용하였다. 단지 단일 복사체를 함유하고 제초제 살포 시험을 통과한 R0 식물을 자가 수정하여 R1 종자를 생산하였다.
R1 식물을 온실에서 성장시키고, 그룹으로 분할하였다. 제초제 내성을 평가하기 위해 그룹당 하나 이상의 PPO 제초제를 그룹에 살포하였다. 예를 들어, PPO 제초제 락토펜을 발아 전에 및/또는 두 개의 실제 잎에서 제1 개화 스테이지에서 220g ai/ha(0.19 lb ai/에이커)(1X)의 속도로 적용하였다. 식물을 처리 한후 1일 내지 14일에 손상에 대해 평가하고, 손상 스코어를 기록하였다. 살포되지 않은 형질전환 식물을 살포되지 않은 야생형 식물과 표현형 비교를 위해 사용하였다.
동종 형질전환 R1 식물을 자가 수정하고 종자를 수집함으로써 R2 식물을 생산하였다. R2 식물을 하나 이상의 필드 위치 또는 온실 검정에서 평가하였다. 제초제 처리를 적용하고, 플롯 또는 식물을 제초제 적용 후 1일 내지 14일째에 작물 손상에 대해 0 내지 100의 스케일로 등급화하였으며, 0은 손상 없음이며, 100은 완전 작물 사멸이다.
SEQUENCE LISTING
<110> Monsanto Technology LLC
<120> Methods and Compositions for Herbicide Tolerance in Plants
<130> WO2017/023778
<140> PCT/US2016/044774
<141> 2016-07-29
<150> US 62/200,428
<151> 2015-08-03
<160> 63
<170> PatentIn version 3.5
<210> 1
<211> 179
<212> PRT
<213> Enterobacter cloacae
<400> 1
Met Lys Ala Leu Val Leu Tyr Ser Thr Arg Asp Gly Gln Thr His Ala
1 5 10 15
Ile Ala Ser Tyr Ile Ala Ser Cys Met Lys Glu Lys Ala Glu Cys Asp
20 25 30
Val Ile Asp Leu Thr His Gly Glu His Val Asn Leu Thr Gln Tyr Asp
35 40 45
Gln Val Leu Ile Gly Ala Ser Ile Arg Tyr Gly His Phe Asn Ala Val
50 55 60
Leu Asp Lys Phe Ile Lys Arg Asn Val Asp Gln Leu Asn Asn Met Pro
65 70 75 80
Ser Ala Phe Phe Cys Val Asn Leu Thr Ala Arg Lys Pro Glu Lys Arg
85 90 95
Thr Pro Gln Thr Asn Pro Tyr Val Arg Lys Phe Leu Leu Ala Thr Pro
100 105 110
Trp Gln Pro Ala Leu Cys Gly Val Phe Ala Gly Ala Leu Arg Tyr Pro
115 120 125
Arg Tyr Arg Trp Ile Asp Lys Val Met Ile Gln Leu Ile Met Arg Met
130 135 140
Thr Gly Gly Glu Thr Asp Thr Ser Lys Glu Val Glu Tyr Thr Asp Trp
145 150 155 160
Glu Gln Val Lys Lys Phe Ala Glu Asp Phe Ala Lys Leu Ser Tyr Lys
165 170 175
Lys Ala Leu
<210> 2
<211> 178
<212> PRT
<213> Pantoea ananatis
<400> 2
Met Lys Ala Leu Ile Leu Phe Ser Thr Arg Asp Gly Gln Thr Gln Lys
1 5 10 15
Ile Ala Ser Ala Ile Ala Asp Glu Ile Lys Gly Gln Gln Ser Cys Asp
20 25 30
Val Ile Asn Ile Gln Asp Ala Lys Thr Leu Asp Trp Gln Gln Tyr Asp
35 40 45
Arg Val Leu Ile Gly Ala Ser Ile Arg Tyr Gly His Phe Gln Pro Val
50 55 60
Val Asn Glu Phe Val Lys His Asn Leu Leu Ala Leu Gln Gln Arg Val
65 70 75 80
Ser Gly Phe Phe Ser Val Asn Leu Thr Ala Arg Lys Pro Glu Lys Arg
85 90 95
Ser Pro Glu Thr Asn Ala Tyr Thr Val Lys Phe Leu Ala Gln Ser Pro
100 105 110
Trp Gln Pro Asp Cys Cys Ala Val Phe Ala Gly Ala Leu Tyr Tyr Pro
115 120 125
Arg Tyr Arg Trp Phe Asp Arg Val Met Ile Gln Phe Ile Met Arg Met
130 135 140
Thr Gly Gly Glu Thr Asp Ala Ser Lys Glu Val Glu Tyr Thr Asp Trp
145 150 155 160
Gln Gln Val Gln Arg Phe Ala Arg Asp Phe Ala Gln Leu Pro Gly Lys
165 170 175
Ser Tyr
<210> 3
<211> 177
<212> PRT
<213> Pantoea stewardii
<400> 3
Met Lys Ala Leu Ile Leu Tyr Ser Thr Arg Asp Gly Gln Thr Arg Lys
1 5 10 15
Ile Ala Ser Ser Ile Ala Asp Val Ile Arg Gln Gln Gln Gln Cys Asp
20 25 30
Val Leu Asn Ile Lys Asp Ala Ser Leu Pro Asp Trp Ala Gln Tyr Asp
35 40 45
Arg Val Leu Ile Gly Ala Ser Ile Arg Tyr Gly His Phe Gln Pro Val
50 55 60
Val Asp Lys Phe Val Lys Gln His Leu His Glu Leu Gln Gln Arg Thr
65 70 75 80
Ser Gly Phe Phe Ser Val Asn Leu Thr Ala Arg Lys Pro Glu Lys Arg
85 90 95
Ser Pro Glu Thr Asn Ala Tyr Thr Gln Lys Phe Leu Ala His Ser Pro
100 105 110
Trp Gln Pro Asp Cys Cys Ala Val Phe Ala Gly Ala Leu Tyr Tyr Pro
115 120 125
Arg Tyr Arg Trp Phe Asp Arg Val Met Ile Gln Leu Ile Met Arg Met
130 135 140
Thr Gly Gly Glu Thr Asp Ser Thr Lys Glu Val Glu Tyr Thr Asp Trp
145 150 155 160
Gln Gln Val Ser Thr Phe Ala Asn Asp Phe Ala Gln Leu Pro Gly Lys
165 170 175
Ser
<210> 4
<211> 181
<212> PRT
<213> Escherichia coli
<400> 4
Met Lys Thr Leu Ile Leu Phe Ser Thr Arg Asp Gly Gln Thr Arg Glu
1 5 10 15
Ile Ala Ser Tyr Leu Ala Ser Glu Leu Lys Glu Leu Gly Ile Gln Ala
20 25 30
Asp Val Ala Asn Val His Arg Ile Glu Glu Pro Gln Trp Glu Asn Tyr
35 40 45
Asp Arg Val Val Ile Gly Ala Ser Ile Arg Tyr Gly His Tyr His Ser
50 55 60
Ala Phe Gln Glu Phe Val Lys Lys His Ala Thr Arg Leu Asn Ser Met
65 70 75 80
Pro Ser Ala Phe Tyr Ser Val Asn Leu Val Ala Arg Lys Pro Glu Lys
85 90 95
Arg Thr Pro Gln Thr Asn Ser Tyr Ala Arg Lys Phe Leu Met Asn Ser
100 105 110
Gln Trp Arg Pro Asp Arg Cys Ala Val Ile Ala Gly Ala Leu Arg Tyr
115 120 125
Pro Arg Tyr Arg Trp Tyr Asp Arg Phe Met Ile Lys Leu Ile Met Lys
130 135 140
Met Ser Gly Gly Glu Thr Asp Thr Arg Lys Glu Val Val Tyr Thr Asp
145 150 155 160
Trp Glu Gln Val Ala Asn Phe Ala Arg Glu Ile Ala His Leu Thr Asp
165 170 175
Lys Pro Thr Leu Lys
180
<210> 5
<211> 178
<212> PRT
<213> Erwinia toletana
<400> 5
Met Lys Ala Leu Ile Leu Phe Ser Ser Arg Glu Gly Gln Thr Arg Glu
1 5 10 15
Ile Ala Ser Tyr Ile Ala Asn Ser Ile Lys Glu Glu Met Glu Cys Asp
20 25 30
Val Phe Asn Ile Leu Arg Val Glu Gln Ile Asp Trp Ser Gln Tyr Asp
35 40 45
Arg Val Leu Ile Gly Gly Ser Ile His Tyr Gly His Phe His Pro Ala
50 55 60
Val Ala Lys Phe Val Lys Arg His Leu His Glu Leu Gln Gln Arg Ser
65 70 75 80
Ser Gly Phe Phe Cys Val Asn Leu Thr Ala Arg Lys Ala Asp Lys Arg
85 90 95
Thr Pro Gln Thr Asn Ala Tyr Met Arg Lys Phe Leu Leu Gln Ser Pro
100 105 110
Trp Gln Pro Asp Cys Cys Ala Val Phe Ala Gly Ala Leu Arg Tyr Thr
115 120 125
Arg Tyr Arg Trp Phe Asp Arg Val Met Ile Gln Leu Ile Met Arg Met
130 135 140
Thr Gly Gly Glu Thr Asp Thr Ser Lys Glu Val Glu Tyr Thr Asp Trp
145 150 155 160
Thr Gln Val Ala Arg Phe Ala Gln Glu Phe Ala His Leu Pro Gly Lys
165 170 175
Thr Gln
<210> 6
<211> 179
<212> PRT
<213> Pectobacterium carotovorum
<400> 6
Met Lys Ala Leu Ile Val Phe Ser Ser Arg Asp Gly Gln Thr Arg Ala
1 5 10 15
Ile Ala Ser Tyr Ile Ala Asn Thr Leu Lys Gly Thr Leu Glu Cys Asp
20 25 30
Val Val Asn Val Leu Asn Ala Asn Asp Ile Asp Leu Ser Gln Tyr Asp
35 40 45
Arg Val Ala Ile Gly Ala Ser Ile Arg Tyr Gly Arg Phe His Pro Ala
50 55 60
Val Asn Gln Phe Ile Arg Lys His Leu Thr Ser Leu Gln Gln Leu Pro
65 70 75 80
Ser Ala Phe Phe Ser Val Asn Leu Thr Ala Arg Lys Pro Glu Lys Arg
85 90 95
Thr Ile Gln Thr Asn Ala Tyr Thr Arg Lys Phe Leu Leu Asn Ser Pro
100 105 110
Trp Gln Pro Asp Leu Cys Cys Val Phe Ala Gly Ala Leu Arg Tyr Pro
115 120 125
Arg Tyr Arg Trp Phe Asp Arg Val Met Ile Gln Leu Ile Met Arg Ile
130 135 140
Thr Gly Gly Glu Thr Asp Ser Thr Lys Glu Ile Glu Tyr Thr Asp Trp
145 150 155 160
Gln Gln Val Ala Arg Phe Ala Gln Asp Phe Ala Gln Leu Ala Ala Lys
165 170 175
Asn Pro Ala
<210> 7
<211> 179
<212> PRT
<213> Shimwellia blattae
<400> 7
Met Lys Thr Leu Ile Leu Phe Ser Thr Arg Asp Gly Gln Thr His Lys
1 5 10 15
Ile Ala Arg His Ile Ala Gly Val Leu Glu Glu Gln Gly Lys Ala Cys
20 25 30
Glu Leu Val Asp Leu Leu Gln Pro Gly Glu Pro Asp Trp Ser Thr Val
35 40 45
Glu Cys Val Val Leu Gly Ala Ser Ile Arg Tyr Gly His Phe His Lys
50 55 60
Ser Phe Ile Arg Phe Val Asn Thr His Ala Gln Arg Leu Asn Asn Met
65 70 75 80
Pro Gly Ala Leu Phe Thr Val Asn Leu Val Ala Arg Lys Pro Glu Lys
85 90 95
Gln Ser Pro Gln Thr Asn Ser Tyr Thr Arg Lys Phe Leu Ala Ala Ser
100 105 110
Pro Trp Gln Pro Gln Arg Cys Gln Val Phe Ala Gly Ala Leu Arg Tyr
115 120 125
Pro Arg Tyr Ser Trp Tyr Asp Arg Met Met Ile Arg Leu Ile Met Lys
130 135 140
Met Ala Gly Gly Glu Thr Asp Thr Arg Lys Glu Val Glu Tyr Thr Asp
145 150 155 160
Trp Gln Ser Val Thr Arg Phe Ala Arg Glu Ile Ala Gln Leu Pro Gly
165 170 175
Glu Thr Arg
<210> 8
<211> 178
<212> PRT
<213> Pantoea stewardii
<400> 8
Met Lys Ala Leu Ile Leu Phe Ser Ser Arg Asp Gly Gln Thr Gln Leu
1 5 10 15
Ile Ala Ser Ser Ile Ala Lys Glu Leu Glu Gly Lys Gln Ala Cys Asp
20 25 30
Val Leu Asn Ile Leu Asp Thr Thr Asn Val Glu Trp Thr Gln Tyr Asp
35 40 45
Arg Val Leu Ile Gly Ala Ser Ile Arg Tyr Gly His Phe His Pro Ala
50 55 60
Val Ala Glu Phe Val Lys Arg His Gln Arg Glu Leu Gln Gln Arg Ser
65 70 75 80
Ser Gly Phe Phe Ser Val Asn Leu Thr Ala Arg Lys Pro Glu Lys Arg
85 90 95
Ser Pro Glu Thr Asn Ala Tyr Thr Ala Lys Phe Leu Asn Gln Ser Pro
100 105 110
Trp Gln Pro Asp Cys Cys Ala Val Phe Ala Gly Ala Leu Arg Tyr Pro
115 120 125
Arg Tyr Arg Trp Phe Asp Arg Ile Met Ile Gln Leu Ile Met Arg Met
130 135 140
Thr Gly Gly Glu Thr Asp Ser Ser Lys Glu Val Glu Tyr Thr Asp Trp
145 150 155 160
Gln Gln Val Thr Arg Phe Ala Gln Glu Phe Ala Arg Leu Pro Gly Lys
165 170 175
Thr Ser
<210> 9
<211> 180
<212> PRT
<213> Enterobacter cloacae
<400> 9
Met Lys Thr Leu Ile Leu Phe Ser Thr Arg Asp Gly Gln Thr Arg Glu
1 5 10 15
Ile Ala Ala Phe Leu Ala Ser Glu Leu Lys Glu Gln Gly Ile Tyr Ala
20 25 30
Asp Val Ile Asn Leu Asn Arg Thr Glu Glu Ile Ala Trp Gln Glu Tyr
35 40 45
Asp Arg Val Val Ile Gly Ala Ser Ile Arg Tyr Gly His Phe His Pro
50 55 60
Ala Val Asp Arg Phe Val Lys Lys His Thr Glu Thr Leu Asn Ser Leu
65 70 75 80
Pro Gly Ala Phe Phe Ser Val Asn Leu Val Ala Arg Lys Ala Glu Lys
85 90 95
Arg Thr Pro Gln Thr Asn Ser Tyr Thr Arg Lys Phe Leu Leu Asn Ser
100 105 110
Pro Trp Lys Pro Ala Ala Cys Ala Val Phe Ala Gly Ala Leu Arg Tyr
115 120 125
Pro Arg Tyr Arg Trp Tyr Asp Arg Phe Met Ile Arg Leu Ile Met Lys
130 135 140
Met Thr Gly Gly Glu Thr Asp Thr Arg Lys Glu Val Val Tyr Thr Asp
145 150 155 160
Trp Ser Gln Val Ala Ser Phe Ala Arg Glu Ile Val Gln Leu Thr Arg
165 170 175
Ser Ser Arg Leu
180
<210> 10
<211> 177
<212> PRT
<213> Enterobacter mori
<400> 10
Met Lys Ile Leu Ile Leu Phe Ser Thr Arg Asp Gly Gln Thr Arg Glu
1 5 10 15
Ile Ala Ala Ser Leu Ala Ser Glu Leu Lys Glu Gln Ala Phe Asp Val
20 25 30
Asp Val Val Asn Leu His Arg Ala Glu Asn Ile Ala Trp Glu Glu Tyr
35 40 45
Asp Gly Val Val Ile Gly Ala Ser Ile Arg Tyr Gly His Phe His Ser
50 55 60
Thr Leu Asn Ser Phe Val Lys Lys His Gln Gln Ala Leu Lys Lys Leu
65 70 75 80
Pro Gly Ala Phe Tyr Ser Val Asn Leu Val Ala Arg Lys Pro Glu Lys
85 90 95
Arg Thr Pro Gln Thr Asn Ser Tyr Thr Arg Lys Phe Leu Leu Asp Ser
100 105 110
Pro Trp Gln Pro Asp Leu Ser Ala Val Phe Ala Gly Ala Leu Arg Tyr
115 120 125
Pro Arg Tyr Asn Trp Tyr Asp Arg Ile Met Ile Arg Leu Ile Met Lys
130 135 140
Ile Thr Gly Gly Glu Thr Asp Thr Arg Lys Glu Val Val Tyr Thr Asp
145 150 155 160
Trp Gln Gln Val Thr His Phe Ala His Glu Ile Val Gln Leu Val Arg
165 170 175
Lys
<210> 11
<211> 178
<212> PRT
<213> Enterobacter cloacae
<400> 11
Lys Ala Leu Val Leu Tyr Ser Thr Arg Asp Gly Gln Thr His Ala Ile
1 5 10 15
Ala Ser Tyr Ile Ala Ser Cys Met Lys Glu Lys Ala Glu Cys Asp Val
20 25 30
Ile Asp Leu Thr His Gly Glu His Val Asn Leu Thr Gln Tyr Asp Gln
35 40 45
Val Leu Ile Gly Ala Ser Ile Arg Tyr Gly His Phe Asn Ala Val Leu
50 55 60
Asp Lys Phe Ile Lys Arg Asn Val Asp Gln Leu Asn Asn Met Pro Ser
65 70 75 80
Ala Phe Phe Cys Val Asn Leu Thr Ala Arg Lys Pro Glu Lys Arg Thr
85 90 95
Pro Gln Thr Asn Pro Tyr Val Arg Lys Phe Leu Leu Ala Thr Pro Trp
100 105 110
Gln Pro Ala Leu Cys Gly Val Phe Ala Gly Ala Leu Arg Tyr Pro Arg
115 120 125
Tyr Arg Trp Ile Asp Lys Val Met Ile Gln Leu Ile Met Arg Met Thr
130 135 140
Gly Gly Glu Thr Asp Thr Ser Lys Glu Val Glu Tyr Thr Asp Trp Glu
145 150 155 160
Gln Val Lys Lys Phe Ala Glu Asp Phe Ala Lys Leu Ser Tyr Lys Lys
165 170 175
Ala Leu
<210> 12
<211> 177
<212> PRT
<213> Pantoea ananatis
<400> 12
Lys Ala Leu Ile Leu Phe Ser Thr Arg Asp Gly Gln Thr Gln Lys Ile
1 5 10 15
Ala Ser Ala Ile Ala Asp Glu Ile Lys Gly Gln Gln Ser Cys Asp Val
20 25 30
Ile Asn Ile Gln Asp Ala Lys Thr Leu Asp Trp Gln Gln Tyr Asp Arg
35 40 45
Val Leu Ile Gly Ala Ser Ile Arg Tyr Gly His Phe Gln Pro Val Val
50 55 60
Asn Glu Phe Val Lys His Asn Leu Leu Ala Leu Gln Gln Arg Val Ser
65 70 75 80
Gly Phe Phe Ser Val Asn Leu Thr Ala Arg Lys Pro Glu Lys Arg Ser
85 90 95
Pro Glu Thr Asn Ala Tyr Thr Val Lys Phe Leu Ala Gln Ser Pro Trp
100 105 110
Gln Pro Asp Cys Cys Ala Val Phe Ala Gly Ala Leu Tyr Tyr Pro Arg
115 120 125
Tyr Arg Trp Phe Asp Arg Val Met Ile Gln Phe Ile Met Arg Met Thr
130 135 140
Gly Gly Glu Thr Asp Ala Ser Lys Glu Val Glu Tyr Thr Asp Trp Gln
145 150 155 160
Gln Val Gln Arg Phe Ala Arg Asp Phe Ala Gln Leu Pro Gly Lys Ser
165 170 175
Tyr
<210> 13
<211> 180
<212> PRT
<213> Escherichia coli
<400> 13
Lys Thr Leu Ile Leu Phe Ser Thr Arg Asp Gly Gln Thr Arg Glu Ile
1 5 10 15
Ala Ser Tyr Leu Ala Ser Glu Leu Lys Glu Leu Gly Ile Gln Ala Asp
20 25 30
Val Ala Asn Val His Arg Ile Glu Glu Pro Gln Trp Glu Asn Tyr Asp
35 40 45
Arg Val Val Ile Gly Ala Ser Ile Arg Tyr Gly His Tyr His Ser Ala
50 55 60
Phe Gln Glu Phe Val Lys Lys His Ala Thr Arg Leu Asn Ser Met Pro
65 70 75 80
Ser Ala Phe Tyr Ser Val Asn Leu Val Ala Arg Lys Pro Glu Lys Arg
85 90 95
Thr Pro Gln Thr Asn Ser Tyr Ala Arg Lys Phe Leu Met Asn Ser Gln
100 105 110
Trp Arg Pro Asp Arg Cys Ala Val Ile Ala Gly Ala Leu Arg Tyr Pro
115 120 125
Arg Tyr Arg Trp Tyr Asp Arg Phe Met Ile Lys Leu Ile Met Lys Met
130 135 140
Ser Gly Gly Glu Thr Asp Thr Arg Lys Glu Val Val Tyr Thr Asp Trp
145 150 155 160
Glu Gln Val Ala Asn Phe Ala Arg Glu Ile Ala His Leu Thr Asp Lys
165 170 175
Pro Thr Leu Lys
180
<210> 14
<211> 177
<212> PRT
<213> Erwinia toletana
<400> 14
Lys Ala Leu Ile Leu Phe Ser Ser Arg Glu Gly Gln Thr Arg Glu Ile
1 5 10 15
Ala Ser Tyr Ile Ala Asn Ser Ile Lys Glu Glu Met Glu Cys Asp Val
20 25 30
Phe Asn Ile Leu Arg Val Glu Gln Ile Asp Trp Ser Gln Tyr Asp Arg
35 40 45
Val Leu Ile Gly Gly Ser Ile His Tyr Gly His Phe His Pro Ala Val
50 55 60
Ala Lys Phe Val Lys Arg His Leu His Glu Leu Gln Gln Arg Ser Ser
65 70 75 80
Gly Phe Phe Cys Val Asn Leu Thr Ala Arg Lys Ala Asp Lys Arg Thr
85 90 95
Pro Gln Thr Asn Ala Tyr Met Arg Lys Phe Leu Leu Gln Ser Pro Trp
100 105 110
Gln Pro Asp Cys Cys Ala Val Phe Ala Gly Ala Leu Arg Tyr Thr Arg
115 120 125
Tyr Arg Trp Phe Asp Arg Val Met Ile Gln Leu Ile Met Arg Met Thr
130 135 140
Gly Gly Glu Thr Asp Thr Ser Lys Glu Val Glu Tyr Thr Asp Trp Thr
145 150 155 160
Gln Val Ala Arg Phe Ala Gln Glu Phe Ala His Leu Pro Gly Lys Thr
165 170 175
Gln
<210> 15
<211> 178
<212> PRT
<213> Pectobacterium carotovorum
<400> 15
Lys Ala Leu Ile Val Phe Ser Ser Arg Asp Gly Gln Thr Arg Ala Ile
1 5 10 15
Ala Ser Tyr Ile Ala Asn Thr Leu Lys Gly Thr Leu Glu Cys Asp Val
20 25 30
Val Asn Val Leu Asn Ala Asn Asp Ile Asp Leu Ser Gln Tyr Asp Arg
35 40 45
Val Ala Ile Gly Ala Ser Ile Arg Tyr Gly Arg Phe His Pro Ala Val
50 55 60
Asn Gln Phe Ile Arg Lys His Leu Thr Ser Leu Gln Gln Leu Pro Ser
65 70 75 80
Ala Phe Phe Ser Val Asn Leu Thr Ala Arg Lys Pro Glu Lys Arg Thr
85 90 95
Ile Gln Thr Asn Ala Tyr Thr Arg Lys Phe Leu Leu Asn Ser Pro Trp
100 105 110
Gln Pro Asp Leu Cys Cys Val Phe Ala Gly Ala Leu Arg Tyr Pro Arg
115 120 125
Tyr Arg Trp Phe Asp Arg Val Met Ile Gln Leu Ile Met Arg Ile Thr
130 135 140
Gly Gly Glu Thr Asp Ser Thr Lys Glu Ile Glu Tyr Thr Asp Trp Gln
145 150 155 160
Gln Val Ala Arg Phe Ala Gln Asp Phe Ala Gln Leu Ala Ala Lys Asn
165 170 175
Pro Ala
<210> 16
<211> 178
<212> PRT
<213> Shimwellia blattae
<400> 16
Lys Thr Leu Ile Leu Phe Ser Thr Arg Asp Gly Gln Thr His Lys Ile
1 5 10 15
Ala Arg His Ile Ala Gly Val Leu Glu Glu Gln Gly Lys Ala Cys Glu
20 25 30
Leu Val Asp Leu Leu Gln Pro Gly Glu Pro Asp Trp Ser Thr Val Glu
35 40 45
Cys Val Val Leu Gly Ala Ser Ile Arg Tyr Gly His Phe His Lys Ser
50 55 60
Phe Ile Arg Phe Val Asn Thr His Ala Gln Arg Leu Asn Asn Met Pro
65 70 75 80
Gly Ala Leu Phe Thr Val Asn Leu Val Ala Arg Lys Pro Glu Lys Gln
85 90 95
Ser Pro Gln Thr Asn Ser Tyr Thr Arg Lys Phe Leu Ala Ala Ser Pro
100 105 110
Trp Gln Pro Gln Arg Cys Gln Val Phe Ala Gly Ala Leu Arg Tyr Pro
115 120 125
Arg Tyr Ser Trp Tyr Asp Arg Met Met Ile Arg Leu Ile Met Lys Met
130 135 140
Ala Gly Gly Glu Thr Asp Thr Arg Lys Glu Val Glu Tyr Thr Asp Trp
145 150 155 160
Gln Ser Val Thr Arg Phe Ala Arg Glu Ile Ala Gln Leu Pro Gly Glu
165 170 175
Thr Arg
<210> 17
<211> 179
<212> PRT
<213> Enterobacter cloacae
<400> 17
Lys Thr Leu Ile Leu Phe Ser Thr Arg Asp Gly Gln Thr Arg Glu Ile
1 5 10 15
Ala Ala Phe Leu Ala Ser Glu Leu Lys Glu Gln Gly Ile Tyr Ala Asp
20 25 30
Val Ile Asn Leu Asn Arg Thr Glu Glu Ile Ala Trp Gln Glu Tyr Asp
35 40 45
Arg Val Val Ile Gly Ala Ser Ile Arg Tyr Gly His Phe His Pro Ala
50 55 60
Val Asp Arg Phe Val Lys Lys His Thr Glu Thr Leu Asn Ser Leu Pro
65 70 75 80
Gly Ala Phe Phe Ser Val Asn Leu Val Ala Arg Lys Ala Glu Lys Arg
85 90 95
Thr Pro Gln Thr Asn Ser Tyr Thr Arg Lys Phe Leu Leu Asn Ser Pro
100 105 110
Trp Lys Pro Ala Ala Cys Ala Val Phe Ala Gly Ala Leu Arg Tyr Pro
115 120 125
Arg Tyr Arg Trp Tyr Asp Arg Phe Met Ile Arg Leu Ile Met Lys Met
130 135 140
Thr Gly Gly Glu Thr Asp Thr Arg Lys Glu Val Val Tyr Thr Asp Trp
145 150 155 160
Ser Gln Val Ala Ser Phe Ala Arg Glu Ile Val Gln Leu Thr Arg Ser
165 170 175
Ser Arg Leu
<210> 18
<211> 178
<212> PRT
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 18
Lys Ala Leu Val Leu Tyr Ser Thr Arg Asp Gly Gln Thr His Ala Ile
1 5 10 15
Ala Ser Tyr Ile Ala Ser Cys Met Lys Glu Lys Ala Glu Cys Asp Val
20 25 30
Ile Asp Leu Thr His Gly Glu His Val Asn Leu Thr Gln Tyr Asp Gln
35 40 45
Val Leu Ile Gly Ala Asn Ile Arg Tyr Gly His Phe Asn Ala Val Leu
50 55 60
Asp Lys Phe Ile Lys Arg Asn Val Asp Gln Leu Asn Asn Met Pro Ser
65 70 75 80
Ala Phe Phe Cys Val Asn Leu Thr Ala Arg Lys Pro Glu Lys Arg Thr
85 90 95
Pro Gln Thr Asn Pro Tyr Val Arg Lys Phe Leu Leu Ala Thr Pro Trp
100 105 110
Gln Pro Ala Leu Cys Gly Val Phe Ala Gly Ala Leu Arg Tyr Pro Arg
115 120 125
Tyr Arg Trp Ile Asp Lys Val Met Ile Gln Leu Ile Met Arg Met Thr
130 135 140
Gly Gly Glu Thr Asp Thr Ser Lys Glu Val Glu Tyr Thr Asp Trp Glu
145 150 155 160
Gln Val Lys Lys Phe Ala Glu Asp Phe Ala Lys Leu Ser Tyr Lys Lys
165 170 175
Ala Leu
<210> 19
<211> 172
<212> PRT
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 19
Lys Ala Leu Val Leu Tyr Ser Thr Arg Asp Gly Gln Thr His Ala Ile
1 5 10 15
Ala Ser Tyr Ile Ala Ser Cys Met Lys Glu Lys Ala Glu Cys Asp Val
20 25 30
Ile Asp Leu Thr His Gly Glu His Val Asn Leu Thr Gln Tyr Asp Gln
35 40 45
Val Leu Ile Gly Ala Ser Ile Arg Tyr Gly His Phe Asn Ala Val Leu
50 55 60
Asp Lys Phe Ile Lys Arg Asn Val Asp Gln Leu Asn Asn Met Pro Ser
65 70 75 80
Ala Phe Phe Cys Val Asn Leu Thr Ala Arg Lys Pro Glu Lys Arg Thr
85 90 95
Pro Gln Thr Asn Pro Tyr Val Arg Lys Phe Leu Leu Ala Thr Pro Trp
100 105 110
Gln Pro Ala Leu Cys Gly Val Phe Ala Gly Ala Leu Arg Tyr Pro Arg
115 120 125
Tyr Arg Trp Ile Asp Lys Val Met Ile Gln Leu Ile Met Arg Met Thr
130 135 140
Gly Gly Glu Thr Asp Thr Ser Lys Glu Val Glu Tyr Thr Asp Trp Glu
145 150 155 160
Gln Val Lys Lys Phe Ala Glu Asp Phe Ala Lys Leu
165 170
<210> 20
<211> 179
<212> PRT
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 20
Lys Thr Leu Ile Leu Phe Ser Thr Arg Asp Gly Gln Thr Arg Glu Ile
1 5 10 15
Ala Ala Phe Leu Ala Ser Glu Leu Lys Glu Gln Gly Ile Tyr Ala Asp
20 25 30
Val Ile Asn Leu Asn Arg Thr Glu Glu Ile Ala Trp Gln Glu Tyr Asp
35 40 45
Arg Val Val Ile Gly Ala Ser Ile Arg Tyr Gly His Phe His Pro Ala
50 55 60
Val Asp Arg Phe Val Lys Lys His Thr Glu Thr Leu Asn Ser Leu Pro
65 70 75 80
Gly Ala Phe Phe Ser Val Asn Leu Val Ala Arg Lys Ala Glu Lys Arg
85 90 95
Thr Pro Gln Thr Asn Ser Tyr Thr Arg Lys Phe Leu Leu Asn Ser Pro
100 105 110
Trp Lys Pro Ala Ala Cys Ala Val Phe Ala Gly Ala Leu Arg Tyr Pro
115 120 125
Arg Tyr Arg Trp Tyr Asp Arg Phe Met Ile Arg Leu Ile Met Lys Met
130 135 140
Thr Gly Gly Glu Thr Asp Thr Arg Lys Glu Val Val Tyr Thr Asp Trp
145 150 155 160
Ser Gln Ile Ala Ser Phe Ala Arg Glu Ile Val Gln Leu Thr Arg Ser
165 170 175
Ser Arg Leu
<210> 21
<211> 504
<212> PRT
<213> Amaranthus tuberculatus
<400> 21
Met Gly Asn Ile Ser Glu Arg Glu Glu Pro Thr Ser Ala Lys Arg Val
1 5 10 15
Ala Val Val Gly Ala Gly Val Ser Gly Leu Ala Ala Ala Tyr Lys Leu
20 25 30
Lys Ser His Gly Leu Ser Val Thr Leu Phe Glu Ala Asp Ser Arg Ala
35 40 45
Gly Gly Lys Leu Lys Thr Val Lys Lys Asp Gly Phe Ile Trp Asp Glu
50 55 60
Gly Ala Asn Thr Met Thr Glu Ser Glu Ala Glu Val Ser Ser Leu Ile
65 70 75 80
Asp Asp Leu Gly Leu Arg Glu Lys Gln Gln Leu Pro Ile Ser Gln Asn
85 90 95
Lys Arg Tyr Ile Ala Arg Asp Gly Leu Pro Val Leu Leu Pro Ser Asn
100 105 110
Pro Ala Ala Leu Leu Thr Ser Asn Ile Leu Ser Ala Lys Ser Lys Leu
115 120 125
Gln Ile Met Leu Glu Pro Phe Leu Trp Arg Lys His Asn Ala Thr Glu
130 135 140
Leu Ser Asp Glu His Val Gln Glu Ser Val Gly Glu Phe Phe Glu Arg
145 150 155 160
His Phe Gly Lys Glu Phe Val Asp Tyr Val Ile Asp Pro Phe Val Ala
165 170 175
Gly Thr Cys Gly Gly Asp Pro Gln Ser Leu Ser Met His His Thr Phe
180 185 190
Pro Glu Val Trp Asn Ile Glu Lys Arg Phe Gly Ser Val Phe Ala Gly
195 200 205
Leu Ile Gln Ser Thr Leu Leu Ser Lys Lys Glu Lys Gly Gly Glu Asn
210 215 220
Ala Ser Ile Lys Lys Pro Arg Val Arg Gly Ser Phe Ser Phe Gln Gly
225 230 235 240
Gly Met Gln Thr Leu Val Asp Thr Met Cys Lys Gln Leu Gly Glu Asp
245 250 255
Glu Leu Lys Leu Gln Cys Glu Val Leu Ser Leu Ser Tyr Asn Gln Lys
260 265 270
Gly Ile Pro Ser Leu Gly Asn Trp Ser Val Ser Ser Met Ser Asn Asn
275 280 285
Thr Ser Glu Asp Gln Ser Tyr Asp Ala Val Val Val Thr Ala Pro Ile
290 295 300
Arg Asn Val Lys Glu Met Lys Ile Met Lys Phe Gly Asn Pro Phe Ser
305 310 315 320
Leu Asp Phe Ile Pro Glu Val Thr Tyr Val Pro Leu Ser Val Met Ile
325 330 335
Thr Ala Phe Lys Lys Asp Lys Val Lys Arg Pro Leu Glu Gly Phe Gly
340 345 350
Val Leu Ile Pro Ser Lys Glu Gln His Asn Gly Leu Lys Thr Leu Gly
355 360 365
Thr Leu Phe Ser Ser Met Met Phe Pro Asp Arg Ala Pro Ser Asp Met
370 375 380
Cys Leu Phe Thr Thr Phe Val Gly Gly Ser Arg Asn Arg Lys Leu Ala
385 390 395 400
Asn Ala Ser Thr Asp Glu Leu Lys Gln Ile Val Ser Ser Asp Leu Gln
405 410 415
Gln Leu Leu Gly Thr Glu Asp Glu Pro Ser Phe Val Asn His Leu Phe
420 425 430
Trp Ser Asn Ala Phe Pro Leu Tyr Gly His Asn Tyr Asp Ser Val Leu
435 440 445
Arg Ala Ile Asp Lys Met Glu Lys Asp Leu Pro Gly Phe Phe Tyr Ala
450 455 460
Gly Asn His Lys Gly Gly Leu Ser Val Gly Lys Ala Met Ala Ser Gly
465 470 475 480
Cys Lys Ala Ala Glu Leu Val Ile Ser Tyr Leu Asp Ser His Ile Tyr
485 490 495
Val Lys Met Asp Glu Lys Thr Ala
500
<210> 22
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 22
atgaaagcgc tggtgctgta tagcacccgc gatggccaga cccatgcgat tgcgagctat 60
attgcgagct gcatgaaaga aaaagcggaa tgcgatgtga ttgatctgac ccatggcgaa 120
catgtgaacc tgacccagta tgatcaggtg ctgattggcg cgagcattcg ctatggccat 180
tttaacgcgg tgctggataa atttattaaa cgcaacgtgg atcagctgaa caacatgccg 240
agcgcgtttt tttgcgtgaa cctgaccgcg cgcaaaccgg aaaaacgcac cccgcagacc 300
aacccgtatg tgcgcaaatt tctgctggcg accccgtggc agccggcgct gtgcggcgtg 360
tttgcgggcg cgctgcgcta tccgcgctat cgctggattg ataaagtgat gattcagctg 420
attatgcgca tgaccggcgg cgaaaccgat accagcaaag aagtggaata taccgattgg 480
gaacaggtga aaaaatttgc ggaagatttt gcgaaactga gctataaaaa agcgctg 537
<210> 23
<211> 534
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 23
atgaaagcgc tgattctgtt tagcacccgc gatggccaga cccagaaaat tgcgagcgcg 60
attgcggatg aaattaaagg ccagcagagc tgcgatgtga ttaacattca ggatgcgaaa 120
accctggatt ggcagcagta tgatcgcgtg ctgattggcg cgagcattcg ctatggccat 180
tttcagccgg tggtgaacga atttgtgaaa cataacctgc tggcgctgca gcagcgcgtg 240
agcggctttt ttagcgtgaa cctgaccgcg cgcaaaccgg aaaaacgcag cccggaaacc 300
aacgcgtata ccgtgaaatt tctggcgcag agcccgtggc agccggattg ctgcgcggtg 360
tttgcgggcg cgctgtatta tccgcgctat cgctggtttg atcgcgtgat gattcagttt 420
attatgcgca tgaccggcgg cgaaaccgat gcgagcaaag aagtggaata taccgattgg 480
cagcaggtgc agcgctttgc gcgcgatttt gcgcagctgc cgggcaaaag ctat 534
<210> 24
<211> 531
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 24
atgaaagcgc tgattctgta tagcacccgc gatggccaga cccgcaaaat tgcgagcagc 60
attgcggatg tgattcgcca gcagcagcag tgcgatgtgc tgaacattaa agatgcgagc 120
ctgccggatt gggcgcagta tgatcgcgtg ctgattggcg cgagcattcg ctatggccat 180
tttcagccgg tggtggataa atttgtgaaa cagcatctgc atgaactgca gcagcgcacc 240
agcggctttt ttagcgtgaa cctgaccgcg cgcaaaccgg aaaaacgcag cccggaaacc 300
aacgcgtata cccagaaatt tctggcgcat agcccgtggc agccggattg ctgcgcggtg 360
tttgcgggcg cgctgtatta tccgcgctat cgctggtttg atcgcgtgat gattcagctg 420
attatgcgca tgaccggcgg cgaaaccgat agcaccaaag aagtggaata taccgattgg 480
cagcaggtga gcacctttgc gaacgatttt gcgcagctgc cgggcaaaag c 531
<210> 25
<211> 546
<212> DNA
<213> Escherichia coli
<400> 25
gtgaaaacat taattctttt ctcaacaagg gacggacaaa cgcgcgagat tgcctcctac 60
ctggcttcgg aactgaaaga actggggatc caggcggatg tcgccaatgt gcaccgcatt 120
gaagaaccac agtgggaaaa ctatgaccgt gtggtcattg gtgcttctat tcgctatggt 180
cactaccatt cagcgttcca ggaatttgtc aaaaaacatg cgacgcggct gaattcgatg 240
ccgagcgcct tttactccgt gaatctggtg gcgcgcaaac cggagaagcg tactccacag 300
accaacagct acgcgcgcaa gtttctgatg aactcgcaat ggcgtcccga tcgctgcgcg 360
gtcattgccg gggcgctgcg ttacccacgt tatcgctggt acgaccgttt tatgatcaag 420
ctgattatga agatgtcagg cggtgaaacg gatacgcgca aagaagttgt ctataccgat 480
tgggagcagg tggcgaattt cgcccgagaa atcgcccatt taaccgacaa accgacgctg 540
aaataa 546
<210> 26
<211> 534
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 26
atgaaagcgc tgattctgtt tagcagccgc gaaggccaga cccgcgaaat tgcgagctat 60
attgcgaaca gcattaaaga agaaatggaa tgcgatgtgt ttaacattct gcgcgtggaa 120
cagattgatt ggagccagta tgatcgcgtg ctgattggcg gcagcattca ttatggccat 180
tttcatccgg cggtggcgaa atttgtgaaa cgccatctgc atgaactgca gcagcgcagc 240
agcggctttt tttgcgtgaa cctgaccgcg cgcaaagcgg ataaacgcac cccgcagacc 300
aacgcgtata tgcgcaaatt tctgctgcag agcccgtggc agccggattg ctgcgcggtg 360
tttgcgggcg cgctgcgcta tacccgctat cgctggtttg atcgcgtgat gattcagctg 420
attatgcgca tgaccggcgg cgaaaccgat accagcaaag aagtggaata taccgattgg 480
acccaggtgg cgcgctttgc gcaggaattt gcgcatctgc cgggcaaaac ccag 534
<210> 27
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 27
atgaaagcgc tgattgtgtt tagcagccgc gatggccaga cccgcgcgat tgcgagctat 60
attgcgaaca ccctgaaagg caccctggaa tgcgatgtgg tgaacgtgct gaacgcgaac 120
gatattgatc tgagccagta tgatcgcgtg gcgattggcg cgagcattcg ctatggccgc 180
tttcatccgg cggtgaacca gtttattcgc aaacatctga ccagcctgca gcagctgccg 240
agcgcgtttt ttagcgtgaa cctgaccgcg cgcaaaccgg aaaaacgcac cattcagacc 300
aacgcgtata cccgcaaatt tctgctgaac agcccgtggc agccggatct gtgctgcgtg 360
tttgcgggcg cgctgcgcta tccgcgctat cgctggtttg atcgcgtgat gattcagctg 420
attatgcgca ttaccggcgg cgaaaccgat agcaccaaag aaattgaata taccgattgg 480
cagcaggtgg cgcgctttgc gcaggatttt gcgcagctgg cggcgaaaaa cccggcg 537
<210> 28
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 28
atgaagacct tgatcctatt ctccaccagg gacggccaaa cacacaagat cgcaaggcac 60
atcgcaggag tcctcgaaga gcaggggaag gcctgcgagt tggtcgatct gttacagccc 120
ggcgaaccag actggagtac cgttgaatgc gtcgttctag gggccagcat tagatatggt 180
cacttccata agtctttcat caggttcgta aacactcacg cgcagcgctt gaataatatg 240
ccaggcgccc ttttcacagt taacttagtc gcccgaaagc ccgagaagca gagtccacag 300
acgaactctt acacccgcaa gtttctcgcc gcctcccctt ggcagccaca gcgatgccaa 360
gttttcgcgg gcgctttgag gtaccctagg tactcgtggt acgacagaat gatgatacgt 420
ttgataatga agatggccgg gggcgagact gacacaagga aggaggttga gtacactgac 480
tggcagtcgg tgactcggtt cgcgagggag atcgctcagc tgccgggaga gacgcgg 537
<210> 29
<211> 534
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 29
atgaaagcgc tgattctgtt tagcagccgc gatggccaga cccagctgat tgcgagcagc 60
attgcgaaag aactggaagg caaacaggcg tgcgatgtgc tgaacattct ggataccacc 120
aacgtggaat ggacccagta tgatcgcgtg ctgattggcg cgagcattcg ctatggccat 180
tttcatccgg cggtggcgga atttgtgaaa cgccatcagc gcgaactgca gcagcgcagc 240
agcggctttt ttagcgtgaa cctgaccgcg cgcaaaccgg aaaaacgcag cccggaaacc 300
aacgcgtata ccgcgaaatt tctgaaccag agcccgtggc agccggattg ctgcgcggtg 360
tttgcgggcg cgctgcgcta tccgcgctat cgctggtttg atcgcattat gattcagctg 420
attatgcgca tgaccggcgg cgaaaccgat agcagcaaag aagtggaata taccgattgg 480
cagcaggtga cccgctttgc gcaggaattt gcgcgcctgc cgggcaaaac cagc 534
<210> 30
<211> 540
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 30
atgaaaaccc tgattctgtt tagcacccgc gatggccaga cccgcgaaat tgcggcgttt 60
ctggcgagcg aactgaaaga acagggcatt tatgcggatg tgattaacct gaaccgcacc 120
gaagaaattg cgtggcagga atatgatcgc gtggtgattg gcgcgagcat tcgctatggc 180
cattttcatc cggcggtgga tcgctttgtg aaaaaacata ccgaaaccct gaacagcctg 240
ccgggcgcgt tttttagcgt gaacctggtg gcgcgcaaag cggaaaaacg caccccgcag 300
accaacagct atacccgcaa atttctgctg aacagcccgt ggaaaccggc ggcgtgcgcg 360
gtgtttgcgg gcgcgctgcg ctatccgcgc tatcgctggt atgatcgctt tatgattcgc 420
ctgattatga aaatgaccgg cggcgaaacc gatacccgca aagaagtggt gtataccgat 480
tggagccagg tggcgagctt tgcgcgcgaa attgtgcagc tgacccgcag cagccgcctg 540
<210> 31
<211> 531
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 31
atgaaaattc tgattctgtt tagcacccgc gatggccaga cccgcgaaat tgcggcgagc 60
ctggcgagcg aactgaaaga acaggcgttt gatgtggatg tggtgaacct gcatcgcgcg 120
gaaaacattg cgtgggaaga atatgatggc gtggtgattg gcgcgagcat tcgctatggc 180
cattttcata gcaccctgaa cagctttgtg aaaaaacatc agcaggcgct gaaaaaactg 240
ccgggcgcgt tttatagcgt gaacctggtg gcgcgcaaac cggaaaaacg caccccgcag 300
accaacagct atacccgcaa atttctgctg gatagcccgt ggcagccgga tctgagcgcg 360
gtgtttgcgg gcgcgctgcg ctatccgcgc tataactggt atgatcgcat tatgattcgc 420
ctgattatga aaattaccgg cggcgaaacc gatacccgca aagaagtggt gtataccgat 480
tggcagcagg tgacccattt tgcgcatgaa attgtgcagc tggtgcgcaa a 531
<210> 32
<211> 540
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 32
atgaaggcct tggtactgta ctcgacgcgg gacggccaga cccacgcaat tgcttcatac 60
atcgcctcct gcatgaagga gaaggccgaa tgcgacgtga tcgacctcac ccacggggag 120
cacgtgaacc tcacccaata cgatcaggtg ctaatcggtg cgagtattcg ttacggccac 180
ttcaacgccg tgcttgacaa gttcatcaag agaaacgtgg atcagctgaa caacatgcca 240
agcgcgttct tctgcgtaaa cctcacagca aggaagcccg agaagcgtac tccccagaca 300
aacccttatg tccgaaaatt cttgcttgct accccctggc agcccgcgtt gtgcggagtg 360
ttcgcagggg cccttcggta cccgcgatac cggtggatcg acaaggtgat gatccagcta 420
ataatgcgga tgactggggg agagacagac acgagcaagg aggtcgagta cacggattgg 480
gagcaggtta agaagttcgc ggaggatttt gcaaagctat cgtacaagaa ggccctctag 540
<210> 33
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 33
atgaaggcct tgatcctgtt ctctacacgc gacggacaga cacagaagat cgcatctgcc 60
atcgctgatg agataaaggg gcagcaatcg tgcgacgtga ttaacataca ggatgccaaa 120
accctcgact ggcagcagta cgaccgggta ctcatcggcg cctccattcg ttacgggcat 180
ttccagcccg ttgtgaatga gtttgtcaag cacaacctct tggccctaca gcagagagtt 240
tccggattct tctccgtgaa cttgacagcc cgaaagccag agaagcggag ccccgagact 300
aacgcttata cagtcaaatt cttggcgcag tcaccctggc aaccggactg ctgcgctgtt 360
tttgcggggg ccctgtacta cccacggtac cggtggttcg atagggtgat gatacagttc 420
ataatgcgaa tgacgggggg agagaccgac gcatcgaaag aggtggagta cactgactgg 480
cagcaggtgc agcggttcgc gcgagacttc gcgcagttac cgggtaagtc ctactga 537
<210> 34
<211> 534
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 34
atgaaggcgc tgatcttgta ctcaaccagg gacggtcaga ctcgcaagat tgcaagtagc 60
attgcggacg tcatcaggca gcagcagcag tgcgacgtct taaacattaa agacgcatca 120
cttcctgact gggcccaata tgaccgagtg ctcatcggag ctagcatccg ttacgggcat 180
ttccagcccg ttgtagacaa gttcgtgaag cagcacttgc acgagcttca gcagcggacc 240
tccggcttct tctccgtgaa cctgacggcg aggaagcctg aaaaaaggag ccctgagacc 300
aatgcctaca cccagaaatt cttggcgcac tccccttggc agcccgattg ctgtgccgtt 360
ttcgcggggg ccctttacta ccccaggtac cgttggttcg accgggtgat gatccagttg 420
attatgcgca tgactggtgg agagaccgac tctaccaagg aagtggagta cactgactgg 480
cagcaggtga gtaccttcgc caacgatttt gcccagcttc caggcaagag ctaa 534
<210> 35
<211> 546
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 35
atgaagacct tgattctatt ctccacaagg gacggccaga ctagggagat cgcttcctac 60
ctggccagcg agctaaagga gcttggcatt caggcagacg tggctaacgt gcaccgaatt 120
gaggagccgc agtgggagaa ctacgatcgg gtcgtgatcg gcgccagcat ccggtatgga 180
cactaccaca gcgcgttcca ggagttcgtg aaaaagcacg cgacccgtct gaatagcatg 240
ccatcagcgt tctactcggt caacctcgtg gctcgtaagc ccgagaagcg gacaccccag 300
accaactcgt atgccaggaa gttccttatg aactcgcagt ggcgaccgga ccgctgcgcg 360
gtgatcgccg gtgcgctcag gtaccctcgt tataggtggt acgacaggtt tatgattaaa 420
cttataatga aaatgagcgg cggagagacc gacaccagaa aagaggtggt ttacacagac 480
tgggagcagg tagcaaactt cgctagggag attgctcacc tcaccgacaa gccgaccttg 540
aagtaa 546
<210> 36
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 36
atgaaggccc ttatactgtt cagttccaga gaaggccaga cgagggagat agcgagttac 60
attgccaact cgataaagga ggaaatggaa tgcgacgtgt tcaacatcct tcgtgtggag 120
cagatcgact ggtctcaata cgaccgcgtc ctgatcgggg gctcgataca ctacggccat 180
ttccacccag cggtggcaaa atttgtcaag aggcacctcc atgagttgca acagaggtct 240
tccggctttt tctgcgtcaa cctgacggcc aggaaggccg acaagcggac tccccagacc 300
aatgcctaca tgagaaagtt cttgttgcag tccccatggc aacccgattg ctgcgccgtg 360
tttgcggggg cccttaggta cacccgttac aggtggttcg acagggtaat gattcagctg 420
atcatgagga tgacgggcgg agagactgac acatcgaagg aggtggagta cacagactgg 480
acgcaggtcg cccgcttcgc gcaggagttc gcccatttgc ccggcaaaac tcagtga 537
<210> 37
<211> 540
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 37
atgaaggctc ttatcgtatt ctcttcgagg gatggccaaa cccgagcgat cgcgtcttat 60
attgctaata ccctcaaagg gaccctagag tgcgacgtcg tcaacgtcct caatgctaac 120
gacattgatt tgagccagta cgaccgtgtg gccattggcg cctccattcg ctacgggagg 180
ttccacccag ctgttaacca gtttatccgg aagcacctta cgagcctcca gcagctacca 240
tctgcgttct tctccgtgaa cctcacagct cggaagcccg agaagaggac tatacaaacc 300
aacgcgtaca ctaggaagtt tctactgaac tcgccgtggc agccggacct gtgctgcgtg 360
ttcgcgggag cccttcgcta tccccgttac aggtggtttg accgagtgat gattcaactc 420
ataatgcgca taacgggggg cgagacagac tccaccaagg agatcgagta caccgactgg 480
cagcaggtcg cgcgattcgc ccaggatttt gcacagcttg ccgcaaagaa cccggcatga 540
<210> 38
<211> 540
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 38
atgaagacct tgatcctatt ctccaccagg gacggccaaa cacacaagat cgcaaggcac 60
atcgcaggag tcctcgaaga gcaggggaag gcctgcgagt tggtcgatct gttacagccc 120
ggcgaaccag actggagtac cgttgaatgc gtcgttctag gggccagcat tagatatggt 180
cacttccata agtctttcat caggttcgta aacactcacg cgcagcgctt gaataatatg 240
ccaggcgccc ttttcacagt taacttagtc gcccgaaagc ccgagaagca gagtccacag 300
acgaactctt acacccgcaa gtttctcgcc gcctcccctt ggcagccaca gcgatgccaa 360
gttttcgcgg gcgctttgag gtaccctagg tactcgtggt acgacagaat gatgatacgt 420
ttgataatga agatggccgg gggcgagact gacacaagga aggaggttga gtacactgac 480
tggcagtcgg tgactcggtt cgcgagggag atcgctcagc tgccgggaga gacgcggtag 540
<210> 39
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 39
atgaaggccc taattttatt cagtagtagg gacggccaga cccagcttat agcatcgtct 60
atcgccaagg agctcgaagg gaagcaggcg tgcgacgtgt tgaatatcct cgacacgact 120
aatgtggagt ggacccagta cgaccgcgtg ctgattggag catccatccg gtacgggcac 180
tttcaccctg cggtcgccga gttcgtaaag cgtcaccagc gagagctaca gcagagaagt 240
agtggctttt tctctgtgaa cttgacggcc cgtaagccgg aaaagaggtc ccccgagact 300
aacgcctata ccgccaagtt ccttaaccaa agtccatggc agcctgactg ttgcgctgtg 360
ttcgctgggg ctttgcgata ccctcggtac cgctggttcg acagaattat gatccagcta 420
atcatgcgga tgactggggg tgagacagat tcttcaaagg aggtcgagta caccgactgg 480
cagcaggtga cccgcttcgc gcaagagttc gccaggcttc cgggaaagac cagttga 537
<210> 40
<211> 543
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 40
atgaagaccc taatactgtt ctctacccgc gacgggcaga caagggagat cgccgcgttc 60
cttgcctcgg agctgaagga gcaggggatt tacgctgacg tcataaacct taaccggacg 120
gaggagatag cttggcagga gtatgataga gtcgtaatcg gggcgtcgat ccgatacggg 180
catttccacc ctgctgtcga ccgcttcgtg aagaagcaca cagagacact caactcactg 240
cccggcgcct ttttctctgt aaaccttgtt gcccggaaag ccgagaagag aacgccgcag 300
acgaactcat acaccaggaa gttcctatta aacagcccgt ggaagccagc ggcctgcgcg 360
gtctttgctg gggccctccg ctaccctaga taccgctggt acgacaggtt catgatacga 420
ctgattatga aaatgacagg cggggagacg gatacccgaa aggaggtagt ctacactgac 480
tggtcgcagg tcgcgtcgtt tgccagagag atagtccagt tgaccaggtc atcgcgcttg 540
tga 543
<210> 41
<211> 534
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 41
atgaagatat taatcctttt ctccacccgt gacggccaaa cccgtgagat tgcggcgtcc 60
ttggcgtccg aactcaagga gcaggcattc gacgtggacg tcgtcaacct tcaccgggcc 120
gagaacatcg catgggagga gtacgacggt gttgtcatcg gagcgtccat caggtacggc 180
cactttcata gtaccctgaa ctcatttgtc aagaagcatc agcaggctct taagaagctt 240
cccggggctt tctacagcgt gaacctcgtc gcccggaagc ctgagaagcg cacaccgcag 300
accaatagct acacccgcaa gttcctcttg gattccccgt ggcagcccga cctttcagcc 360
gtgttcgccg gggcactcag gtaccctcgg tacaattggt acgaccgtat catgattaga 420
cttatcatga agattacagg cggcgagact gataccagga aggaagtagt ctacacagac 480
tggcagcagg tcactcactt tgctcacgag atcgtccagc tcgtgcggaa gtag 534
<210> 42
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 42
aaggccttgg tactgtactc gacgcgggac ggccagaccc acgcaattgc ttcatacatc 60
gcctcctgca tgaaggagaa ggccgaatgc gacgtgatcg acctcaccca cggggagcac 120
gtgaacctca cccaatacga tcaggtgcta atcggtgcga gtattcgtta cggccacttc 180
aacgccgtgc ttgacaagtt catcaagaga aacgtggatc agctgaacaa catgccaagc 240
gcgttcttct gcgtaaacct cacagcaagg aagcccgaga agcgtactcc ccagacaaac 300
ccttatgtcc gaaaattctt gcttgctacc ccctggcagc ccgcgttgtg cggagtgttc 360
gcaggggccc ttcggtaccc gcgataccgg tggatcgaca aggtgatgat ccagctaata 420
atgcggatga ctgggggaga gacagacacg agcaaggagg tcgagtacac ggattgggag 480
caggttaaga agttcgcgga ggattttgca aagctatcgt acaagaaggc cctctag 537
<210> 43
<211> 534
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 43
aaggccttga tcctgttctc tacacgcgac ggacagacac agaagatcgc atctgccatc 60
gctgatgaga taaaggggca gcaatcgtgc gacgtgatta acatacagga tgccaaaacc 120
ctcgactggc agcagtacga ccgggtactc atcggcgcct ccattcgtta cgggcatttc 180
cagcccgttg tgaatgagtt tgtcaagcac aacctcttgg ccctacagca gagagtttcc 240
ggattcttct ccgtgaactt gacagcccga aagccagaga agcggagccc cgagactaac 300
gcttatacag tcaaattctt ggcgcagtca ccctggcaac cggactgctg cgctgttttt 360
gcgggggccc tgtactaccc acggtaccgg tggttcgata gggtgatgat acagttcata 420
atgcgaatga cggggggaga gaccgacgca tcgaaagagg tggagtacac tgactggcag 480
caggtgcagc ggttcgcgcg agacttcgcg cagttaccgg gtaagtccta ctga 534
<210> 44
<211> 543
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 44
aagaccttga ttctattctc cacaagggac ggccagacta gggagatcgc ttcctacctg 60
gccagcgagc taaaggagct tggcattcag gcagacgtgg ctaacgtgca ccgaattgag 120
gagccgcagt gggagaacta cgatcgggtc gtgatcggcg ccagcatccg gtatggacac 180
taccacagcg cgttccagga gttcgtgaaa aagcacgcga cccgtctgaa tagcatgcca 240
tcagcgttct actcggtcaa cctcgtggct cgtaagcccg agaagcggac accccagacc 300
aactcgtatg ccaggaagtt ccttatgaac tcgcagtggc gaccggaccg ctgcgcggtg 360
atcgccggtg cgctcaggta ccctcgttat aggtggtacg acaggtttat gattaaactt 420
ataatgaaaa tgagcggcgg agagaccgac accagaaaag aggtggttta cacagactgg 480
gagcaggtag caaacttcgc tagggagatt gctcacctca ccgacaagcc gaccttgaag 540
taa 543
<210> 45
<211> 534
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 45
aaggccctta tactgttcag ttccagagaa ggccagacga gggagatagc gagttacatt 60
gccaactcga taaaggagga aatggaatgc gacgtgttca acatccttcg tgtggagcag 120
atcgactggt ctcaatacga ccgcgtcctg atcgggggct cgatacacta cggccatttc 180
cacccagcgg tggcaaaatt tgtcaagagg cacctccatg agttgcaaca gaggtcttcc 240
ggctttttct gcgtcaacct gacggccagg aaggccgaca agcggactcc ccagaccaat 300
gcctacatga gaaagttctt gttgcagtcc ccatggcaac ccgattgctg cgccgtgttt 360
gcgggggccc ttaggtacac ccgttacagg tggttcgaca gggtaatgat tcagctgatc 420
atgaggatga cgggcggaga gactgacaca tcgaaggagg tggagtacac agactggacg 480
caggtcgccc gcttcgcgca ggagttcgcc catttgcccg gcaaaactca gtga 534
<210> 46
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 46
aaggctctta tcgtattctc ttcgagggat ggccaaaccc gagcgatcgc gtcttatatt 60
gctaataccc tcaaagggac cctagagtgc gacgtcgtca acgtcctcaa tgctaacgac 120
attgatttga gccagtacga ccgtgtggcc attggcgcct ccattcgcta cgggaggttc 180
cacccagctg ttaaccagtt tatccggaag caccttacga gcctccagca gctaccatct 240
gcgttcttct ccgtgaacct cacagctcgg aagcccgaga agaggactat acaaaccaac 300
gcgtacacta ggaagtttct actgaactcg ccgtggcagc cggacctgtg ctgcgtgttc 360
gcgggagccc ttcgctatcc ccgttacagg tggtttgacc gagtgatgat tcaactcata 420
atgcgcataa cggggggcga gacagactcc accaaggaga tcgagtacac cgactggcag 480
caggtcgcgc gattcgccca ggattttgca cagcttgccg caaagaaccc ggcatga 537
<210> 47
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 47
aagaccttga tcctattctc caccagggac ggccaaacac acaagatcgc aaggcacatc 60
gcaggagtcc tcgaagagca ggggaaggcc tgcgagttgg tcgatctgtt acagcccggc 120
gaaccagact ggagtaccgt tgaatgcgtc gttctagggg ccagcattag atatggtcac 180
ttccataagt ctttcatcag gttcgtaaac actcacgcgc agcgcttgaa taatatgcca 240
ggcgcccttt tcacagttaa cttagtcgcc cgaaagcccg agaagcagag tccacagacg 300
aactcttaca cccgcaagtt tctcgccgcc tccccttggc agccacagcg atgccaagtt 360
ttcgcgggcg ctttgaggta ccctaggtac tcgtggtacg acagaatgat gatacgtttg 420
ataatgaaga tggccggggg cgagactgac acaaggaagg aggttgagta cactgactgg 480
cagtcggtga ctcggttcgc gagggagatc gctcagctgc cgggagagac gcggtag 537
<210> 48
<211> 540
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 48
aagaccctaa tactgttctc tacccgcgac gggcagacaa gggagatcgc cgcgttcctt 60
gcctcggagc tgaaggagca ggggatttac gctgacgtca taaaccttaa ccggacggag 120
gagatagctt ggcaggagta tgatagagtc gtaatcgggg cgtcgatccg atacgggcat 180
ttccaccctg ctgtcgaccg cttcgtgaag aagcacacag agacactcaa ctcactgccc 240
ggcgcctttt tctctgtaaa ccttgttgcc cggaaagccg agaagagaac gccgcagacg 300
aactcataca ccaggaagtt cctattaaac agcccgtgga agccagcggc ctgcgcggtc 360
tttgctgggg ccctccgcta ccctagatac cgctggtacg acaggttcat gatacgactg 420
attatgaaaa tgacaggcgg ggagacggat acccgaaagg aggtagtcta cactgactgg 480
tcgcaggtcg cgtcgtttgc cagagagata gtccagttga ccaggtcatc gcgcttgtga 540
<210> 49
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 49
aaggccttgg tactgtactc gacgcgggac ggccagaccc acgcaattgc ttcatacatc 60
gcctcctgca tgaaggagaa ggccgaatgc gacgtgatcg acctcaccca cggggagcac 120
gtgaacctca cccaatacga tcaggtgcta atcggtgcga gtattcgtta cggccacttc 180
aacgccgtgc ttgacaagtt catcaagaga aacgtggatc agctgaacaa catgccaagc 240
gcgttcttct gcgtaaacct cacggcaagg aagcccgaga agcgtactcc ccagacaaac 300
ccttatgtcc gaaaattctt gcttgctacc ccctggcagc ccgcgttgtg cggagtgttc 360
gcaggggccc ttcggtaccc gcgataccgg tggatcgaca aggtgatgat ccagctaata 420
atgcggatga ctgggggaga gacagacacg agcaaggagg tcgagtacac ggattgggag 480
caggttaaga agttcgcgga ggattttgca aagctatcgt acaagaaggc cctctag 537
<210> 50
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 50
aaggccttgg tactgtactc gacgcgggac ggccagaccc acgcaattgc ttcatacatc 60
gcctcctgca tgaaggagaa ggccgaatgc gacgtgatcg acctcaccca cggggagcac 120
gtgaacctca cccaatacga tcaggtgcta atcggtgcga atattcgtta cggccacttc 180
aacgccgtgc ttgacaagtt catcaagaga aacgtggatc agctgaacaa catgccaagc 240
gcgttcttct gcgtaaacct cacagcaagg aagcccgaga agcgtactcc ccagacaaac 300
ccttatgtcc gaaaattctt gcttgctacc ccctggcagc ccgcgttgtg cggagtgttc 360
gcaggggccc ttcggtaccc gcgataccgg tggatcgaca aggtgatgat ccagctaata 420
atgcggatga ctgggggaga gacagacacg agcaaggagg tcgagtacac ggattgggag 480
caggttaaga agttcgcgga ggattttgca aagctatcgt acaagaaggc cctctag 537
<210> 51
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 51
aaggccttgg tactgtactc gacgcgggac ggccagaccc acgcaattgc ttcatacatc 60
gcctcctgca tgaaggagaa ggccgaatgc gacgtgatcg acctcaccca cggggagcac 120
gtgaacctca cccaatacga tcaggtgcta atcggtgcga gtattcgtta cggccacttc 180
aacgccgtgc ttgacaagtt catcaagaga aacgtggatc agctgaacaa catgccaagc 240
gcgttcttct gcgtaaacct cacagcaagg aagcccgaga agcgtactcc ccagacaaac 300
ccttatgtcc gaaaattctt gcttgctacc ccctggcagc ccgcgttgtg cggagtgttc 360
gcaggggccc ttcggtaccc gcgataccgg tggatcgaca aggtgatgat ccagctaata 420
atgcggatga ctgggggaga gacagacacg agcaaggagg tcgagtacac ggattgggag 480
caggttaaga agttcgcgga ggattttgca aagctatagt acaagaaggc cctctag 537
<210> 52
<211> 534
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 52
aaggccttga tcctgttctc tacacgcgac ggacagacac agaagatcgc atctgccatc 60
gctgatgaga taaaggggca gcaatcgtgc gacgtgatta acatacagga tgccaaaacc 120
ctcgactggc agcagtacga ccgggtactc atcggcgcct ccattcgtta cgggcatttc 180
cagcccgttg tgaatgagtt tgtcaagcac aacctcttgg ccctacagca gagagtttcc 240
ggattcttct ccgtgaactt gacagcccga aagccagaga agcggagccc cgagactaac 300
gcttatacag tcaaattctt ggcgcagtca ccctggcaac cggactgctg cgctgttttt 360
gcgggggccc tgtactaccc acggtaccgg tggttcgata gggtgatgat acagttcata 420
atgcgaatga cgggggggga gaccgacgca tcgaaagagg tggagtacac tgactggcag 480
caggtgcagc ggttcgcgcg agacttcgcg cagttaccgg gtaagtccta ctga 534
<210> 53
<211> 540
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 53
aagaccctaa tactgttctc tacccgcgac gggcagacaa gggagatcgc cgcgttcctt 60
gcctcggagc tgaaggagca ggggatttac gctgacgtca taaaccttaa ccggacggag 120
gagatagctt ggcaggagta tgatagagtc gtaatcgggg cgtcgatccg atacgggcat 180
ttccaccctg ctgtcgaccg cttcgtgaag aagcacacag agacactcaa ctcactgccc 240
ggcgcctttt tctctgtaaa ccttgttgcc cggaaagccg agaagagaac gccgcagacg 300
aactcataca ccaggaagtt cctattaaac agcccgtgga agccagcggc ctgcgcggtc 360
tttgctgggg ccctccgcta ccctagatac cgctggtacg acaggttcat gatacgactg 420
attatgaaaa tgacaggcgg ggagacggat acccgaaagg aggtagtcta cactgactgg 480
tcgcagatcg cgtcgtttgc cagagagata gtccagttga ccaggtcatc gcgcttgtga 540
<210> 54
<211> 540
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 54
atgaaggcgc tcgtgctcta cagcacacgc gacggccaga ctcatgcgat cgcctcttac 60
atcgcgtcct gtatgaagga gaaggccgag tgcgacgtca tcgatctcac gcacggggag 120
cacgtgaatc ttacgcagta cgaccaagtg ctgataggcg cctctatccg ttacggccat 180
tttaacgccg tcctcgacaa attcatcaag cgcaatgtag accagctgaa caacatgccc 240
tccgcgttct tttgcgtgaa cctgacggct cggaagcctg agaagcgaac acctcagacc 300
aacccatacg tgcggaaatt cctactcgca acgccatggc agcccgccct gtgcggggtt 360
ttcgcagggg cgctacgcta tccgcgttac cgctggatcg ataaggtgat gatccagcta 420
ataatgcgca tgaccggcgg cgagacagac acatcgaagg aagtcgaata cacagactgg 480
gaacaggtga agaagtttgc agaggatttc gccaagctct catacaaaaa ggcattgtga 540
<210> 55
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 55
atgaaggcgc ttatactgtt ctcgacacgc gacggtcaga cgcagaaaat cgcctcagcc 60
atcgccgacg agatcaaggg ccagcagagc tgcgatgtga tcaatattca ggacgccaaa 120
actctcgact ggcagcagta tgaccgcgtg ctcattggcg catcaatccg ctacgggcat 180
ttccagccag tcgtcaatga gtttgtgaaa cataacctct tggcattgca gcagcgggtg 240
tctggcttct tctccgtgaa ccttacagct agaaaaccag agaagcggtc gcccgagact 300
aacgcctaca ccgttaagtt ccttgcgcag tcaccgtggc agcctgattg ctgcgcggtc 360
ttcgccgggg cactgtacta ccctcgatac cggtggtttg atagggtaat gatccagttc 420
ataatgcgca tgaccggtgg ggagaccgac gcaagtaaag aagttgagta cacggattgg 480
cagcaggtgc aaaggttcgc acgcgacttc gcgcagctcc cgggcaagtc ttactga 537
<210> 56
<211> 534
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 56
atgaaagccc tgatcctcta ttccaccagg gacggccaga cccgcaagat agcctcctcc 60
atcgctgatg tcatccgcca gcagcagcag tgcgacgttt taaacattaa ggacgcttca 120
ctgcctgatt gggcccagta tgaccgcgtc ctgatcggcg cgtcgattcg gtacggccac 180
ttccagcctg tggttgacaa gttcgtcaag cagcacctgc atgagctgca gcagcgaact 240
agcgggttct tcagtgtgaa cctgacagct agaaagcccg aaaagagatc cccagaaacc 300
aacgcctata cgcagaaatt ccttgctcac tcaccctggc agcctgactg ttgtgccgtc 360
ttcgcgggcg ccttgtacta tccccgctac cgctggttcg atagggtgat gatccagctg 420
attatgagaa tgacgggagg ggagaccgat tcgaccaagg aggtagagta cactgactgg 480
caacaggtgt caactttcgc aaacgacttc gcacaactac ccggtaagtc ttga 534
<210> 57
<211> 546
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 57
atgaaaaccc taatactgtt ctcgacccgc gacggccaga cgcgtgagat tgcgagctac 60
ctggcctccg agctcaagga gctggggatc caagccgatg tcgcgaacgt gcaccgcatt 120
gaggagccgc agtgggagaa ttacgatcgc gttgtgatag gggccagcat ccgctatggc 180
cactaccact cggcctttca ggagtttgta aagaaacacg ccacaagatt aaactccatg 240
cctagcgcct tctactccgt caaccttgtc gcgcgcaagc cggagaagcg gacacctcag 300
acgaactcct acgcgcggaa gttcctgatg aacagccagt ggcggccgga cagatgtgct 360
gttattgcgg gagccctgag atacccgagg taccggtggt acgataggtt tatgattaaa 420
cttattatga agatgtctgg tggggagact gacaccagga aggaggtggt atatacagac 480
tgggagcagg tcgccaattt cgctcgggaa atcgcgcatc tgacagacaa gcctacactg 540
aagtag 546
<210> 58
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 58
atgaaggccc tgatcctctt tagctctagg gagggccaga cccgcgagat cgcgtcatat 60
atcgcgaatt ccataaagga ggagatggag tgcgatgtgt ttaacatcct tagggtggag 120
caaatagact ggtctcagta tgaccgtgtg ctcatagggg ggagcatcca ctacggccac 180
tttcacccgg ccgtggcgaa attcgtcaag cgacacctcc acgagcttca gcagcgctcc 240
tcagggttct tctgcgtcaa cctgacagca agaaaggcag ataaacgcac cccgcagacg 300
aacgcctaca tgaggaagtt ccttctgcag tctccttggc agcccgattg ctgcgcggtg 360
ttcgccggtg cactgcgcta tacgcgctat agatggtttg atagagtcat gattcagctc 420
atcatgcgga tgaccggcgg ggaaacggat actagtaagg aggtggagta cacggactgg 480
acccaggtgg cacgtttcgc ccaggagttt gcacatcttc ctgggaagac ccaatga 537
<210> 59
<211> 540
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 59
atgaaggcgc taattgtgtt cagctccagg gatggccaga cgagggctat agcatcctat 60
atcgccaata ccttgaaagg aacgctcgag tgtgacgtgg tcaacgtctt gaacgccaat 120
gacattgacc tttcccagta cgaccgagtt gccataggcg cgtcgatccg ctacgggcga 180
tttcaccctg cagtcaacca gtttatacgg aagcatttga cctcgctgca gcagctcccg 240
tcagccttct tctctgtgaa tttaaccgcg cggaagcctg agaaacggac gatccaaaca 300
aacgcctata cccgaaagtt cctcctgaac agcccatggc agccagacct gtgctgtgtc 360
ttcgccggcg cgttgcggta tccccgctac aggtggttcg atagagtgat gatccagctc 420
atcatgagga tcaccggggg agagaccgat agtaccaagg agatcgagta cacggactgg 480
cagcaggtgg ctcgcttcgc ccaggacttc gctcagttgg ccgcaaagaa tccagcataa 540
<210> 60
<211> 540
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 60
atgaagacac tgatcctgtt ctcgactcga gatggccaga ctcataaaat tgcgcgccac 60
attgcggggg tcctggagga gcagggcaaa gcgtgcgagc tcgtggactt actccagccc 120
ggggagccgg actggagcac ggtggagtgc gtcgttctgg gcgcttccat acgttacggg 180
catttccaca aaagtttcat ccggttcgtc aacacccacg ctcaacggct gaacaacatg 240
cctggcgcgc tattcactgt taacttagtg gctcgtaagc ccgagaagca gtctccgcag 300
actaactcct acacaaggaa atttctagca gcaagcccat ggcaaccgca gcggtgccag 360
gtgttcgctg gagctctgcg ctatcctagg tacagttggt acgacagaat gatgatacgg 420
ttgattatga agatggcagg cggggagacg gacaccagga aagaggtcga atacactgac 480
tggcaatcag tcactcggtt tgctagagag atcgcgcaat taccaggtga gacgcggtaa 540
<210> 61
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 61
atgaaggctc tcatactgtt cagctcgaga gacgggcaga cccagctgat cgcctcctcc 60
atagcaaagg agctagaggg caagcaagcc tgcgacgtgc tcaatattct cgacacaacc 120
aacgtggagt ggactcagta cgacagagtc ctaatcggcg cgtccatcag atacggccac 180
ttccatcccg ccgtcgctga attcgtgaaa cgccaccagc gtgagctcca gcagcgcagc 240
agcggcttct tcagcgtgaa tcttactgcg agaaagccgg aaaagcggag tcccgagact 300
aacgcttata cggcaaagtt cctcaaccaa tctccctggc aaccagactg ctgtgccgtg 360
ttcgctgggg cactgaggta tccgcgctat cggtggttcg atagaatcat gatacagctg 420
ataatgcgta tgactggtgg ggagacggat tccagtaaag aggtagagta tactgattgg 480
cagcaggtca ctaggttcgc gcaggagttt gctaggctgc cgggcaagac atcctga 537
<210> 62
<211> 543
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 62
atgaaaacct taatcttgtt cagcacccgc gacggccaga cgcgtgaaat cgcagcgttc 60
ctcgcttcgg agctcaagga acagggaatt tacgccgacg tcattaacct aaaccgtacc 120
gaagagattg cgtggcagga gtatgaccgc gtggtgattg gcgcttctat ccgctatggc 180
cacttccacc cggctgttga ccggttcgtg aagaagcaca cggagacctt gaactcactg 240
ccgggggcat tctttagcgt aaatctggtg gcgcgcaagg ccgagaagcg caccccccag 300
acgaacagct acacccgcaa atttttactt aactccccat ggaaacctgc ggcctgcgca 360
gtgttcgcag gagctctccg ctatcctcgc tatcgatggt acgatcggtt catgattcgg 420
ctgattatga aaatgacggg cggcgagacg gatacgcgaa aggaagttgt ctacactgac 480
tggtcccagg tggcctcgtt tgcaagggag atcgtacagc tcactcgatc tagtaggctc 540
tga 543
<210> 63
<211> 534
<212> DNA
<213> Artificial Sequence
<220>
<223> Recombinant
<400> 63
atgaagattc tcatcttatt ttccacccga gacggccaaa cccgcgagat tgcggcgtcc 60
ctcgcctccg agttgaagga gcaggcgttt gatgtggatg tggtcaacct ccaccgcgca 120
gaaaacatag cgtgggagga gtacgatggg gtcgtcatcg gagcgtcaat ccgctacgga 180
catttccact caacgctgaa ttcatttgtg aagaagcacc aacaagcgct caagaagctg 240
cccggagcat tctacagcgt caacctcgtg gctcggaagc cggaaaagcg caccccgcaa 300
acaaacagct acacacgcaa gtttctgctc gactcgccct ggcaacccga cctgagtgcc 360
gttttcgccg gggcactgcg ctatccccgt tacaactggt acgatcgcat aatgattcga 420
ctgatcatga agattacagg cggggaaacc gatactcgga aggaggtggt gtatacagac 480
tggcagcagg ttacccactt cgcccacgag atcgtccagc tcgttcgtaa gtga 534
Claims (31)
- 재조합 DNA 분자로서, 서열번호 1 내지 서열번호 20으로 이루어진 군으로부터 선택된 폴리펩타이드 서열과 적어도 85%의 서열 동일성(sequence identity)을 갖는 단백질을 엔코딩하는 핵산 서열에 작동 가능하게 연결된 이종 프로모터(heterologous promoter)를 포함하되, 상기 단백질은 제초제-비민감성 프로토포르피리노겐 옥시다제(protoporphyrinogen oxidase) 활성을 갖는, 재조합 DNA 분자.
- 제1항에 있어서, 상기 핵산 서열이 서열번호 22 내지 서열번호 63으로 이루어진 군으로부터 선택되는, 재조합 DNA 분자.
- 제1항에 있어서, 상기 단백질이 서열번호 1 내지 서열번호 20으로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는, 재조합 DNA 분자.
- 제1항에 있어서, 상기 이종 프로모터가 식물 세포에서 기능적인, 재조합 DNA 분자.
- 제4항에 있어서, 상기 핵산 서열이 세포 내에 작동 가능하게 연결된 단백질을 위치시키도록 기능하는 표적화 서열(targeting sequence)을 엔코딩하는 DNA 분자에 작동 가능하게 연결되는, 재조합 DNA 분자.
- 제1항의 상기 재조합 DNA 분자를 포함하는, DNA 작제물.
- 제6항에 있어서, 상기 재조합 DNA가 세포 내에 상기 단백질을 위치시키도록 기능하는 표적화 서열을 엔코딩하는 작동 가능하게 연결된 DNA 분자를 포함하는, DNA 작제물.
- 제7항에 있어서, 상기 단백질이 상기 세포에 제초제 내성(herbicide tolerance)을 부여하는, DNA 작제물.
- 제6항에 있어서, 상기 DNA 작제물이 형질전환 식물, 종자, 또는 세포의 게놈에 존재하는, DNA 작제물.
- 재조합 폴리펩타이드로서, 서열번호 1 내지 서열번호 20으로부터 선택된 아미노산 서열의 전장과 적어도 85%의 서열 동일성을 포함하되, 상기 폴리펩타이드는 제초제-비민감성 프로토포르피리노겐 옥시다제 활성을 갖는, 재조합 폴리펩타이드.
- 제1항의 상기 재조합 DNA 분자를 포함하는, 형질전환 식물, 종자, 세포, 또는 식물 부분.
- 제11항에 있어서, 상기 형질전환 식물, 종자, 세포, 또는 식물 부분이 추가적인 형질전환 제초제 내성 형질(transgenic herbicide tolerance trait)을 포함하는, 형질전환 식물, 종자, 세포, 또는 식물 부분.
- 제11항에 있어서, 적어도 하나의 PPO 제초제에 대한 제초제 내성을 포함하는 것으로서 규정된, 형질전환 식물, 종자, 세포, 또는 식물 부분.
- 제11항에 따른 종자.
- 제10항의 상기 재조합 폴리펩타이드를 포함하는, 형질전환 식물, 종자, 세포, 또는 식물 부분.
- 상기 식물, 종자, 세포, 또는 식물 부분에서 제10항의 상기 재조합 폴리펩타이드를 이종으로 발현시키는 것을 포함하는, 식물, 종자, 세포, 또는 식물 부분에 제초제 내성을 부여하는, 방법.
- 제16항에 있어서, 상기 식물, 종자, 세포, 또는 식물 부분이 상기 재조합 폴리펩타이드에 의해 부여된 프로토포르피리노겐 옥시다제 활성을 포함하는, 방법.
- 제16항에 있어서, 상기 제초제 내성이 아시플루오르펜(acifluorfen), 포메사펜(fomesafen), 락토펜(lactofen), 플루오로글리코펜-에틸(fluoroglycofen-ethyl), 옥시플루오르펜(oxyfluorfen), 플루미옥사진(flumioxazin), 아자페니딘(azafenidin), 카펜트라존-에틸(carfentrazone-ethyl), 설펜트라존(sulfentrazone), 플루티아세트-메틸(fluthiacet-methyl), 옥사다이아르길(oxadiargyl), 옥사다이아존(oxadiazon), 피라플루펜-에틸(pyraflufen-ethyl), 사플루페나실(saflufenacil) 및 S-3100으로 이루어진 군으로부터 선택된 적어도 하나의 PPO 제초제에 대한 것인, 방법.
- 하기 단계들을 포함하는, 식물 변형(plant transformation) 방법:
a) 식물 세포에 제1항의 재조합 DNA 분자를 도입하는 단계; 및
b) 이로부터 상기 재조합 DNA 분자를 포함하는 식물을 재생시키는 단계. - 제19항에 있어서, 적어도 하나의 PPO 제초제에 대해 내성이 있는 식물을 선택하는 단계를 더 포함하는, 방법.
- 제19항에 있어서, 재생된 상기 식물을 그 자체와 또는 제2 식물과 교배하고 상기 교배로부터 종자를 수집하는 단계를 더 포함하는, 방법.
- 식물 성장 구역에서 잡초를 방제하는 방법으로서, 제11항의 형질전환 식물 또는 종자를 포함하는 식물 성장 구역(plant growth area)을 적어도 하나의 PPO 제초제와 접촉시키는 단계를 포함하되, 상기 형질전환 식물 또는 종자는 상기 PPO 제초제에 대해 내성이 있으며, 그리고 상기 잡초는 상기 식물 성장 구역에서 방제되는, 방법.
- 프로토포르피리노겐 옥시다제 활성을 갖는 단백질을 엔코딩하는 뉴클레오타이드 서열을 동정하는 방법으로서,
a) 천연 이. 콜라이(E. coli) PPO 효소를 위한 유전자 넉아웃(gene knockout)을 갖는 이. 콜라이 균주를, 후보 제초제 내성 단백질을 엔코딩하는 재조합 DNA 분자를 포함하는 박테리아 발현 벡터로 변형시키는 단계; 및
b) 변형된 상기 이. 콜라이를 헴-무함유 박테리아 배지(heme-free bacterial medium)를 사용하여 성장시키는 단계로서, 상기 박테리아 배지를 사용한 성장은 프로토포르피리노겐 옥시다제 활성을 갖는 단백질을 동정하는, 상기 성장시키는 단계를 포함하는, 방법. - 제초제-비민감성 프로토포르피리노겐 옥시다제 활성을 갖는 단백질을 엔코딩하는 뉴클레오타이드 서열을 동정하는 방법으로서,
a) 천연 이. 콜라이 PPO 효소를 위한 유전자 넉아웃을 갖는 이. 콜라이 균주를, 재조합 단백질을 엔코딩하는 재조합 DNA 분자를 포함하는 박테리아 발현 벡터로 변형시키는 단계; 및
b) 변형된 상기 이. 콜라이를 적어도 하나의 PPO 제초제를 함유한 박테리아 배지를 사용하여 성장시키는 단계로서, 상기 박테리아 배지를 사용한 성장은 제초제-비민감성(herbicide-insensitive) 프로토포르피리노겐 옥시다제 활성을 갖는 단백질을 동정하는, 상기 성장시키는 단계를 포함하는, 방법. - 하기 단계들을 포함하는, 제초제 내성 유전자를 스크리닝하는 방법:
a) 식물 세포에서 제1항의 상기 재조합 DNA 분자를 발현시키는 단계; 및
b) PPO 제초제에 대한 내성을 나타내는 식물 세포를 동정하는 단계. - 하기 단계들을 포함하는, 제초제 내성 유전자를 스크리닝하는 방법:
a) HemG가 결핍된 박테리아 세포에서 제1항의 재조합 DNA 분자를 발현시키는 단계로서, 상기 박테리아 세포는 PPO 제초제의 존재 하에서 헴-무함유 배지에서 성장되는, 상기 발현시키는 단계; 및
b) PPO 제초제에 대한 내성을 나타내는 박테리아 세포를 동정하는 단계. - 하기 단계들을 포함하는, PPO 제초제 및 적어도 하나의 다른 제초제에 대해 내성이 있는 식물을 생산하는 방법:
a) 제11항에 따른 식물을 수득하는 단계;
b) 형질전환 식물을 상기 적어도 하나의 다른 제초제에 대한 내성을 포함하는 제2 식물과 교배하는 단계; 및
c) PPO 제초제 및 상기 적어도 하나의 다른 제초제에 대한 내성을 포함하는 상기 교배로부터 생성된 자손 식물을 선택하는 단계. - 하기 단계들을 포함하는, 제초제 내성 잡초의 발달을 감소시키는 방법:
a) 작물 성장 환경(crop growing environment)에서 제12항에 따른 식물을 배양하는 단계; 및
b) 상기 작물 성장 환경에 PPO 제초제 및 적어도 하나의 다른 제초제를 적용하는 단계로서, 상기 작물 식물은 상기 PPO 제초제 및 상기 적어도 하나의 다른 제초제에 대해 내성이 있는, 상기 살포하는 단계. - 제28항에 있어서, 상기 PPO 제초제가 아시플루오르펜, 포메사펜, 락토펜, 플루오로글리코펜-에틸, 옥시플루오르펜, 플루미옥사진, 아자페니딘, 카펜트라존-에틸, 설펜트라존, 플루티아세트-메틸, 옥사다이아르길, 옥사다이아존, 피라플루펜-에틸, 사플루페나실 및 S-3100으로 이루어진 군으로부터 선택되는, 방법.
- 제28항에 있어서, 상기 적어도 하나의 다른 제초제가 ACCase 저해제, ALS 저해제, EPSPS 저해제, 합성 옥신(auxin), 광합성 저해제, 글루타민 합성 저해제, HPPD 저해제, PPO 저해제, 및 장쇄 지방산 저해제로 이루어진 군으로부터 선택되는, 방법.
- 제30항에 있어서, 상기 ACCase 저해제가 아릴옥시페녹시 프로피오네이트 또는 시클로헥산다이온이거나; 상기 ALS 저해제가 설포닐유레아, 이미다졸리논, 트라이아졸로이리미딘, 또는 트라이아졸리논이거나; 상기 EPSPS 저해제가 글리포세이트이거나; 상기 합성 옥신이 페녹시 제초제, 벤조산, 카르복실산, 또는 세미카바존이거나; 상기 광합성 저해제가 트리아진, 트라이아지논, 나이트릴, 벤조티아다이아졸, 또는 유레아이거나; 상기 글루타민 합성 저해제가 글루포시네이트이거나; 상기 HPPD 저해제가 아이소옥사졸, 피라졸론, 또는 트라이케톤이거나; 상기 PPO 저해제가 다이페닐에터, N-페닐프탈이미드, 아릴 트라이아지논, 또는 피리미딘다이온이거나; 또는 상기 장쇄 지방산 저해제가 클로로아세트아마이드, 옥시아세트아마이드, 또는 피라졸인, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562200428P | 2015-08-03 | 2015-08-03 | |
US62/200,428 | 2015-08-03 | ||
PCT/US2016/044774 WO2017023778A1 (en) | 2015-08-03 | 2016-07-29 | Methods and compositions for herbicide tolerance in plants |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20180028532A true KR20180028532A (ko) | 2018-03-16 |
Family
ID=57943510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020187005699A KR20180028532A (ko) | 2015-08-03 | 2016-07-29 | 식물에서 제초제 내성을 위한 방법 및 조성물 |
Country Status (22)
Country | Link |
---|---|
US (4) | US10370677B2 (ko) |
EP (1) | EP3331997B1 (ko) |
JP (3) | JP7030684B2 (ko) |
KR (1) | KR20180028532A (ko) |
CN (2) | CN108235709B (ko) |
AR (5) | AR105589A1 (ko) |
AU (3) | AU2016303496B2 (ko) |
BR (1) | BR112018002068A2 (ko) |
CA (1) | CA2993656A1 (ko) |
CL (1) | CL2018000301A1 (ko) |
CO (1) | CO2018002368A2 (ko) |
DK (1) | DK3331997T3 (ko) |
EC (1) | ECSP18015892A (ko) |
MX (4) | MX2018001525A (ko) |
PE (1) | PE20181026A1 (ko) |
PH (1) | PH12018500208A1 (ko) |
PT (1) | PT3331997T (ko) |
RS (1) | RS65394B1 (ko) |
RU (1) | RU2755224C2 (ko) |
UA (1) | UA126894C2 (ko) |
WO (1) | WO2017023778A1 (ko) |
ZA (1) | ZA201800469B (ko) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160286801A1 (en) | 2013-03-15 | 2016-10-06 | Suncor Energy Inc. | Herbicidal Compositions |
MX2018001525A (es) * | 2015-08-03 | 2018-04-24 | Monsanto Technology Llc | Metodos y composiciones para tolerancia a los herbicidas en plantas. |
US10378023B2 (en) | 2015-09-01 | 2019-08-13 | Monsanto Technology Llc | Methods and compositions for herbicide tolerance in plants |
US10563220B2 (en) | 2015-12-21 | 2020-02-18 | Monsanto Technology Llc | Compositions and methods for efficient targeting of transgenes |
BR112019000923A2 (pt) | 2016-07-29 | 2019-04-30 | Monsanto Technology Llc | métodos e composições para expressão gênica em plantas |
CA3026528A1 (en) * | 2017-12-15 | 2019-06-15 | Monsanto Technology Llc | Methods and compositions for ppo herbicide tolerance |
US11758907B2 (en) | 2017-12-20 | 2023-09-19 | Sumitomo Chemical Company, Limited | Method for controlling harmful organisms in crops |
WO2019210403A1 (en) * | 2018-04-30 | 2019-11-07 | Suncor Energy Inc. | Macrocyclic tetrapyrrole compounds, compositions and methods for increasing abiotic stress resistance in plants |
CN111423990B (zh) * | 2020-04-10 | 2021-08-27 | 科稷达隆(北京)生物技术有限公司 | 一种乙氧氟草醚敏感型酵母菌及其制备方法 |
MX2023006053A (es) | 2020-11-24 | 2023-06-06 | Syngenta Crop Protection Ag | Compuestos herbicidas. |
BR112023020434A2 (pt) | 2021-04-07 | 2023-12-05 | Syngenta Crop Protection Ag | Compostos herbicidas |
WO2023044364A1 (en) | 2021-09-15 | 2023-03-23 | Enko Chem, Inc. | Protoporphyrinogen oxidase inhibitors |
WO2023137309A2 (en) | 2022-01-14 | 2023-07-20 | Enko Chem, Inc. | Protoporphyrinogen oxidase inhibitors |
WO2023169984A1 (en) | 2022-03-11 | 2023-09-14 | Syngenta Crop Protection Ag | Herbicidal compounds |
WO2023222589A1 (en) | 2022-05-20 | 2023-11-23 | Syngenta Crop Protection Ag | Herbicidal compounds |
WO2024012968A1 (en) | 2022-07-13 | 2024-01-18 | Syngenta Crop Protection Ag | Herbicidal pyrimidinone derivatives |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5767373A (en) * | 1994-06-16 | 1998-06-16 | Novartis Finance Corporation | Manipulation of protoporphyrinogen oxidase enzyme activity in eukaryotic organisms |
AR006928A1 (es) | 1996-05-01 | 1999-09-29 | Pioneer Hi Bred Int | Una molecula de adn aislada que codifica una proteina fluorescente verde como marcador rastreable para la transformacion de plantas, un metodo para laproduccion de plantas transgenicas, un vector de expresion, una planta transgenica y celulas de dichas plantas. |
CA2276053C (en) * | 1996-12-27 | 2007-10-23 | Sumitomo Chemical Co., Ltd. | Methods of conferring ppo-inhibiting herbicide resistance to plants by gene manipulation |
ZA98371B (en) * | 1997-01-31 | 1999-07-16 | Du Pont | Genetically transformed plants demonstrating resistance to porphyrinogen biosynthesis-inhibiting herbicides. |
US6905852B1 (en) * | 1997-09-11 | 2005-06-14 | Nihon Nohyaku Co., Ltd. | Herbicide-resistant protoporphyrinogen oxidase isolated from Nicotiana tabacum |
WO2001012825A1 (en) * | 1999-08-13 | 2001-02-22 | Syngenta Participations Ag | Herbicide-tolerant protoporphyrinogen oxidase |
US7314974B2 (en) | 2002-02-21 | 2008-01-01 | Monsanto Technology, Llc | Expression of microbial proteins in plants for production of plants with improved properties |
US7671254B2 (en) * | 2005-08-25 | 2010-03-02 | The Board Of Trustees Of The University Of Illinois | Herbicide resistance gene, compositions and methods |
JP5365159B2 (ja) * | 2008-11-25 | 2013-12-11 | 住友化学株式会社 | 有害生物防除用組成物及び有害生物の防除方法 |
KR102085133B1 (ko) * | 2010-12-16 | 2020-03-05 | 바스프 아그로 비.브이. | 제초제에 대한 내성이 증가된 식물 |
US10041087B2 (en) * | 2012-06-19 | 2018-08-07 | BASF Agro B.V. | Plants having increased tolerance to herbicides |
AT514775B1 (de) | 2013-08-28 | 2017-11-15 | Erber Ag | Polypeptid zur hydrolytischen Spaltung von Zearalenon und/oder Zearalenon Derivaten, isoliertes Polynukleotid davon sowie Zusatzstoff enthaltend das Polypeptid |
MD4770B1 (ro) | 2013-12-18 | 2021-10-31 | BASF Agro B.V. | Plante cu toleranţă sporită la erbicide |
EP3310154A4 (en) | 2015-06-17 | 2019-02-13 | BASF Agro B.V. | PLANTS WITH INCREASED TOLERANCE TO HERBICIDES |
MX2018001525A (es) * | 2015-08-03 | 2018-04-24 | Monsanto Technology Llc | Metodos y composiciones para tolerancia a los herbicidas en plantas. |
US10378023B2 (en) | 2015-09-01 | 2019-08-13 | Monsanto Technology Llc | Methods and compositions for herbicide tolerance in plants |
US10563220B2 (en) | 2015-12-21 | 2020-02-18 | Monsanto Technology Llc | Compositions and methods for efficient targeting of transgenes |
BR112018072473A2 (pt) * | 2016-05-20 | 2019-02-19 | Basf Agro Bv | molécula de ácido nucleico, cassete de expressão, célula vegetal, planta, semente, métodos para expressar um ácido nucleico, produzir uma planta, controlar vegetação e cultivar a planta, combinação útil para o controle, processo para preparar uma combinação e uso de uma combinação |
BR112019000923A2 (pt) | 2016-07-29 | 2019-04-30 | Monsanto Technology Llc | métodos e composições para expressão gênica em plantas |
CA3026528A1 (en) | 2017-12-15 | 2019-06-15 | Monsanto Technology Llc | Methods and compositions for ppo herbicide tolerance |
-
2016
- 2016-07-29 MX MX2018001525A patent/MX2018001525A/es unknown
- 2016-07-29 UA UAA201802110A patent/UA126894C2/uk unknown
- 2016-07-29 WO PCT/US2016/044774 patent/WO2017023778A1/en active Application Filing
- 2016-07-29 CN CN201680055282.2A patent/CN108235709B/zh active Active
- 2016-07-29 DK DK16833627.9T patent/DK3331997T3/da active
- 2016-07-29 PE PE2018000175A patent/PE20181026A1/es unknown
- 2016-07-29 RS RS20240411A patent/RS65394B1/sr unknown
- 2016-07-29 BR BR112018002068-0A patent/BR112018002068A2/pt not_active Application Discontinuation
- 2016-07-29 JP JP2018505611A patent/JP7030684B2/ja active Active
- 2016-07-29 CN CN202311158897.6A patent/CN117143890A/zh active Pending
- 2016-07-29 KR KR1020187005699A patent/KR20180028532A/ko not_active Application Discontinuation
- 2016-07-29 CA CA2993656A patent/CA2993656A1/en active Pending
- 2016-07-29 AU AU2016303496A patent/AU2016303496B2/en active Active
- 2016-07-29 PT PT168336279T patent/PT3331997T/pt unknown
- 2016-07-29 EP EP16833627.9A patent/EP3331997B1/en active Active
- 2016-07-29 US US15/224,276 patent/US10370677B2/en active Active
- 2016-07-29 RU RU2018107701A patent/RU2755224C2/ru active
- 2016-08-03 AR ARP160102374A patent/AR105589A1/es not_active Application Discontinuation
-
2018
- 2018-01-23 ZA ZA2018/00469A patent/ZA201800469B/en unknown
- 2018-01-26 PH PH12018500208A patent/PH12018500208A1/en unknown
- 2018-02-02 MX MX2021011148A patent/MX2021011148A/es unknown
- 2018-02-02 MX MX2021011149A patent/MX2021011149A/es unknown
- 2018-02-02 MX MX2021011150A patent/MX2021011150A/es unknown
- 2018-02-02 CL CL2018000301A patent/CL2018000301A1/es unknown
- 2018-03-01 CO CONC2018/0002368A patent/CO2018002368A2/es unknown
- 2018-03-01 EC ECIEPI201815892A patent/ECSP18015892A/es unknown
-
2019
- 2019-06-25 US US16/452,305 patent/US11236353B2/en active Active
- 2019-06-25 US US16/452,327 patent/US11198886B2/en active Active
-
2020
- 2020-12-01 AU AU2020281034A patent/AU2020281034B2/en active Active
- 2020-12-03 AR ARP200103373A patent/AR122348A2/es unknown
- 2020-12-03 AR ARP200103374A patent/AR120668A2/es unknown
- 2020-12-03 AR ARP200103376A patent/AR120670A2/es unknown
- 2020-12-03 AR ARP200103375A patent/AR120669A2/es unknown
-
2021
- 2021-07-21 JP JP2021120873A patent/JP7344933B2/ja active Active
- 2021-11-09 US US17/522,737 patent/US20220127634A1/en active Pending
-
2022
- 2022-11-04 AU AU2022263577A patent/AU2022263577A1/en active Pending
-
2023
- 2023-06-13 JP JP2023096944A patent/JP2023116671A/ja active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7344933B2 (ja) | 植物における除草剤耐容性のための方法及び組成物 | |
US11319551B2 (en) | Methods and compositions for PPO herbicide tolerance in plants | |
RU2763534C2 (ru) | Способы и композиции для экспрессии генов в растениях | |
AU2020281170C1 (en) | Compositions and methods for efficient targeting of transgenes | |
CN107119061A (zh) | 草甘膦抗性植物和相关方法 | |
KR20090059103A (ko) | 변형된 디캄바 모노옥시게나제 효소 및 그의 사용 방법 | |
AU2019466501A9 (en) | Mutant hydroxyphenylpyruvate dioxygenase polypeptide, encoding gene thereof and use thereof | |
CA2963122A1 (en) | Herbicide tolerance genes and methods of use thereof | |
US11952582B2 (en) | Herbicide-resistance gene and application thereof in plant breeding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal |