KR101356311B1 - 증가된 수확량을 갖는 식물 및 이의 생산 방법 - Google Patents
증가된 수확량을 갖는 식물 및 이의 생산 방법 Download PDFInfo
- Publication number
- KR101356311B1 KR101356311B1 KR1020077017270A KR20077017270A KR101356311B1 KR 101356311 B1 KR101356311 B1 KR 101356311B1 KR 1020077017270 A KR1020077017270 A KR 1020077017270A KR 20077017270 A KR20077017270 A KR 20077017270A KR 101356311 B1 KR101356311 B1 KR 101356311B1
- Authority
- KR
- South Korea
- Prior art keywords
- gln
- gly
- ala
- ser
- met
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 107
- 230000001965 increasing effect Effects 0.000 title claims abstract description 64
- 241000196324 Embryophyta Species 0.000 claims abstract description 297
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 127
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 120
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 120
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 84
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 83
- 229920001184 polypeptide Polymers 0.000 claims abstract description 78
- 230000014509 gene expression Effects 0.000 claims abstract description 50
- 230000009261 transgenic effect Effects 0.000 claims abstract description 33
- 241000219195 Arabidopsis thaliana Species 0.000 claims abstract description 20
- 206010042863 synovial sarcoma Diseases 0.000 claims abstract description 8
- 230000005945 translocation Effects 0.000 claims abstract description 8
- 108090000623 proteins and genes Proteins 0.000 claims description 133
- 102000004169 proteins and genes Human genes 0.000 claims description 42
- 240000007594 Oryza sativa Species 0.000 claims description 26
- 235000007164 Oryza sativa Nutrition 0.000 claims description 21
- 230000001105 regulatory effect Effects 0.000 claims description 20
- 239000002028 Biomass Substances 0.000 claims description 18
- 240000008042 Zea mays Species 0.000 claims description 18
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 17
- 235000010469 Glycine max Nutrition 0.000 claims description 12
- 244000068988 Glycine max Species 0.000 claims description 12
- 235000009566 rice Nutrition 0.000 claims description 12
- 101150104463 GOS2 gene Proteins 0.000 claims description 11
- 240000000111 Saccharum officinarum Species 0.000 claims description 10
- 235000007201 Saccharum officinarum Nutrition 0.000 claims description 10
- 235000013339 cereals Nutrition 0.000 claims description 9
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 8
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 8
- 238000012239 gene modification Methods 0.000 claims description 8
- 230000005017 genetic modification Effects 0.000 claims description 8
- 235000013617 genetically modified food Nutrition 0.000 claims description 8
- 238000002741 site-directed mutagenesis Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 7
- 238000001994 activation Methods 0.000 claims description 7
- 235000013399 edible fruits Nutrition 0.000 claims description 7
- 244000062793 Sorghum vulgare Species 0.000 claims description 6
- 244000098338 Triticum aestivum Species 0.000 claims description 6
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 6
- 235000005822 corn Nutrition 0.000 claims description 6
- 240000005979 Hordeum vulgare Species 0.000 claims description 5
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 5
- 235000021307 Triticum Nutrition 0.000 claims description 5
- 235000014571 nuts Nutrition 0.000 claims description 5
- 235000010627 Phaseolus vulgaris Nutrition 0.000 claims description 4
- 244000046052 Phaseolus vulgaris Species 0.000 claims description 4
- 238000011161 development Methods 0.000 claims description 3
- 235000007319 Avena orientalis Nutrition 0.000 claims description 2
- 244000075850 Avena orientalis Species 0.000 claims description 2
- 241000219193 Brassicaceae Species 0.000 claims description 2
- 235000007238 Secale cereale Nutrition 0.000 claims description 2
- 244000082988 Secale cereale Species 0.000 claims description 2
- 235000011684 Sorghum saccharatum Nutrition 0.000 claims description 2
- 235000019713 millet Nutrition 0.000 claims description 2
- 230000008121 plant development Effects 0.000 claims description 2
- 230000008635 plant growth Effects 0.000 claims description 2
- 238000012225 targeting induced local lesions in genomes Methods 0.000 claims description 2
- 230000005030 transcription termination Effects 0.000 claims description 2
- 240000006394 Sorghum bicolor Species 0.000 claims 1
- 230000002068 genetic effect Effects 0.000 abstract description 9
- 108020004414 DNA Proteins 0.000 description 69
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 59
- JYCQGAGDJQYEDB-GUBZILKMSA-N Met-Gln-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O JYCQGAGDJQYEDB-GUBZILKMSA-N 0.000 description 44
- 108010044940 alanylglutamine Proteins 0.000 description 42
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 40
- 235000018102 proteins Nutrition 0.000 description 39
- PBYFVIQRFLNQCO-GUBZILKMSA-N Gln-Pro-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O PBYFVIQRFLNQCO-GUBZILKMSA-N 0.000 description 31
- 210000004027 cell Anatomy 0.000 description 31
- 238000009396 hybridization Methods 0.000 description 28
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 27
- 108010050848 glycylleucine Proteins 0.000 description 26
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 25
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 24
- 108010078144 glutaminyl-glycine Proteins 0.000 description 24
- 230000012010 growth Effects 0.000 description 24
- 108010040856 glutamyl-cysteinyl-alanine Proteins 0.000 description 23
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 21
- NMYFPKCIGUJMIK-GUBZILKMSA-N Gln-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NMYFPKCIGUJMIK-GUBZILKMSA-N 0.000 description 21
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 21
- 150000001413 amino acids Chemical class 0.000 description 21
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 20
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 20
- 108010031719 prolyl-serine Proteins 0.000 description 20
- 230000035882 stress Effects 0.000 description 20
- 241000894007 species Species 0.000 description 19
- 101000658118 Arabidopsis thaliana Threonine-tRNA ligase, mitochondrial 1 Proteins 0.000 description 18
- AAOBFSKXAVIORT-GUBZILKMSA-N Gln-Asn-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O AAOBFSKXAVIORT-GUBZILKMSA-N 0.000 description 18
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 18
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 18
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 17
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 17
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 16
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 16
- 108010091871 leucylmethionine Proteins 0.000 description 16
- 108010077112 prolyl-proline Proteins 0.000 description 16
- 210000001519 tissue Anatomy 0.000 description 16
- UBGGJTMETLEXJD-DCAQKATOSA-N Asn-Leu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O UBGGJTMETLEXJD-DCAQKATOSA-N 0.000 description 15
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 15
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 15
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 15
- ZZCJYPLMOPTZFC-SRVKXCTJSA-N Pro-Met-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O ZZCJYPLMOPTZFC-SRVKXCTJSA-N 0.000 description 15
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 15
- 108010047495 alanylglycine Proteins 0.000 description 15
- 108010071207 serylmethionine Proteins 0.000 description 15
- GQZDDFRXSDGUNG-YVNDNENWSA-N Gln-Ile-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O GQZDDFRXSDGUNG-YVNDNENWSA-N 0.000 description 14
- MJUUWJJEUOBDGW-IHRRRGAJSA-N His-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 MJUUWJJEUOBDGW-IHRRRGAJSA-N 0.000 description 14
- 125000003275 alpha amino acid group Chemical group 0.000 description 14
- 238000013507 mapping Methods 0.000 description 14
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 13
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 13
- SAEBUDRWKUXLOM-ACZMJKKPSA-N Glu-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(O)=O SAEBUDRWKUXLOM-ACZMJKKPSA-N 0.000 description 13
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 13
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 13
- 238000003306 harvesting Methods 0.000 description 13
- 238000005259 measurement Methods 0.000 description 13
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 12
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 12
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 12
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 12
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 12
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 12
- WLRYGVYQFXRJDA-DCAQKATOSA-N Gln-Pro-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 WLRYGVYQFXRJDA-DCAQKATOSA-N 0.000 description 12
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 12
- CMBXOSFZCFGDLE-IHRRRGAJSA-N Gln-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O CMBXOSFZCFGDLE-IHRRRGAJSA-N 0.000 description 12
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 12
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 12
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 12
- 108010005233 alanylglutamic acid Proteins 0.000 description 12
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 11
- ZNNNYCXPCKACHX-DCAQKATOSA-N His-Gln-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZNNNYCXPCKACHX-DCAQKATOSA-N 0.000 description 11
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 11
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 11
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 11
- XIGAHPDZLAYQOS-SRVKXCTJSA-N Met-Pro-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 XIGAHPDZLAYQOS-SRVKXCTJSA-N 0.000 description 11
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 11
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 11
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 11
- 108010047857 aspartylglycine Proteins 0.000 description 11
- 108010005942 methionylglycine Proteins 0.000 description 11
- 239000000203 mixture Substances 0.000 description 11
- 238000006467 substitution reaction Methods 0.000 description 11
- 230000009466 transformation Effects 0.000 description 11
- UGLPMYSCWHTZQU-AUTRQRHGSA-N Ala-Ala-Tyr Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UGLPMYSCWHTZQU-AUTRQRHGSA-N 0.000 description 10
- 108010090461 DFG peptide Proteins 0.000 description 10
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 10
- JNENSVNAUWONEZ-GUBZILKMSA-N Gln-Lys-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JNENSVNAUWONEZ-GUBZILKMSA-N 0.000 description 10
- YZPVGIVFMZLQMM-YUMQZZPRSA-N Gly-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN YZPVGIVFMZLQMM-YUMQZZPRSA-N 0.000 description 10
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 10
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 10
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 10
- GYXVUTAOICLGKJ-ACZMJKKPSA-N Ser-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N GYXVUTAOICLGKJ-ACZMJKKPSA-N 0.000 description 10
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 10
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 10
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 10
- 235000007244 Zea mays Nutrition 0.000 description 10
- 108010060035 arginylproline Proteins 0.000 description 10
- 108010038633 aspartylglutamate Proteins 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 108010012058 leucyltyrosine Proteins 0.000 description 10
- 108010085203 methionylmethionine Proteins 0.000 description 10
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 10
- 108010029020 prolylglycine Proteins 0.000 description 10
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 9
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 9
- PODFFOWWLUPNMN-DCAQKATOSA-N Gln-His-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PODFFOWWLUPNMN-DCAQKATOSA-N 0.000 description 9
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 9
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 9
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 9
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 9
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 9
- WXUUEPIDLLQBLJ-DCAQKATOSA-N Met-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N WXUUEPIDLLQBLJ-DCAQKATOSA-N 0.000 description 9
- 235000002595 Solanum tuberosum Nutrition 0.000 description 9
- 244000061456 Solanum tuberosum Species 0.000 description 9
- 108010087924 alanylproline Proteins 0.000 description 9
- 210000002257 embryonic structure Anatomy 0.000 description 9
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- 230000037431 insertion Effects 0.000 description 9
- 108010068488 methionylphenylalanine Proteins 0.000 description 9
- 108010090894 prolylleucine Proteins 0.000 description 9
- 108010026333 seryl-proline Proteins 0.000 description 9
- 230000002103 transcriptional effect Effects 0.000 description 9
- 239000013598 vector Substances 0.000 description 9
- LZLCLRQMUQWUHJ-GUBZILKMSA-N Asn-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N LZLCLRQMUQWUHJ-GUBZILKMSA-N 0.000 description 8
- 240000002791 Brassica napus Species 0.000 description 8
- YJSCHRBERYWPQL-DCAQKATOSA-N Gln-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N YJSCHRBERYWPQL-DCAQKATOSA-N 0.000 description 8
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 8
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 8
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 8
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 8
- GXYYFDKJHLRNSI-SRVKXCTJSA-N Met-Gln-His Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O GXYYFDKJHLRNSI-SRVKXCTJSA-N 0.000 description 8
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 8
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 8
- 108700019146 Transgenes Proteins 0.000 description 8
- 108010070944 alanylhistidine Proteins 0.000 description 8
- 108010049041 glutamylalanine Proteins 0.000 description 8
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 8
- 239000003550 marker Substances 0.000 description 8
- 239000000523 sample Substances 0.000 description 8
- 108010061238 threonyl-glycine Proteins 0.000 description 8
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 7
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 7
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 7
- 235000011293 Brassica napus Nutrition 0.000 description 7
- XHWLNISLUFEWNS-CIUDSAMLSA-N Glu-Gln-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XHWLNISLUFEWNS-CIUDSAMLSA-N 0.000 description 7
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 7
- OMOZPGCHVWOXHN-BQBZGAKWSA-N Gly-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)CN OMOZPGCHVWOXHN-BQBZGAKWSA-N 0.000 description 7
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 7
- VTMSUKSRIKCCAD-ULQDDVLXSA-N His-Tyr-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N VTMSUKSRIKCCAD-ULQDDVLXSA-N 0.000 description 7
- 241000880493 Leptailurus serval Species 0.000 description 7
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 7
- LQUIENKUVKPNIC-ULQDDVLXSA-N Leu-Met-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LQUIENKUVKPNIC-ULQDDVLXSA-N 0.000 description 7
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 7
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 7
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 7
- HZLSUXCMSIBCRV-RVMXOQNASA-N Met-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N HZLSUXCMSIBCRV-RVMXOQNASA-N 0.000 description 7
- JFNPBBOGGNMSRX-CIUDSAMLSA-N Pro-Gln-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O JFNPBBOGGNMSRX-CIUDSAMLSA-N 0.000 description 7
- FISHYTLIMUYTQY-GUBZILKMSA-N Pro-Gln-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 FISHYTLIMUYTQY-GUBZILKMSA-N 0.000 description 7
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 7
- 241000169446 Promethis Species 0.000 description 7
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 7
- WANVRBAZGSICCP-SRVKXCTJSA-N Val-Pro-Met Chemical compound CSCC[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C)C(O)=O WANVRBAZGSICCP-SRVKXCTJSA-N 0.000 description 7
- 230000003321 amplification Effects 0.000 description 7
- 244000038559 crop plants Species 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 230000006872 improvement Effects 0.000 description 7
- 238000002703 mutagenesis Methods 0.000 description 7
- 231100000350 mutagenesis Toxicity 0.000 description 7
- 238000003199 nucleic acid amplification method Methods 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 6
- VBDMWOKJZDCFJM-FXQIFTODSA-N Ala-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N VBDMWOKJZDCFJM-FXQIFTODSA-N 0.000 description 6
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 6
- ZDYNWWQXFRUOEO-XDTLVQLUSA-N Ala-Gln-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDYNWWQXFRUOEO-XDTLVQLUSA-N 0.000 description 6
- PVQLRJRPUTXFFX-CIUDSAMLSA-N Ala-Met-Gln Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PVQLRJRPUTXFFX-CIUDSAMLSA-N 0.000 description 6
- AWNAEZICPNGAJK-FXQIFTODSA-N Ala-Met-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O AWNAEZICPNGAJK-FXQIFTODSA-N 0.000 description 6
- OWUCNXMFJRFOFI-BQBZGAKWSA-N Asn-Gly-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O OWUCNXMFJRFOFI-BQBZGAKWSA-N 0.000 description 6
- XMTDCXXLDZKAGI-ACZMJKKPSA-N Cys-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N XMTDCXXLDZKAGI-ACZMJKKPSA-N 0.000 description 6
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 6
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 6
- CYTSBCIIEHUPDU-ACZMJKKPSA-N Gln-Asp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O CYTSBCIIEHUPDU-ACZMJKKPSA-N 0.000 description 6
- GHYJGDCPHMSFEJ-GUBZILKMSA-N Gln-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GHYJGDCPHMSFEJ-GUBZILKMSA-N 0.000 description 6
- DQLVHRFFBQOWFL-JYJNAYRXSA-N Gln-Lys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)O DQLVHRFFBQOWFL-JYJNAYRXSA-N 0.000 description 6
- JTWZNMUVQWWGOX-SOUVJXGZSA-N Gln-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JTWZNMUVQWWGOX-SOUVJXGZSA-N 0.000 description 6
- BIYNPVYAZOUVFQ-CIUDSAMLSA-N Glu-Pro-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O BIYNPVYAZOUVFQ-CIUDSAMLSA-N 0.000 description 6
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 6
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 6
- 239000004471 Glycine Substances 0.000 description 6
- 244000299507 Gossypium hirsutum Species 0.000 description 6
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 6
- 241000282414 Homo sapiens Species 0.000 description 6
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 6
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 6
- 108091092195 Intron Proteins 0.000 description 6
- MPSBSKHOWJQHBS-IHRRRGAJSA-N Leu-His-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N MPSBSKHOWJQHBS-IHRRRGAJSA-N 0.000 description 6
- CPONGMJGVIAWEH-DCAQKATOSA-N Leu-Met-Ala Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O CPONGMJGVIAWEH-DCAQKATOSA-N 0.000 description 6
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 6
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 6
- CRGKLOXHKICQOL-GARJFASQSA-N Met-Gln-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N CRGKLOXHKICQOL-GARJFASQSA-N 0.000 description 6
- OBPCXINRFKHSRY-SDDRHHMPSA-N Met-Met-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N OBPCXINRFKHSRY-SDDRHHMPSA-N 0.000 description 6
- 108010079364 N-glycylalanine Proteins 0.000 description 6
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 6
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 6
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 6
- QHEGAOPHISYNDF-XDTLVQLUSA-N Tyr-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHEGAOPHISYNDF-XDTLVQLUSA-N 0.000 description 6
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 6
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 6
- 230000000295 complement effect Effects 0.000 description 6
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 6
- 108010010147 glycylglutamine Proteins 0.000 description 6
- 108010015792 glycyllysine Proteins 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 108010070643 prolylglutamic acid Proteins 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 238000009331 sowing Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 5
- IXTPACPAXIOCRG-ACZMJKKPSA-N Ala-Glu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N IXTPACPAXIOCRG-ACZMJKKPSA-N 0.000 description 5
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 5
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 5
- 108700028369 Alleles Proteins 0.000 description 5
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 5
- DNBMCNQKNOKOSD-DCAQKATOSA-N Arg-Pro-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O DNBMCNQKNOKOSD-DCAQKATOSA-N 0.000 description 5
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 5
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 5
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 5
- 235000005976 Citrus sinensis Nutrition 0.000 description 5
- 240000002319 Citrus sinensis Species 0.000 description 5
- 108091026890 Coding region Proteins 0.000 description 5
- 238000001134 F-test Methods 0.000 description 5
- MLZRSFQRBDNJON-GUBZILKMSA-N Gln-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MLZRSFQRBDNJON-GUBZILKMSA-N 0.000 description 5
- CKNUKHBRCSMKMO-XHNCKOQMSA-N Gln-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O CKNUKHBRCSMKMO-XHNCKOQMSA-N 0.000 description 5
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 5
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 5
- VUVKKXPCKILIBD-AVGNSLFASA-N Gln-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VUVKKXPCKILIBD-AVGNSLFASA-N 0.000 description 5
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 5
- KLKYKPXITJBSNI-CIUDSAMLSA-N Gln-Met-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O KLKYKPXITJBSNI-CIUDSAMLSA-N 0.000 description 5
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 5
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 5
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 5
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 5
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 5
- LIXWIUAORXJNBH-QWRGUYRKSA-N Gly-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN LIXWIUAORXJNBH-QWRGUYRKSA-N 0.000 description 5
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 5
- 235000009432 Gossypium hirsutum Nutrition 0.000 description 5
- ZVKDCQVQTGYBQT-LSJOCFKGSA-N His-Pro-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O ZVKDCQVQTGYBQT-LSJOCFKGSA-N 0.000 description 5
- CYHJCEKUMCNDFG-LAEOZQHASA-N Ile-Gln-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N CYHJCEKUMCNDFG-LAEOZQHASA-N 0.000 description 5
- QPXBPQUGXHURGP-UWVGGRQHSA-N Leu-Gly-Met Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)O)N QPXBPQUGXHURGP-UWVGGRQHSA-N 0.000 description 5
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 5
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 5
- GGNOBVSOZPHLCE-GUBZILKMSA-N Lys-Gln-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GGNOBVSOZPHLCE-GUBZILKMSA-N 0.000 description 5
- 241000219823 Medicago Species 0.000 description 5
- KLFPZIUIXZNEKY-DCAQKATOSA-N Met-Gln-Met Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O KLFPZIUIXZNEKY-DCAQKATOSA-N 0.000 description 5
- ZDJICAUBMUKVEJ-CIUDSAMLSA-N Met-Ser-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O ZDJICAUBMUKVEJ-CIUDSAMLSA-N 0.000 description 5
- FZDOBWIKRQORAC-ULQDDVLXSA-N Met-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N FZDOBWIKRQORAC-ULQDDVLXSA-N 0.000 description 5
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 5
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 5
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 5
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 5
- FEVDNIBDCRKMER-IUCAKERBSA-N Pro-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEVDNIBDCRKMER-IUCAKERBSA-N 0.000 description 5
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 5
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 5
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 5
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 5
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 5
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 5
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 5
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 5
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 5
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 5
- 240000003768 Solanum lycopersicum Species 0.000 description 5
- CTONFVDJYCAMQM-IUKAMOBKSA-N Thr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)N CTONFVDJYCAMQM-IUKAMOBKSA-N 0.000 description 5
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 210000004899 c-terminal region Anatomy 0.000 description 5
- 230000001276 controlling effect Effects 0.000 description 5
- 230000007423 decrease Effects 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 5
- 108010018006 histidylserine Proteins 0.000 description 5
- 230000001939 inductive effect Effects 0.000 description 5
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 5
- 239000002773 nucleotide Substances 0.000 description 5
- 239000003921 oil Substances 0.000 description 5
- 210000000056 organ Anatomy 0.000 description 5
- 239000013612 plasmid Substances 0.000 description 5
- 230000006798 recombination Effects 0.000 description 5
- 238000005215 recombination Methods 0.000 description 5
- 108010048818 seryl-histidine Proteins 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 108010078580 tyrosylleucine Proteins 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 238000005406 washing Methods 0.000 description 5
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 4
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 4
- OSRZOHXQCUFIQG-FPMFFAJLSA-N Ala-Phe-Pro Chemical compound C([C@H](NC(=O)[C@@H]([NH3+])C)C(=O)N1[C@H](CCC1)C([O-])=O)C1=CC=CC=C1 OSRZOHXQCUFIQG-FPMFFAJLSA-N 0.000 description 4
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 4
- 244000291564 Allium cepa Species 0.000 description 4
- 241000219194 Arabidopsis Species 0.000 description 4
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 4
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 4
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 4
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 4
- GFGUPLIETCNQGF-DCAQKATOSA-N Asn-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O GFGUPLIETCNQGF-DCAQKATOSA-N 0.000 description 4
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 4
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 4
- 241000228212 Aspergillus Species 0.000 description 4
- 235000006008 Brassica napus var napus Nutrition 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 241000221085 Euphorbia esula Species 0.000 description 4
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 4
- RBWKVOSARCFSQQ-FXQIFTODSA-N Gln-Gln-Ser Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O RBWKVOSARCFSQQ-FXQIFTODSA-N 0.000 description 4
- IWUFOVSLWADEJC-AVGNSLFASA-N Gln-His-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IWUFOVSLWADEJC-AVGNSLFASA-N 0.000 description 4
- LVRKAFPPFJRIOF-GARJFASQSA-N Gln-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N LVRKAFPPFJRIOF-GARJFASQSA-N 0.000 description 4
- ROHVCXBMIAAASL-HJGDQZAQSA-N Gln-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)N)N)O ROHVCXBMIAAASL-HJGDQZAQSA-N 0.000 description 4
- RWCBJYUPAUTWJD-NHCYSSNCSA-N Gln-Met-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O RWCBJYUPAUTWJD-NHCYSSNCSA-N 0.000 description 4
- OZEQPCDLCDRCGY-SOUVJXGZSA-N Gln-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCC(=O)N)N)C(=O)O OZEQPCDLCDRCGY-SOUVJXGZSA-N 0.000 description 4
- LGWNISYVKDNJRP-FXQIFTODSA-N Gln-Ser-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGWNISYVKDNJRP-FXQIFTODSA-N 0.000 description 4
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 4
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 4
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 4
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 4
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 4
- YNIMVVJTPWCUJH-KBPBESRZSA-N Gly-His-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YNIMVVJTPWCUJH-KBPBESRZSA-N 0.000 description 4
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 4
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 4
- QAMMIGULQSIRCD-IRXDYDNUSA-N Gly-Phe-Tyr Chemical compound C([C@H](NC(=O)C[NH3+])C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C([O-])=O)C1=CC=CC=C1 QAMMIGULQSIRCD-IRXDYDNUSA-N 0.000 description 4
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 4
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 4
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 4
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 4
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 4
- LJKDGRWXYUTRSH-YVNDNENWSA-N Ile-Gln-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LJKDGRWXYUTRSH-YVNDNENWSA-N 0.000 description 4
- IMRKCLXPYOIHIF-ZPFDUUQYSA-N Ile-Met-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N IMRKCLXPYOIHIF-ZPFDUUQYSA-N 0.000 description 4
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 4
- BOFAFKVZQUMTID-AVGNSLFASA-N Leu-Gln-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BOFAFKVZQUMTID-AVGNSLFASA-N 0.000 description 4
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 4
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 4
- ZAJNRWKGHWGPDQ-SDDRHHMPSA-N Met-Arg-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N ZAJNRWKGHWGPDQ-SDDRHHMPSA-N 0.000 description 4
- LRALLISKBZNSKN-BQBZGAKWSA-N Met-Gly-Ser Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LRALLISKBZNSKN-BQBZGAKWSA-N 0.000 description 4
- CUICVBQQHMKBRJ-LSJOCFKGSA-N Met-His-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O CUICVBQQHMKBRJ-LSJOCFKGSA-N 0.000 description 4
- YLBUMXYVQCHBPR-ULQDDVLXSA-N Met-Leu-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YLBUMXYVQCHBPR-ULQDDVLXSA-N 0.000 description 4
- NTYQUVLERIHPMU-HRCADAONSA-N Met-Phe-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N NTYQUVLERIHPMU-HRCADAONSA-N 0.000 description 4
- PHURAEXVWLDIGT-LPEHRKFASA-N Met-Ser-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N PHURAEXVWLDIGT-LPEHRKFASA-N 0.000 description 4
- NDJSSFWDYDUQID-YTWAJWBKSA-N Met-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N)O NDJSSFWDYDUQID-YTWAJWBKSA-N 0.000 description 4
- HOTNHEUETJELDL-BPNCWPANSA-N Met-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N HOTNHEUETJELDL-BPNCWPANSA-N 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 102000015636 Oligopeptides Human genes 0.000 description 4
- 108010038807 Oligopeptides Proteins 0.000 description 4
- RFEXGCASCQGGHZ-STQMWFEESA-N Phe-Gly-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O RFEXGCASCQGGHZ-STQMWFEESA-N 0.000 description 4
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 4
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 4
- MZNUJZBYRWXWLQ-AVGNSLFASA-N Pro-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 MZNUJZBYRWXWLQ-AVGNSLFASA-N 0.000 description 4
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 4
- WVXQQUWOKUZIEG-VEVYYDQMSA-N Pro-Thr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O WVXQQUWOKUZIEG-VEVYYDQMSA-N 0.000 description 4
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 4
- BYCVMHKULKRVPV-GUBZILKMSA-N Ser-Lys-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYCVMHKULKRVPV-GUBZILKMSA-N 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- LKJCABTUFGTPPY-HJGDQZAQSA-N Thr-Pro-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O LKJCABTUFGTPPY-HJGDQZAQSA-N 0.000 description 4
- 241000209140 Triticum Species 0.000 description 4
- OJPRSVJGNCAKQX-SRVKXCTJSA-N Val-Met-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OJPRSVJGNCAKQX-SRVKXCTJSA-N 0.000 description 4
- 235000014787 Vitis vinifera Nutrition 0.000 description 4
- 240000006365 Vitis vinifera Species 0.000 description 4
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 4
- 108010093581 aspartyl-proline Proteins 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 229940088598 enzyme Drugs 0.000 description 4
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 4
- 235000002532 grape seed extract Nutrition 0.000 description 4
- 108010028295 histidylhistidine Proteins 0.000 description 4
- 108010085325 histidylproline Proteins 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 125000003729 nucleotide group Chemical group 0.000 description 4
- 108091033319 polynucleotide Proteins 0.000 description 4
- 102000040430 polynucleotide Human genes 0.000 description 4
- 239000002157 polynucleotide Substances 0.000 description 4
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 4
- 108010053725 prolylvaline Proteins 0.000 description 4
- 230000000644 propagated effect Effects 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 108010003137 tyrosyltyrosine Proteins 0.000 description 4
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 3
- 241000589158 Agrobacterium Species 0.000 description 3
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 3
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 3
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 3
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 3
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 3
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 3
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 3
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 3
- 235000005255 Allium cepa Nutrition 0.000 description 3
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 3
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 3
- HAFCJCDJGIOYPW-WDSKDSINSA-N Asp-Gly-Gln Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O HAFCJCDJGIOYPW-WDSKDSINSA-N 0.000 description 3
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 3
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 3
- 241000743776 Brachypodium distachyon Species 0.000 description 3
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 3
- 240000000385 Brassica napus var. napus Species 0.000 description 3
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 3
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 3
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 3
- GRNOCLDFUNCIDW-ACZMJKKPSA-N Cys-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N GRNOCLDFUNCIDW-ACZMJKKPSA-N 0.000 description 3
- 101100437104 Drosophila melanogaster AttB gene Proteins 0.000 description 3
- REJJNXODKSHOKA-ACZMJKKPSA-N Gln-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N REJJNXODKSHOKA-ACZMJKKPSA-N 0.000 description 3
- XXLBHPPXDUWYAG-XQXXSGGOSA-N Gln-Ala-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XXLBHPPXDUWYAG-XQXXSGGOSA-N 0.000 description 3
- SOBBAYVQSNXYPQ-ACZMJKKPSA-N Gln-Asn-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SOBBAYVQSNXYPQ-ACZMJKKPSA-N 0.000 description 3
- GPISLLFQNHELLK-DCAQKATOSA-N Gln-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GPISLLFQNHELLK-DCAQKATOSA-N 0.000 description 3
- ZQPOVSJFBBETHQ-CIUDSAMLSA-N Gln-Glu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZQPOVSJFBBETHQ-CIUDSAMLSA-N 0.000 description 3
- CLPQUWHBWXFJOX-BQBZGAKWSA-N Gln-Gly-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O CLPQUWHBWXFJOX-BQBZGAKWSA-N 0.000 description 3
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 3
- KKCJHBXMYYVWMX-KQXIARHKSA-N Gln-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N KKCJHBXMYYVWMX-KQXIARHKSA-N 0.000 description 3
- BJPPYOMRAVLXBY-YUMQZZPRSA-N Gln-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N BJPPYOMRAVLXBY-YUMQZZPRSA-N 0.000 description 3
- AQPZYBSRDRZBAG-AVGNSLFASA-N Gln-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N AQPZYBSRDRZBAG-AVGNSLFASA-N 0.000 description 3
- UESYBOXFJWJVSB-AVGNSLFASA-N Gln-Phe-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O UESYBOXFJWJVSB-AVGNSLFASA-N 0.000 description 3
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 3
- DCWNCMRZIZSZBL-KKUMJFAQSA-N Gln-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O DCWNCMRZIZSZBL-KKUMJFAQSA-N 0.000 description 3
- RWQCWSGOOOEGPB-FXQIFTODSA-N Gln-Ser-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O RWQCWSGOOOEGPB-FXQIFTODSA-N 0.000 description 3
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 3
- VYOILACOFPPNQH-UMNHJUIQSA-N Gln-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N VYOILACOFPPNQH-UMNHJUIQSA-N 0.000 description 3
- HNAUFGBKJLTWQE-IFFSRLJSSA-N Gln-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N)O HNAUFGBKJLTWQE-IFFSRLJSSA-N 0.000 description 3
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 3
- NUSWUSKZRCGFEX-FXQIFTODSA-N Glu-Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O NUSWUSKZRCGFEX-FXQIFTODSA-N 0.000 description 3
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 3
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 3
- ZAPFAWQHBOHWLL-GUBZILKMSA-N Glu-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N ZAPFAWQHBOHWLL-GUBZILKMSA-N 0.000 description 3
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 3
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 3
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 3
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 3
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 3
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 3
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 3
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 3
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 3
- BBTCXWTXOXUNFX-IUCAKERBSA-N Gly-Met-Arg Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O BBTCXWTXOXUNFX-IUCAKERBSA-N 0.000 description 3
- IFHJOBKVXBESRE-YUMQZZPRSA-N Gly-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN IFHJOBKVXBESRE-YUMQZZPRSA-N 0.000 description 3
- RVGMVLVBDRQVKB-UWVGGRQHSA-N Gly-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN RVGMVLVBDRQVKB-UWVGGRQHSA-N 0.000 description 3
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 3
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 3
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 3
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 3
- 235000014751 Gossypium arboreum Nutrition 0.000 description 3
- 240000001814 Gossypium arboreum Species 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- CHZRWFUGWRTUOD-IUCAKERBSA-N His-Gly-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N CHZRWFUGWRTUOD-IUCAKERBSA-N 0.000 description 3
- FDQYIRHBVVUTJF-ZETCQYMHSA-N His-Gly-Gly Chemical compound [O-]C(=O)CNC(=O)CNC(=O)[C@@H]([NH3+])CC1=CN=CN1 FDQYIRHBVVUTJF-ZETCQYMHSA-N 0.000 description 3
- 101000642815 Homo sapiens Protein SSXT Proteins 0.000 description 3
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 3
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 3
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 3
- DBXXASNNDTXOLU-MXAVVETBSA-N Ile-Leu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DBXXASNNDTXOLU-MXAVVETBSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- 235000003127 Lactuca serriola Nutrition 0.000 description 3
- 240000006137 Lactuca serriola Species 0.000 description 3
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 3
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 3
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 3
- CFZZDVMBRYFFNU-QWRGUYRKSA-N Leu-His-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O CFZZDVMBRYFFNU-QWRGUYRKSA-N 0.000 description 3
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 3
- 244000081841 Malus domestica Species 0.000 description 3
- 235000011430 Malus pumila Nutrition 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- FWTBMGAKKPSTBT-GUBZILKMSA-N Met-Gln-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FWTBMGAKKPSTBT-GUBZILKMSA-N 0.000 description 3
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 3
- BKIFWLQFOOKUCA-DCAQKATOSA-N Met-His-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N BKIFWLQFOOKUCA-DCAQKATOSA-N 0.000 description 3
- JOYFULUKJRJCSX-IUCAKERBSA-N Met-Met-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O JOYFULUKJRJCSX-IUCAKERBSA-N 0.000 description 3
- QEDGNYFHLXXIDC-DCAQKATOSA-N Met-Pro-Gln Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O QEDGNYFHLXXIDC-DCAQKATOSA-N 0.000 description 3
- FNYBIOGBMWFQRJ-SRVKXCTJSA-N Met-Pro-Met Chemical compound CSCC[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N FNYBIOGBMWFQRJ-SRVKXCTJSA-N 0.000 description 3
- SPSSJSICDYYTQN-HJGDQZAQSA-N Met-Thr-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O SPSSJSICDYYTQN-HJGDQZAQSA-N 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 241001520808 Panicum virgatum Species 0.000 description 3
- 235000008566 Pinus taeda Nutrition 0.000 description 3
- 241000218679 Pinus taeda Species 0.000 description 3
- 108700001094 Plant Genes Proteins 0.000 description 3
- 241000183024 Populus tremula Species 0.000 description 3
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 3
- ZSKJPKFTPQCPIH-RCWTZXSCSA-N Pro-Arg-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSKJPKFTPQCPIH-RCWTZXSCSA-N 0.000 description 3
- UVKNEILZSJMKSR-FXQIFTODSA-N Pro-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 UVKNEILZSJMKSR-FXQIFTODSA-N 0.000 description 3
- DRIJZWBRGMJCDD-DCAQKATOSA-N Pro-Gln-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O DRIJZWBRGMJCDD-DCAQKATOSA-N 0.000 description 3
- KLOQCCRTPHPIFN-DCAQKATOSA-N Pro-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 KLOQCCRTPHPIFN-DCAQKATOSA-N 0.000 description 3
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 3
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 3
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 3
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 3
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 3
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 3
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 3
- QBUWQRKEHJXTOP-DCAQKATOSA-N Ser-His-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QBUWQRKEHJXTOP-DCAQKATOSA-N 0.000 description 3
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 3
- 235000007230 Sorghum bicolor Nutrition 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- 108010006785 Taq Polymerase Proteins 0.000 description 3
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 3
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 3
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 3
- GYBVHTWOQJMYAM-HRCADAONSA-N Tyr-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N GYBVHTWOQJMYAM-HRCADAONSA-N 0.000 description 3
- OGPKMBOPMDTEDM-IHRRRGAJSA-N Tyr-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N OGPKMBOPMDTEDM-IHRRRGAJSA-N 0.000 description 3
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 3
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 3
- HQYVQDRYODWONX-DCAQKATOSA-N Val-His-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N HQYVQDRYODWONX-DCAQKATOSA-N 0.000 description 3
- WSUWDIVCPOJFCX-TUAOUCFPSA-N Val-Met-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N WSUWDIVCPOJFCX-TUAOUCFPSA-N 0.000 description 3
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 239000012190 activator Substances 0.000 description 3
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 3
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 238000009395 breeding Methods 0.000 description 3
- 230000001488 breeding effect Effects 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 239000012297 crystallization seed Substances 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 238000011049 filling Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 108010081551 glycylphenylalanine Proteins 0.000 description 3
- 108010036413 histidylglycine Proteins 0.000 description 3
- 102000057055 human SS18 Human genes 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 3
- 108010034529 leucyl-lysine Proteins 0.000 description 3
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 210000001161 mammalian embryo Anatomy 0.000 description 3
- 238000002844 melting Methods 0.000 description 3
- 230000008018 melting Effects 0.000 description 3
- 230000002503 metabolic effect Effects 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 230000002018 overexpression Effects 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 235000012015 potatoes Nutrition 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000035755 proliferation Effects 0.000 description 3
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 239000011734 sodium Substances 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 108091006106 transcriptional activators Proteins 0.000 description 3
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000005303 weighing Methods 0.000 description 3
- 108010027345 wheylin-1 peptide Proteins 0.000 description 3
- WOJJIRYPFAZEPF-YFKPBYRVSA-N 2-[[(2s)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]propanoyl]amino]acetate Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)CN WOJJIRYPFAZEPF-YFKPBYRVSA-N 0.000 description 2
- XWTNPSHCJMZAHQ-QMMMGPOBSA-N 2-[[2-[[2-[[(2s)-2-amino-4-methylpentanoyl]amino]acetyl]amino]acetyl]amino]acetic acid Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(=O)NCC(O)=O XWTNPSHCJMZAHQ-QMMMGPOBSA-N 0.000 description 2
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 2
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 2
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 2
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 2
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 2
- CRWFEKLFPVRPBV-CIUDSAMLSA-N Ala-Gln-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O CRWFEKLFPVRPBV-CIUDSAMLSA-N 0.000 description 2
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 2
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 2
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 2
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 2
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 2
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 2
- JDIQCVUDDFENPU-ZKWXMUAHSA-N Ala-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CNC=N1 JDIQCVUDDFENPU-ZKWXMUAHSA-N 0.000 description 2
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 2
- SBYABBIDCYVZFF-BJDJZHNGSA-N Ala-Met-Gln-Gln Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O SBYABBIDCYVZFF-BJDJZHNGSA-N 0.000 description 2
- DEWWPUNXRNGMQN-LPEHRKFASA-N Ala-Met-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N DEWWPUNXRNGMQN-LPEHRKFASA-N 0.000 description 2
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 2
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 2
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 2
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 2
- 241000401082 Aquilegia formosa x Aquilegia pubescens Species 0.000 description 2
- DFCIPNHFKOQAME-FXQIFTODSA-N Arg-Ala-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFCIPNHFKOQAME-FXQIFTODSA-N 0.000 description 2
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 2
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 2
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 2
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 2
- AYKKKGFJXIDYLX-ACZMJKKPSA-N Asn-Gln-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AYKKKGFJXIDYLX-ACZMJKKPSA-N 0.000 description 2
- MECFLTFREHAZLH-ACZMJKKPSA-N Asn-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N MECFLTFREHAZLH-ACZMJKKPSA-N 0.000 description 2
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 2
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 2
- HXWUJJADFMXNKA-BQBZGAKWSA-N Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O HXWUJJADFMXNKA-BQBZGAKWSA-N 0.000 description 2
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 2
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 2
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 2
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 2
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 2
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 2
- 240000007124 Brassica oleracea Species 0.000 description 2
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 2
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 2
- 235000012905 Brassica oleracea var viridis Nutrition 0.000 description 2
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 2
- 108010077544 Chromatin Proteins 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 241000220223 Fragaria Species 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- LKUWAWGNJYJODH-KBIXCLLPSA-N Gln-Ala-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKUWAWGNJYJODH-KBIXCLLPSA-N 0.000 description 2
- IGNGBUVODQLMRJ-CIUDSAMLSA-N Gln-Ala-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IGNGBUVODQLMRJ-CIUDSAMLSA-N 0.000 description 2
- WQWMZOIPXWSZNE-WDSKDSINSA-N Gln-Asp-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O WQWMZOIPXWSZNE-WDSKDSINSA-N 0.000 description 2
- JFSNBQJNDMXMQF-XHNCKOQMSA-N Gln-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JFSNBQJNDMXMQF-XHNCKOQMSA-N 0.000 description 2
- UICOTGULOUGGLC-NUMRIWBASA-N Gln-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UICOTGULOUGGLC-NUMRIWBASA-N 0.000 description 2
- NVEASDQHBRZPSU-BQBZGAKWSA-N Gln-Gln-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O NVEASDQHBRZPSU-BQBZGAKWSA-N 0.000 description 2
- AJDMYLOISOCHHC-YVNDNENWSA-N Gln-Gln-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AJDMYLOISOCHHC-YVNDNENWSA-N 0.000 description 2
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 2
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 2
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 2
- FALJZCPMTGJOHX-SRVKXCTJSA-N Gln-Met-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O FALJZCPMTGJOHX-SRVKXCTJSA-N 0.000 description 2
- QBEWLBKBGXVVPD-RYUDHWBXSA-N Gln-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N QBEWLBKBGXVVPD-RYUDHWBXSA-N 0.000 description 2
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 2
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 2
- UGEZSPWLJABDAR-KKUMJFAQSA-N Gln-Tyr-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N UGEZSPWLJABDAR-KKUMJFAQSA-N 0.000 description 2
- ICRKQMRFXYDYMK-LAEOZQHASA-N Gln-Val-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ICRKQMRFXYDYMK-LAEOZQHASA-N 0.000 description 2
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 2
- PBEQPAZRHDVJQI-SRVKXCTJSA-N Glu-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N PBEQPAZRHDVJQI-SRVKXCTJSA-N 0.000 description 2
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 2
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 2
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 2
- DAHLWSFUXOHMIA-FXQIFTODSA-N Glu-Ser-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O DAHLWSFUXOHMIA-FXQIFTODSA-N 0.000 description 2
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 2
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 2
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 2
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 2
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 2
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 2
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 2
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 2
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 2
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 2
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 2
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 2
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 2
- ICUTTWWCDIIIEE-BQBZGAKWSA-N Gly-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN ICUTTWWCDIIIEE-BQBZGAKWSA-N 0.000 description 2
- QGDOOCIPHSSADO-STQMWFEESA-N Gly-Met-Phe Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGDOOCIPHSSADO-STQMWFEESA-N 0.000 description 2
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 2
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 2
- 241000208818 Helianthus Species 0.000 description 2
- KYMUEAZVLPRVAE-GUBZILKMSA-N His-Asn-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KYMUEAZVLPRVAE-GUBZILKMSA-N 0.000 description 2
- UPGJWSUYENXOPV-HGNGGELXSA-N His-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N UPGJWSUYENXOPV-HGNGGELXSA-N 0.000 description 2
- FYTCLUIYTYFGPT-YUMQZZPRSA-N His-Gly-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FYTCLUIYTYFGPT-YUMQZZPRSA-N 0.000 description 2
- MPXGJGBXCRQQJE-MXAVVETBSA-N His-Ile-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O MPXGJGBXCRQQJE-MXAVVETBSA-N 0.000 description 2
- CKRJBQJIGOEKMC-SRVKXCTJSA-N His-Lys-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CKRJBQJIGOEKMC-SRVKXCTJSA-N 0.000 description 2
- RNAYRCNHRYEBTH-IHRRRGAJSA-N His-Met-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RNAYRCNHRYEBTH-IHRRRGAJSA-N 0.000 description 2
- XJFITURPHAKKAI-SRVKXCTJSA-N His-Pro-Gln Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CN=CN1 XJFITURPHAKKAI-SRVKXCTJSA-N 0.000 description 2
- YEKYGQZUBCRNGH-DCAQKATOSA-N His-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CO)C(=O)O YEKYGQZUBCRNGH-DCAQKATOSA-N 0.000 description 2
- FFKJUTZARGRVTH-KKUMJFAQSA-N His-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FFKJUTZARGRVTH-KKUMJFAQSA-N 0.000 description 2
- WSWAUVHXQREQQG-JYJNAYRXSA-N His-Tyr-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O WSWAUVHXQREQQG-JYJNAYRXSA-N 0.000 description 2
- 101000714470 Homo sapiens Synaptotagmin-1 Proteins 0.000 description 2
- 101000874762 Homo sapiens Synaptotagmin-2 Proteins 0.000 description 2
- 101000891898 Homo sapiens Synaptotagmin-3 Proteins 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- DMHGKBGOUAJRHU-RVMXOQNASA-N Ile-Arg-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N DMHGKBGOUAJRHU-RVMXOQNASA-N 0.000 description 2
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 2
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 2
- CNPNWGHRMBQHBZ-ZKWXMUAHSA-N Ile-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O CNPNWGHRMBQHBZ-ZKWXMUAHSA-N 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 2
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 2
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 2
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 2
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 2
- UCNNZELZXFXXJQ-BZSNNMDCSA-N Leu-Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCNNZELZXFXXJQ-BZSNNMDCSA-N 0.000 description 2
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 2
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 2
- 240000007472 Leucaena leucocephala Species 0.000 description 2
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 2
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 2
- KUQWVNFMZLHAPA-CIUDSAMLSA-N Met-Ala-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O KUQWVNFMZLHAPA-CIUDSAMLSA-N 0.000 description 2
- YLLWCSDBVGZLOW-CIUDSAMLSA-N Met-Gln-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O YLLWCSDBVGZLOW-CIUDSAMLSA-N 0.000 description 2
- UOENBSHXYCHSAU-YUMQZZPRSA-N Met-Gln-Gly Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UOENBSHXYCHSAU-YUMQZZPRSA-N 0.000 description 2
- ULLIQRYQNMAAHC-RWMBFGLXSA-N Met-His-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N ULLIQRYQNMAAHC-RWMBFGLXSA-N 0.000 description 2
- QTMIXEQWGNIPBL-JYJNAYRXSA-N Met-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N QTMIXEQWGNIPBL-JYJNAYRXSA-N 0.000 description 2
- VSJAPSMRFYUOKS-IUCAKERBSA-N Met-Pro-Gly Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O VSJAPSMRFYUOKS-IUCAKERBSA-N 0.000 description 2
- YLDSJJOGQNEQJK-AVGNSLFASA-N Met-Pro-Leu Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YLDSJJOGQNEQJK-AVGNSLFASA-N 0.000 description 2
- CNFMPVYIVQUJOO-NHCYSSNCSA-N Met-Val-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O CNFMPVYIVQUJOO-NHCYSSNCSA-N 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 2
- ISYSEOWLRQKQEQ-JYJNAYRXSA-N Phe-His-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISYSEOWLRQKQEQ-JYJNAYRXSA-N 0.000 description 2
- AAERWTUHZKLDLC-IHRRRGAJSA-N Phe-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O AAERWTUHZKLDLC-IHRRRGAJSA-N 0.000 description 2
- CZQZSMJXFGGBHM-KKUMJFAQSA-N Phe-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O CZQZSMJXFGGBHM-KKUMJFAQSA-N 0.000 description 2
- 241000218595 Picea sitchensis Species 0.000 description 2
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 2
- SMCHPSMKAFIERP-FXQIFTODSA-N Pro-Asn-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 SMCHPSMKAFIERP-FXQIFTODSA-N 0.000 description 2
- TXPUNZXZDVJUJQ-LPEHRKFASA-N Pro-Asn-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O TXPUNZXZDVJUJQ-LPEHRKFASA-N 0.000 description 2
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 2
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 2
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 2
- YTWNSIDWAFSEEI-RWMBFGLXSA-N Pro-His-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N3CCC[C@@H]3C(=O)O YTWNSIDWAFSEEI-RWMBFGLXSA-N 0.000 description 2
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 2
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 2
- HBBBLSVBQGZKOZ-GUBZILKMSA-N Pro-Met-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O HBBBLSVBQGZKOZ-GUBZILKMSA-N 0.000 description 2
- WIPAMEKBSHNFQE-IUCAKERBSA-N Pro-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@@H]1CCCN1 WIPAMEKBSHNFQE-IUCAKERBSA-N 0.000 description 2
- APIAILHCTSBGLU-JYJNAYRXSA-N Pro-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@@H]2CCCN2 APIAILHCTSBGLU-JYJNAYRXSA-N 0.000 description 2
- ANESFYPBAJPYNJ-SDDRHHMPSA-N Pro-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ANESFYPBAJPYNJ-SDDRHHMPSA-N 0.000 description 2
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 2
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 2
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 241000220483 Ribes Species 0.000 description 2
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 2
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 2
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 2
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 2
- XWCYBVBLJRWOFR-WDSKDSINSA-N Ser-Gln-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O XWCYBVBLJRWOFR-WDSKDSINSA-N 0.000 description 2
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 2
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 2
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 2
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 2
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 2
- CLKKNZQUQMZDGD-SRVKXCTJSA-N Ser-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CN=CN1 CLKKNZQUQMZDGD-SRVKXCTJSA-N 0.000 description 2
- VIIJCAQMJBHSJH-FXQIFTODSA-N Ser-Met-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O VIIJCAQMJBHSJH-FXQIFTODSA-N 0.000 description 2
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 2
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 2
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 2
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 2
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 2
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 2
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 2
- KIEIJCFVGZCUAS-MELADBBJSA-N Ser-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N)C(=O)O KIEIJCFVGZCUAS-MELADBBJSA-N 0.000 description 2
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 2
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 2
- 102100036417 Synaptotagmin-1 Human genes 0.000 description 2
- 102100036151 Synaptotagmin-2 Human genes 0.000 description 2
- 102100040757 Synaptotagmin-3 Human genes 0.000 description 2
- -1 Tag-100 epitopes Proteins 0.000 description 2
- 244000269722 Thea sinensis Species 0.000 description 2
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 2
- VIBXMCZWVUOZLA-OLHMAJIHSA-N Thr-Asn-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VIBXMCZWVUOZLA-OLHMAJIHSA-N 0.000 description 2
- QNJZOAHSYPXTAB-VEVYYDQMSA-N Thr-Asn-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O QNJZOAHSYPXTAB-VEVYYDQMSA-N 0.000 description 2
- NOWXWJLVGTVJKM-PBCZWWQYSA-N Thr-Asp-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O NOWXWJLVGTVJKM-PBCZWWQYSA-N 0.000 description 2
- VOHWDZNIESHTFW-XKBZYTNZSA-N Thr-Glu-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O VOHWDZNIESHTFW-XKBZYTNZSA-N 0.000 description 2
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 2
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 2
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 2
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 2
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 2
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 2
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 2
- CRWOSTCODDFEKZ-HRCADAONSA-N Tyr-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CRWOSTCODDFEKZ-HRCADAONSA-N 0.000 description 2
- QUILOGWWLXMSAT-IHRRRGAJSA-N Tyr-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QUILOGWWLXMSAT-IHRRRGAJSA-N 0.000 description 2
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 2
- QPBJXNYYQTUTDD-KKUMJFAQSA-N Tyr-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QPBJXNYYQTUTDD-KKUMJFAQSA-N 0.000 description 2
- PYJKETPLFITNKS-IHRRRGAJSA-N Tyr-Pro-Asn Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O PYJKETPLFITNKS-IHRRRGAJSA-N 0.000 description 2
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 2
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 2
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 2
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 2
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 2
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 2
- OFQGGTGZTOTLGH-NHCYSSNCSA-N Val-Met-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N OFQGGTGZTOTLGH-NHCYSSNCSA-N 0.000 description 2
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 2
- VSCIANXXVZOYOC-AVGNSLFASA-N Val-Pro-His Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VSCIANXXVZOYOC-AVGNSLFASA-N 0.000 description 2
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 2
- 230000036579 abiotic stress Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 230000027455 binding Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 210000003483 chromatin Anatomy 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 108010009297 diglycyl-histidine Proteins 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000035784 germination Effects 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 2
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 2
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 2
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 2
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 239000004009 herbicide Substances 0.000 description 2
- 238000010191 image analysis Methods 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 235000009973 maize Nutrition 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000007899 nucleic acid hybridization Methods 0.000 description 2
- 239000002853 nucleic acid probe Substances 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 235000019198 oils Nutrition 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000010647 peptide synthesis reaction Methods 0.000 description 2
- 238000007634 remodeling Methods 0.000 description 2
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000008117 seed development Effects 0.000 description 2
- 238000009394 selective breeding Methods 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000001086 yeast two-hybrid system Methods 0.000 description 2
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 1
- IAOXXKYIZHCAQJ-ACZMJKKPSA-N (2s)-2-[[2-[[(2s)-2-[[(2s)-2,4-diamino-4-oxobutanoyl]amino]propanoyl]amino]acetyl]amino]propanoic acid Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O IAOXXKYIZHCAQJ-ACZMJKKPSA-N 0.000 description 1
- RVLOMLVNNBWRSR-KNIFDHDWSA-N (2s)-2-aminopropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound C[C@H](N)C(O)=O.NCCCC[C@H](N)C(O)=O RVLOMLVNNBWRSR-KNIFDHDWSA-N 0.000 description 1
- PKDBCJSWQUOKDO-UHFFFAOYSA-M 2,3,5-triphenyltetrazolium chloride Chemical compound [Cl-].C1=CC=CC=C1C(N=[N+]1C=2C=CC=CC=2)=NN1C1=CC=CC=C1 PKDBCJSWQUOKDO-UHFFFAOYSA-M 0.000 description 1
- PEZMQPADLFXCJJ-ZETCQYMHSA-N 2-[[2-[[(2s)-1-(2-aminoacetyl)pyrrolidine-2-carbonyl]amino]acetyl]amino]acetic acid Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(=O)NCC(O)=O PEZMQPADLFXCJJ-ZETCQYMHSA-N 0.000 description 1
- OTEWWRBKGONZBW-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]-4-methylpentanoyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NC(CC(C)C)C(=O)NCC(=O)NCC(O)=O OTEWWRBKGONZBW-UHFFFAOYSA-N 0.000 description 1
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 1
- XJFPXLWGZWAWRQ-UHFFFAOYSA-N 2-[[2-[[2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O XJFPXLWGZWAWRQ-UHFFFAOYSA-N 0.000 description 1
- ZBMRKNMTMPPMMK-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid;azane Chemical compound [NH4+].CP(O)(=O)CCC(N)C([O-])=O ZBMRKNMTMPPMMK-UHFFFAOYSA-N 0.000 description 1
- 240000004507 Abelmoschus esculentus Species 0.000 description 1
- 241000208140 Acer Species 0.000 description 1
- 108090000104 Actin-related protein 3 Proteins 0.000 description 1
- 241000219068 Actinidia Species 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 241000157282 Aesculus Species 0.000 description 1
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 1
- ZFXQNADNEBRERM-BJDJZHNGSA-N Ala-Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 ZFXQNADNEBRERM-BJDJZHNGSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- STACJSVFHSEZJV-GHCJXIJMSA-N Ala-Asn-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STACJSVFHSEZJV-GHCJXIJMSA-N 0.000 description 1
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 1
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 1
- WQVYAWIMAWTGMW-ZLUOBGJFSA-N Ala-Asp-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WQVYAWIMAWTGMW-ZLUOBGJFSA-N 0.000 description 1
- MCKSLROAGSDNFC-ACZMJKKPSA-N Ala-Asp-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MCKSLROAGSDNFC-ACZMJKKPSA-N 0.000 description 1
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 1
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 1
- DECCMEWNXSNSDO-ZLUOBGJFSA-N Ala-Cys-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DECCMEWNXSNSDO-ZLUOBGJFSA-N 0.000 description 1
- CZPAHAKGPDUIPJ-CIUDSAMLSA-N Ala-Gln-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CZPAHAKGPDUIPJ-CIUDSAMLSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 1
- VWEWCZSUWOEEFM-WDSKDSINSA-N Ala-Gly-Ala-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(O)=O VWEWCZSUWOEEFM-WDSKDSINSA-N 0.000 description 1
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 1
- LTSBJNNXPBBNDT-HGNGGELXSA-N Ala-His-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)O LTSBJNNXPBBNDT-HGNGGELXSA-N 0.000 description 1
- HUUOZYZWNCXTFK-INTQDDNPSA-N Ala-His-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N HUUOZYZWNCXTFK-INTQDDNPSA-N 0.000 description 1
- GSHKMNKPMLXSQW-KBIXCLLPSA-N Ala-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C)N GSHKMNKPMLXSQW-KBIXCLLPSA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 1
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 1
- MAEQBGQTDWDSJQ-LSJOCFKGSA-N Ala-Met-His Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MAEQBGQTDWDSJQ-LSJOCFKGSA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- HYIDEIQUCBKIPL-CQDKDKBSSA-N Ala-Phe-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N HYIDEIQUCBKIPL-CQDKDKBSSA-N 0.000 description 1
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 1
- OMCKWYSDUQBYCN-FXQIFTODSA-N Ala-Ser-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O OMCKWYSDUQBYCN-FXQIFTODSA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 1
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 1
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 1
- UBTKNYUAMYRMKE-GOPGUHFVSA-N Ala-Trp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N UBTKNYUAMYRMKE-GOPGUHFVSA-N 0.000 description 1
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 1
- BHFOJPDOQPWJRN-XDTLVQLUSA-N Ala-Tyr-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CCC(N)=O)C(O)=O BHFOJPDOQPWJRN-XDTLVQLUSA-N 0.000 description 1
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 1
- MUGAESARFRGOTQ-IGNZVWTISA-N Ala-Tyr-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N MUGAESARFRGOTQ-IGNZVWTISA-N 0.000 description 1
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 1
- 241000524150 Albizia amara Species 0.000 description 1
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 1
- 241000962146 Alsophila tricolor Species 0.000 description 1
- 235000009328 Amaranthus caudatus Nutrition 0.000 description 1
- 240000001592 Amaranthus caudatus Species 0.000 description 1
- 241000744007 Andropogon Species 0.000 description 1
- 101710117679 Anthocyanidin 3-O-glucosyltransferase Proteins 0.000 description 1
- 240000007087 Apium graveolens Species 0.000 description 1
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 description 1
- 235000010591 Appio Nutrition 0.000 description 1
- 241000218156 Aquilegia Species 0.000 description 1
- 241000260702 Aquilegia formosa Species 0.000 description 1
- 101001027306 Arabidopsis thaliana Growth-regulating factor 5 Proteins 0.000 description 1
- 101001027302 Arabidopsis thaliana Growth-regulating factor 9 Proteins 0.000 description 1
- 235000003911 Arachis Nutrition 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- 244000080767 Areca catechu Species 0.000 description 1
- 235000006226 Areca catechu Nutrition 0.000 description 1
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 1
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 1
- SYAUZLVLXCDRSH-IUCAKERBSA-N Arg-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N SYAUZLVLXCDRSH-IUCAKERBSA-N 0.000 description 1
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 1
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 1
- MSILNNHVVMMTHZ-UWVGGRQHSA-N Arg-His-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 MSILNNHVVMMTHZ-UWVGGRQHSA-N 0.000 description 1
- UPKMBGAAEZGHOC-RWMBFGLXSA-N Arg-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O UPKMBGAAEZGHOC-RWMBFGLXSA-N 0.000 description 1
- HNJNAMGZQZPSRE-GUBZILKMSA-N Arg-Pro-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O HNJNAMGZQZPSRE-GUBZILKMSA-N 0.000 description 1
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 1
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- LFAUVOXPCGJKTB-DCAQKATOSA-N Arg-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N LFAUVOXPCGJKTB-DCAQKATOSA-N 0.000 description 1
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 1
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 1
- 241001167018 Aroa Species 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 1
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 1
- IOTKDTZEEBZNCM-UGYAYLCHSA-N Asn-Asn-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOTKDTZEEBZNCM-UGYAYLCHSA-N 0.000 description 1
- DXZNJWFECGJCQR-FXQIFTODSA-N Asn-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N DXZNJWFECGJCQR-FXQIFTODSA-N 0.000 description 1
- KXEGPPNPXOKKHK-ZLUOBGJFSA-N Asn-Asp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KXEGPPNPXOKKHK-ZLUOBGJFSA-N 0.000 description 1
- XVVOVPFMILMHPX-ZLUOBGJFSA-N Asn-Asp-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XVVOVPFMILMHPX-ZLUOBGJFSA-N 0.000 description 1
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 1
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- UEONJSPBTSWKOI-CIUDSAMLSA-N Asn-Gln-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O UEONJSPBTSWKOI-CIUDSAMLSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- GJFYPBDMUGGLFR-NKWVEPMBSA-N Asn-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC(=O)N)N)C(=O)O GJFYPBDMUGGLFR-NKWVEPMBSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- ZKDGORKGHPCZOV-DCAQKATOSA-N Asn-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZKDGORKGHPCZOV-DCAQKATOSA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- SXNJBDYEBOUYOJ-DCAQKATOSA-N Asn-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)N)N SXNJBDYEBOUYOJ-DCAQKATOSA-N 0.000 description 1
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 1
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 1
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 1
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 1
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 1
- UYRPHDGXHKBZHJ-CIUDSAMLSA-N Asn-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N UYRPHDGXHKBZHJ-CIUDSAMLSA-N 0.000 description 1
- VOKWBBBXJONREA-DCAQKATOSA-N Asn-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N VOKWBBBXJONREA-DCAQKATOSA-N 0.000 description 1
- WCRQQIPFSXFIRN-LPEHRKFASA-N Asn-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N WCRQQIPFSXFIRN-LPEHRKFASA-N 0.000 description 1
- KEUNWIXNKVWCFL-FXQIFTODSA-N Asn-Met-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O KEUNWIXNKVWCFL-FXQIFTODSA-N 0.000 description 1
- VITDJIPIJZAVGC-VEVYYDQMSA-N Asn-Met-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VITDJIPIJZAVGC-VEVYYDQMSA-N 0.000 description 1
- ZJIFRAPZHAGLGR-MELADBBJSA-N Asn-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZJIFRAPZHAGLGR-MELADBBJSA-N 0.000 description 1
- PLTGTJAZQRGMPP-FXQIFTODSA-N Asn-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O PLTGTJAZQRGMPP-FXQIFTODSA-N 0.000 description 1
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 1
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 1
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 1
- ZNYKKCADEQAZKA-FXQIFTODSA-N Asn-Ser-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O ZNYKKCADEQAZKA-FXQIFTODSA-N 0.000 description 1
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 1
- YHXNKGKUDJCAHB-PBCZWWQYSA-N Asn-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O YHXNKGKUDJCAHB-PBCZWWQYSA-N 0.000 description 1
- KSZHWTRZPOTIGY-AVGNSLFASA-N Asn-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KSZHWTRZPOTIGY-AVGNSLFASA-N 0.000 description 1
- YSYTWUMRHSFODC-QWRGUYRKSA-N Asn-Tyr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O YSYTWUMRHSFODC-QWRGUYRKSA-N 0.000 description 1
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 1
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 1
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 1
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 1
- LJRPYAZQQWHEEV-FXQIFTODSA-N Asp-Gln-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O LJRPYAZQQWHEEV-FXQIFTODSA-N 0.000 description 1
- PMEHKVHZQKJACS-PEFMBERDSA-N Asp-Gln-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PMEHKVHZQKJACS-PEFMBERDSA-N 0.000 description 1
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 1
- RQYMKRMRZWJGHC-BQBZGAKWSA-N Asp-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)O)N RQYMKRMRZWJGHC-BQBZGAKWSA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- OGTCOKZFOJIZFG-CIUDSAMLSA-N Asp-His-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O OGTCOKZFOJIZFG-CIUDSAMLSA-N 0.000 description 1
- CRNKLABLTICXDV-GUBZILKMSA-N Asp-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N CRNKLABLTICXDV-GUBZILKMSA-N 0.000 description 1
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- ZBYLEBZCVKLPCY-FXQIFTODSA-N Asp-Ser-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZBYLEBZCVKLPCY-FXQIFTODSA-N 0.000 description 1
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 1
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- QOCFFCUFZGDHTP-NUMRIWBASA-N Asp-Thr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QOCFFCUFZGDHTP-NUMRIWBASA-N 0.000 description 1
- GWWSUMLEWKQHLR-NUMRIWBASA-N Asp-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GWWSUMLEWKQHLR-NUMRIWBASA-N 0.000 description 1
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 1
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 1
- ALMIMUZAWTUNIO-BZSNNMDCSA-N Asp-Tyr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ALMIMUZAWTUNIO-BZSNNMDCSA-N 0.000 description 1
- 235000005340 Asparagus officinalis Nutrition 0.000 description 1
- 241000243239 Astelia fragrans Species 0.000 description 1
- 241001061305 Astragalus cicer Species 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 235000000832 Ayote Nutrition 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241000012950 Baikiaea plurijuga Species 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 241000219429 Betula Species 0.000 description 1
- 241000219198 Brassica Species 0.000 description 1
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 1
- 235000004221 Brassica oleracea var gemmifera Nutrition 0.000 description 1
- 235000017647 Brassica oleracea var italica Nutrition 0.000 description 1
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 1
- 244000064816 Brassica oleracea var. acephala Species 0.000 description 1
- 244000308368 Brassica oleracea var. gemmifera Species 0.000 description 1
- 244000277360 Bruguiera gymnorhiza Species 0.000 description 1
- 241001424028 Burkea africana Species 0.000 description 1
- 235000008635 Cadaba farinosa Nutrition 0.000 description 1
- 241000628166 Cadaba farinosa Species 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 244000292211 Canna coccinea Species 0.000 description 1
- 235000005273 Canna coccinea Nutrition 0.000 description 1
- 240000008574 Capsicum frutescens Species 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241000522254 Cassia Species 0.000 description 1
- 241000701489 Cauliflower mosaic virus Species 0.000 description 1
- 101100543541 Chlorobium chlorochromatii (strain CaD3) ybeY gene Proteins 0.000 description 1
- 244000037364 Cinnamomum aromaticum Species 0.000 description 1
- 235000014489 Cinnamomum aromaticum Nutrition 0.000 description 1
- 235000021511 Cinnamomum cassia Nutrition 0.000 description 1
- 241000207199 Citrus Species 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- 241000350000 Colophospermum mopane Species 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- ITRJWOMZKQRYTA-RFZYENFJSA-N Cortisone acetate Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@@](C(=O)COC(=O)C)(O)[C@@]1(C)CC2=O ITRJWOMZKQRYTA-RFZYENFJSA-N 0.000 description 1
- 241001507946 Cotoneaster Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 241001092040 Crataegus Species 0.000 description 1
- 240000005109 Cryptomeria japonica Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 244000024469 Cucumis prophetarum Species 0.000 description 1
- 240000004244 Cucurbita moschata Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- 241000723198 Cupressus Species 0.000 description 1
- 102000001493 Cyclophilins Human genes 0.000 description 1
- 108010068682 Cyclophilins Proteins 0.000 description 1
- 235000017788 Cydonia oblonga Nutrition 0.000 description 1
- 244000236931 Cydonia oblonga Species 0.000 description 1
- 241000931332 Cymbopogon Species 0.000 description 1
- 244000019459 Cynara cardunculus Species 0.000 description 1
- 235000019106 Cynara scolymus Nutrition 0.000 description 1
- LWTTURISBKEVAC-CIUDSAMLSA-N Cys-Cys-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N LWTTURISBKEVAC-CIUDSAMLSA-N 0.000 description 1
- KJJASVYBTKRYSN-FXQIFTODSA-N Cys-Pro-Asp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CC(=O)O)C(=O)O KJJASVYBTKRYSN-FXQIFTODSA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 241000746417 Dalbergia monetaria Species 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 241000035389 Davallia divaricata Species 0.000 description 1
- 208000005156 Dehydration Diseases 0.000 description 1
- 241000522190 Desmodium Species 0.000 description 1
- 241000196119 Dicksonia Species 0.000 description 1
- 241001414368 Diheteropogon amplectens Species 0.000 description 1
- 241000219761 Dioclea Species 0.000 description 1
- 241000219764 Dolichos Species 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000628129 Echinochloa pyramidalis Species 0.000 description 1
- 235000007349 Eleusine coracana Nutrition 0.000 description 1
- 244000078127 Eleusine coracana Species 0.000 description 1
- 101100491986 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) aromA gene Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 244000166124 Eucalyptus globulus Species 0.000 description 1
- 241001175061 Euclea schimperi Species 0.000 description 1
- 241001140636 Eulalia villosa Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 244000233576 Feijoa sellowiana Species 0.000 description 1
- 235000012068 Feijoa sellowiana Nutrition 0.000 description 1
- 241001022083 Flemingia Species 0.000 description 1
- 235000016676 Freycinetia banksii Nutrition 0.000 description 1
- 240000004719 Freycinetia banksii Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108700023863 Gene Components Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 241000208152 Geranium Species 0.000 description 1
- 244000105059 Geranium thunbergii Species 0.000 description 1
- 235000005491 Geranium thunbergii Nutrition 0.000 description 1
- 235000008100 Ginkgo biloba Nutrition 0.000 description 1
- 244000194101 Ginkgo biloba Species 0.000 description 1
- 241000411998 Gliricidia Species 0.000 description 1
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 1
- TWHDOEYLXXQYOZ-FXQIFTODSA-N Gln-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N TWHDOEYLXXQYOZ-FXQIFTODSA-N 0.000 description 1
- CRRFJBGUGNNOCS-PEFMBERDSA-N Gln-Asp-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CRRFJBGUGNNOCS-PEFMBERDSA-N 0.000 description 1
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 1
- QYKBTDOAMKORGL-FXQIFTODSA-N Gln-Gln-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QYKBTDOAMKORGL-FXQIFTODSA-N 0.000 description 1
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 1
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 1
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 1
- XSBGUANSZDGULP-IUCAKERBSA-N Gln-Gly-Lys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O XSBGUANSZDGULP-IUCAKERBSA-N 0.000 description 1
- QQAPDATZKKTBIY-YUMQZZPRSA-N Gln-Gly-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O QQAPDATZKKTBIY-YUMQZZPRSA-N 0.000 description 1
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 1
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 1
- SBHVGKBYOQKAEA-SDDRHHMPSA-N Gln-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SBHVGKBYOQKAEA-SDDRHHMPSA-N 0.000 description 1
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 1
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- WEAVZFWWIPIANL-SRVKXCTJSA-N Gln-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N WEAVZFWWIPIANL-SRVKXCTJSA-N 0.000 description 1
- ILKYYKRAULNYMS-JYJNAYRXSA-N Gln-Lys-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ILKYYKRAULNYMS-JYJNAYRXSA-N 0.000 description 1
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 1
- XUZQMPGBGFQJMY-SRVKXCTJSA-N Gln-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N XUZQMPGBGFQJMY-SRVKXCTJSA-N 0.000 description 1
- YGNPTRVNRUKVLA-DCAQKATOSA-N Gln-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N YGNPTRVNRUKVLA-DCAQKATOSA-N 0.000 description 1
- XUMFMAVDHQDATI-DCAQKATOSA-N Gln-Pro-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XUMFMAVDHQDATI-DCAQKATOSA-N 0.000 description 1
- PIUPHASDUFSHTF-CIUDSAMLSA-N Gln-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O PIUPHASDUFSHTF-CIUDSAMLSA-N 0.000 description 1
- FQCILXROGNOZON-YUMQZZPRSA-N Gln-Pro-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O FQCILXROGNOZON-YUMQZZPRSA-N 0.000 description 1
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 1
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 1
- NYCVMJGIJYQWDO-CIUDSAMLSA-N Gln-Ser-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NYCVMJGIJYQWDO-CIUDSAMLSA-N 0.000 description 1
- SXFPZRRVWSUYII-KBIXCLLPSA-N Gln-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N SXFPZRRVWSUYII-KBIXCLLPSA-N 0.000 description 1
- UXXIVIQGOODKQC-NUMRIWBASA-N Gln-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UXXIVIQGOODKQC-NUMRIWBASA-N 0.000 description 1
- WPJDPEOQUIXXOY-AVGNSLFASA-N Gln-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O WPJDPEOQUIXXOY-AVGNSLFASA-N 0.000 description 1
- UBRQJXFDVZNYJP-AVGNSLFASA-N Gln-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UBRQJXFDVZNYJP-AVGNSLFASA-N 0.000 description 1
- HPBKQFJXDUVNQV-FHWLQOOXSA-N Gln-Tyr-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O HPBKQFJXDUVNQV-FHWLQOOXSA-N 0.000 description 1
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 1
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 1
- PABVKUJVLNMOJP-WHFBIAKZSA-N Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(O)=O PABVKUJVLNMOJP-WHFBIAKZSA-N 0.000 description 1
- WPLGNDORMXTMQS-FXQIFTODSA-N Glu-Gln-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O WPLGNDORMXTMQS-FXQIFTODSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 1
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 1
- BRKUZSLQMPNVFN-SRVKXCTJSA-N Glu-His-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BRKUZSLQMPNVFN-SRVKXCTJSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- JJSVALISDCNFCU-SZMVWBNQSA-N Glu-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O JJSVALISDCNFCU-SZMVWBNQSA-N 0.000 description 1
- QMOSCLNJVKSHHU-YUMQZZPRSA-N Glu-Met-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QMOSCLNJVKSHHU-YUMQZZPRSA-N 0.000 description 1
- YHOJJFFTSMWVGR-HJGDQZAQSA-N Glu-Met-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YHOJJFFTSMWVGR-HJGDQZAQSA-N 0.000 description 1
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 1
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- JVYNYWXHZWVJEF-NUMRIWBASA-N Glu-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O JVYNYWXHZWVJEF-NUMRIWBASA-N 0.000 description 1
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 1
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 1
- GZUKEVBTYNNUQF-WDSKDSINSA-N Gly-Ala-Gln Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GZUKEVBTYNNUQF-WDSKDSINSA-N 0.000 description 1
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- PHONXOACARQMPM-BQBZGAKWSA-N Gly-Ala-Met Chemical compound [H]NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O PHONXOACARQMPM-BQBZGAKWSA-N 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- WJZLEENECIOOSA-WDSKDSINSA-N Gly-Asn-Gln Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)O WJZLEENECIOOSA-WDSKDSINSA-N 0.000 description 1
- XEJTYSCIXKYSHR-WDSKDSINSA-N Gly-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN XEJTYSCIXKYSHR-WDSKDSINSA-N 0.000 description 1
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 1
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 1
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 1
- YDWZGVCXMVLDQH-WHFBIAKZSA-N Gly-Cys-Asn Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(N)=O YDWZGVCXMVLDQH-WHFBIAKZSA-N 0.000 description 1
- DTRUBYPMMVPQPD-YUMQZZPRSA-N Gly-Gln-Arg Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DTRUBYPMMVPQPD-YUMQZZPRSA-N 0.000 description 1
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 1
- KTSZUNRRYXPZTK-BQBZGAKWSA-N Gly-Gln-Glu Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KTSZUNRRYXPZTK-BQBZGAKWSA-N 0.000 description 1
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 1
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 1
- QPCVIQJVRGXUSA-LURJTMIESA-N Gly-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QPCVIQJVRGXUSA-LURJTMIESA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- FQKKPCWTZZEDIC-XPUUQOCRSA-N Gly-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 FQKKPCWTZZEDIC-XPUUQOCRSA-N 0.000 description 1
- UUWOBINZFGTFMS-UWVGGRQHSA-N Gly-His-Met Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(O)=O UUWOBINZFGTFMS-UWVGGRQHSA-N 0.000 description 1
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- VIIBEIQMLJEUJG-LAEOZQHASA-N Gly-Ile-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O VIIBEIQMLJEUJG-LAEOZQHASA-N 0.000 description 1
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 1
- DENRBIYENOKSEX-PEXQALLHSA-N Gly-Ile-His Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DENRBIYENOKSEX-PEXQALLHSA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 1
- YSDLIYZLOTZZNP-UWVGGRQHSA-N Gly-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN YSDLIYZLOTZZNP-UWVGGRQHSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 1
- FHQRLHFYVZAQHU-IUCAKERBSA-N Gly-Lys-Gln Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O FHQRLHFYVZAQHU-IUCAKERBSA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- DBJYVKDPGIFXFO-BQBZGAKWSA-N Gly-Met-Ala Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O DBJYVKDPGIFXFO-BQBZGAKWSA-N 0.000 description 1
- RUDRIZRGOLQSMX-IUCAKERBSA-N Gly-Met-Met Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O RUDRIZRGOLQSMX-IUCAKERBSA-N 0.000 description 1
- MDKCBHZLQJZOCJ-STQMWFEESA-N Gly-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)CN MDKCBHZLQJZOCJ-STQMWFEESA-N 0.000 description 1
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 1
- MTBIKIMYHUWBRX-QWRGUYRKSA-N Gly-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN MTBIKIMYHUWBRX-QWRGUYRKSA-N 0.000 description 1
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 1
- DHNXGWVNLFPOMQ-KBPBESRZSA-N Gly-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN DHNXGWVNLFPOMQ-KBPBESRZSA-N 0.000 description 1
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 1
- SCJJPCQUJYPHRZ-BQBZGAKWSA-N Gly-Pro-Asn Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O SCJJPCQUJYPHRZ-BQBZGAKWSA-N 0.000 description 1
- HJARVELKOSZUEW-YUMQZZPRSA-N Gly-Pro-Gln Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJARVELKOSZUEW-YUMQZZPRSA-N 0.000 description 1
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 1
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 1
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 1
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 1
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 1
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 1
- LYZYGGWCBLBDMC-QWHCGFSZSA-N Gly-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)CN)C(=O)O LYZYGGWCBLBDMC-QWHCGFSZSA-N 0.000 description 1
- NGBGZCUWFVVJKC-IRXDYDNUSA-N Gly-Tyr-Tyr Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NGBGZCUWFVVJKC-IRXDYDNUSA-N 0.000 description 1
- MUGLKCQHTUFLGF-WPRPVWTQSA-N Gly-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)CN MUGLKCQHTUFLGF-WPRPVWTQSA-N 0.000 description 1
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 239000005562 Glyphosate Substances 0.000 description 1
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 1
- 108050002220 Green fluorescent protein, GFP Proteins 0.000 description 1
- 241001648387 Grevillea Species 0.000 description 1
- 241000013479 Guibourtia coleosperma Species 0.000 description 1
- 241000214032 Hedysarum Species 0.000 description 1
- 235000003222 Helianthus annuus Nutrition 0.000 description 1
- 240000007860 Heteropogon contortus Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- QIVPRLJQQVXCIY-HGNGGELXSA-N His-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](CCC(N)=O)C(O)=O QIVPRLJQQVXCIY-HGNGGELXSA-N 0.000 description 1
- DCRODRAURLJOFY-XPUUQOCRSA-N His-Ala-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)NCC(O)=O DCRODRAURLJOFY-XPUUQOCRSA-N 0.000 description 1
- WGVPDSNCHDEDBP-KKUMJFAQSA-N His-Asp-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WGVPDSNCHDEDBP-KKUMJFAQSA-N 0.000 description 1
- VYMGAXSNYUFVCK-GUBZILKMSA-N His-Gln-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N VYMGAXSNYUFVCK-GUBZILKMSA-N 0.000 description 1
- LPZUKJALYGXBIE-SRVKXCTJSA-N His-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N LPZUKJALYGXBIE-SRVKXCTJSA-N 0.000 description 1
- FLYSHWAAHYNKRT-JYJNAYRXSA-N His-Gln-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FLYSHWAAHYNKRT-JYJNAYRXSA-N 0.000 description 1
- PQKCQZHAGILVIM-NKIYYHGXSA-N His-Glu-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O PQKCQZHAGILVIM-NKIYYHGXSA-N 0.000 description 1
- GHAFKUCRIVBLDJ-IHRRRGAJSA-N His-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N GHAFKUCRIVBLDJ-IHRRRGAJSA-N 0.000 description 1
- AIPUZFXMXAHZKY-QWRGUYRKSA-N His-Leu-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AIPUZFXMXAHZKY-QWRGUYRKSA-N 0.000 description 1
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 1
- BKOVCRUIXDIWFV-IXOXFDKPSA-N His-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 BKOVCRUIXDIWFV-IXOXFDKPSA-N 0.000 description 1
- NKRWVZQTPXPNRZ-SRVKXCTJSA-N His-Met-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC1=CN=CN1 NKRWVZQTPXPNRZ-SRVKXCTJSA-N 0.000 description 1
- YXASFUBDSDAXQD-UWVGGRQHSA-N His-Met-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O YXASFUBDSDAXQD-UWVGGRQHSA-N 0.000 description 1
- KQJBFMJFUXAYPK-AVGNSLFASA-N His-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N KQJBFMJFUXAYPK-AVGNSLFASA-N 0.000 description 1
- ABCCKUZDWMERKT-AVGNSLFASA-N His-Pro-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O ABCCKUZDWMERKT-AVGNSLFASA-N 0.000 description 1
- JMSONHOUHFDOJH-GUBZILKMSA-N His-Ser-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 JMSONHOUHFDOJH-GUBZILKMSA-N 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241000209219 Hordeum Species 0.000 description 1
- 244000284937 Hyparrhenia rufa Species 0.000 description 1
- 241000782597 Hypericum erectum Species 0.000 description 1
- 241000310653 Hyperthelia dissoluta Species 0.000 description 1
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 1
- UMYZBHKAVTXWIW-GMOBBJLQSA-N Ile-Asp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UMYZBHKAVTXWIW-GMOBBJLQSA-N 0.000 description 1
- OONBGFHNQVSUBF-KBIXCLLPSA-N Ile-Gln-Cys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(O)=O OONBGFHNQVSUBF-KBIXCLLPSA-N 0.000 description 1
- DVRDRICMWUSCBN-UKJIMTQDSA-N Ile-Gln-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DVRDRICMWUSCBN-UKJIMTQDSA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 1
- PWUMCBLVWPCKNO-MGHWNKPDSA-N Ile-Leu-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PWUMCBLVWPCKNO-MGHWNKPDSA-N 0.000 description 1
- IALVDKNUFSTICJ-GMOBBJLQSA-N Ile-Met-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IALVDKNUFSTICJ-GMOBBJLQSA-N 0.000 description 1
- NPAYJTAXWXJKLO-NAKRPEOUSA-N Ile-Met-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N NPAYJTAXWXJKLO-NAKRPEOUSA-N 0.000 description 1
- HQEPKOFULQTSFV-JURCDPSOSA-N Ile-Phe-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)O)N HQEPKOFULQTSFV-JURCDPSOSA-N 0.000 description 1
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 1
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 1
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 235000000177 Indigofera tinctoria Nutrition 0.000 description 1
- 101100288095 Klebsiella pneumoniae neo gene Proteins 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 240000004322 Lens culinaris Species 0.000 description 1
- 235000014647 Lens culinaris subsp culinaris Nutrition 0.000 description 1
- 241001092400 Leptarrhena pyrolifolia Species 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 1
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 1
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- KUEVMUXNILMJTK-JYJNAYRXSA-N Leu-Gln-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KUEVMUXNILMJTK-JYJNAYRXSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- XQXGNBFMAXWIGI-MXAVVETBSA-N Leu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 XQXGNBFMAXWIGI-MXAVVETBSA-N 0.000 description 1
- OYQUOLRTJHWVSQ-SRVKXCTJSA-N Leu-His-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O OYQUOLRTJHWVSQ-SRVKXCTJSA-N 0.000 description 1
- OHZIZVWQXJPBJS-IXOXFDKPSA-N Leu-His-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OHZIZVWQXJPBJS-IXOXFDKPSA-N 0.000 description 1
- ZALAVHVPPOHAOL-XUXIUFHCSA-N Leu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N ZALAVHVPPOHAOL-XUXIUFHCSA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 1
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 1
- PKKMDPNFGULLNQ-AVGNSLFASA-N Leu-Met-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O PKKMDPNFGULLNQ-AVGNSLFASA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 1
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 1
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 1
- 235000010643 Leucaena leucocephala Nutrition 0.000 description 1
- 235000004431 Linum usitatissimum Nutrition 0.000 description 1
- 240000006240 Linum usitatissimum Species 0.000 description 1
- 241001329168 Loudetia simplex Species 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- MRWXLRGAFDOILG-DCAQKATOSA-N Lys-Gln-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRWXLRGAFDOILG-DCAQKATOSA-N 0.000 description 1
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 1
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 1
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- DAOSYIZXRCOKII-SRVKXCTJSA-N Lys-His-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O DAOSYIZXRCOKII-SRVKXCTJSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 1
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- VSTNAUBHKQPVJX-IHRRRGAJSA-N Lys-Met-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O VSTNAUBHKQPVJX-IHRRRGAJSA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 1
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- 241000220225 Malus Species 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000004456 Manihot esculenta Nutrition 0.000 description 1
- 201000005505 Measles Diseases 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- QGQGAIBGTUJRBR-NAKRPEOUSA-N Met-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCSC QGQGAIBGTUJRBR-NAKRPEOUSA-N 0.000 description 1
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 1
- DCHHUGLTVLJYKA-FXQIFTODSA-N Met-Asn-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DCHHUGLTVLJYKA-FXQIFTODSA-N 0.000 description 1
- NSGXXVIHCIAISP-CIUDSAMLSA-N Met-Asn-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O NSGXXVIHCIAISP-CIUDSAMLSA-N 0.000 description 1
- DBOMZJOESVYERT-GUBZILKMSA-N Met-Asn-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N DBOMZJOESVYERT-GUBZILKMSA-N 0.000 description 1
- IHITVQKJXQQGLJ-LPEHRKFASA-N Met-Asn-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N IHITVQKJXQQGLJ-LPEHRKFASA-N 0.000 description 1
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 1
- RZJOHSFAEZBWLK-CIUDSAMLSA-N Met-Gln-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N RZJOHSFAEZBWLK-CIUDSAMLSA-N 0.000 description 1
- AETNZPKUUYYYEK-CIUDSAMLSA-N Met-Glu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AETNZPKUUYYYEK-CIUDSAMLSA-N 0.000 description 1
- WWWGMQHQSAUXBU-BQBZGAKWSA-N Met-Gly-Asn Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O WWWGMQHQSAUXBU-BQBZGAKWSA-N 0.000 description 1
- STLBOMUOQNIALW-BQBZGAKWSA-N Met-Gly-Cys Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O STLBOMUOQNIALW-BQBZGAKWSA-N 0.000 description 1
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 1
- UZVKFARGHHMQGX-IUCAKERBSA-N Met-Gly-Met Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCSC UZVKFARGHHMQGX-IUCAKERBSA-N 0.000 description 1
- MVBZBRKNZVJEKK-DTWKUNHWSA-N Met-Gly-Pro Chemical compound CSCC[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N MVBZBRKNZVJEKK-DTWKUNHWSA-N 0.000 description 1
- JZNGSNMTXAHMSV-AVGNSLFASA-N Met-His-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JZNGSNMTXAHMSV-AVGNSLFASA-N 0.000 description 1
- RXWPLVRJQNWXRQ-IHRRRGAJSA-N Met-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 RXWPLVRJQNWXRQ-IHRRRGAJSA-N 0.000 description 1
- GETCJHFFECHWHI-QXEWZRGKSA-N Met-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCSC)N GETCJHFFECHWHI-QXEWZRGKSA-N 0.000 description 1
- MSSJHBAKDDIRMJ-SRVKXCTJSA-N Met-Lys-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MSSJHBAKDDIRMJ-SRVKXCTJSA-N 0.000 description 1
- VAGCEUUEMMXFEX-GUBZILKMSA-N Met-Met-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O VAGCEUUEMMXFEX-GUBZILKMSA-N 0.000 description 1
- YHBHDYYHOUAKLR-AVGNSLFASA-N Met-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YHBHDYYHOUAKLR-AVGNSLFASA-N 0.000 description 1
- XOFDBXYPKZUAAM-GUBZILKMSA-N Met-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N XOFDBXYPKZUAAM-GUBZILKMSA-N 0.000 description 1
- JQHYVIKEFYETEW-IHRRRGAJSA-N Met-Phe-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=CC=C1 JQHYVIKEFYETEW-IHRRRGAJSA-N 0.000 description 1
- VQILILSLEFDECU-GUBZILKMSA-N Met-Pro-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O VQILILSLEFDECU-GUBZILKMSA-N 0.000 description 1
- BJPQKNHZHUCQNQ-SRVKXCTJSA-N Met-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCSC)N BJPQKNHZHUCQNQ-SRVKXCTJSA-N 0.000 description 1
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 1
- FDGAMQVRGORBDV-GUBZILKMSA-N Met-Ser-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCSC FDGAMQVRGORBDV-GUBZILKMSA-N 0.000 description 1
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 1
- KYJHWKAMFISDJE-RCWTZXSCSA-N Met-Thr-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCSC KYJHWKAMFISDJE-RCWTZXSCSA-N 0.000 description 1
- CQRGINSEMFBACV-WPRPVWTQSA-N Met-Val-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O CQRGINSEMFBACV-WPRPVWTQSA-N 0.000 description 1
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 1
- 241000218666 Metasequoia Species 0.000 description 1
- 240000008790 Musa x paradisiaca Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- 240000002853 Nelumbo nucifera Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 240000002778 Neonotonia wightii Species 0.000 description 1
- 108010065395 Neuropep-1 Proteins 0.000 description 1
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 241000219830 Onobrychis Species 0.000 description 1
- 241001446528 Ornithopus Species 0.000 description 1
- 241000209094 Oryza Species 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 241001618237 Peltophorum africanum Species 0.000 description 1
- 244000025272 Persea americana Species 0.000 description 1
- 235000011236 Persea americana var americana Nutrition 0.000 description 1
- 240000007377 Petunia x hybrida Species 0.000 description 1
- 241000219833 Phaseolus Species 0.000 description 1
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 1
- IILUKIJNFMUBNF-IHRRRGAJSA-N Phe-Gln-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O IILUKIJNFMUBNF-IHRRRGAJSA-N 0.000 description 1
- LLGTYVHITPVGKR-RYUDHWBXSA-N Phe-Gln-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O LLGTYVHITPVGKR-RYUDHWBXSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- VJLLEKDQJSMHRU-STQMWFEESA-N Phe-Gly-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O VJLLEKDQJSMHRU-STQMWFEESA-N 0.000 description 1
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 1
- FKFCKDROTNIVSO-JYJNAYRXSA-N Phe-Pro-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O FKFCKDROTNIVSO-JYJNAYRXSA-N 0.000 description 1
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 1
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 1
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 1
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 1
- 240000008340 Phormium cookianum Species 0.000 description 1
- 241001092035 Photinia Species 0.000 description 1
- 241000195888 Physcomitrella Species 0.000 description 1
- 240000000020 Picea glauca Species 0.000 description 1
- 235000008127 Picea glauca Nutrition 0.000 description 1
- 241000218602 Pinus <genus> Species 0.000 description 1
- 235000010582 Pisum sativum Nutrition 0.000 description 1
- 240000004713 Pisum sativum Species 0.000 description 1
- 235000018794 Podocarpus totara Nutrition 0.000 description 1
- 240000003145 Podocarpus totara Species 0.000 description 1
- 241000133788 Pogonarthria Species 0.000 description 1
- 241000133806 Pogonarthria squarrosa Species 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 241000219000 Populus Species 0.000 description 1
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 1
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 1
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- LCRSGSIRKLXZMZ-BPNCWPANSA-N Pro-Ala-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LCRSGSIRKLXZMZ-BPNCWPANSA-N 0.000 description 1
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 1
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 1
- KQCCDMFIALWGTL-GUBZILKMSA-N Pro-Asn-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 KQCCDMFIALWGTL-GUBZILKMSA-N 0.000 description 1
- FUVBEZJCRMHWEM-FXQIFTODSA-N Pro-Asn-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FUVBEZJCRMHWEM-FXQIFTODSA-N 0.000 description 1
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 1
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 1
- LANQLYHLMYDWJP-SRVKXCTJSA-N Pro-Gln-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O LANQLYHLMYDWJP-SRVKXCTJSA-N 0.000 description 1
- XZONQWUEBAFQPO-HJGDQZAQSA-N Pro-Gln-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZONQWUEBAFQPO-HJGDQZAQSA-N 0.000 description 1
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 1
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 1
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 1
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 1
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- SSWJYJHXQOYTSP-SRVKXCTJSA-N Pro-His-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O SSWJYJHXQOYTSP-SRVKXCTJSA-N 0.000 description 1
- JRQCDSNPRNGWRG-AVGNSLFASA-N Pro-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2 JRQCDSNPRNGWRG-AVGNSLFASA-N 0.000 description 1
- PUQRDHNIOONJJN-AVGNSLFASA-N Pro-Lys-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O PUQRDHNIOONJJN-AVGNSLFASA-N 0.000 description 1
- WFIVLLFYUZZWOD-RHYQMDGZSA-N Pro-Lys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WFIVLLFYUZZWOD-RHYQMDGZSA-N 0.000 description 1
- JFBJPBZSTMXGKL-JYJNAYRXSA-N Pro-Met-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JFBJPBZSTMXGKL-JYJNAYRXSA-N 0.000 description 1
- MHBSUKYVBZVQRW-HJWJTTGWSA-N Pro-Phe-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MHBSUKYVBZVQRW-HJWJTTGWSA-N 0.000 description 1
- DWPXHLIBFQLKLK-CYDGBPFRSA-N Pro-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 DWPXHLIBFQLKLK-CYDGBPFRSA-N 0.000 description 1
- QAAYIXYLEMRULP-SRVKXCTJSA-N Pro-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 QAAYIXYLEMRULP-SRVKXCTJSA-N 0.000 description 1
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 1
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 1
- BJCXXMGGPHRSHV-GUBZILKMSA-N Pro-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BJCXXMGGPHRSHV-GUBZILKMSA-N 0.000 description 1
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 1
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 1
- LZHHZYDPMZEMRX-STQMWFEESA-N Pro-Tyr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O LZHHZYDPMZEMRX-STQMWFEESA-N 0.000 description 1
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 1
- 101710083689 Probable capsid protein Proteins 0.000 description 1
- 240000000037 Prosopis spicigera Species 0.000 description 1
- 235000006629 Prosopis spicigera Nutrition 0.000 description 1
- 101800004937 Protein C Proteins 0.000 description 1
- 235000008572 Pseudotsuga menziesii Nutrition 0.000 description 1
- 240000001416 Pseudotsuga menziesii Species 0.000 description 1
- 241000350492 Pterolobium stellatum Species 0.000 description 1
- 241000220324 Pyrus Species 0.000 description 1
- 235000014443 Pyrus communis Nutrition 0.000 description 1
- 240000001987 Pyrus communis Species 0.000 description 1
- 241000219492 Quercus Species 0.000 description 1
- 235000011129 Rhopalostylis sapida Nutrition 0.000 description 1
- 240000007586 Rhopalostylis sapida Species 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 241001493421 Robinia <trematode> Species 0.000 description 1
- 235000011449 Rosa Nutrition 0.000 description 1
- 241001092459 Rubus Species 0.000 description 1
- 241000124033 Salix Species 0.000 description 1
- 101800001700 Saposin-D Proteins 0.000 description 1
- 102400000827 Saposin-D Human genes 0.000 description 1
- 241001138409 Sciadopitys verticillata Species 0.000 description 1
- 241001639806 Searsia natalensis Species 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- 241001138418 Sequoia sempervirens Species 0.000 description 1
- 241000422846 Sequoiadendron giganteum Species 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 1
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 1
- BCKYYTVFBXHPOG-ACZMJKKPSA-N Ser-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N BCKYYTVFBXHPOG-ACZMJKKPSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- YMAWDPHQVABADW-CIUDSAMLSA-N Ser-Gln-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YMAWDPHQVABADW-CIUDSAMLSA-N 0.000 description 1
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 1
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 1
- VDVYTKZBMFADQH-AVGNSLFASA-N Ser-Gln-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VDVYTKZBMFADQH-AVGNSLFASA-N 0.000 description 1
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- UAJAYRMZGNQILN-BQBZGAKWSA-N Ser-Gly-Met Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UAJAYRMZGNQILN-BQBZGAKWSA-N 0.000 description 1
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 1
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 1
- OQPNSDWGAMFJNU-QWRGUYRKSA-N Ser-Gly-Tyr Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OQPNSDWGAMFJNU-QWRGUYRKSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- ZGFRMNZZTOVBOU-CIUDSAMLSA-N Ser-Met-Gln Chemical compound N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)O ZGFRMNZZTOVBOU-CIUDSAMLSA-N 0.000 description 1
- VXYQOFXBIXKPCX-BQBZGAKWSA-N Ser-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N VXYQOFXBIXKPCX-BQBZGAKWSA-N 0.000 description 1
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 1
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 1
- WNDUPCKKKGSKIQ-CIUDSAMLSA-N Ser-Pro-Gln Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O WNDUPCKKKGSKIQ-CIUDSAMLSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 1
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 1
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 1
- 241000276699 Seriola Species 0.000 description 1
- 235000010896 Sesbania bispinosa Nutrition 0.000 description 1
- 244000112572 Sesbania bispinosa Species 0.000 description 1
- 235000015392 Sesbania grandiflora Nutrition 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 241000219315 Spinacia Species 0.000 description 1
- 241000847989 Sporobolus fimbriatus Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 241000408201 Stiburus Species 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 241000505911 Tadehagi Species 0.000 description 1
- 241001138405 Taxodium distichum Species 0.000 description 1
- 235000006468 Thea sinensis Nutrition 0.000 description 1
- 244000152045 Themeda triandra Species 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 1
- GCXFWAZRHBRYEM-NUMRIWBASA-N Thr-Gln-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O GCXFWAZRHBRYEM-NUMRIWBASA-N 0.000 description 1
- DIPIPFHFLPTCLK-LOKLDPHHSA-N Thr-Gln-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O DIPIPFHFLPTCLK-LOKLDPHHSA-N 0.000 description 1
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 1
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 1
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 1
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- UBDDORVPVLEECX-FJXKBIBVSA-N Thr-Gly-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UBDDORVPVLEECX-FJXKBIBVSA-N 0.000 description 1
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- PAXANSWUSVPFNK-IUKAMOBKSA-N Thr-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N PAXANSWUSVPFNK-IUKAMOBKSA-N 0.000 description 1
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 1
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 1
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 1
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 1
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 241000219793 Trifolium Species 0.000 description 1
- CSOBBJWWODOYGW-ILWGZMRPSA-N Trp-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N)C(=O)O CSOBBJWWODOYGW-ILWGZMRPSA-N 0.000 description 1
- WVAKXMOGMWLWHK-VJBMBRPKSA-N Trp-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N WVAKXMOGMWLWHK-VJBMBRPKSA-N 0.000 description 1
- 240000003021 Tsuga heterophylla Species 0.000 description 1
- 235000008554 Tsuga heterophylla Nutrition 0.000 description 1
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 1
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 1
- CYDVHRFXDMDMGX-KKUMJFAQSA-N Tyr-Asn-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O CYDVHRFXDMDMGX-KKUMJFAQSA-N 0.000 description 1
- IXTQGBGHWQEEDE-AVGNSLFASA-N Tyr-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IXTQGBGHWQEEDE-AVGNSLFASA-N 0.000 description 1
- JWGXUKHIKXZWNG-RYUDHWBXSA-N Tyr-Gly-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JWGXUKHIKXZWNG-RYUDHWBXSA-N 0.000 description 1
- WPRVVBVWIUWLOH-UFYCRDLUSA-N Tyr-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N WPRVVBVWIUWLOH-UFYCRDLUSA-N 0.000 description 1
- SZEIFUXUTBBQFQ-STQMWFEESA-N Tyr-Pro-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SZEIFUXUTBBQFQ-STQMWFEESA-N 0.000 description 1
- VYQQQIRHIFALGE-UWJYBYFXSA-N Tyr-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VYQQQIRHIFALGE-UWJYBYFXSA-N 0.000 description 1
- BCOBSVIZMQXKFY-KKUMJFAQSA-N Tyr-Ser-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O BCOBSVIZMQXKFY-KKUMJFAQSA-N 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 235000012511 Vaccinium Nutrition 0.000 description 1
- 241000736767 Vaccinium Species 0.000 description 1
- JFAWZADYPRMRCO-UBHSHLNASA-N Val-Ala-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JFAWZADYPRMRCO-UBHSHLNASA-N 0.000 description 1
- JYVKKBDANPZIAW-AVGNSLFASA-N Val-Arg-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N JYVKKBDANPZIAW-AVGNSLFASA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 1
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 1
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 1
- HVRRJRMULCPNRO-BZSNNMDCSA-N Val-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 HVRRJRMULCPNRO-BZSNNMDCSA-N 0.000 description 1
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 1
- 241000219873 Vicia Species 0.000 description 1
- 241000219094 Vitaceae Species 0.000 description 1
- 235000009392 Vitis Nutrition 0.000 description 1
- 241000219095 Vitis Species 0.000 description 1
- 240000001198 Zantedeschia aethiopica Species 0.000 description 1
- FJWGYAHXMCUOOM-QHOUIDNNSA-N [(2s,3r,4s,5r,6r)-2-[(2r,3r,4s,5r,6s)-4,5-dinitrooxy-2-(nitrooxymethyl)-6-[(2r,3r,4s,5r,6s)-4,5,6-trinitrooxy-2-(nitrooxymethyl)oxan-3-yl]oxyoxan-3-yl]oxy-3,5-dinitrooxy-6-(nitrooxymethyl)oxan-4-yl] nitrate Chemical compound O([C@@H]1O[C@@H]([C@H]([C@H](O[N+]([O-])=O)[C@H]1O[N+]([O-])=O)O[C@H]1[C@@H]([C@@H](O[N+]([O-])=O)[C@H](O[N+]([O-])=O)[C@@H](CO[N+]([O-])=O)O1)O[N+]([O-])=O)CO[N+](=O)[O-])[C@@H]1[C@@H](CO[N+]([O-])=O)O[C@@H](O[N+]([O-])=O)[C@H](O[N+]([O-])=O)[C@H]1O[N+]([O-])=O FJWGYAHXMCUOOM-QHOUIDNNSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 244000193174 agave Species 0.000 description 1
- 230000009418 agronomic effect Effects 0.000 description 1
- 108010084217 alanyl-glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 235000012735 amaranth Nutrition 0.000 description 1
- 239000004178 amaranth Substances 0.000 description 1
- 238000000540 analysis of variance Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 1
- 101150037081 aroA gene Proteins 0.000 description 1
- 235000016520 artichoke thistle Nutrition 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 108010066988 asparaginyl-alanyl-glycyl-alanine Proteins 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000010352 biotechnological method Methods 0.000 description 1
- 238000005422 blasting Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 235000019577 caloric intake Nutrition 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 244000195896 dadap Species 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 235000021186 dishes Nutrition 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000006353 environmental stress Effects 0.000 description 1
- 239000003256 environmental substance Substances 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009313 farming Methods 0.000 description 1
- 239000003925 fat Substances 0.000 description 1
- 235000019197 fats Nutrition 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 239000003337 fertilizer Substances 0.000 description 1
- 235000019688 fish Nutrition 0.000 description 1
- 229940014144 folate Drugs 0.000 description 1
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 1
- 235000019152 folic acid Nutrition 0.000 description 1
- 239000011724 folic acid Substances 0.000 description 1
- 239000004459 forage Substances 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 102000054767 gene variant Human genes 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 1
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 1
- 108010054666 glycyl-leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010017446 glycyl-prolyl-arginyl-proline Proteins 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 1
- 229940097068 glyphosate Drugs 0.000 description 1
- 235000021021 grapes Nutrition 0.000 description 1
- 235000021384 green leafy vegetables Nutrition 0.000 description 1
- 230000002363 herbicidal effect Effects 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 239000010903 husk Substances 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 229940097275 indigo Drugs 0.000 description 1
- COHYTHOBJLSHDF-UHFFFAOYSA-N indigo powder Natural products N1C2=CC=CC=C2C(=O)C1=C1C(=O)C2=CC=CC=C2N1 COHYTHOBJLSHDF-UHFFFAOYSA-N 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000003973 irrigation Methods 0.000 description 1
- 230000002262 irrigation Effects 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 235000021374 legumes Nutrition 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 235000013622 meat product Nutrition 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 210000004897 n-terminal region Anatomy 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 229940079938 nitrocellulose Drugs 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 238000003499 nucleic acid array Methods 0.000 description 1
- 235000006286 nutrient intake Nutrition 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000005305 organ development Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000016087 ovulation Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 235000021017 pears Nutrition 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000000575 pesticide Substances 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 238000000206 photolithography Methods 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 230000021749 root development Effects 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 239000012266 salt solution Substances 0.000 description 1
- 238000013077 scoring method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- FQENQNTWSFEDLI-UHFFFAOYSA-J sodium diphosphate Chemical compound [Na+].[Na+].[Na+].[Na+].[O-]P([O-])(=O)OP([O-])([O-])=O FQENQNTWSFEDLI-UHFFFAOYSA-J 0.000 description 1
- 229940048086 sodium pyrophosphate Drugs 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 239000010421 standard material Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 235000021012 strawberries Nutrition 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 235000013616 tea Nutrition 0.000 description 1
- 235000019818 tetrasodium diphosphate Nutrition 0.000 description 1
- 239000001577 tetrasodium phosphonato phosphate Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 1
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Botany (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Agricultural Chemicals And Associated Chemicals (AREA)
- Cultivation Of Plants (AREA)
Abstract
본 발명은 식물에서 활막 육종 전위 (SYT) 폴리펩티드 또는 그의 상동체를 코딩하는 핵산의 발현을 조절함으로써 식물 수확량을 증가시키는 방법에 관한 것이다. 이러한 방법은 SYT 핵산 또는 그의 변이체를 식물 내에 도입하는 것을 포함한다. 본 발명은 또한 상응하는 야생형 식물에 비해 증가된 수확량을 갖는, 식물 내에 도입된 SYT 핵산 또는 그의 변이체를 갖는 트랜스제닉 식물에 관한 것이다. 본 발명은 또한 본 발명의 방법에 유용한 구조물에 관한 것이다.
SYT 폴리펩티드, 트랜스제닉 식물, 유전적 구조물, 아라비돕시스 탈리아나(Arabidopsis thaliana)
Description
본 발명은 일반적으로 분자 생물학 분야에 관한 것이고, 상응하는 야생형 식물에 비해 식물 수확량을 증가시키는 방법에 관한 것이다. 더욱 구체적으로, 본 발명은 식물에서 활막 육종 전위 (SYT) 폴리펩티드 또는 그의 상동체를 코딩하는 핵산의 발현을 조절하는 것을 포함하는, 식물 수확량을 증가시키는 방법에 관한 것이다. 본 발명은 또한 상응하는 야생형 식물에 비해 증가된 수확량을 가지는, SYT 폴리펩티드 또는 그의 상동체를 코딩하는 핵산의 조절된 발현을 보유하는 식물에 관한 것이다. 본 발명은 또한 본 발명의 방법에 유용한 구조물을 제공한다.
끊임없이 증가하는 세계 인구, 및 농업용 연료에 이용할 수 있는 경작지 공급의 감소로 인해 농업의 효율성을 개선시키는 방향으로 연구되고 있다. 작물 및 원예작물의 개선을 위한 통상적 수단은 목적한 특성을 지닌 식물을 찾는 선택적 품종 개량 기술을 이용한다. 그러나, 그러한 선택적 품종 개량 기술은 다수의 결점을 갖는다. 즉, 상기 기술은 전형적으로 노동 집약적이며, 종종 이종 유전자 성분을 함유하여 모 식물로부터 계승되는 바람직한 형질을 항상 야기할 수는 없는 식물을 생산한다. 분자 생물학의 진보로 인해 인류는 동물 및 식물의 배형질을 개질시켰다. 식물의 유전자 공학은 유전자 물질 (전형적으로 DNA 또는 RNA 형태)의 단리 및 조작, 및 식물로의 상기 유전자 물질의 후속적 도입을 수반한다. 이러한 기술은 다양한 개선된 경제학, 농경학 또는 원예학적 형질을 갖는 작물 또는 식물의 산출 능력을 가진다.
특별히 경제적으로 관심이 되는 특징은 수확량, 많은 식물의 경우에 종자 수확량이다. 수확량은 일반적으로 작물로부터의 측정가능한 경제 가치의 생산량으로서 정의된다. 이는 수량 및/또는 품질의 용어로 정의될 수 있다. 식물 종자는 인간 및 동물 영양분의 중요한 공급원이다. 옥수수, 벼, 밀, 캐놀라 및 대두와 같은 작물은 종자 자체의 직접 소비를 통해서든지 또는 가공처리된 종자로 사육된 육류 생산품의 소비를 통해서든지 총 인간 칼로리 섭취량의 절반 이상을 차지한다. 이들은 또한 설탕, 오일, 및 산업 공정에 사용되는 많은 종류의 대사물의 공급원이다. 종자는 발아 후의 새로운 싹 및 뿌리의 공급원인 배아, 및 묘목의 발아 및 초기 성장 동안 배아 성장을 위한 영양분의 공급원인 배유를 함유한다. 종자의 발달은 많은 유전자를 수반하며, 뿌리, 잎 및 줄기로부터 성장하는 종자로의 대사물의 이동을 필요로 한다. 배유는 특히 탄수화물 중합체의 대사 전구물질, 오일 및 단백질을 흡수하고, 낟알을 부풀리기 위해 이들을 축적 거대분자로 합성한다. 종자 수, 종자 생물량, 종자 발달, 종자 충전을 통해서든지, 또는 임의의 다른 종자-관련 형질을 통해서든지 식물 종자 수확량을 증가시키는 능력은 농업, 및 심지어 많은 비-농업적 용도, 예컨대 의약품, 항체 또는 백신과 같은 물질의 생물공학 생산에 다수 적용될 것이다.
수확량은 또한 기관, 식물 구조의 수 및 크기 (예를 들어, 가지의 수), 종자 생산량 등과 같은 요인에 따라 달라질 수 있다. 뿌리 발달, 영양분 섭취 및 스트레스 내성은 또한 수확량을 결정하는데 중요한 요인일 수 있다. 따라서, 이들 요인의 최적화가 또한 작물 수확량을 증가시키는데 기여할 수 있다.
본 발명에 따라 식물에서 SYT 폴리펩티드 또는 그의 상동체를 코딩하는 핵산의 발현을 조절하는 것이 상응하는 야생형 식물에 비해 증가된 수확량을 갖는 식물을 제공하는 것으로 드디어 밝혀졌다.
SYT는 식물에서 단백질의 GRF (성장-조절 인자) 족의 전사 활성인자와의 기능적 복합체를 형성하는 전사적 공-활성인자이다 (문헌 [Kim HJ, Kende H (2004) Proc Nat Acad Sc 101: 13374-9]). SYT는 또한 GRF-상호작용 인자로서 GIF라 지칭된다. GRF 전사 활성인자는 효모의 염색질-리모델링 복합체의 SWI/SNF 단백질과 (N-말단 영역에서) 구조적 도메인을 공유한다 (문헌 [van der Knaap E et al., (2000) Plant Phys 122: 695-704]). 이들 복합체의 전사적 공-활성인자는 인핸서 및 프로모터 영역에서 SWI/SNF 복합체를 보충하는데 관여하여 국소 염색질 리모델링을 초래한다고 제시되어 있다 (문헌 [Naar AM et al., (2001) Annu Rev Biochem 70: 475-501] 검토). 국소 염색질 구조의 변경은 전사 활성을 조절한다. 더욱 명확하게는, SYT는 식물 SWI/SNF 복합체와 상호작용하여 GRF 표적 유전자(들)의 전사적 활성화에 영향을 준다고 제시되어 있다 (문헌 [Kim HJ, Kende H (2004) Proc Nat Acad Sc 101: 13374-9]).
SYT는 아라비돕시스(Arabidopsis)의 3개의 군의 유전자 족에 속한다. SYT 폴리펩티드는 인간 SYT와 상동성을 가진다. 인간 SYT 폴리펩티드는 전사적 공-활성인자인 것으로 제시되어 있다 (문헌 [Thaete et al . (1999) Hum Molec Genet 8: 585-591]). 하기 3개의 도메인은 포유류 SYT 폴리펩티드의 특징을 나타낸다:
(i) 포유동물, 식물, 선충류 및 어류에서 보존되는 N-말단 SNH (SYT N-말단 상동성) 도메인;
(ii) 비-주기적으로 발생하는, 주로 글리신, 프롤린, 글루타민 및 티로신으로 구성된 C-말단 QPGY-풍부 도메인; 및
(iii) 2개의 상기 도메인 사이에 위치하는 메티오닌-풍부 (Met-풍부) 도메인.
식물 SYT 폴리펩티드에서, SNH 도메인은 잘 보존된다. C-말단 도메인은 글리신 및 글루타민이 풍부하지만, 프롤린 또는 티로신은 풍부하지 않다. 따라서, 포유동물의 QPGY 도메인과 대조적으로 QG-풍부 도메인으로 명명된다. 포유류 SYT와 마찬가지로, Met-풍부 도메인은 QG 도메인의 N-말단으로 식별될 수 있다. QG-풍부 도메인은 실질적으로 단백질의 C-말단 잔여부 (SHN 도메인 제외)인 것으로 간주될 수 있고; Met-풍부 도메인은 전형적으로 QG-풍부 도메인의 전반부 (N-말단에서 C-말단까지) 내에 포함된다. 두번째 Met-풍부 도메인은 식물 SYT 폴리펩티드에서 SNH 도메인의 앞에 존재할 수 있다 (도 1 참조).
SYT-기능 결여된 돌연변이체 및 SYT 발현이 감소된 트랜스제닉 식물은 세포가 거의 없는 작고 폭이 좁은 잎 및 꽃잎을 발생시키는 것으로 보고되었다 (문헌 [Kim HJ, Kende H (2004) Proc Nat Acad Sc 101: 13374-9]).
본 발명에 따라, 식물에서 SYT 폴리펩티드 또는 그의 상동체를 코딩하는 핵산의 발현을 조절하는 것을 포함하는, 식물 수확량을 증가시키는 방법이 제공된다.
본원에서 "상응하는 야생형 식물"에 대한 지칭은 임의의 적합한 대조군 식물(들)을 의미하는 것이며, 이의 선택은 당업자의 능력 내에서 충분할 것이고, 예를 들어 관심 유전자가 없는 상응하는 야생형 식물 또는 상응하는 식물을 포함할 수 있다. 본원에 사용되는 "대조군 식물"은 전체 식물뿐만 아니라, 종자 및 종자의 부분을 비롯한 식물의 부분을 지칭한다.
유리하게는, 본 발명에 따른 방법을 수행하여 상응하는 야생형 식물에 비해 증가된 수확량, 특히 종자 수확량을 갖는 식물을 생산한다.
본원에 정의된 바와 같은 용어 "증가된 수확량"은 각각 상응하는 야생형 식물에 비해 하기 중 임의의 하나 이상에서의 증가를 의미하는 것이다:
(i) 식물의 하나 이상의 부분, 특히 지상의 (수확가능한) 부분의 생물량 (무게)의 증가, 뿌리 생물량의 증가, 또는 임의의 다른 수확가능한 부분 (예컨대 열매, 견과 및 콩)의 생물량의 증가; (ii) 종자 생물량 (종자 무게)의 증가를 포함하고, 식물 당 또는 개별적 종자 베이스에 대한 종자 무게의 증가일 수 있는 총 종자 수확량의 증가; (iii) (충전된) 종자의 수의 증가; (iv) 종자의 조성에 영향을 줄 수도 있는 종자 크기의 증가; (v) 종자의 조성 (오일, 단백질 및 탄수화물 총 함량 및 조성을 포함)에 영향을 줄 수도 있는 종자 부피의 증가; (vi) 각각의 종자 구역의 증가; (vii) 각각의 종자 길이 또는 폭의 증가; (viii) 종자와 같은 수확가능한 부분의 수확량을 총 생물량으로 나눈 비로서 표현되는 수확 지수의 증가; 및 (ix) 계수된 충전 종자의 수 및 이의 총 무게로부터 추정된 천립중(thousand kernel weight: TKW)의 증가. 증가된 TKW는 증가된 종자 크기 및/또는 종자 무게로부터 유래할 수 있다. 증가된 TKW는 배아 크기 및/또는 배유 크기의 증가로부터 유래할 수 있다. 종자 크기, 종자 부피, 종자 구역, 종자 경계선, 종자 폭 및 종자 길이의 증가는 종자의 특정 부분의 증가, 예를 들어 배아 및/또는 배유 및/또는 호분 및/또는 배반, 또는 종자의 다른 부분의 크기의 증가 때문일 수 있다.
예로서 옥수수의 경우, 수확량 증가는 헥타르 또는 에이커 당 식물의 수의 증가; 식물 당 이삭의 수의 증가; 열의 수, 열 당 낟알의 수, 낟알 무게, 천립중, 이삭 길이/직경의 증가; 특히 종자 충전 비 (충전된 종자의 수를 총 종자의 수로 나누고 100을 곱함)의 증가 중 하나 이상으로서 나타내어질 수 있다. 예로서 벼의 경우, 수확량 증가는 헥타르 또는 에이커 당 식물의 수, 식물 당 파니클(panicle)의 수, 파니클 당 스피켈렛(spikelet)의 수, 파니클 당 꽃 (작은 꽃)의 수 (충전된 종자의 수를 초기 파니클의 수로 나눈 비로서 표현됨)의 증가; 종자 충전 비 (충전된 종자의 수를 총 종자의 수로 나누고 100을 곱함)의 증가; 특히 천립중의 증가 중 하나 이상에 의해 나타내어질 수 있다.
수확량의 증가는 또한 개질된 구조를 야기할 수 있거나, 또는 개질된 구조의 결과로서 일어날 수 있다.
바람직한 특징에 따라, 본 발명의 방법을 수행하여 증가된 종자 수확량을 갖는 식물을 생산한다. 따라서, 본 발명에 따라, 식물에서 SYT 폴리펩티드 또는 그의 상동체를 코딩하는 핵산의 발현을 조절하는 것을 포함하는, 식물의 종자 수확량을 증가시키는 방법이 제공된다.
본 발명에 따른 트랜스제닉 식물이 증가된 수확량을 가지기 때문에, 이들 식물은 이의 수명 주기의 상응하는 단계에서 상응하는 야생형 식물의 성장율에 비해 증가된 성장율 (적어도 이의 수명 주기의 일부 동안)을 나타내는 것처럼 보인다. 증가된 성장율은 식물 (종자 포함)의 하나 이상의 부분에 특정적일 수 있거나, 또는 실질적으로 전체 식물 전반에 걸칠 수 있다. 증가된 성장율을 갖는 식물은 심지어 조기 개화를 나타낼 수 있다. 성장율의 증가는 식물의 수명 주기의 하나 이상의 단계에서 또는 실질적으로 전체 식물 수명 주기 동안에 일어날 수 있다. 식물의 수명 주기의 초기 단계 동안에 증가된 성장율은 증진된 생장력을 나타낼 수 있다. 성장율의 증가는 식물의 수확 주기를 변경시켜 달리 가능한 경우보다 식물이 늦게 파종되고/거나 일찍 수확될 수 있게 한다. 성장율이 충분히 증가된 경우, 동일한 식물 종의 종자의 추가 파종 (예를 들어, 1회의 통상적 재배 기간 내에 벼 식물의 파종 및 수확 후 추가의 벼 식물의 파종 및 수확 모두)이 가능할 수 있다. 유사하게, 성장율이 충분히 증가된 경우, 상이한 식물 종의 종자의 추가 파종 (예를 들어, 벼 식물의 파종 및 수확 후, 예를 들어 대두, 감자 또는 임의의 기타 적합한 식물의 파종 및 임의의 수확)이 가능할 수 있다. 일부 작물 식물의 경우, 동일한 근경으로부터의 추가 횟수의 수확이 또한 가능할 수 있다. 식물의 수확 주기의 변경은 에이커 당 연간 생물량 생산의 증가를 유도할 수 있다 ((1년에) 임의의 특정 식물이 성장 및 수확될 수 있는 횟수의 증가로 인해). 작물의 재배를 위한 토지의 제한이 파종의 시기 (시즌 초) 또는 수확의 시기 (시즌 말)에서의 불리한 환경 조건에 의해 종종 결정되기 때문에, 성장율의 증가는 또한 이의 야생형 대응물보다 보다 넓은 지리적 영역에서 트랜스제닉 식물의 경작을 가능하게 할 수 있다. 이러한 불리한 조건은 수확 주기가 짧아진다면 피할 수 있다. 성장율은 다양한 파라미터를 성장 곡선으로부터 추론함으로써 결정될 수 있으며, 이러한 파라미터는 특히 T-Mid (식물이 이의 최대 크기의 50%에 도달하는데 걸리는 시간) 및 T-90 (식물이 이의 최대 크기의 90%에 도달하는데 걸리는 시간)일 수 있다.
본 발명의 방법의 수행은 상응하는 야생형 식물에 비해 증가된 성장율을 갖는 식물을 제공한다. 따라서, 본 발명에 따라, 식물에서 SYT 폴리펩티드 또는 그의 상동체를 코딩하는 핵산의 발현을 조절하는 것을 포함하는, 식물의 성장율을 증가시키는 방법이 제공된다.
(종자) 수확량 및/또는 성장율의 증가는, 식물이 비-스트레스 조건 하에 있든지 식물이 적합한 대조군 식물과 비교하여 다양한 스트레스에 노출되든지에 발생한다. 식물은 전형적으로 스트레스에의 노출에 보다 천천히 성장하는 것으로 반응한다. 심한 스트레스의 조건에서, 식물은 심지어 완전히 성장을 멈출 수 있다. 반면, 온화한 스트레스는 성장이 다시 시작되는 능력 없이 성장이 완전히 중지된 식물을 야기하지는 않는, 식물이 노출되는 특정 스트레스로서 본원에 정의된다. 농사 방법의 진보 (관개, 비료, 살충제 처리)로 인해, 경작된 작물 식물이 심한 스트레스에 자주 직면하지는 않는다. 결론적으로, 농업에 있어 바람직하지 않은 특징은 흔히 온화한 스트레스에 의해 유도된 약화된 성장이다. 온화한 스트레스는 식물이 노출될 수 있는 전형적인 스트레스이다. 이 스트레스는 식물이 노출되는 일상의 생물적 및/또는 비생물적 (환경적) 스트레스일 수 있다. 전형적인 비생물적 또는 환경적 스트레스는 불규칙한 고온 또는 저온/동결 온도에 의해 야기된 온도 스트레스; 염 스트레스; 물 스트레스 (건조 또는 과량의 물)을 포함한다. 화학물질도 또한 비생물적 스트레스를 초래할 수 있다. 생물적 스트레스는 전형적으로 박테리아, 바이러스, 진균 및 곤충과 같은 병원체에 의해 야기된 스트레스이다.
유리하게는, 수확량은 임의 식물에서 개질될 수 있다.
본원에 사용되는 용어 "식물"은 모든 식물, 식물의 원형종 및 후종, 및 종자, 싹, 줄기, 잎, 뿌리 (덩이줄기 포함), 꽃, 및 조직 및 기관을 비롯한 식물의 부분을 포함하며, 여기서, 상기 언급된 각각은 관련 트랜스진(transgene)을 포함한다. 용어 "식물"은 또한 식물 세포, 현탁액 배양, 캘러스 조직, 배아, 분열 영역, 배우체, 포자체, 화분 및 소포자를 포함하며, 여기서, 상기 언급된 각각은 트랜스진을 포함한다.
특히 본 발명의 방법에 유용한 식물은 아카시아(Acacia) 종, 아세르(Acer) 종, 악티니디아(Actinidia) 종, 아에스쿨러스(Aesculus) 종, 아가티스 아우스트랄리스(Agathis australis), 알비지아 아마라(Albizia amara), 알소필라 트리콜로르(Alsophila tricolor), 안드로포곤(Andropogon) 종, 아라키스(Arachis) 종, 아레카 카테추(Areca catechu), 아스텔리아 프라그란스(Astelia fragrans), 아스트라갈루스 시세르(Astragalus cicer), 바이키아에아 플루리주가(Baikiaea plurijuga), 베툴라(Betula) 종, 브라시카(Brassica) 종, 브루귀에라 김노리자(Bruguiera gymnorrhiza), 부르케아 아프리카나(Burkea africana), 부테아 프론도사(Butea frondosa), 카다바 파리노사(Cadaba farinosa), 칼리안드라(Calliandra) 종, 카멜리아 시넨시스(Camellia sinensis), 칸나 인디카(Canna indica), 캅시쿰(Capsicum) 종, 카시아(Cassia) 종, 센트로에마 푸베센스(Centroema pubescens), 카에노멜레스(Chaenomeles) 종, 신나모뭄(Cinnamomum) 카시아, 코페아 아라비카(Coffea arabica), 콜로포스페르뭄 모판(Colophospermum mopane), 코로닐리아 바리아(Coronillia varia), 코토네아스테르 세로티나(Cotoneaster serotina), 크라타에구스(Crataegus) 종, 쿠쿠미스(Cucumis) 종, 쿠프레수스(Cupressus) 종, 시아테아 딜바타(Cyathea dealbata), 시도니아 오블론가(Cydonia oblonga), 크립토메리아 자포니카(Cryptomeria japonica), 심보포곤(Cymbopogon) 종, 신테아(Cynthea) 딜바타, 달베르기아 모네타리아(Dalbergia monetaria), 다발리아 디바리카타(Davallia divaricata), 데스모듐(Desmodium) 종, 딕소니아 스쿠아로사(Dicksonia squarosa), 디헤테로포곤 암플렉텐스(Diheteropogon amplectens), 디오클레아(Dioclea) 종, 돌리코스(Dolichos) 종, 도리크늄 렉툼(Dorycnium rectum), 에키노클로아 피라미달리스(Echinochloa pyramidalis), 에라르티아(Ehrartia) 종, 엘류시네 코라카나(Eleusine coracana), 에라그레스티스(Eragrestis) 종, 에리트리나(Erythrina) 종, 유칼립투스(Eucalyptus) 종, 유클레아 스킴페리(Euclea schimperi), 유랄리아 빌로사(Eulalia villosa), 파고비룸(Fagopyrum) 종, 페이조아 셀로위아나(Feijoa sellowiana), 프라가리아(Fragaria) 종, 플레민기아(Flemingia) 종, 프레이시네티아 뱅크시(Freycinetia banksii), 게라늄 툰베르기(Geranium thunbergii), 깅코 빌로바(Ginkgo biloba), 글리신 자바니카(Glicine javanica), 글리리시디아(Gliricidia) 종, 고시퓸 히르수툼(Gossypium hirsutum), 그레빌레아(Grevillea) 종, 귀보우르티아 콜레오스페르마(Guibourtia coleosperma), 헤디사룸(Hedysarum) 종, 헤마르티아 알티시마(Hemarthia altissima), 헤테로포곤 콘토르투스(Heteropogon contortus), 호르데움 불가레(Hordeum vulgare), 히파레니아 루파(Hyparrhenia rufa), 히페리쿰 에렉툼(Hypericum erectum), 히페르텔리아 디솔루타(Hyperthelia dissoluta), 인디고 인카르나타(Indigo incarnata), 이리스(Iris) 종, 렙타레나 피롤리폴리아(Leptarrhena pyrolifolia), 레스페디자(Lespediza) 종, 레투카(Lettuca) 종, 류카에나 류코세팔라(Leucaena leucocephala), 로우데티아 심플레스(Loudetia simplex), 로토누스 바이네시(Lotonus bainesii), 로투스(Lotus) 종, 마크로틸로마 악실라레(Macrotyloma axillare), 말루스(Malus) 종, 마니호트 에스쿨렌타(Manihot esculenta), 메디카고 사티바(Medicago sativa), 메타세쿼아 글립토스트로보이데스(Metasequoia glyptostroboides), 무사 사피엔툼(Musa sapientum), 니코티아눔(Nicotianum) 종, 오노브리키스(Onobrychis) 종, 오르니토푸스(Ornithopus) 종, 오리자(Oryza) 종, 펠토포룸 아프리카눔(Peltophorum africanum), 페니세툼(Pennisetum) 종, 페르세아 그라티시마(Persea gratissima), 페투니아(Petunia) 종, 파세올루스(Phaseolus) 종, 포에닉스 카나리엔시스(Phoenix canariensis), 포르뮴 쿠키아눔(Phormium cookianum), 포티니아(Photinia) 종, 피세아 글라우카(Picea glauca), 피누스(Pinus) 종, 피숨 사티붐(Pisum sativum), 포도카르푸스 토타라(Podocarpus totara), 포고나르트리아 플렉키(Pogonarthria fleckii), 포고나르트리아 스쿠아로사(Pogonarthria squarrosa), 포풀루스(Populus) 종, 프로소피스 시네라리아(Prosopis cineraria), 슈도트수가 멘지에시(Pseudotsuga menziesii), 프테롤로븀 스텔라툼(Pterolobium stellatum), 피루스 코무니스(Pyrus communis), 쿠에르쿠스(Quercus) 종, 라피올렙시스 움벨라타(Rhaphiolepsis umbellata), 로팔로스틸리스 사피다(Rhopalostylis sapida), 루스 나탈렌시스(Rhus natalensis), 리베스 그로술라리아(Ribes grossularia), 리베스(Ribes) 종, 로비니아 슈도아카시아(Robinia pseudoacacia), 로사(Rosa) 종, 루부스(Rubus) 종, 살릭스(Salix) 종, 스키자키륨 산귀네움(Schyzachyrium sanguineum), 스키아도피티스 베르티실라타(Sciadopitys verticillata), 세쿼아 셈페르비렌스(Sequoia sempervirens), 세쿼아덴드론 기간테움(Sequoiadendron giganteum), 소르굼 비콜로르(Sorghum bicolor), 스피나시아(Spinacia) 종, 스포로볼루스 핌브리아투스(Sporobolus fimbriatus), 스티부루스 알로페쿠로이데스(Stiburus alopecuroides), 스틸로산토스 후밀리스(Stylosanthos humilis), 타데하기(Tadehagi) 종, 탁소듐 디스티쿰(Taxodium distichum), 테메다 트리안드라(Themeda triandra), 트리폴륨(Trifolium) 종, 트리티쿰(Triticum) 종, 추가 헤테로필라(Tsuga heterophylla), 박시늄(Vaccinium) 종, 비키아(Vicia) 종, 비티스 비니페라(Vitis vinifera), 와트소니아 피라미다타(Watsonia pyramidata), 잔테데스키아 아에티오피카(Zantedeschia aethiopica), 제아 메이스(Zea mays), 아마란트, 아티초크, 아스파라거스, 브로콜리, 브뤼셀 스프로츠(Brussels sprouts), 양배추, 캐놀라, 당근, 콜리플라워, 셀러리, 콜라드 그린, 아마, 케일, 렌즈콩, 평지기름, 오크라, 양파, 감자, 벼, 대두, 딸기, 사탕무, 사탕수수, 해바라기, 토마토, 호박, 차 및 조류를 포함하는 목록으로부터 선택되는 비리디플란태(Viridiplantae) 상족, 특히 사료 또는 사료용 두류, 장식용 식물, 식용 작물, 나무 또는 관목을 비롯한 단자엽 및 쌍자엽 식물에 속하는 모든 식물을 포함한다. 본 발명의 바람직한 실시양태에 따라, 식물은 작물 식물이다. 작물 식물의 예로는 특히 대두, 해바라기, 캐놀라, 알팔파, 평지씨, 목화, 토마토, 감자 또는 담배가 있다. 아라비돕시스 탈리아나(Arabidopsis thaliana)는 일반적으로 작물 식물로서 간주되지 않는다. 추가로 바람직하게는, 식물은 사탕수수와 같은 단자엽 식물이다. 더욱 바람직하게는, 식물은 벼, 옥수수, 밀, 보리, 기장, 호밀, 수수 또는 귀리와 같은 곡물이다.
본원에 정의된 바와 같은 용어 "SYT 폴리펩티드 또는 그의 상동체"는 N-말단에서 C-말단까지 (i) 서열 2의 SNH 도메인에 대해 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 (순서대로 더 바람직함)의 서열 동일성을 갖는 SNH 도메인; (ii) Met-풍부 도메인; 및 (iii) QG-풍부 도메인을 포함하는 폴리펩티드를 지칭한다.
바람직하게는, 서열 2의 SNH 도메인에 대해 40% 이상의 동일성을 갖는 SNH 도메인은 도 2에서 흑색으로 나타낸 잔기를 포함한다. 추가로 바람직하게는, SNH 도메인은 서열 1로 나타내어진다.
또한, SYT 폴리펩티드 또는 그의 상동체는 (a) 서열 90; (b) 서열 91; 및 (c) SNH 도메인 앞의 N-말단에서 Met-풍부 도메인 중 하나 이상을 포함할 수 있다.
SYT 폴리펩티드 또는 그의 상동체는 전형적으로 효모 2-하이브리드 계에서 GRF (성장-조절 인자) 폴리펩티드와 상호작용한다. 효모 2-하이브리드 상호작용 검정은 당업계에 익히 공지되어 있다 (문헌 [Field et al. (1989) Nature 340(6230): 245-246] 참조). 예를 들어, 서열 4로 나타내어지는 SYT 폴리펩티드는 AtGRF5 및 AtGRF9와 상호작용할 수 있다. SYT 폴리펩티드 및 그의 상동체는 식물의 수확량, 특히 종자 수확량을 증가시키는 것으로 본 발명자들에 의해 입증되었다.
SYT 폴리펩티드 또는 그의 상동체는 SYT 핵산/유전자에 의해 코딩된다. 따라서, 본원에 정의된 바와 같은 용어 "SYT 핵산/유전자"는 본원 상기에 정의된 바와 같은 SYT 폴리펩티드 또는 그의 상동체를 코딩하는 임의의 핵산/유전자이다.
SYT 폴리펩티드 또는 그의 상동체는 당업계에 익히 공지된 통상적 기법을 사용하여, 예컨대 서열 정렬에 의해 손쉽게 확인될 수 있다. 비교용 서열 정렬 방법은 당업계에 익히 공지되어 있으며, 이 방법에는 GAP, BESTFIT, BLAST, FASTA 및 TFASTA가 포함된다. GAP는 니들맨(Needleman) 및 원치(Wunsch)의 알고리즘 (문헌 [J Mol Biol 48: 443-453, 1970])을 사용하여, 매치(match)의 수를 최대화하고 갭(gap)의 수를 최소화하는 2개의 완전 서열의 정렬을 찾는다. BLAST 알고리즘 (문헌 [Altschul et al. (1990) J Mol Biol 215: 403-10])은 서열 동일성(%)을 계산하고, 2개의 서열 사이의 유사성의 통계적 분석을 수행한다. BLAST 분석 수행을 위한 소프트웨어는 국립 생물공학 연구 센터(National Centre for Biotechnology Information)를 통해 공중에게 입수가능하다. 서열 2의 SNH 도메인에 대해 40% 이상의 서열 동일성을 갖는 SNH 도메인, 및/또는 서열 90 및/또는 서열 91을 포함하는 SYT의 상동체는 예를 들어, http://clustalw.genome.jp/sit-bin/nph-clustalw에서 입수가능한, 디폴트 쌍대(pairwise) 정렬 파라미터로의 클러스탈(Clustalw) 다중 서열 정렬 알고리즘 (버젼 1.83), 및 백분율로의 스코어링 방법을 사용하여 손쉽게 확인될 수 있다. 서열 2의 SNH 도메인에 대해 40% 동일성을 갖는 서열은 SYT인 서열로 확인하기에 충분하다.
추가로, Met-풍부 도메인 또는 QG-풍부 도메인의 존재도 또한 손쉽게 확인될 수 있다. 도 3에 제시된 바와 같이 Met-풍부 도메인 및 QG-풍부 도메인은 SNH 도메인의 뒤에 위치한다. QG-풍부 도메인은 실질적으로 단백질의 C-말단 잔여부 (SHN 도메인 제외)인 것으로 간주될 수 있고; Met-풍부 도메인은 전형적으로 QG-풍부 도메인의 전반부 (N-말단에서 C-말단까지) 내에 포함된다. 폴리펩티드 도메인에 특정 아미노산이 풍부한지를 측정하기 위해, 주요 아미노산 조성 (%)이 엑스파시(ExPASy) 서버로부터의 소프트웨어 프로그램 (문헌 [Gasteiger E et al. (2003) ExPASy: the proteomics server for in-depth protein knowledge and analysis. Nucleic Acids Res 31:3784-3788]), 특히 프로트파람(ProtParam) 도구를 사용하여 계산될 수 있다. 이어서 관심 단백질의 조성이 스위스-프로트(Swiss-Prot) 단백질 서열 데이터 뱅크의 평균 아미노산 조성 (%)과 비교될 수 있다. 상기 데이터뱅크 내의 평균 Met (M) 함량은 2.37%이고, 평균 Gln (Q) 함량은 3.93%이고, 평균 Gly (G) 함량은 6.93%이다. 본원에 정의된 바와 같은 Met-풍부 도메인 또는 QG-풍부 도메인은 스위스-프로트 단백질 서열 데이터 뱅크의 평균 아미노산 조성 (%)을 초과하는 Met 함량 (%) 또는 Gln 및 Gly 함량 (%)을 가진다.
SYT 폴리펩티드 또는 그의 상동체의 예로는 아라비돕시스 탈리아나 Arath_SYT1 (AY102639.1) 서열 4, 아라비돕시스 탈리아나 Arath_SYT2 (AY102640.1) 서열 6, 아라비돕시스 탈리아나 Arath_SYT3 (AY102641.1) 서열 8, 아스페르길루스 오피시날리스(Aspergillus officinalis) Aspof_SYT (CV287542) 서열 10, 브라시카 나푸스(Brassica napus) Brana_SYT (CD823592) 서열 12, 시트루스 시넨시스(Citrus sinensis) Citsi_SYT (CB290588) 서열 14, 고시퓸 아르보레움(Gossypium arboreum) Gosar_SYT (BM359324) 서열 16, 메디카고 트룬쿨라타(Medicago trunculata) Medtr_SYT (CA858507.1) 서열 18, 오리자 사티바 Orysa_SYT1 (AK058575) 서열 20, 오리자 사티바 Orysa_SYT2 (AK105366) 서열 22, 오리자 사티바 Orysa_SYT3 (BP185008) 서열 24, 솔라눔 투베로숨(Solanum tuberosum) Soltu_SYT (BG590990) 서열 26, 제아 메이스 Zeama_SYT1 (BG874129.1, CA409022.1) 서열 28, 제아 메이스 Zeama_SYT2 (AY106697) 서열 30, 호모 사피엔스(Homo sapiens) Homsa_SYT (CAG46900) 서열 32, 알리움 세파(Allium cepa) Allce_SYT2 (CF437485) 서열 34, 아퀼레지아 포르모사(Aquilegia formosa) x 아퀼레지아 푸베센스 Aqufo_SYT1 (DT758802) 서열 36, 브라키포듐 디스타키온(Brachypodium distachyon) Bradi_SYT3 (DV480064) 서열 38, 브라시카 나푸스 Brana_SYT2 (CN732814) 서열 40, 시트루스 시넨시스 Citsi_SYT2 (CV717501) 서열 42, 유포르비아 에술라(Euphorbia esula) Eupes_SYT2 (DV144834) 서열 44, 글리신 막스(Glycine max) Glyma_SYT2 (BQ612648) 서열 46, 글리신 소야(Glycine soya) Glyso_SYT2 (CA799921) 서열 48, 고시퓸 히르수툼 Goshi_SYT1 (DT558852) 서열 50, 고시퓸 히르수툼 Goshi_SYT2 (DT563805) 서열 52, 호르데움 불가레 Horvu_SYT2 (CA032350) 서열 54, 락투카 세리올라(Lactuca serriola) Lacse_SYT2 (DW110765) 서열 56, 리코페르시콘 에스쿨렌툼(Lycopersicon esculentum) Lyces_SYT1 (AW934450, BP893155) 서열 58, 말루스 도메스티카(Malus domestica) Maldo_SYT2 (CV084230, DR997566) 서열 60, 메디카고 트룬쿨라타 Medtr_SYT2 (CA858743, BI310799, AL382135) 서열 62, 파니쿰 비르가툼(Panicum virgatum) Panvi_SYT3 (DN152517) 서열 64, 피세아 시트켄시스(Picea sitchensis) Picsi_SYT1 (DR484100, DR478464) 서열 66, 피누스 타에다(Pinus taeda) Pinta_SYT1 (DT625916) 서열 68, 포풀루스 트레물라(Populus tremula) Poptr_SYT1 (DT476906) 서열 70, 사카룸 오피시나룸(Saccharum officinarum) Sacof_SYT1 (CA078249, CA078630, CA082679, CA234526, CA239244, CA083312) 서열 72, 사카룸 오피시나룸 Sacof_SYT2 (CA110367) 서열 74, 사카룸 오피시나룸 Sacof_SYT3 (CA161933, CA265085) 서열 76, 솔라눔 투베로숨 Soltu_SYT1 (CK265597) 서열 78, 소르굼 비콜로르 Sorbi_SYT3 (CX611128) 서열 80, 트리티쿰 아에스티붐(Triticum aestivum) Triae_SYT2 (CD901951) 서열 82, 트리티쿰 아에스티붐 Triae_SYT3 (BJ246754, BJ252709) 서열 84, 비티스 비니페라(Vitis vinifera) Vitvi_SYT1 (DV219834) 서열 86, 제아 메이스 Zeama_SYT3 (CO468901) 서열 88 (괄호 안의 폴리뉴클레오티드 서열 등록 번호에 의해 코딩됨; 또한 표 1 참조)이 있다.
"SYT 폴리펩티드 또는 그의 상동체"의 정의 하에 있는 서열은 서열 4, 서열 6, 서열 8, 서열 10, 서열 12, 서열 14, 서열 16, 서열 18, 서열 20, 서열 22, 서열 24, 서열 26, 서열 28, 서열 30, 서열 32, 서열 34, 서열 36, 서열 38, 서열 40, 서열 42, 서열 44, 서열 46, 서열 48, 서열 50, 서열 52, 서열 54, 서열 56, 서열 58, 서열 60, 서열 62, 서열 64, 서열 66, 서열 68, 서열 70, 서열 72, 서열 74, 서열 76, 서열 78, 서열 80, 서열 82, 서열 84, 서열 86, 서열 88로 나타내어지는 서열에 제한되지 않으며, N-말단에서 C-말단까지 (i) 서열 2의 SNH 도메인에 대해 40% 이상의 서열 동일성을 갖는 SNH 도메인; (ii) Met-풍부 도메인; 및 (iii) QG-풍부 도메인을 포함하는 임의의 폴리펩티드가 본 발명의 방법을 수행하는 데 적합할 수 있음이 이해되어질 것이다.
SYT 핵산의 예로는 서열 3, 서열 5, 서열 7, 서열 9, 서열 11, 서열 13, 서열 15, 서열 17, 서열 19, 서열 21, 서열 23, 서열 25, 서열 27, 서열 29, 서열 31, 서열 33, 서열 35, 서열 37, 서열 39, 서열 41, 서열 43, 서열 45, 서열 47, 서열 49, 서열 51, 서열 53, 서열 55, 서열 57, 서열 59, 서열 61, 서열 63, 서열 65, 서열 67, 서열 69, 서열 71, 서열 73, 서열 75, 서열 77, 서열 79, 서열 81, 서열 83, 서열 85, 서열 87 중 어느 하나로 나타내어지는 핵산이 있으나, 이에 제한되지 않는다. SYT 핵산/유전자 및 그의 변이체는 본 발명의 방법을 수행하는 데 적합할 수 있다. 전형적으로, SYT 핵산/유전자 변이체는, 상기 핵산/유전자의 발현이 식물에서 조절되는 경우, 동일한 생물학적 기능 또는 수율 증가 기능일 수 있는 천연 발생의 SYT 핵산/유전자와 동일한 기능을 갖는 핵산/유전자이다. 이러한 변이체는 SYT 핵산/유전자의 일부, 및/또는 하기 정의되는 바와 같이 SYT 핵산/유전자와 혼성화될 수 있는 핵산의 일부를 포함한다.
본원에 정의된 바와 같은 용어 "일부"는 N-말단에서 C-말단까지 (i) 서열 2의 SNH 도메인에 대해 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 (순서대로 더 바람직함)의 서열 동일성을 갖는 SNH 도메인; (ii) Met-풍부 도메인; 및 (iii) QG-풍부 도메인을 포함하는 폴리펩티드를 코딩하는 DNA 조각을 지칭한다. 이러한 "일부"는, 예를 들어, SYT 핵산에 대해 하나 이상의 결실을 생성시킴으로써 생산될 수 있다. 상기 "일부"는 단리 형태로 사용될 수 있거나, 또는 이들은 다른 코딩 (또는 비-코딩) 서열에 융합되어, 예를 들어, 여러 활성을 합친 단백질을 생성할 수 있다. 다른 코딩 서열에 융합되는 경우, 번역후에 생산된 생성 폴리펩티드는 SYT 단편에 대해 예측되는 것보다 더 클 수 있다. 바람직하게는, "일부"는 서열 3, 서열 5, 서열 7, 서열 9, 서열 11, 서열 13, 서열 15, 서열 17, 서열 19, 서열 21, 서열 23, 서열 25, 서열 27, 서열 29, 서열 31, 서열 33, 서열 35, 서열 37, 서열 39, 서열 41, 서열 43, 서열 45, 서열 47, 서열 49, 서열 51, 서열 53, 서열 55, 서열 57, 서열 59, 서열 61, 서열 63, 서열 65, 서열 67, 서열 69, 서열 71, 서열 73, 서열 75, 서열 77, 서열 79, 서열 81, 서열 83, 서열 85, 서열 87 중 어느 하나로 나타내어지는 핵산의 일부이다. 가장 바람직하게는, 핵산의 일부는 서열 3, 서열 5 또는 서열 7로 나타내어진다.
SYT 핵산/유전자의 또다른 변이체는 감소된 엄격도 조건하에, 바람직하게는 엄격한 조건하에 상기 정의된 SYT 핵산/유전자와 혼성화할 수 있는 핵산으로서, N-말단에서 C-말단까지 (i) 서열 2의 SNH 도메인에 대해 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 (순서대로 더 바람직함)의 서열 동일성을 갖는 SNH 도메인; (ii) Met-풍부 도메인; 및 (iii) QG-풍부 도메인을 포함하는 폴리펩티드를 코딩하는 서열과 혼성화할 수 있는 핵산이다. 바람직하게는, 혼성화 서열은 서열 3, 서열 5, 서열 7, 서열 9, 서열 11, 서열 13, 서열 15, 서열 17, 서열 19, 서열 21, 서열 23, 서열 25, 서열 27, 서열 29, 서열 31, 서열 33, 서열 35, 서열 37, 서열 39, 서열 41, 서열 43, 서열 45, 서열 47, 서열 49, 서열 51, 서열 53, 서열 55, 서열 57, 서열 59, 서열 61, 서열 63, 서열 65, 서열 67, 서열 69, 서열 71, 서열 73, 서열 75, 서열 77, 서열 79, 서열 81, 서열 83, 서열 85, 서열 87 중 어느 하나로 나타내어지는 핵산, 또는 상기 정의된 서열 중 어느 것의 일부와 혼성화할 수 있는 서열이다. 가장 바람직하게는 핵산의 혼성화 서열은 서열 3, 서열 5 또는 서열 7로 나타내어진 바와 같다.
본원에 정의된 용어 "혼성화"는 실질적으로 상동성인 상보적 뉴클레오티드 서열이 서로 어닐링하는 방법이다. 혼성화 방법은 전체적으로 용액 중에서 수행될 수 있으며, 즉 양쪽의 상보적 핵산은 액체 중에 존재한다. 혼성화 방법은 또한 하나의 상보적인 핵산을 자기성 비드, 세파로스 비드 또는 임의의 기타 수지와 같은 매트릭스에 고정하여 수행할 수도 있다. 혼성화 방법은 추가로 하나의 상보적 핵산을 니트로-셀룰로스 또는 나일론막과 같은 고체 지지체에 고정하거나 또는, 예를 들어, 규소성 유리 지지체에, 예컨대 포토리쏘그라피에 의해 고정하여 (핵산 어레이 또는 마이크로어레이, 또는 핵산 칩으로 공지됨) 수행할 수 있다. 혼성화를 발생시키기 위해, 핵산 분자는 일반적으로 열적으로 또는 화학적으로 변성되어, 이중 가닥이 2개의 단일 가닥으로 용융되고/거나 헤어핀 구조 또는 단일 가닥 핵산으로부터의 2차 구조가 제거된다. 혼성화의 엄격도는 온도, 염 농도, 이온 세기 및 혼성화 완충액 조성과 같은 조건에 의해 영향을 받는다.
써던(Southern) 및 노던(Northern) 혼성화와 같은 핵산 혼성화 실험의 관점에서 "엄격한 혼성화 조건" 및 "엄격한 혼성화 세척 조건"은 상이한 환경 파라미터에 의존적이며 이에 따라 달라진다. 당업자는, 혼성화 및 세척 동안 달라질 수 있고 엄격도 조건을 유지 또는 변경시킬 다양한 파라미터를 인지하고 있다.
Tm은 소정의 이온 세기 및 pH 하에 표적 서열의 50%가 완전 매칭된 프로브에 혼성화하는 온도이다. Tm은 용액 조건, 및 프로브의 길이 및 염기 조성에 의존적이다. 예를 들어, 서열이 길수록 더 높은 온도에서 특이적으로 혼성화한다. 혼성화의 최대 속도는 Tm의 약 16℃ 내지 32℃ 아래에서 얻어진다. 혼성화 용액 중에 1가 양이온이 존재하는 것은, 2개의 핵산 가닥 사이의 정전기적 반발을 감소시킴으로써 하이브리드 형성을 촉진하고; 이러한 효과는 0.4 M 이하의 나트륨 농도에서 명백하다. 포름아미드는 DNA-DNA 및 DNA-RNA 이중나선의 용융 온도를 각 퍼센트의 포름아미드에 대해 0.6 내지 0.7℃ 감소시키고, 50%의 포름아미드를 첨가하면, 혼성화 속도는 저하되지만 30 내지 45℃에서 혼성화가 수행된다. 염기쌍 미스매치는 이중 나선의 혼성화 속도 및 열 안정성을 감소시킨다. 평균적으로, 그리고 큰 프로브의 경우, Tm은 염기 미스매치 % 당 약 1℃ 감소한다. Tm은 하이브리드의 유형에 따라 하기 식을 이용하여 계산될 수 있다:
1. DNA-DNA 하이브리드 (문헌 [Meinkoth and Wahl, Anal. Biochem., 138: 267-284, 1984]):
Tm = 81.5℃ + 16.6xlog[Na+]a + 0.41x%[G/Cb] - 500x[Lc]-1 - 0.61x% 포름아미드
2. DNA-RNA 또는 RNA-RNA 하이브리드:
Tm = 79.8 + 18.5 (log10[Na+]a) + 0.58 (%G/Cb) + 11.8 (%G/Cb)2 - 820/Lc
3. 올리고-DNA 또는 올리고-RNAd 하이브리드:
<20개 뉴클레오티드에 대해: Tm = 2 (ln)
20 내지 35개 뉴클레오티드에 대해: Tm= 22 + 1.46 (ln)
a 또는 다른 1가 양이온에 대해서, 그러나 단지 0.01 내지 0.4 M 범위에서만 정확함.
b 30% 내지 75% 범위의 %GC에 대해서만 정확함.
c L = 이중나선의 염기쌍 길이.
d 올리고, 올리고뉴클레오티드; ln, 프라이머의 유효 길이 = 2×(G/C의 수)+(A/T의 수).
주의: 각각의 1% 포름아미드에 대해 Tm은 약 0.6 내지 0.7℃씩 감소하는 데 반해, 6 M 우레아의 존재는 Tm을 약 30℃씩 감소시킨다.
혼성화 특이성은 전형적으로 후-혼성화 세척의 작용이다. 비-특이적인 혼성화로부터 생성된 백그라운드를 제거하기 위해, 샘플을 묽은 염 용액으로 세척한다. 이러한 세척의 주요 인자로는 최종 세척 용액의 이온 세기 및 온도가 포함되며: 염 농도가 낮을수록 그리고 세척 온도가 높을수록, 세척 엄격도가 더 높다. 세척 조건은 전형적으로 혼성화 엄격도에서 또는 그 이하에서 수행된다. 일반적으로, 핵산 혼성화 검사법 또는 유전자 증폭 검출 절차에 적합한 엄격한 조건은 상기 기재된 바와 같다. 더 큰 엄격도 또는 덜한 엄격도 조건이 또한 선택될 수 있다. 일반적으로, 낮은 엄격도 조건은 소정의 이온 세기 및 pH에서 특이적인 서열에 대해 열적 융점(Tm)보다 약 50℃ 더 낮은 것으로 선택된다. 중간 엄격도 조건은 온도가 Tm의 20℃ 아래인 경우이고, 높은 엄격도 조건은 온도가 Tm의 10℃ 아래인 경우이다. 예를 들어, 엄격한 조건은, 예를 들어, 적어도 조건 A-L 만큼 엄격한 것이고; 감소된 엄격도 조건은, 예를 들어, 적어도 조건 M-R 만큼 엄격하다. 비-특이적인 결합은, 예를 들어, 단백질 함유 용액으로의 막 차단, 이형 RNA, DNA의 첨가, 및 혼성화 완충액에 대한 SDS, 및 RNase로의 처리와 같은 다수의 공지된 기술 중 어느 하나를 이용하여 제어될 수 있다. 혼성화 및 세척 조건의 예는 하기 표 2에 열거되어 있다.
‡ "하이브리드 길이"는 혼성화 핵산에 대해 예측된 길이이다. 공지된 서열의 핵산이 혼성화되는 경우, 하이브리드 길이는 본원에 기재된 보존 영역의 확인 및 서열의 정렬에 의해 측정될 수 있다.
† SSPE (1×SSPE는 0.15 M NaCl, 10 mM NaH2PO4 및 1.25 mM EDTA (pH 7.4)임)는 혼성화 및 세척 완충액 중에서 SSC (1×SSC는 0.15 M NaCl 및 15 mM 시트르산나트륨임)를 치환할 수 있고; 세척은 혼성화가 완결된 후 15분 동안 수행된다. 혼성화 및 세척은 5 × 덴하르트(Denhardt) 시약, 0.5 내지 1.0% SDS, 100 ㎍/ml 변성 단편화 연어 정자 DNA, 0.5% 나트륨 피로포스페이트, 및 50% 이하의 포름아미드를 추가로 포함할 수 있다.
* Tb-Tr: 길이가 50개 미만의 염기쌍인 것으로 예측되는 하이브리드의 혼성화 온도는 하이브리드의 용융 온도 Tm보다 5 내지 10℃ 낮아야 하고; Tm은 상기 언급된 식에 따라 측정된다.
± 본 발명은 또한 임의의 하나 이상의 DNA 또는 RNA 하이브리드 파트너를 PNA 또는 변형 핵산으로 치환하는 것을 포함한다.
엄격도 수준을 정의하는 목적을 위해, 문헌 [Sambrook et al. (2001) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York] 또는 [Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989)]을 참조할 수 있다.
SYT 핵산 또는 그의 변이체는 임의의 인공 공급원 또는 천연 공급원, 예컨대 식물, 조류 또는 동물으로부터 유래될 수 있다. 이러한 핵산은 게놈 환경 및 또는 조성에 있어서 계획적인 인간 조작을 통해 그의 천연 형태로부터 변형될 수 있다. 핵산은 동일한 식물 종 (예를 들어 하나에 다른 하나가 도입됨)으로부터이든지 또는 상이한 식물 종으로부터이든지 식물 기원의 것이 바람직하다. 바람직하게는 식물 기원의 핵산은 SYT1을 코딩한다. 다르게는, 핵산은 폴리펩티드 수준에서 서로 밀접하게 관계된 SYT2 또는 SYT3을 코딩할 수 있다. 핵산은 쌍자엽 식물 종, 바람직하게는 브라시카세아에(Brassicaceae), 추가로 바람직하게는 아라비돕시스 탈리아나로부터 단리될 수 있다. 더욱 바람직하게는, 아라비돕시스 탈리아나로부터 단리된 3가지 SYT 핵산은 서열 3, 서열 5 및 서열 7로 나타내어지고, 3가지 SYT 아미노산 서열은 서열 4, 서열 6 및 서열 8로 나타내어진 바와 같다.
SYT 폴리펩티드 또는 그의 상동체를 코딩하는 핵산의 발현은 (바람직하게는 SYT 유전자의 유전자좌에서) 유전적 변형을 도입함으로써 조절될 수 있다. 본원에 정의된 유전자의 유전자좌는 게놈 영역을 의미하는 것으로 간주되며, 이는 관심있는 유전자 및 코딩 영역의 10 kb 상류 또는 하류를 포함한다.
유전적 변형은, 예를 들어, T-DNA 활성화, TILLING, 부위-특이적 돌연변이 유발, 방향성 분자진화 및 상동 재조합 중 임의의 하나 (또는 그 이상)의 방법에 의해, 또는 SYT 폴리펩티드 또는 그의 상동체를 코딩하는 핵산을 식물에 도입 및 발현시킴으로써 도입될 수 있다. 유전적 변형의 도입 후에, SYT 폴리펩티드 또는 그의 상동체를 코딩하는 핵산의 조절된 발현을 위해 선택되는 단계가 뒤따라 오고, 여기서 조절된 발현은 수확량이 증가된, 특히 종자 수율이 증가된 식물을 제공한다.
T-DNA 활성화 태깅(tagging) (문헌 [Hayashi et al. Science (1992) 1350-1353])은 관심있는 유전자의 게놈 영역 또는 유전자 코딩 영역의 10 kb 상류 또는 하류에 일반적으로 프로모터 (번역 인핸서 또는 인트론일 수도 있음)를 상기 프로모터가 표적 유전자의 발현을 지시하는 배열로 함유한 T-DNA 삽입을 포함한다. 전형적으로, 그의 천연 프로모터에 의한 표적 유전자의 발현 조절은 방해받고, 유전자는 새로 도입된 프로모터의 조절하에 있게 된다. 상기 프로모터는 전형적으로 T-DNA 내에 함입된다. 이 T-DNA는 식물 게놈 내에, 예를 들어, 아그로박테리움(Agrobacterium) 감염을 통해 랜덤하게 삽입되고, 삽입된 T-DNA 근처의 유전자의 과발현을 유도한다. 생성된 트랜스제닉 식물은 도입된 프로모터에 근접한 유전자의 과발현으로 인해 우성 표현형을 나타낸다. 도입하고자 하는 프로모터는 목적하는 유기체, 이 경우에는 식물에서 유전자 발현을 지시할 수 있는 임의의 프로모터일 수 있다. 예를 들어, 구성적, 조직-선호적, 세포 유형-선호적 및 유도성 프로모터는 모두 T-DNA 활성화에 사용하기에 적합하다.
유전적 변형은 또한 TILLING (Targeted Induced Local Lesions In Genomes) 기술을 이용하여 SYT 유전자의 유전자좌에 도입될 수 있다. 이것은 SYT 활성이 증대된 단백질을 코딩하는 SYT 핵산의 돌연변이유발된 변이체를 발생시키고/시키거나 확인하고 마지막으로 단리하는 데 유용한 돌연변이 유발 기술이다. TILLING은 또한 이러한 돌연변이 변이체를 수반하는 식물의 선별이 가능하다. 이러한 돌연변이 변이체는 그의 천연 형태인 유전자에 의해 나타나는 것보다 더 높은 SYT 활성을 나타낼 수 있다. TILLNG은 고밀도 돌연변이 유발을 고속 스크리닝 방법과 조합한다. 전형적으로 TILLING 이후의 단계는: (a) EMS 돌연변이 유발 (문헌 [Redei GP and Koncz C (1992) In Methods in Arabidopsis Research, Koncz C, Chua NH, Schell J, eds. Singapore, World Scientific Publishing Co, pp. 16-82]; [Feldmann et al., (1994) In Meyerowitz EM, Somerville CR, eds, Arabidopsis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, pp 137-172]; [Lightner J and Caspar T (1998) In J Martinez-Zapater, J Salinas, eds, Methods on Molecular Biology, Vol. 82. Humana Press, Totowa, NJ, pp 91-104]); (b) DNA 생산 및 개체의 풀링(pooling); (c) 관심있는 영역의 PCR 증폭; (d) 이형 이중나선을 형성하기 위한 변성 및 어닐링; (e) DHPLC (여기서, 풀 중 이형 이중나선의 존재는 크로마토그램에서 여분의 피크로서 검출됨); (f) 돌연변이체 개체의 확인; 및 (g) 돌연변이체 PCR 생성물의 서열분석이다. TILLING 방법은 당업계에 공지되어 있다 (문헌 [McCallum et al., (2000) Nat Biotechnol 18: 455-457; reviewed by Stemple (2004) Nat Rev Genet 5(2): 145-50]).
부위-특이적 돌연변이 유발이 SYT 핵산의 변이체를 발생시키기 위해 사용될 수 있다. 몇몇 방법, 가장 일반적인 PCR 기재의 방법은 부위-특이적 돌연변이 유발을 달성할 수 있다 (최신 프로토콜 [molecular biology. Wiley Eds. http://www.4ulr.com/products/currentprotocols/index.html]).
방향성 분자진화는 또한 SYT 핵산의 변이체를 발생시키기 위해 사용될 수 있다. 이것은 DNA 셔플링(shuffling) 다음 적절한 스크리닝 및/또는 선별을 반복하여 생물학적 활성이 변형된 SYT 폴리펩티드 또는 상동체 또는 그의 일부를 코딩하는 SYT 핵산 또는 그의 일부의 변이체를 생성하는 것으로 이루어진다 (문헌 [Castle et al., (2004) Science 304(5674): 1151-4]; 미국 특허 제5,811,238호 및 제6,395,547호).
T-DNA 활성화, TILLING, 부위-특이적 돌연변이 유발 및 방향성 분자진화는 새로운 SYT 대립유전자 및 변이체를 생성할 수 있는 기술의 예이다.
상동 재조합은 선택된 핵산을 지정된 선택 위치에서 게놈에 도입하는 것을 허용한다. 상동 재조합은 효모 또는 이끼 피스코미트렐라(Physcomitrella)와 같은 하위 유기체에 대한 생물 과학에서 일상적으로 사용되는 표준 기술이다. 식물에서 상동 재조합의 수행 방법은 모델 식물 (문헌 [Offringa et al. (1990) EMBO J 9(10): 3077-84]) 뿐만 아니라 작물, 예를 들어 벼 (문헌 [Terada et al. (2002) Nat Biotech 20(10): 1030-4]; [Iida and Terada (2004) Curr Opin Biotech 15(2): 132-8])에 대해서도 기재된 바 있다. 표적으로 하는 핵산 (상기 정의된 바와 같이 SYT 핵산 또는 그의 변이체일 수 있음)은 SYT 유전자의 유전자좌를 표적으로 한다. 표적으로 하는 핵산은 내인성 유전자를 대체하는 데 사용되는 개선된 대립유전자일 수 있거나 또는 내인성 유전자에 추가로 도입될 수 있다.
유전적 변형을 도입하는 바람직한 방법은 SYT 폴리펩티드 또는 그의 상동체를 코딩하는 핵산을 식물에 도입 및 발현시키는 것이다 (이러한 경우 SYT 유전자의 유전자좌일 필요는 없음). SYT 폴리펩티드 또는 그의 상동체는 N-말단에서 C-말단까지 (i) 서열 2의 SNH 도메인에 대해 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 (순서대로 더 바람직함)의 서열 동일성을 갖는 SNH 도메인; (ii) Met-풍부 도메인; 및 (iii) QG-풍부 도메인을 포함하는 폴리펩티드로서 정의된다.
바람직하게는, 서열 2의 SNH 도메인에 대해 40% 이상의 동일성을 갖는 SNH 도메인은 도 2에서 흑색으로 나타낸 잔기를 포함한다. 더욱 바람직하게는, SNH 도메인은 서열 1로 나타내어진다.
식물 내로 도입하고자 하는 핵산은 전장의 핵산일 수 있거나 또는 상기 정의된 바와 같이 혼성화 서열 또는 그 일부일 수 있다.
단백질의 "상동체"는 해당하는 비변형 단백질에 비해 아미노산 치환, 결실 및/또는 삽입을 갖는 펩티드, 올리고펩티드, 폴리펩티드, 단백질 및 효소, 및 이들이 유래된 비변형 단백질과 유사한 생물학적 및 기능적 활성을 갖는 펩티드, 올리고펩티드, 폴리펩티드, 단백질 및 효소를 포함한다. 이러한 상동체를 생성하기 위해, 단백질의 아미노산은 유사한 성질 (예를 들어, 유사한 소수성, 친수성, 항원성, α-나선 구조 또는 β-시트 구조를 형성하거나 파괴하는 경향성)을 갖는 다른 아미노산으로 대체될 수 있다. 보존성 치환에 대한 표는 당업계에 공지되어 있다 (예를 들어 문헌 [Creighton (1984) Protein. W.H. Freeman and Company] 및 하기 표 3 참조).
상동체는 오르토로그(orthologue) 및 파라로그(paralogue)를 포함하며, 유전자의 원형을 이루는 관계를 기재하는 데 사용되는 진화적 컨셉을 포함한다. 파라로그는 원형을 이루는 유전자의 복재를 통해 기원하는 동일한 종 내에 있는 유전자이고, 오르토로그는 종분화를 통해 기원하는 상이한 유기체로부터의 유전자이다.
예를 들어, 단자엽 식물 종에서의 오르토로그는 소위 상호 블라스트 조사(reciprocal blast search)를 수행함으로써 용이하게 발견될 수 있다. 이것은 임의의 서열 데이타베이스, 예컨대 http://www.ncbi.nlm.nih.gov에서 발견될 수 있는 공개적으로 사용가능한 NCBI 데이타베이스에 대한 질의 서열 (예를 들어, 서열 3, 서열 4, 서열 5, 서열 6, 서열 7 또는 서열 8)을 블라스팅하는 것을 포함하는 제1 블라스트에 의해 수행될 수 있다. BLASTN 또는 TBLASTX (표준 디폴트값(default value) 사용)는 뉴클레오티드 서열 및 BLASTP로부터 출발하는 경우 사용될 수 있거나, 또는 TBLASTN (표준 디폴트값 사용)은 단백질 서열로부터 출발하는 경우 사용될 수 있다. BLAST 결과물은 임의로는 필터링될 수 있다. 필터링 결과물 또는 필터링되지 않은 결과물의 전장의 서열은 이어서 질의(query) 서열 (여기서, 질의 서열은 서열 3, 서열 4, 서열 5, 서열 6, 서열 7 또는 서열 8이고, 제2 블라스트는 따라서 아라비돕시스 서열에 대한 것임)이 유래된 유기체로부터의 서열에 대해 BLAST된 배경 (제2 BLAST)이다. 이어서, 제1 및 제2 BLAST의 결과를 비교한다. 파라로그는 제2 블라스트로부터의 고순위 히트(high-ranking hit)가 질의 서열이 유래된 종과 동일한 종으로부터 온 것인 경우 확인되고; 오르토로그는 고순위 히트가 질의 서열이 유래된 종과 동일한 종으로부터 온 것이 아닌 경우 확인된다. 고순위 히트는 낮은 E-값을 갖는 것들이다. E-값이 낮을수록, 스코어가 보다 유의하다 (또는 다른 말로, 히트가 기회에 의해 발견된 히트가 더 낮음). E-값의 산정수치는 당업계에 공지되어 있다. 더 큰 패밀리의 경우에는, ClustalW를 사용한 다음, 이웃 연결수(neighbour joining tree)를 사용하여 관련 유전자의 클러스트화를 시각화하는 것을 보조하고 오르토로그 및 파라로그를 확인할 수 있다.
상동체는, 즉 아미노산 서열에서 하나 이상의 잔기를 제거하고 그 자리에 상이한 잔기를 삽입하는 경우인 단백질의 "치환 변이체"의 형태일 수 있다. 아미노산 치환은 전형적으로 단일 잔기에 대한 것이지만, 폴리펩티드에 따라 놓인 기능적 제한에 의존적으로 클러스터화될 수 있고; 삽입은 일반적으로 약 1 내지 10개 정도의 아미노산 잔기의 것일 것이다. 바람직하게는, 아미노산 치환은 보존적 아미노산 치환을 포함한다. 보존적 치환에 대한 표는 당업계에서 이미 사용가능하다. 하기의 표는 보존성 아미노산 치환의 표를 제공한다.
상동체는 또한, 즉 하나 이상의 아미노산 잔기를 단백질 내 지정된 부위내로 도입하는 경우인 단백질의 "삽입 변이체"의 형태인 것일 수 있다. 삽입은 N-말단 및/또는 C-말단 융합 뿐만 아니라 단일 또는 다중 아미노산의 서열내 삽입을 포함할 수 있다. 일반적으로, 아미노산 서열 내 삽입은 약 1 내지 10개 잔기 정도가 N- 또는 C-말단 융합보다 작을 것이다. N- 또는 C-말단 융합 단백질 또는 펩티드의 예로는 효모 2-하이브리드 시스템, 파지 코트 단백질, (히스티딘)-6-tag, 글루타티온 S-트랜스퍼라제-tag, 단백질 A, 말토스-결합 단백질, 디히드로폴레이트 리덕타제, Tag·100 에피토프, c-myc 에피토프, FLAG®-에피토프, lacZ, CMP (칼모듈린-결합 펩티드), HA 에피토프, 단백질 C 에피토프 및 VSV 에피토프에서 사용된 바와 같은 전사 활성제의 결합 도메인 또는 활성화 도메인이 포함된다.
단백질의 "결실 변이체"의 형태인 상동체는 단백질로부터 하나 이상의 아미노산을 제거한 것을 특징으로 한다.
단백질의 아미노산 변이체는 당업계에 공지된 펩티드 합성 기술, 예컨대 고체상 펩티드 합성 등, 또는 재조합 DNA 조작을 이용하여 용이하게 생산될 수 있다. 단백질의 치환, 삽입 또는 결실 변이체를 생산하기 위한 DNA 서열의 조작 방법은 당업계에 잘 공지되어 있다. 예를 들어, DNA의 지정 부위에서의 치환 돌연변이 생산 기술은 당업자들에게 잘 공지되어 있고, M13 돌연변이 유발, T7-Gen 시험관내 돌연변이 유발 (오하이오주 클레블란드 소재의 USB), 퀵체인지(QuickChange) 부위 특이적 돌연변이 유발 (캘리포니아주 샌디에고 소재의 스트라타젠(Stratagene)), PCR-매개의 부위-특이적 돌연변이 유발 또는 기타 부위-특이적 돌연변이 유발 프로토콜을 포함한다.
SYT 폴리펩티드 또는 그의 상동체는 유도체일 수 있다. "유도체"로는 단백질의 천연-발생 형태의 아미노산 서열, 예를 들어, 서열 4, 서열 6, 서열 8, 서열 10, 서열 12, 서열 14, 서열 16, 서열 18, 서열 20, 서열 22, 서열 24, 서열 26, 서열 28, 서열 30, 서열 32, 서열 34, 서열 36, 서열 38, 서열 40, 서열 42, 서열 44, 서열 46, 서열 48, 서열 50, 서열 52, 서열 54, 서열 56, 서열 58, 서열 60, 서열 62, 서열 64, 서열 66, 서열 68, 서열 70, 서열 72, 서열 74, 서열 76, 서열 78, 서열 80, 서열 82, 서열 84, 서열 86 및 서열 88에 제시된 아미노산 서열과 비교하여 비천연-발생 아미노산 잔기의 치환, 결실 또는 부가를 포함할 수 있는 펩티드, 올리고펩티드, 폴리펩티드, 단백질 및 효소가 있다.
단백질의 "유도체"는 천연-발생 형태의 폴리펩티드의 아미노산 서열과 비교하여 천연 발생 변형, 글루코실화, 아실화, 프레닐화 또는 비천연-발생의 아미노산 잔기를 포함할 수 있는 펩티드, 올리고펩티드, 폴리펩티드, 단백질 및 효소를 포함한다. 유도체는 또한 이것이 유래된 아미노산 서열과 비교하여 하나 이상의 비-아미노산 치환체를 포함할 수 있는데, 예를 들어, 아미노산 서열에 공유적으로 또는 비공유적으로 결합된 리포터 분자 또는 다른 리간드, 예컨대 천연-발생 단백질의 아미노산 서열에 비해, 그의 검출이 용이하도록 결합되어 있는 리포터 분자, 및 비천연-발생 아미노산 잔기를 포함할 수 있다.
SYT 폴리펩티드 또는 그의 상동체는 SYT 핵산/유전자의 선택적 스플라이싱(alternative splice) 변이체에 의해 코딩될 수 있다. 본원에 사용되는 용어 "선택적 스플라이싱 변이체"는 핵산 서열의 변이체를 포함하며, 여기서 선택된 인트론 및/또는 엑손은 절개, 교체 또는 첨가되거나, 또는 인트론은 단축 또는 연장된다. 이러한 변이체는 단백질의 생물학적 활성이 유지된 것일 수 있고, 이는 단백질의 기능적 분절을 선택적으로 유지함으로써 달성될 수 있다. 이러한 스플라이싱 변이체는 자연에서 발견될 수 있거나 또는 인공생산될 수도 있다. 이러한 스플라이싱 변이체를 생산하는 방법은 당업계에 잘 공지되어 있다. 바람직한 스플라이싱 변이체는 N-말단에서 C-말단까지 (i) 서열 2의 SNH 도메인에 대해 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 (순서대로 더 바람직함)의 서열 동일성을 갖는 SNH 도메인; (ii) Met-풍부 도메인; 및 (iii) QG-풍부 도메인을 포함하는 폴리펩티드를 코딩하는 핵산의 스플라이싱 변이체이다. 바람직하게는, 서열 2의 SNH 도메인에 대해 40% 이상의 동일성을 갖는 SNH 도메인은 도 2에서 흑색으로 나타낸 잔기를 포함한다. 더욱 바람직하게는, SNH 도메인은 서열 1로 나타내어진다.
또한, SYT 폴리펩티드 또는 그의 상동체는 (i) 서열 90; 및/또는 (ii) 서열 91; 및/또는 (iii) SNH 도메인 앞의 N-말단에 Met-풍부 도메인을 하나 이상 포함할 수 있다.
서열 3, 서열 5, 서열 7, 서열 9, 서열 11, 서열 13, 서열 15, 서열 17, 서열 19, 서열 21, 서열 23, 서열 25, 서열 27, 서열 29, 서열 31, 서열 33, 서열 35, 서열 37, 서열 39, 서열 41, 서열 43, 서열 45, 서열 47, 서열 49, 서열 51, 서열 53, 서열 55, 서열 57, 서열 59, 서열 61, 서열 63, 서열 65, 서열 67, 서열 69, 서열 71, 서열 73, 서열 75, 서열 77, 서열 79, 서열 81, 서열 83, 서열 85 및 서열 87로 나타내어지는 핵산의 스플라이싱 변이체가 더 바람직하다. 서열 3, 서열 5 및 서열 7로 나타내어지는 SYT 핵산/유전자의 스플라이싱 변이체가 가장 바람직하다.
상동체는 또한 SYT 폴리펩티드 또는 그의 상동체를 코딩하는 핵산의 대립 변이체, 바람직하게는 N-말단에서 C-말단까지 (i) 서열 2의 SNH 도메인에 대해 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 (순서대로 더 바람직함)의 서열 동일성을 갖는 SNH 도메인; (ii) Met-풍부 도메인; 및 (iii) QG-풍부 도메인을 포함하는 폴리펩티드를 코딩하는 핵산의 대립 변이체에 의해 코딩될 수도 있다. 바람직하게는, 서열 2의 SNH 도메인에 대해 40% 이상의 동일성을 갖는 SNH 도메인은 도 2에 흑색으로 나타낸 잔기를 포함한다. 더욱 바람직하게는, SNH 도메인은 서열 1로 나타내어진다. 또한, SYT 폴리펩티드 또는 그의 상동체는 (i) 서열 90; 및/또는 (ii) 서열 91; 및/또는 (iii) SNH 도메인 앞의 N-말단에 Met-풍부 도메인 중 하나 이상을 포함할 수 있다.
더욱 바람직하게는, 대립 변이체는 서열 3, 서열 5, 서열 7, 서열 9, 서열 11, 서열 13, 서열 15, 서열 17, 서열 19, 서열 21, 서열 23, 서열 25, 서열 27, 서열 29, 서열 31, 서열 33, 서열 35, 서열 37, 서열 39, 서열 41, 서열 43, 서열 45, 서열 47, 서열 49, 서열 51, 서열 53, 서열 55, 서열 57, 서열 59, 서열 61, 서열 63, 서열 65, 서열 67, 서열 69, 서열 71, 서열 73, 서열 75, 서열 77, 서열 79, 서열 81, 서열 83, 서열 85 및 서열 87 중 어느 하나로 나타내어지는 핵산의 대립 변이체이다. 가장 바람직하게는, 대립 변이체는 서열 3, 서열 5 및 서열 7 중 어느 하나로 나타내어지는 핵산의 대립 변이체이다.
대립 변이체는 천연적으로 존재하고, 이러한 천연 대립유전자의 사용은 본 발명의 방법에 포함된다. 대립 변이체는 단일 뉴클레오티드 다형성 (SNP) 뿐만 아니라 소형 삽입/결실 다형성 (INDEL)을 포함한다. INDEL의 크기는 보통 100 bp 미만이다. SNP 및 INDEL은 대부분 유기체의 천연 발생 다형성 균주에서 가장 큰 서열 변이체 세트를 형성한다.
본 발명의 바람직한 측면에 따라, SYT 핵산 또는 그의 변이체의 조절된 발현이란 증가된 발현이다. 발현 증가는 SYT 폴리펩티드의 상승된 활성과 동등할 수 있는 상승된 SYT mRNA 또는 폴리펩티드 수준을 유도하거나; 또는 상기 활성은 또한 폴리펩티드 수준에서 변화가 없는 경우, 또는 심지어 폴리펩티드 수준에서 감소하는 경우에도 상승될 수 있다. 이것은 폴리펩티드의 내재성 성질을 변경하는 경우에, 예를 들어, 야생형 폴리펩티드보다 더 활성인 돌연변이체 버젼을 생산함으로써 수행할 수 있다. 유전자 또는 유전자 생성물 발현의 증가 방법은 당업계에 문헌화되어 있고, 예를 들어, 적절한 프로모터, 전사 인핸서 또는 번역 인핸서의 사용에 의해 구동되는 과발현을 포함한다. 프로모터 또는 인핸서 요소로서 작용하는 단리된 핵산은 폴리뉴클레오티드의 비-이형 형태의 적절한 위치 (전형적으로 상류)에 도입되어 SYT 핵산 또는 그의 변이체의 발현을 상승조절할 수 있다. 예를 들어, 내인성 프로모터는 돌연변이, 결실 및/또는 치환에 의해 생체내에서 변경될 수 있거나 (Kmiec, US 5,565,350; Zarling et al., PCT/US93/03868 참조), 또는 단리된 프로모터를 본 발명의 유전자로부터 적절한 배향 및 방향으로 식물 세포 내에 도입하여, 유전자 발현을 조절할 수 있다. 유전자 또는 유전자 생성물 발현의 감소 방법은 당업계에 문헌화되어 있다.
폴리펩티드 발현이 바람직한 경우, 폴리뉴클레오티드 코딩 영역의 3'-말단에 폴리아데닐화 영역을 포함하는 것이 일반적으로 바람직하다. 폴리아데닐화 영역은 천연 유전자, 다양한 기타 식물 유전자 또는 T-DNA로부터 유래될 수 있다. 부가하고자 하는 3'-말단 서열은, 예를 들어, 노팔린 신타제 또는 옥토핀 신타제 유전자로부터, 또는 다르게는 또다른 식물 유전자로부터, 또는 덜 바람직하게는 임의의 기타 진핵성 유전자로부터 유래될 수 있다.
인트론 서열은 또한 부분 코딩 서열 또는 5' 비번역 영역의 코딩 서열에 부가되어 세포질에 축적되는 성숙 메세지의 양을 증가시킬 수 있다. 식물 및 동물 발현 구조물 중 전사 단위에서 스플라이싱 가능한 인트론을 포함시키는 것은 mRNA 및 단백질 수준 둘 다에서 1000-배까지 유전자 발현을 증가시키는 것으로 나타났다 (문헌 [Buchman and Berg, Mol. Cell biol. 8:4395-4405 (1988); Callis et al., Genes Dev. 1:1183-1200 (1987)]). 유전자 발현의 이러한 인트론 증대는 전형적으로 전사 단위의 5' 말단 가까이 위치하는 경우 가장 크다. 메이즈(maize) 인트론 Adh1-S 인트론 1, 2, 및 6, 브론즈(Bronze)-1 인트론의 사용은 당업계에 공지되어 있다. 일반적으로, 문헌 [The Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994)]를 참조한다.
본 발명은 또한 본 발명에 따른 방법에 유용한 뉴클레오티드 서열의 도입 및/또는 발현을 용이하게 하는 유전적 구조물 및 벡터를 제공한다.
따라서,
(i) 상기 정의된 바와 같은 임의의 SYT 핵산 또는 그의 변이체;
(ii) 핵산 서열 (i)의 발현을 구동시킬 수 있는 하나 이상의 조절 서열; 및 임의로는
(iii) 전사 종결 서열을 포함하는 유전자 구조물이 제공된다.
바람직한 구조물은 조절 서열이 식물, 바람직하게는 단자엽 식물로부터 유래된 프로모터인 구조물이다.
본 발명에 따른 방법에 유용한 구조물은 당업자에게 공지되어 있는 재조합 DNA 기술을 이용하여 구성될 수 있다. 유전자 구조물은 식물 내로 형질전환하기에 적합하고 형질전환 세포에서 관심있는 유전자의 발현에 적합한 벡터 내에 삽입될 수 있다 (이는 시판 구입가능할 수 있음).
식물은 관심 서열 (즉, SYT 폴리펩티드 또는 그의 상동체를 코딩하는 핵산)을 포함하는 벡터로 형질전환된다. 관심 서열은 하나 이상의 조절 서열 (적어도 프로모터)에 작동가능하게 연결된다. 용어 "조절 요소", "조절 서열" 및 "프로모터"는 모두 본원에서 상호교환가능하게 사용되고, 넓은 범위에서, 이들이 라이게이션되는 서열의 발현에 영향을 미칠 수 있는 조절 핵산 서열을 지칭하기 위해 사용된다. 상기 용어에는 전통적인 진핵성 게놈 유전자로부터 유래된 전사 조절 서열 (정확한 전사 개시를 위해 요구되는 TATA box를 포함하고, CCAAT box 서열은 포함하거나 포함하지 않음), 및 발생적 및/또는 외부 자극에 대한 반응에서, 또는 조직-특이적 방식에서 유전자 발현을 변경시키는 추가 조절 요소 (즉, 상류 활성화 서열, 인핸서 및 사일런서(silencer))가 포함된다. 또한, 상기 용어에는 전통적인 원핵성 유전자의 전사 조절 서열이 포함되며, 이러한 경우 이는 -35 box 서열 및/또는 -10 box 전사 조절 서열을 포함할 수 있다. 용어 "조절 요소"는 또한 세포, 조직 또는 기관에서 핵산 분자 발현을 수여, 활성화 또는 증대시키는 합성 융합 분자 또는 유도체를 포함한다. 본원에 사용되는 용어 "작동가능하게 연결된"은 프로모터 서열과 관심있는 유전자 사이에 있는 기능적 연결을 지칭하며, 프로모터 서열이 관심있는 유전자의 전사를 개시할 수 있다.
유리하게는, 임의의 유형의 프로모터는 핵산 서열의 발현을 구동하기 위해 사용될 수 있다. 프로모터는 발생적, 화학적, 환경적 또는 물리적 자극에 대해 반응하는 유도 또는 증가된 전사 개시를 갖는 유도성 프로모터일 수 있다. 유도성 프로모터의 예로는 스트레스-유도성 프로모터, 즉 식물이 다양한 스트레스 조건에 노출되는 경우 활성화되는 프로모터가 있다. 추가적으로 또는 다르게는, 프로모터는 조직-선호적 프로모터, 즉 특정 조직, 예컨대 잎, 뿌리, 종자 조직 등에서 선호적으로 전사를 개사할 수 있는 프로모터일 수 있다. 특정 조직에서만 전사를 개시할 수 있는 프로모터는 본원에서 "조직-특이적"인 것으로 지칭된다.
바람직하게는, SYT 핵산 또는 그의 변이체는 구성적 프로모터에 작동가능하게 연결된다. 구성적 프로모터는 대부분 동안 전사적으로 활성이지만, 그의 성장 및 발생의 모든 시기에 필수적인 것은 아니며, 실질적으로 편재적으로 발현된다. 바람직하게는 프로모터는 식물, 더 바람직하게는 단자엽 식물로부터 유래된다. 가장 바람직하게는 GOS2 프로모터 (벼로부터 유래됨) (서열 89)가 사용된다. 본 발명의 이용가능성은 서열 3, 서열 5 또는 서열 7로 나타내어지는 SYT 핵산에 제한되지 않고, GOS2 프로모터에 의해 구동되는 경우 SYT 핵산의 발현에 제한되지 않는다는 본 발명의 이용가능성이 명확할 것이다. SYT 핵산의 발현을 구동하기 위해 사용될 수 있는 기타 구성적 프로모터의 예는 또한 하기 표 4에 나타낸다.
유전자 공급원 | 발현 패턴 | 참고문헌 |
액틴 | 구성적 | McElroy et al , Plant Cell, 2: 163-171, 1990 |
CAMV 35S | 구성적 | Odell et al , Nature, 313: 810-812, 1985 |
CaMV 19S | 구성적 | Nilsson et al ., Physiol . Plant . 100:456-462, 1997 |
GOS2 | 구성적 | de Pater et al , Plant J Nov;2(6):837-44, 1992 |
유비퀴틴 | 구성적 | Christensen et al , Plant Mol. Biol. 18: 675-689, 1992 |
벼 사이클로필린 | 구성적 | Buchholz et al , Plant Mol Biol. 25(5): 837-43, 1994 |
옥수수 H3 히스톤 | 구성적 | Lepetit et al , Mol. Gen. Genet. 231:276-285, 1992 |
액틴 2 | 구성적 | An et al , Plant J. 10(1); 107-121, 1996 |
임의로, 식물에 도입되는 구조물에 하나 이상의 종결자 서열을 사용할 수도 있다. 용어 "종결자"는 일차 전사물의 3' 프로세싱 및 폴리아데닐화 및 전사의 종결을 신호화하는 전사 단위의 말단에 있는 DNA 서열인 조절 서열을 포함한다. 추가의 조절 요소는 전사뿐만 아니라 번역 인핸서도 포함할 수 있다. 당업자는 본 발명을 수행하는 데에 사용하기에 적합할 수 있는 종결자 및 인핸서 서열을 알고 있을 것이다. 이러한 서열은 당업자에게 공지되어 있거나 당업자가 쉽게 입수할 수 있다.
본 발명의 유전자 구조물은 특정한 세포 유형에서의 유지 및/또는 복제에 요구되는 복제 서열의 원천을 추가로 포함할 수 있다. 이의 한 예는, 유전자 구조물이 유전자부체의(episomal) 유전자 요소 (예컨대 플라스미드 또는 코스미드 분자)로서 박테리아 세포에서 유지될 것이 요구되는 경우이다. 바람직한 복제 원천으로는 f1-ori 및 colE1가 포함되나 이에 제한되지 않는다.
임의로 유전자 구조물은 선별가능한 마커 유전자를 포함할 수 있다. 본원에 사용된 바와 같은 용어 "선별가능한 마커 유전자"는 세포에 표현형을 부여하는 임의의 유전자를 포함하며, 이는 상기 세포에서 발현되어 본 발명의 핵산 구조물로 형질감염 또는 형질전환된 세포의 확인 및/또는 선별을 용이하게 한다. 적합한 마커는 새로운 대사적 특성을 도입시키거나 시각적인 선별을 가능하게 하는, 항생제 또는 제초제 내성을 부여하는 마커로부터 선택될 수 있다. 선별가능한 마커 유전자의 예로는 항생제에 대한 내성을 부여하는 유전자 (네오마이신 및 카나마이신을 포스포릴화하는 nptII, 또는 히그로마이신을 포스포릴화하는 hpt 등), 제초제에 대한 내성을 부여하는 유전자 (예를 들어 Basta에 대한 내성을 제공하는 bar; 글리포세이트에 대한 내성을 제공하는 aroA 또는 gox), 또는 대사적 특성을 제공하는 유전자 (식물이 유일한 탄소원으로서 만노스를 사용하게 하는 manA 등)가 포함된다. 시각적 마커 유전자에 의해서는 색상 (예를 들어 β-글루쿠로니다제, GUS), 발광 (루시퍼라제 등) 또는 형광 (녹색 형광 단백질, GFP, 및 그의 유도체)이 형성된다.
본 발명은 또한 본 발명에 따른 방법으로 수득가능한 식물을 포함한다. 따라서, 본 발명은 본 발명에 따른 방법으로 수득가능한 식물, 식물의 부분 및 식물 세포를 제공하며, 상기 식물은 거기에 SYT 핵산 또는 그의 변이체를 도입한 것이고, 상기 식물, 식물의 부분 및 식물 세포는 바람직하게는 작물 식물로부터, 더욱 바람직하게는 단자엽 식물로부터 얻어진다.
또한, 본 발명은 식물에서 SYT 핵산 또는 그의 변이체의 도입 및 발현을 포함하는, 증가된 수확량을 갖는 트랜스제닉 식물의 생산 방법을 제공한다.
더욱 구체적으로, 본 발명은
(i) 식물 또는 식물 세포에서 SYT 핵산 또는 그의 변이체를 도입 및 발현시키는 단계; 및
(ii) 식물 성장 및 발달을 촉진시키는 조건하에서 식물 세포를 재배하는 단계를 포함하는, 증가된 수확량을 갖는 트랜스제닉 식물, 바람직하게는 단자엽 식물의 생산 방법을 제공한다.
재배 단계 (ii)로부터 얻은 식물의 이후 세대는 다양한 수단, 예를 들어 클로날 증식 또는 전통적인 품종 개량 기술로 증식될 수 있다. 예를 들어, 제1 세대 (또는 T1) 형질전환된 식물은 자가수분(self)되어 호모자이고스 제2 세대 (또는 T2) 형질전환체를 제공할 수 있고, T2 식물은 전통적인 품종 개량 기술을 통해 추가로 증식될 수 있다.
핵산을 식물 세포 또는 식물 자체로 직접 도입시킬 수 있다 (식물의 조직, 기관 또는 임의의 다른 부분으로의 도입을 포함함). 본 발명의 바람직한 특성에 따르면, 핵산은 형질전환에 의해 식물로 도입된다.
본원에서 언급한 바와 같은 용어 "형질전환"은 전달에 사용되는 방법에 관계 없이, 외인성 폴리뉴클레오티드를 숙주 세포로 전달하는 것을 포함한다. 기관형성에 의해서이든 배형성에 의해서이든, 이후에 클로날 증식할 수 있는 식물 조직은 본 발명의 유전자 구조물로 형질전환될 수 있고, 전체 식물이 그로부터 재생될 수 있다. 선택되는 특정 조직은 형질전환될 특정 종에 이용가능하고 그 종에 가장 적합한 클로날 증식 시스템에 따라 달라질 것이다. 예시적인 조직 표적은 옆편(leaf disk), 화분, 배아, 자엽, 배축, 대배우체, 캘러스 조직, 존재하는 분열 조직 (예컨대 정단 분열조직, 액아 및 뿌리 분열조직), 및 유도된 분열 조직 (예컨대 자엽 분열조직 및 배축 분열조직)을 포함한다. 폴리뉴클레오티드는 숙주 세포로 순간적으로 또는 안정적으로 도입될 수 있고, 통합되지 않은 상태로, 예를 들어 플라스미드로서 유지될 수 있다. 다르게는, 이는 숙주 게놈으로 통합될 수 있다. 그 후, 얻어진 형질전환된 식물 세포를 사용하여 당업계에 공지된 방식으로 형질전환된 식물을 재생시킬 수 있다.
현재 식물 종의 형질전환은 매우 통상적인 기술이다. 유리하게는, 여러 형질전환 방법 중 임의의 방법을 사용하여 적합한 선조 세포로 관심 유전자를 도입시킬 수 있다. 형질전환 방법은 리포솜의 사용, 전기천공, 유리 DNA 업테이크를 증가시키는 화학물질, 식물로 DNA 직접 주입, 입자 총 충격, 바이러스 또는 화분을 이용한 형질전환 및 마이크로발사를 포함한다. 상기 방법은 원생동물에 대한 칼슘/폴리에틸렌 글리콜 방법 (Krens, F.A. et al., (1982) Nature 296, 72-74; Negrutiu I et al. (1987) Plant Mol Biol 8: 363-373); 원생동물의 전기천공 (Shillito R.D. et al., 1985 Bio/Technol 3, 1099-1102); 식물 물질로의 마이크로주입 (Crossway A et al ., (1986) Mol. Gen Genet 202: 179-185); DNA 또는 RNA-코팅된 입자 충격 (Klein TM et al., (1987) Nature 327: 70); (비통합성) 바이러스로의 감염 등으로부터 선택될 수 있다. SYT 핵산/유전자를 발현하는 트랜스제닉 벼 식물은 벼 형질전환에 대한 임의의 공지된 방법, 예를 들면 공개된 유럽 특허 출원 EP 1198985 A1, [Aldemita and Hodges (Planta 199: 612-617, 1996)]; [Chan et al. (Plant Mol Biol 22 (3): 491-506, 1993)], [Hiei et al. (Plant J 6 (2): 271-282, 1994)] 중 하나에 기재된 것을 이용하여 아그로박테리움-매개 형질전환을 통해 생산하는 것이 바람직하며, 상기 문헌의 내용은 언급에 의해 전체를 기재한 것처럼 본원에 포함된다. 옥수수 형질전환의 경우, 바람직한 방법은 문헌 [Ishida et al. (Nat. Biotechnol 14(6): 745-50, 1996)] 또는 [Frame et al. (Plant Physiol 129(1): 13-22, 2002)]에 기재된 것과 같으며, 상기 문헌의 내용은 언급에 의해 전체를 기재한 것처럼 본원에 포함된다.
일반적으로 형질전환 후, 식물 세포 또는 세포 분류물을 관심 유전자로 공동전달된 식물-발현가능한 유전자에 의해 코딩되는 하나 이상의 마커의 존재에 대해 선별하고, 그 후 형질전환된 물질을 전체 식물로 재생시킨다.
DNA 전달 및 재생 후, 형질전환되었을 것이라 추정되는 식물을 예를 들어 써던 분석을 이용하여 관심 유전자의 존재, 복사 수 및/또는 게놈 조직화에 대해 평가할 수 있다. 다르게는 또는 추가로, 노던 및/또는 웨스턴 분석, 정량 PCR을 이용하여 새로 도입된 DNA의 발현 수치를 모니터링할 수 있으며, 이러한 기술은 당업자에게 공지되어 있다.
생성된 형질전환된 식물은 다양한 수단, 예를 들어 클로날 증식 또는 전통적인 품종개량 기술로 증식될 수 있다. 예를 들어, 제1 세대 (또는 T1) 형질전환된 식물은 자가수분되어 호모자이고스 제2 세대 (또는 T2) 형질전환체를 제공할 수 있고, T2 식물은 전통적인 품종개량 기술을 통해 추가로 증식될 수 있다.
생성된 형질전환된 유기체는 다양한 형태을 가질 수 있다. 예를 들어, 이는 형질전환된 세포 및 형질전환되지 않은 세포의 키메라; 클로날 형질전환체 (예컨대 발현 카세트를 함유하도록 형질전환된 모든 세포); 형질전환된 및 형질전환되지 않은 조직의 접목체(graft) (예컨대 식물에서 형질전환되지 않은 접순(scion)에 접목된 형질전환된 뿌리줄기)일 수 있다.
분명히, 본 발명은 본원에 기재된 임의의 방법으로 생산된 모든 식물 세포 또는 식물 및 모든 식물의 부분 및 그의 증식물에까지 연장된다. 본 발명은 상기 임의의 방법으로 생산된 일차 형질전환된 세포 또는 형질감염된 세포, 조직, 기관 또는 전체 식물의 자손을 포함하도록 더욱 연장되며, 유일한 조건은 자손들이 본 발명에 따른 방법으로 부모에 의해 생산된 것과 동일한 유전자형 및/또는 표현형 특성(들)을 나타내야 한다는 것이다. 또한, 본 발명은 단리된 SYT 핵산 또는 그의 변이체를 함유하는 숙주 세포를 포함한다. 본 발명에 따른 바람직한 숙주 세포는 식물 세포이다. 또한, 본 발명은 종자, 잎, 과일, 꽃, 줄기 배양물, 뿌리, 덩이줄기 및 구근과 같은 (이에 제한되지 않음) 식물의 수확가능한 부분에까지 연장된다. 추가로, 본 발명은 상기 식물의 수확가능한 부분으로부터 유래된, 바람직하게는 직접적으로 유래된 생성물, 예를 들어 건조 펠렛 또는 분말, 가루(meal), 오일, 지방 및 지방산, 전분 또는 단백질에 관한 것이다.
또한, 본 발명은 SYT 핵산 또는 그의 변이체의 용도 및 SYT 폴리펩티드 또는 그의 동족체의 용도 및 식물 수확량, 특히 종자 수확량을 증가시키는 데에 있어 상기 정의한 구조물의 용도를 포함한다. 종자 수확량은 상기 정의한 바와 같으며, 증가된 총 종자 수확량 또는 증가된 TKW를 포함하는 것이 바람직하다.
SYT 핵산 또는 그의 변이체, 또는 SYT 폴리펩티드 또는 그의 동족체는 SYT 유전자 또는 그의 변이체에 유전공학적으로 연결될 수 있는 DNA 마커를 확인하는 품종 개량 프로그램에 사용할 수 있다. SYT 핵산/유전자 또는 그의 변이체, 또는 SYT 폴리펩티드 또는 그의 동족체를 사용하여 분자 마커를 규정할 수 있다. 그 후, 상기 DNA 또는 단백질 마커를 품종 개량 프로그램에 사용하여 증가된 수확량을 갖는 식물을 선별할 수 있다. SYT 유전자 또는 그의 변이체는 예를 들어 서열 3, 서열 5, 서열 7, 서열 9, 서열 11, 서열 13, 서열 15, 서열 17, 서열 19, 서열 21, 서열 23, 서열 25, 서열 27, 서열 29, 서열 31, 서열 33, 서열 35, 서열 37, 서열 39, 서열 41, 서열 43, 서열 45, 서열 47, 서열 49, 서열 51, 서열 53, 서열 55, 서열 57, 서열 59, 서열 61, 서열 63, 서열 65, 서열 67, 서열 69, 서열 71, 서열 73, 서열 75, 서열 77, 서열 79, 서열 81, 서열 83, 서열 85 및 서열 87 중 어느 하나로 나타내어지는 핵산일 수 있다.
SYT 핵산/유전자의 대립 변이체를 또한 마커-보조 품종 개량 프로그램에 사용할 수 있다. 상기 품종개량 프로그램은 때때로 예컨대 EMS 돌연변이유발을 이용하는 식물의 돌연변이유발 처리에 의한 대립 변이체의 도입을 요구하며, 다르게는, 상기 프로그램은 의도치 않게 유발된 소위 "천연" 기원의 대립 변이체 수집으로 시작될 수 있다. 그 후, 대립 변이체의 확인은 예를 들어 PCR에 의해 수행한다. 그 후, 증가된 수확량을 제공하는 해당 서열의 우수한 대립 변이체의 선별을 위한 단계가 뒤따른다. 선별은 전형적으로 해당 서열의 여러가지 대립 변이체, 예를 들어 서열 3, 서열 5, 서열 7, 서열 9, 서열 11, 서열 13, 서열 15, 서열 17, 서열 19, 서열 21, 서열 23, 서열 25, 서열 27, 서열 29, 서열 31, 서열 33, 서열 35, 서열 37, 서열 39, 서열 41, 서열 43, 서열 45, 서열 47, 서열 49, 서열 51, 서열 53, 서열 55, 서열 57, 서열 59, 서열 61, 서열 63, 서열 65, 서열 67, 서열 69, 서열 71, 서열 73, 서열 75, 서열 77, 서열 79, 서열 81, 서열 83, 서열 85 및 서열 87 중 임의의 하나의 여러가지 대립 변이체를 함유하는 식물의 성장 성과를 모니터링함으로써 수행한다. 성장 성과는 온실 또는 농장에서 모니터링할 수 있다. 추가의 임의의 단계는 우수한 대립 변이체가 확인된 식물을 다른 식물과 교배하는 것을 포함한다. 이를 사용하여 예를 들면 관심있는 표현형 특성의 조합을 만들 수 있다.
또한, SYT 핵산 또는 그의 변이체는 일부인 유전자를 유전공학적으로 및 생리적으로 맵핑하기 위한 프로브 및 상기 유전자와 관련된 특성에 대한 마커로서 사용할 수 있다. 이러한 정보는 원하는 표현형을 가진 종류를 발달시키기 위해 식물 품종 개량에서 유용할 수 있다. SYT 핵산 또는 그의 변이체의 이러한 사용은 길이 15개 이상의 뉴클레오티드 핵산 서열만을 요구한다. SYT 핵산 또는 그의 변이체는 제한효소 절편 길이 다형성 (RFLP) 마커로서 사용할 수 있다. 제한-소화된 식물 게놈 DNA의 써던 블롯 (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual)은 SYT 핵산 또는 그의 변이체로 프로빙할 수 있다. 그 후, 유전자 맵을 구성하기 위해서, 생성된 밴드 패턴을 맵마스터(MapMaker) (Lander et al. (1987) Genomics 1: 174-181)와 같은 컴퓨터 프로그램을 이용하여 유전자 분석할 수 있다. 또한, 핵산을 사용하여, 부모 및 정의된 유전자 교배의 자손을 나타내는 한 셋트의 개인들의 제한 엔도뉴클레아제-처리된 게놈 DNA를 함유하는 써던 블롯을 프로빙할 수 있다. DNA 다형성의 분리를 주목하며, 이를 사용하여 이전에 상기 개체군을 이용하여 얻어진 유전자 맵에서의 SYT 핵산 또는 그의 변이체의 위치를 계산한다 (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).
유전자 맵핑에 사용하기 위한 식물 유전자-유도성 프로브의 생산 및 사용은 문헌 [Bematzky and Tanksley (1986) Plant Mol. Biol. Reporter 4: 37-41]에 기재되어 있다. 수많은 문헌들이 상기 요약된 방법론 및 그의 변형을 이용한 특정 cDNA 클론의 유전자 맵핑을 기재하고 있다. 예를 들어, 맵핑을 위해 F2 이종교배 개체군, 역교배 개체군, 랜덤하게 짝지어진 개체군, 거의 동종동계인(isogenic) 종류, 및 다른 세트의 개인들을 이용할 수 있다. 이러한 방법론은 당업자에게 공지되어 있다.
또한 핵산 프로브를 물리적 맵핑 (즉, 물리적 맵에서의 서열의 배치; 문헌 [Hoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346] 및 상기 문헌에 언급된 문헌 참조)을 위해 사용할 수 있다.
다른 실시양태에서, 핵산 프로브를 직접적 형광 계내 하이브리드화 (FISH) 맵핑에 사용할 수 있다 (Trask (1991) Trends Genet. 7:149-154). 현재의 FISH 맵핑 방법이 거대 클론의 사용을 선호하지만 (몇개의 kb 내지 몇백개의 kb; 문헌 [Laan et al. (1995) Genome Res. 5:13-20] 참조), 민감도의 향상으로 인해 더 짧은 프로브를 이용한 FISH 맵핑의 수행이 가능할 수 있다.
다양한 핵산 증폭을 바탕으로 하는 유전자적 및 물리적 맵핑 방법은 핵산을 이용하여 수행할 수 있다. 그의 예로는 대립유전자-특이적 증폭 (Kazazian (1989) J. Lab. Clin. Med 11:95-96), PCR-증폭된 단편의 다형성 (CAPS; Sheffield et al. (1993) Genomics 16:325-332), 대립유전자-특이적 라이게이션 (Landegren et al. (1988) Science 241:1077-1080), 뉴클레오티드 연장 반응 (Sokolov (1990) Nucleic Acid Res. 18:3671), 방사능 하이브리드 맵핑 (Walter et al. (1997) Nat. Genet. 7:22-28) 및 해피 맵핑 (Dear and Cook (1989) Nucleic Acid Res. 17:6795-6807)이 포함된다. 상기 방법을 위해, 핵산의 서열을 사용하여 증폭 반응 또는 프라이머 연장 반응에 사용하기 위한 프라이머 쌍을 고안하고 제조한다. 이러한 프라이머의 고안은 당업자에게 공지되어 있다. PCR을 바탕으로 하는 유전자 맵핑을 이용하는 방법에서, 상기 핵산 서열에 상응하는 구역에서 맵핑 교배의 부모 사이의 DNA 서열 차이를 확인하는 것이 필수적일 수 있다. 그러나 이는 일반적으로 맵핑 방법에서는 필수적이지 않다.
본 발명에 따른 방법으로 본원 상기에 기재된 바와 같은 증가된 수확량을 갖는 식물이 생산된다. 상기 수확량 향상 특성은 또한 다른 경제적으로 유리한 특성, 예를 들어 추가의 수확량 향상 특성, 다양한 스트레스에 대한 내성, 다양한 구조적 특징 및/또는 생화학적 및/또는 생리학적 특징을 변경시키는 특성과 조합될 수 있다.
이제, 하기 도면을 언급하면서 본 발명을 기재할 것이다.
도 1은 식물 및 포유동물로부터 얻은 SYT 폴리펩티드의 전형적인 도메인 구조를 나타낸다. 보존된 SNH 도메인은 단백질의 N-말단에 위치한다. 단백질 도메인의 C-말단 잔여부는 식물 SYT 폴리펩티드에서는 QG-풍부 도메인 및 포유동물 SYT 폴리펩티드에서는 QPGY-풍부 도메인으로 이루어진다. Met-풍부 도메인은 전형적으로 포유동물에서 QPGY-풍부부 또는 식물에서 QG-풍부부의 전반부 (N-말단에서 C-말단까지) 내에 포함된다. 두번째 Met-풍부 도메인은 식물 SYT 폴리펩티드에서 SNH 도메인 앞에 존재할 수 있다.
도 2는 10의 갭 개방 벌점 및 0.05의 갭 연장에 대한 결함 셋팅을 갖는 변형된 ClustalW 알고리즘 (InforMax, Bethesda, MD, http://www.informaxinc.com)을 기본으로 하는 VNTI AlignX 다중 정렬 프로그램을 이용한 몇몇 SYT 폴리펩티드의 N-말단의 다중 정렬을 나타낸다. 식물 및 인간 SYT 폴리펩티드에 걸쳐 SNH 도메인에 네모를 친다. 정렬에서의 마지막 줄은 정렬된 서열로부터 유도된 일치 서열로 이루어진다.
도 3은 10의 갭 개방 벌점 및 0.05의 갭 연장에 대한 결함 셋팅을 갖는 변형된 ClustalW 알고리즘 (InforMax, Bethesda, MD, http://www.informaxinc.com)을 기본으로 하는 VNTI AlignX 다중 정렬 프로그램을 이용한 몇몇 식물 SYT 폴리펩티드의 다중 정렬을 나타낸다. N-말단에서 C-말단까지 두 개의 주요 도메인에 네모를 치고, SNH 도메인 및 Met-풍부/QG-풍부 도메인으로서 확인한다. 추가로, N-말단 Met-풍부 도메인에 또한 네모를 치고, 서열 90 및 서열 91의 위치에 굵게 밑줄 친다.
도 4는 CLUSTALW 1.83 (http://align.genome.jp/sit-bin/clustalw)을 이용한 다중 SYT 폴리펩티드의 정렬로부터 얻은 이웃 연결 나무(Neighbour joining tree)를 나타낸다. SYT1 및 SYT2/SYT3 분기군은 괄호로 확인된다.
도 5는 GOS2 프로모터 (내부 기준 PRO0129)의 제어하에 아라비돕시스 탈리아나 AtSYT1의 오리자 사티바에서의 발현에 대한 이항(binary) 벡터 p0523을 나타낸다.
도 6은 GOS2 프로모터 (내부 기준 PRO0129)의 제어하에 아라비돕시스 탈리아나 AtSYT2의 오리자 사티바에서의 발현에 대한 이항 벡터 p0524를 나타낸다.
도 7은 GOS2 프로모터 (내부 기준 PRO0129)의 제어하에 아라비돕시스 탈리아나 AtSYT3의 오리자 사티바에서의 발현에 대한 이항 벡터 p0767을 나타낸다.
도 8은 본 발명에 따른 방법을 수행하는 데에 유용한 서열의 예를 기재한다. SYT 핵산 서열은 시작부터 종결까지 제시된다. 상기 서열의 대부분은 낮은 품질의 EST 서열화로부터 유도된다. 그러므로, 핵산 치환을 고려할 수 있다.
이제 하기 실시예를 언급하면서 본 발명을 기재할 것이며, 실시예는 오직 예시를 위한 것이다.
DNA 조작: 달리 기재하지 않는다면, 재조합 DNA 기술을 문헌 [Sambrook (2001) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York] 또는 [Ausubel et al. (1994), Current Protocols in Molecular Biology, Current Protocols]의 제1권 및 제2권에 기재된 표준 프로토콜에 따라 수행한다. 식물 분자 작업에 대한 표준 물질 및 방법은 [Plant Molecular Biology Labfase (1993) by R.D.D. Croy, published by BIOS Scientific Publications Ltd (UK) and Blackwell Scientific Publications (UK)]에 기재되어 있다.
실시예
1:
AtSYT1
,
AtSYT2
및
AtSYT3
의 유전자
클로닝
아라비돕시스 탈리아나 AtSYT1 유전자를 아라비돕시스 탈리아나 시들링 cDNA 라이브러리 (인비트로젠(Invitrogen), 영국 페이슬리 소재)를 주형으로 사용하는 PCR에 의해 증폭시켰다. 시들링으로 추출된 RNA의 역전사 후, cDNA를 pCMV 스포트 6.0으로 클로닝하였다. 뱅크의 평균 삽입 크기는 1.5 kb이고, 클론의 최초 수는 약 1.59 x 107 cfu이었다. 6 x 1011 cfu/ml를 첫번째 증폭한 후 최초 역가를 결정하니 9.6 x 105 cfu/ml이었다. 플라스미드 추출 후, 주형 200 ng을 50 ㎕ PCR 혼합물에 사용하였다. 프라이머 prm06681 (서열 92; 센스, 시작 코돈을 굵게 표시, AttB1 부위를 이탤릭체로 표시: 5'-GGGGACAAGTTTGTACAAAAAAGCAGGCTTAAACAATGCAACAGCACCTGATG-3') 및 prm06682 (서열 93; 역, 상보적, AttB2 부위를 이탤릭체로 표시: 5'- GGGGACCACTTTGTACAAGAAAGCTGGGTCATCATTAAGATTCCTTGTGC-3') (이는 게이트웨이(Gateway) 재조합에 대한 AttB 부위를 포함함)를 PCR 증폭을 위해 사용하였다. 표준 조건에서 Hifi Taq DNA 폴리머라제를 사용하여 PCR을 수행하였다. 727 bp의 PCR 단편 (attB 부위 포함)을 증폭시키고, 역시 표준 방법을 이용하여 정제하였다. 이어서, 게이트웨이 절차의 첫번째 단계인 BP 반응을 수행하고, 그 동안 PCR 단편이 생체내에서 pDONR201 플라스미드와 재조합되어 게이트웨이 용어에 따르면 "진입 클론"인 p07466이 생산되었다. 플라스미드 pDONR201은 게이트웨이 (등록상표) 기술의 일부로서 인비트로젠으로부터 구입하였다.
아라비돕시스 탈리아나 AtSYT2 유전자를 아라비돕시스 탈리아나 AtSYT1 유전자와 동일한 방법을 사용하여 PCR로 증폭시켰다. 프라이머 prm06685 (서열 94; 센스, 시작 코돈을 굵게 표시, AttB1 부위를 이탤릭체로 표시: 5'-GGGGACAAGTTTGTACAAAAAAGCAGGCTTAAACAATGCAGCAGCAGCAGTCT 3' 및 prm06686 (서열 95; 역, 정지 코돈을 굵게 표시, 상보적, AttB2 부위를 이탤릭체로 표시: 5' GGGGACCACTTTGTACAAGAAAGCTGGGTTCTTTGGATCCTTTTCACTTG 3') (이는 게이트웨이 재조합에 대한 AttB 부위를 포함함)을 PCR 증폭을 위해 사용하였다. 표준 조건에서 Hifi Taq DNA 폴리머라제를 사용하여 PCR을 수행하였다. 666 bp의 PCR 단편 (attB 부위 포함)을 증폭시키고, 상기와 같이 정제하였다. 진입 클론을 p07467로 번호 매겼다.
아라비돕시스 탈리아나 AtSYT3 유전자를 아라비돕시스 탈리아나 AtSYT1 및 AtSYT2 유전자와 동일한 방법을 사용하여 PCR로 증폭시켰다. 프라이머 prm06683 (서열 96; 센스, 시작 코돈을 굵게 표시, AttB1 부위를 이탤릭체로 표시: 5' GGGGACAAGTTTGTACAAAAAAGCAGGCTTAAACAATGCAGCAATCTCCACAGAT 3' 및 prm06684 (서열 97; 역, 정지 코돈을 굵게 표시, 상보적, AttB2 부위를 이탤릭체로 표시: 5' GGGGACCACTTTGTACAAGAAAGCTGGGTTCCTCTATTTCATTTTCCTTCAG 3') (이는 게이트웨이 재조합에 대한 AttB 부위를 포함함)을 증폭을 위해 사용하였다. 표준 조건에서 Hifi Taq DNA 폴리머라제를 사용하여 PCR을 수행하였다. 745 bp의 PCR 단편 (attB 부위 포함)을 증폭시키고, 상기와 같이 정제하였다. 진입 클론을 p07604로 번호 매겼다.
실시예
2: 벡터 구축
이어서, 진입 클론 p07466, p07467 및 p07604을 p00640과의 LR 반응에 사용하고, 지정 벡터를 오리자 사티바 형질전환에 사용하였다. 상기 벡터는 T-DNA 영역 내에 기능 요소로서 식물 선별성 마커; 스크리닝가능한 마커 발현 카세트; 및 진입 클론에서 이미 클로닝된 관심 서열과의 LR 생체내 재조합을 위해 의도되는 게이트웨이 카세트를 함유한다. 구성적 발현 (PRO0129)을 위한 벼 GOS2 프로모터 (서열 89)를 상기 게이트웨이 카세트의 상류에 위치시켰다.
LR 재조합 단계 후, 생성된 발현 벡터, 즉 각각 AtSYT1에 대해 p0523, AtSYT2에 대해 p0524 및 AtSYT3에 대해 p0767 (도 5 내지 7)을 아그로박테리움 균주 LBA4044로 형질전환시킨 후, 오리자 사티바 식물로 형질전환시켰다. 형질전환된 벼 식물을 성장시킨 후, 실시예 3에 기재한 파라미터에 대해 조사하였다.
실시예
3: 벼
GOS2
프로모터의 제어하에서
AtSYT1
,
AtSYT2
및
AtSYT3
의 평가 및 결과
대략 15 내지 20개의 독립적인 T0 벼 형질전환체를 생산하였다. 일차 형질전환체를 T1 종자의 성장 및 수확을 위해 조직 배양 챔버에서 온실까지 이동시켰 다. 6개 종목 (이 중 T1 자손은 트랜스진의 존재/부재에 대해 3:1로 분리됨)이 잔류하였다. 상기 종목 각각에 대해, 트랜스진을 함유하는 대략 10개의 T1 묘목 (헤테로자이고트 및 호모자이고트) 및 트랜스진이 없는 대략 10개의 T1 묘목 (눌리자이고트(nullizygote))를 시각적 마커 발현을 모니터링함으로써 선별하였다.
통계적 분석: F-시험
식물 표현형 특성의 전반적 평가를 위한 통계적 모델로서 2-인자 아노바(ANOVA) (변이체 분석)를 사용하였다. 본 발명의 유전자로 형질전환된 모든 사건의 모든 식물에 대해 측정된 모든 파라미터에 대해 F-시험을 수행하였다. F-시험을 수행하여 형질전환 사건 모두에 대한 유전자의 영향 및 포괄적 유전자 효과로도 공지되어 있는 유전자의 전체적 영향을 확인하였다. 진정한 포괄적 유전자 효과에 대한 유의성에 대한 역치는 F-시험에 대해 5% 가능성 수준으로 설정하였다. 유의한 F-시험 값은 단지 표현형의 차이를 가져오는 유전자의 존재 또는 위치만이 아님을 의미하는 유전자 효과를 가리킨다.
종자-관련 파라미터 측정
성숙한 일차 원추(panicle)를 수확하고, 자루에 넣고, 바코드로 표지한 후, 37℃의 오븐에서 3일 동안 건조시켰다. 이어서, 원추를 타작하여, 모든 종자를 수집하고 계수하였다. 송풍 장치를 이용하여 속이 찬 껍질을 빈 껍질과 분리하였다. 빈 껍질을 폐기하고, 남아 있는 분획을 다시 계수하였다. 속이 찬 껍질을 분석 저울에서 칭량하였다. 분리 단계 후에 남아 있는 속이 찬 껍질의 수를 계수함으로써 속이 찬 종자의 수를 결정하였다. 식물에서 수확한 속이 찬 껍질 모두를 칭량함으 로써 총 종자 수확량을 측정하였다. 식물에서 수확한 껍질의 수를 계수함으로써 식물 당 총 종자수를 측정하였다. 계수한 속이 찬 종자의 수 및 그의 총 중량으로부터 천립중 (TKW)을 외삽하였다.
칭량 및 화상 장치의 2가지 주요 구성으로 이루어진 통상적 장치를 이용하여 개별 종자 파라미터 (폭, 길이, 면적, 중량을 포함)를 측정하고, 화상 분석을 위한 소프트웨어에 연결시켰다.
3.1 온실에서 자란
트랜스제닉
식물에 대한 총 종자 수확량 및
TKW
측정 결과
T1 세대에 대한 AtSYT1, AtSYT2 및 AtSYT3 트랜스제닉 식물에 대한 총 종자 수확량 및 TKW 측정 결과를 표 5 내지 7에 각각 나타낸다. 어느 하나의 파라미터에서 증가를 갖는 종류의 수를 표시한다. 트랜스제닉과 상응하는 눌리자이고트 사이의 백분율 차이 및 F 시험으로부터의 P 값도 또한 나타낸다.
총 종자 수확량 및 TKW 둘 다 AtSYT1, AtSYT2 및 ATSYT3 트랜스제닉 식물에 대한 T1 세대에서 유의하게 증가하였다 (각각 표 5 내지 7).
|
증가를 나타낸 사건수 | % 차이 | F 시험의 P 값 |
총 종자 수확량 | 6 중의 5 | 19 | 0.005 |
TKW | 6 중의 5 | 11 | <0.0001 |
|
증가를 나타낸 사건수 | % 차이 | F 시험의 P 값 |
총 종자 수확량 | 6 중의 4 | 37 | 0.05 |
TKW | 6 중의 6 | 5 | <0.0001 |
|
증가를 나타낸 사건수 | % 차이 | F 시험의 P 값 |
총 종자 수확량 | 6 중의 5 | 22 | 0.0074 |
TKW | 6 중의 5 | 7 | <0.0001 |
3.2
T2
세대
AtSYT1
트랜스제닉
식물로부터 얻은 종자의 종자 크기 측정 결과
칭량 및 화상 장치의 2가지 주요 구성으로 이루어진 통상적 장치를 이용하여 T2 식물로부터 얻은 종자에서 개별 종자 파라미터 (폭, 길이 및 면적)를 측정하고, 화상 분석을 위한 소프트웨어에 연결시켰다. 껍질이 있는 종자 및 껍질이 없는 종자 모두에 대해 측정하였다.
오리자 사티바 AtSYT1 트랜스제닉 식물에 대한 T3 종자 (T2 식물로부터 수확한 것)의 평균 개별 종자 면적, 길이 및 폭 측정 결과를 표 8에 나타낸다. 트랜스제닉과 상응하는 눌리자이고트 사이의 백분율 차이 뿐만 아니라 주어진 파라미터가 증가된 사건수 및 F 시험으로부터의 P 값도 또한 나타낸다.
T3 껍질이 있는 종자 및 껍질이 없는 종자 (T2 트랜스제닉 오리자 사티바 AtSYT1 식물로부터 수확한 것)의 평균 개별 종자 면적, 길이 및 폭은 모두 그의 무효(null) 대응물에 비해 유의하게 증가하였다 (표 8).
|
증가를 나타낸 사건수 | % 차이 | F 시험의 P 값 |
평균 종자 면적 | 6 중의 6 | 11 % | <0.0001 |
평균 껍질이 없는 종자 면적 | 6 중의 6 | 10 % | <0.0001 |
평균 종자 길이 | 6 중의 6 | 6 % | <0.0001 |
평균 껍질이 없는 종자 길이 | 6 중의 6 | 5 % | <0.0001 |
평균 종자 폭 | 6 중의 6 | 5 % | <0.0001 |
평균 껍질이 없는 종자 폭 | 6 중의 6 | 4 % | <0.0001 |
3.3
T2
세대
AtSYT1
트랜스제닉
식물로부터 얻은 종자의 배 및
배유
크기 측정 결과
껍질이 없는 종자를 세로로 절반으로 절단하고, 반쪽 종자들을 35℃에서 2 내지 3시간 동안 착색제인 2,3,5-트리페닐테트라졸리움 클로라이드로 염색함으로써 배 및 배유 크기를 또한 측정하였다. 염색 후, 2개의 반쪽을 화상화가 준비된 페트리 디쉬 중의 아가로스 겔에 놓았다. 3개의 독립 사건을 취하고, 각 사건으로부터 트랜스진에 호모자이고스인 120개의 종자 및 트랜스진이 없는 120개의 종자를 분석하였다. 종자의 디지털 사진을 찍고, 화상을 이미지프로 소프트웨어로 분석하였다. 3개 사건에 대한 결과를 하기에 기재한다.
모든 3개 사건에서, 트랜스진에 호모자이고스인 종자의 배가 트랜스진이 없는 종자의 배보다 더 컸다. 3개 사건 각각의 종자에 대한 배의 평균 면적에서 t-시험으로부터의 p 값이 0.0325, <0.0001 및 <0.0001로서 유의한 증가가 있었다. 유사하게, 3개 사건 각각의 종자에 대한 배의 평균 주변길이(perimeter)에서 p 값이 0.0176, <0.0001 및 <0.0001로서 유의한 증가가 있었다. 또한, 3개 사건 각각의 종자에 대한 배유의 평균 주변길이에서 모든 p 값이 <0.0001로서 유의한 증가가 있었다.
3.4 농장에서 성장한
AtSYT1
트랜스제닉
식물에 대한
TKW
측정 결과
AtSYT1 호모자이고스 트랜스제닉 식물 및 그의 상응하는 대조물질을 9월에 농장에 심어 12월에 수확하였다. 반복할 때마다 104개의 식물로 각 점유지에 대해 4번을 반복하여 재배하였다 (4개의 사건). 식물 사이의 간격은 20 x 20 cm이었다. 농장에 물을 대고 관개하였다. 종자 수확 후, 종자를 상기 기재한 바와 같이 TKW에 대해 측정하였다. 상기 측정의 결과를 표 9에 나타낸다.
사건 | TKW에서의 백분율 증가(%) |
사건 1 | 8 |
사건 2 | 6 |
사건 3 | 5 |
사건 4 | 10 |
TKW는 농장에서 측정된 모든 트랜스제닉 사건에서 증가하였다.
SEQUENCE LISTING
<110> CropDesign N.V.
<120> Plants having increased yield and a method for making the same
<130> CD-129-PCT
<150> EP 05100537.9
<151> 2005-01-27
<150> US 60/649,041
<151> 2005-02-01
<150> US 60/730,403
<151> 2005-10-26
<160> 97
<170> PatentIn version 3.3
<210> 1
<211> 46
<212> PRT
<213> Artificial sequence
<220>
<223> consensus sequence
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa can be either Gln or Lys
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa can be any amino acid
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa can be either Asp or Glu
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa can be either Glu or Asp
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> Xaa can be either Lys or Asn
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa can be any amino acid
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> Xaa can be any amino acid
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> Xaa can be either Cys, Ala and Lys
<220>
<221> MISC_FEATURE
<222> (16)..(16)
<223> Xaa can be either Leu, Val or Met
<220>
<221> MISC_FEATURE
<222> (17)..(17)
<223> Xaa can be either Glu, Asp or Ser
<220>
<221> MISC_FEATURE
<222> (18)..(18)
<223> Xaa can be either Ser or Asn
<220>
<221> MISC_FEATURE
<222> (19)..(19)
<223> Xaa can be either Gln or Leu
<220>
<221> MISC_FEATURE
<222> (21)..(21)
<223> Xaa can be any amino acid
<220>
<221> MISC_FEATURE
<222> (23)..(23)
<223> Xaa can be either Lys or Arg
<220>
<221> MISC_FEATURE
<222> (24)..(25)
<223> Xaa can be any amino acid
<220>
<221> MISC_FEATURE
<222> (28)..(28)
<223> Xaa can be either Ala, Glu or Ser
<220>
<221> MISC_FEATURE
<222> (29)..(30)
<223> Xaa can be any amino acid
<220>
<221> MISC_FEATURE
<222> (32)..(32)
<223> Xaa can be any either Ala, Ser or Gln
<220>
<221> MISC_FEATURE
<222> (33)..(33)
<223> Xaa can be any amino acid
<220>
<221> MISC_FEATURE
<222> (35)..(35)
<223> Xaa can be either Gln or His
<220>
<221> MISC_FEATURE
<222> (36)..(36)
<223> Xaa can be any amino acid
<220>
<221> MISC_FEATURE
<222> (39)..(39)
<223> Xaa can be either Met, Leu or Val
<220>
<221> MISC_FEATURE
<222> (43)..(43)
<223> Xaa can be either Ala or Thr
<400> 1
Ile Gln Xaa Xaa Leu Xaa Xaa Asn Xaa Xaa Leu Ile Xaa Xaa Ile Xaa
1 5 10 15
Xaa Xaa Xaa Asn Xaa Gly Xaa Xaa Xaa Glu Cys Xaa Xaa Xaa Gln Xaa
20 25 30
Xaa Leu Xaa Xaa Asn Leu Xaa Tyr Leu Ala Xaa Ile Ala Asp
35 40 45
<210> 2
<211> 46
<212> PRT
<213> Arabidopsis thaliana
<400> 2
Ile Gln Gln Tyr Leu Asp Glu Asn Lys Ser Leu Ile Leu Lys Ile Val
1 5 10 15
Glu Ser Gln Asn Ser Gly Lys Leu Ser Glu Cys Ala Glu Asn Gln Ala
20 25 30
Arg Leu Gln Arg Asn Leu Met Tyr Leu Ala Ala Ile Ala Asp
35 40 45
<210> 3
<211> 633
<212> DNA
<213> Arabidopsis thaliana
<220>
<221> misc_feature
<223> a at position 386 AND t at position 425 can be changed to g at
position 386 AND c at position 425
<400> 3
atgcaacagc acctgatgca gatgcagccc atgatggctg gttactaccc cagcaatgtt 60
acctctgatc atatccaaca gtacttggac gaaaacaaat cgttgattct gaagattgtt 120
gagtctcaaa actctggaaa gcttagcgaa tgcgccgaga atcaagcaag gcttcaacgc 180
aacctaatgt acctagctgc aatagcagat tctcagcctc agccaccaag tgtgcatagc 240
cagtatggat ctgctggtgg tgggatgatt cagggagaag gagggtcaca ctatttgcag 300
cagcaacaag cgactcaaca gcaacagatg actcagcagt ctctaatggc ggctcgatct 360
tcaatgttgt atgctcagca acagcagcag cagcagcctt acgcgacgct tcagcatcag 420
caattgcacc atagccagct tggaatgagc tcgagcagcg gaggaggagg aagcagtggt 480
ctccatatcc ttcagggaga ggctggtggg tttcatgatt ttggccgtgg gaagccggaa 540
atgggaagtg gtggtggcgg tgaaggcaga ggaggaagtt caggggatgg tggagaaacc 600
ctttacttga aatcatcaga tgatgggaat tga 633
<210> 4
<211> 210
<212> PRT
<213> Arabidopsis thaliana
<220>
<221> MISC_FEATURE
<223> Gln at position 129 AND Leu at position 141 can be changed to Arg
at position 129 AND Ser at position 141
<400> 4
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Gly Tyr Tyr
1 5 10 15
Pro Ser Asn Val Thr Ser Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Ser Glu Cys Ala Glu Asn Gln Ala Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Pro Ser Val His Ser
65 70 75 80
Gln Tyr Gly Ser Ala Gly Gly Gly Met Ile Gln Gly Glu Gly Gly Ser
85 90 95
His Tyr Leu Gln Gln Gln Gln Ala Thr Gln Gln Gln Gln Met Thr Gln
100 105 110
Gln Ser Leu Met Ala Ala Arg Ser Ser Met Leu Tyr Ala Gln Gln Gln
115 120 125
Gln Gln Gln Gln Pro Tyr Ala Thr Leu Gln His Gln Gln Leu His His
130 135 140
Ser Gln Leu Gly Met Ser Ser Ser Ser Gly Gly Gly Gly Ser Ser Gly
145 150 155 160
Leu His Ile Leu Gln Gly Glu Ala Gly Gly Phe His Asp Phe Gly Arg
165 170 175
Gly Lys Pro Glu Met Gly Ser Gly Gly Gly Gly Glu Gly Arg Gly Gly
180 185 190
Ser Ser Gly Asp Gly Gly Glu Thr Leu Tyr Leu Lys Ser Ser Asp Asp
195 200 205
Gly Asn
210
<210> 5
<211> 588
<212> DNA
<213> Arabidopsis thaliana
<400> 5
atgcagcagc agcagtctcc gcaaatgttt ccgatggttc cgtcgattcc ccctgctaac 60
aacatcacta ccgaacagat ccaaaagtac cttgatgaga acaagaagct gattatggcc 120
atcatggaaa accagaatct cggtaaactt gctgagtgcg cccagtacca agctcttctc 180
cagaagaact tgatgtatct tgctgcaatt gctgatgctc aacccccacc acctacgcca 240
ggaccttcac catctacagc tgtcgctgcc cagatggcaa caccgcattc tgggatgcaa 300
ccacctagct acttcatgca acacccacaa gcatcccctg cagggatttt cgctccaagg 360
ggtcctttac agtttggtag cccactccag tttcaggatc cgcaacagca gcagcagata 420
catcagcaag ctatgcaagg acacatgggg attagaccaa tgggtatgac caacaacggg 480
atgcagcatg cgatgcaaca accagaaacc ggtcttggag gaaacgtggg gcttagagga 540
ggaaagcaag atggagcaga tggacaagga aaagatgatg gcaagtga 588
<210> 6
<211> 195
<212> PRT
<213> Arabidopsis thaliana
<400> 6
Met Gln Gln Gln Gln Ser Pro Gln Met Phe Pro Met Val Pro Ser Ile
1 5 10 15
Pro Pro Ala Asn Asn Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp
20 25 30
Glu Asn Lys Lys Leu Ile Met Ala Ile Met Glu Asn Gln Asn Leu Gly
35 40 45
Lys Leu Ala Glu Cys Ala Gln Tyr Gln Ala Leu Leu Gln Lys Asn Leu
50 55 60
Met Tyr Leu Ala Ala Ile Ala Asp Ala Gln Pro Pro Pro Pro Thr Pro
65 70 75 80
Gly Pro Ser Pro Ser Thr Ala Val Ala Ala Gln Met Ala Thr Pro His
85 90 95
Ser Gly Met Gln Pro Pro Ser Tyr Phe Met Gln His Pro Gln Ala Ser
100 105 110
Pro Ala Gly Ile Phe Ala Pro Arg Gly Pro Leu Gln Phe Gly Ser Pro
115 120 125
Leu Gln Phe Gln Asp Pro Gln Gln Gln Gln Gln Ile His Gln Gln Ala
130 135 140
Met Gln Gly His Met Gly Ile Arg Pro Met Gly Met Thr Asn Asn Gly
145 150 155 160
Met Gln His Ala Met Gln Gln Pro Glu Thr Gly Leu Gly Gly Asn Val
165 170 175
Gly Leu Arg Gly Gly Lys Gln Asp Gly Ala Asp Gly Gln Gly Lys Asp
180 185 190
Asp Gly Lys
195
<210> 7
<211> 672
<212> DNA
<213> Arabidopsis thaliana
<400> 7
atgcagcaat ctccacagat gattccgatg gttcttcctt catttccgcc caccaataat 60
atcaccaccg aacagatcca aaagtatctt gatgagaaca agaagctgat aatggcgatc 120
ttggaaaatc agaacctcgg taaacttgca gaatgtgctc agtatcaagc tcttctccag 180
aagaatttga tgtatctcgc tgcaattgcg gatgctcaac ctcagccacc agcagctaca 240
ctaacatcag gagccatgac tccccaagca atggctccta atccgtcatc aatgcagcca 300
ccaccaagct acttcatgca gcaacatcaa gctgtgggaa tggctcaaca aatacctcct 360
gggattttcc ctcctagagg tccattgcaa tttggtagcc cgcatcagtt tctggatccg 420
cagcaacagt tacatcaaca agctatgcaa gggcacatgg ggattagacc aatgggtttg 480
aataataaca acggactgca acatcaaatg caccaccatg aaactgctct tgccgcaaac 540
aatgcgggtc ctaacgatgc tagtggagga ggtaaaccgg atgggaccaa tatgagccag 600
agtggagctg atgggcaagg tggctcagcc gctagacatg gcggtggtga tgcaaaaact 660
gaaggaaaat ga 672
<210> 8
<211> 223
<212> PRT
<213> Arabidopsis thaliana
<400> 8
Met Gln Gln Ser Pro Gln Met Ile Pro Met Val Leu Pro Ser Phe Pro
1 5 10 15
Pro Thr Asn Asn Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu
20 25 30
Asn Lys Lys Leu Ile Met Ala Ile Leu Glu Asn Gln Asn Leu Gly Lys
35 40 45
Leu Ala Glu Cys Ala Gln Tyr Gln Ala Leu Leu Gln Lys Asn Leu Met
50 55 60
Tyr Leu Ala Ala Ile Ala Asp Ala Gln Pro Gln Pro Pro Ala Ala Thr
65 70 75 80
Leu Thr Ser Gly Ala Met Thr Pro Gln Ala Met Ala Pro Asn Pro Ser
85 90 95
Ser Met Gln Pro Pro Pro Ser Tyr Phe Met Gln Gln His Gln Ala Val
100 105 110
Gly Met Ala Gln Gln Ile Pro Pro Gly Ile Phe Pro Pro Arg Gly Pro
115 120 125
Leu Gln Phe Gly Ser Pro His Gln Phe Leu Asp Pro Gln Gln Gln Leu
130 135 140
His Gln Gln Ala Met Gln Gly His Met Gly Ile Arg Pro Met Gly Leu
145 150 155 160
Asn Asn Asn Asn Gly Leu Gln His Gln Met His His His Glu Thr Ala
165 170 175
Leu Ala Ala Asn Asn Ala Gly Pro Asn Asp Ala Ser Gly Gly Gly Lys
180 185 190
Pro Asp Gly Thr Asn Met Ser Gln Ser Gly Ala Asp Gly Gln Gly Gly
195 200 205
Ser Ala Ala Arg His Gly Gly Gly Asp Ala Lys Thr Glu Gly Lys
210 215 220
<210> 9
<211> 633
<212> DNA
<213> Aspergillus officinalis
<400> 9
atgcagcagc acctgatgca gatgcagccc atgatggcaa cctacggttc accgaatcag 60
gtcaccaccg atatcattca gcagtatctg gacgagaaca agcagttgat tctggctatt 120
cttgaaaacc aaaattcagg aaaagctgat gaatgtgctg agaatcaggc taagcttcag 180
aggaatctga tgtatcttgc agccattgcg gatagccagc cccaagttcc taccattgct 240
cagtatcctc ccaacgctgt tgctgctatg caatcgagtg ctcgctacat gcaacaacac 300
caagcagctc aacagatgac ccctcaatct ctcatggctg ctcgctcctc aatgctctac 360
tcacagtccc caatgtctgc actccagcag caacagcagc aagcagcaat gcatagccag 420
ctcgccatga gctccggagg caacaacagc agcaccggag gattcaccat tcttcatggt 480
gaagctagca taggaggcaa tggctcaatg aattctggtg gagtctttgg agattttgga 540
cggagcagcg gtgggaagca agagactggg agcgaagggc acgggacaga gactcctatg 600
tacctgaaag gctctgaaga agaaggaaac tga 633
<210> 10
<211> 210
<212> PRT
<213> Aspergillus officinalis
<400> 10
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Thr Tyr Gly
1 5 10 15
Ser Pro Asn Gln Val Thr Thr Asp Ile Ile Gln Gln Tyr Leu Asp Glu
20 25 30
Asn Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn Ser Gly Lys
35 40 45
Ala Asp Glu Cys Ala Glu Asn Gln Ala Lys Leu Gln Arg Asn Leu Met
50 55 60
Tyr Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Val Pro Thr Ile Ala
65 70 75 80
Gln Tyr Pro Pro Asn Ala Val Ala Ala Met Gln Ser Ser Ala Arg Tyr
85 90 95
Met Gln Gln His Gln Ala Ala Gln Gln Met Thr Pro Gln Ser Leu Met
100 105 110
Ala Ala Arg Ser Ser Met Leu Tyr Ser Gln Ser Pro Met Ser Ala Leu
115 120 125
Gln Gln Gln Gln Gln Gln Ala Ala Met His Ser Gln Leu Ala Met Ser
130 135 140
Ser Gly Gly Asn Asn Ser Ser Thr Gly Gly Phe Thr Ile Leu His Gly
145 150 155 160
Glu Ala Ser Ile Gly Gly Asn Gly Ser Met Asn Ser Gly Gly Val Phe
165 170 175
Gly Asp Phe Gly Arg Ser Ser Gly Gly Lys Gln Glu Thr Gly Ser Glu
180 185 190
Gly His Gly Thr Glu Thr Pro Met Tyr Leu Lys Gly Ser Glu Glu Glu
195 200 205
Gly Asn
210
<210> 11
<211> 591
<212> DNA
<213> Brassica napus
<400> 11
atgcagccca tgatggctgg ttactacccc agcaatgtca cctctgatca tatccagcag 60
tacttggatg agaacaagtc tttgattctg aagatagttg agtctcaaaa ctcaggaaag 120
ctcagcgagt gtgccgagaa tcaggcaagg cttcaacgca acctcatgta cttggctgca 180
atagcagatt ctcagcctca acctccaagc gtgcatagcc agtatggatc tgctggtggt 240
gggttgattc agggagaagg agcgtcacac tatttgcagc agcaacaggc gactcaacag 300
cagcagatga ctcagcagtc tcttatggca gctcgttctt caatgatgta tcagcagcag 360
caacagcctt atgcaacgct tcagcatcag cagttgcacc atagccagct tgggatgagc 420
tctagcagcg gaggaggaag cagtggtctc catatccttc agggagaggc tggtgggttt 480
catgaatttg gccgtgggaa gccggagatg ggaagtggtg aaggcagggg tggaagctca 540
ggggatggtg gagaaacact ctacttgaag tcatcagatg atgggaactg a 591
<210> 12
<211> 203
<212> PRT
<213> Brassica napus
<400> 12
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Gly Tyr Tyr
1 5 10 15
Pro Ser Asn Val Thr Ser Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Ser Glu Cys Ala Glu Asn Gln Ala Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Pro Ser Val His Ser
65 70 75 80
Gln Tyr Gly Ser Ala Gly Gly Gly Leu Ile Gln Gly Glu Gly Ala Ser
85 90 95
His Tyr Leu Gln Gln Gln Gln Ala Thr Gln Gln Gln Gln Met Thr Gln
100 105 110
Gln Ser Leu Met Ala Ala Arg Ser Ser Met Met Tyr Gln Gln Gln Gln
115 120 125
Gln Pro Tyr Ala Thr Leu Gln His Gln Gln Leu His His Ser Gln Leu
130 135 140
Gly Met Ser Ser Ser Ser Gly Gly Gly Ser Ser Gly Leu His Ile Leu
145 150 155 160
Gln Gly Glu Ala Gly Gly Phe His Glu Phe Gly Arg Gly Lys Pro Glu
165 170 175
Met Gly Ser Gly Glu Gly Arg Gly Gly Ser Ser Gly Asp Gly Gly Glu
180 185 190
Thr Leu Tyr Leu Lys Ser Ser Asp Asp Gly Asn
195 200
<210> 13
<211> 663
<212> DNA
<213> Citrus sinensis
<400> 13
atgcaacagc acctgatgca gatgcagccc atgatggcag cttattatcc caacaacgtc 60
actactgacc acattcaaca gtatctagat gagaacaaat cattgatttt gaagattgtt 120
gagagccaga attcagggaa actgagcgag tgtgcagaga accaggcaag attgcagcgg 180
aatctcatgt acctggctgc tattgctgat gctcaacccc aaccacctag cgttcatgcc 240
cagttctctt ctggtggcat tatgcagcca ggagctcact atatgcaaca ccagcaatct 300
cagccaatga caccacagtc acttatggct gcacgctcat ccatggtgta ctctcaacag 360
caattttcag tgcttcagca acagcaagcc ttgcatggtc agcttggcat gagctctggt 420
ggtagctcag gacttcacat gctgcaaagt gagggtagta ctgcaggagg tagtggttca 480
cttgggggtg ggggattccc tgattttggc cgtggctcat ctggtgaagg cttgcactca 540
aggggaatgg ggagcaagca tgatataggc agttctggat ctgctgaagg acgaggaggg 600
agctcaggaa gccaagatgg aggcgaaact ctctacttga aaggggctga tgatggaaat 660
taa 663
<210> 14
<211> 219
<212> PRT
<213> Citrus sinensis
<400> 14
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr Tyr
1 5 10 15
Pro Asn Asn Val Thr Thr Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Ser Glu Cys Ala Glu Asn Gln Ala Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ala Gln Pro Gln Pro Pro Ser Val His Ala
65 70 75 80
Gln Phe Ser Ser Gly Gly Ile Met Gln Pro Gly Ala His Tyr Met Gln
85 90 95
His Gln Gln Ser Gln Pro Met Thr Pro Gln Ser Leu Met Ala Ala Arg
100 105 110
Ser Ser Met Val Tyr Ser Gln Gln Gln Phe Ser Val Leu Gln Gln Gln
115 120 125
Gln Ala Leu His Gly Gln Leu Gly Met Ser Ser Gly Gly Ser Ser Gly
130 135 140
Leu His Met Leu Gln Ser Glu Gly Ser Thr Ala Gly Gly Ser Gly Ser
145 150 155 160
Leu Gly Gly Gly Gly Phe Pro Asp Phe Gly Arg Gly Ser Ser Gly Glu
165 170 175
Gly Leu His Ser Arg Gly Met Gly Ser Lys His Asp Ile Gly Ser Ser
180 185 190
Gly Ser Ala Glu Gly Arg Gly Gly Ser Ser Gly Ser Gln Asp Gly Gly
195 200 205
Glu Thr Leu Tyr Leu Lys Gly Ala Asp Asp Gly
210 215
<210> 15
<211> 660
<212> DNA
<213> Gossypium arboreum
<220>
<221> misc_feature
<222> (309)..(309)
<223> n is a, c, g, or t
<400> 15
atgcagcagc acctgatgca gatgcagccc atgatggcag cttattatcc caacaacgtc 60
actactgatc atattcaaca gtatctcgat gagaacaagt cattgatctt aaagattgtt 120
gagagccaga attctgggaa attgagtgaa tgtgctgaga accaagcaag gctgcagcga 180
aacctcatgt acctggctgc cattgcggat tctcaacccc aaccacccac cgtgcatgca 240
cagtttccat ctggtggtat catgcagcaa ggagctgggc actacatgca gcaccaacaa 300
gctcaacana tgacacaaca gtcgcttatg gctgctcggt cctcaatgtt gtattctcag 360
caaccatttt ctgcactgca acaacaacaa caacaaggct ttgcacagtc agcttggcat 420
gagctctggc gggagcacag gcctttcata tgctgcaaac tgaatctagt actgcagggg 480
gcagtgagac accttgggcc cgagggttgt cctgatttgg acgggggtct tttggagagg 540
catccctggt ggcaggccaa tggccggggg aacaaccaaa aatccgggga ggccggctca 600
cctaagggcc gggaggagcc cttggggcag gggggggtga tggggggaac ctcttcttaa 660
<210> 16
<211> 219
<212> PRT
<213> Gossypium arboreum
<220>
<221> misc_feature
<222> (103)..(103)
<223> Xaa can be any naturally occurring amino acid
<400> 16
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr Tyr
1 5 10 15
Pro Asn Asn Val Thr Thr Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Ser Glu Cys Ala Glu Asn Gln Ala Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Pro Thr Val His Ala
65 70 75 80
Gln Phe Pro Ser Gly Gly Ile Met Gln Gln Gly Ala Gly His Tyr Met
85 90 95
Gln His Gln Gln Ala Gln Xaa Met Thr Gln Gln Ser Leu Met Ala Ala
100 105 110
Arg Ser Ser Met Leu Tyr Ser Gln Gln Pro Phe Ser Ala Leu Gln Gln
115 120 125
Gln Gln Gln Gln Gly Phe Ala Gln Ser Ala Trp His Glu Leu Trp Arg
130 135 140
Glu His Arg Pro Phe Ile Cys Cys Lys Leu Asn Leu Val Leu Gln Gly
145 150 155 160
Ala Val Arg His Leu Gly Pro Glu Gly Cys Pro Asp Leu Asp Gly Gly
165 170 175
Leu Leu Glu Arg His Pro Trp Trp Gln Ala Asn Gly Arg Gly Asn Asn
180 185 190
Gln Lys Ser Gly Glu Ala Gly Ser Pro Lys Gly Arg Glu Glu Pro Leu
195 200 205
Gly Gln Gly Gly Val Met Gly Gly Thr Ser Ser
210 215
<210> 17
<211> 636
<212> DNA
<213> Medicago trunculata
<400> 17
atgcagcagc acctgatgca gatgcagccc atgatggcag cttactatcc taacaacgtc 60
actactgatc atattcaaca gtatcttgat gagaacaagt ccttgattct caagattgtt 120
gaaagccaga acactggcaa gctcaccgag tgtgctgaga accaatcaag gcttcagaga 180
aatctcatgt acctagctgc aatagctgat tctcaacccc aaccacctac tatgcctggc 240
cagtaccctt caagtggaat gatgcagcag ggaggacact acatgcaggc tcaacaagct 300
cagcagatga cacaacaaca attaatggct gcacgttcct ctcttatgta tgctcaacag 360
cttcaacagc agcaagcctt gcaaagccaa cttggtatga attccagtgg aagtcaaggc 420
cttcacatgt tgcatagtga aggggctaat gttggaggca attcatctct aggggctggt 480
tttcctgatt ttggccgtag ctcagccggt gatggtttgc acggcagtgg taagcaagac 540
attggaagca ctgatggccg cggtggaagc tctagtggtc actctggtga tggcggcgaa 600
acactttacc tgaaatcttc tggtgatggg aattag 636
<210> 18
<211> 211
<212> PRT
<213> Medicago trunculata
<400> 18
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr Tyr
1 5 10 15
Pro Asn Asn Val Thr Thr Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Thr Gly Lys Leu
35 40 45
Thr Glu Cys Ala Glu Asn Gln Ser Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Pro Thr Met Pro Gly
65 70 75 80
Gln Tyr Pro Ser Ser Gly Met Met Gln Gln Gly Gly His Tyr Met Gln
85 90 95
Ala Gln Gln Ala Gln Gln Met Thr Gln Gln Gln Leu Met Ala Ala Arg
100 105 110
Ser Ser Leu Met Tyr Ala Gln Gln Leu Gln Gln Gln Gln Ala Leu Gln
115 120 125
Ser Gln Leu Gly Met Asn Ser Ser Gly Ser Gln Gly Leu His Met Leu
130 135 140
His Ser Glu Gly Ala Asn Val Gly Gly Asn Ser Ser Leu Gly Ala Gly
145 150 155 160
Phe Pro Asp Phe Gly Arg Ser Ser Ala Gly Asp Gly Leu His Gly Ser
165 170 175
Gly Lys Gln Asp Ile Gly Ser Thr Asp Gly Arg Gly Gly Ser Ser Ser
180 185 190
Gly His Ser Gly Asp Gly Gly Glu Thr Leu Tyr Leu Lys Ser Ser Gly
195 200 205
Asp Gly Asn
210
<210> 19
<211> 684
<212> DNA
<213> Oryza sativa
<400> 19
atgcagcagc aacacctgat gcagatgaac cagggcatga tggggggata tgcttcccct 60
accaccgtca ccactgatct cattcagcag tatctggatg agaacaagca gctgatcctg 120
gccatccttg acaaccagaa caatgggaag gtggaagagt gcgctcggaa ccaagctaag 180
ctccagcaca atctcatgta cctcgccgcc atcgccgaca gccagccgcc gcagacggcc 240
gccatgtccc agtatccgtc gaacctgatg atgcagtccg gggcgaggta catgccgcag 300
cagtcggcgc agatgatggc gccgcagtcg ctgatggcgg cgaggtcttc gatgatgtac 360
gcgcagccgg cgctgtcgcc gctccagcag cagcagcagc agcaggcggc ggcggcgcac 420
gggcagctgg gcatgggctc ggggggcacc accagcgggt tcagcatcct ccacggcgag 480
gccagcatgg gcggcggcgg cggcggcggt ggcgccggta acagcatgat gaacgccggc 540
gtgttctccg acttcggacg cggcggcggc ggcggcggca aggaggggtc cacctcgctg 600
tccgtcgacg tccggggcgc caactccggc gcccagagcg gcgacgggga gtacctcaag 660
ggcaccgagg aggaaggcag ctag 684
<210> 20
<211> 227
<212> PRT
<213> Oryza sativa
<400> 20
Met Gln Gln Gln His Leu Met Gln Met Asn Gln Gly Met Met Gly Gly
1 5 10 15
Tyr Ala Ser Pro Thr Thr Val Thr Thr Asp Leu Ile Gln Gln Tyr Leu
20 25 30
Asp Glu Asn Lys Gln Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Asn
35 40 45
Gly Lys Val Glu Glu Cys Ala Arg Asn Gln Ala Lys Leu Gln His Asn
50 55 60
Leu Met Tyr Leu Ala Ala Ile Ala Asp Ser Gln Pro Pro Gln Thr Ala
65 70 75 80
Ala Met Ser Gln Tyr Pro Ser Asn Leu Met Met Gln Ser Gly Ala Arg
85 90 95
Tyr Met Pro Gln Gln Ser Ala Gln Met Met Ala Pro Gln Ser Leu Met
100 105 110
Ala Ala Arg Ser Ser Met Met Tyr Ala Gln Pro Ala Leu Ser Pro Leu
115 120 125
Gln Gln Gln Gln Gln Gln Gln Ala Ala Ala Ala His Gly Gln Leu Gly
130 135 140
Met Gly Ser Gly Gly Thr Thr Ser Gly Phe Ser Ile Leu His Gly Glu
145 150 155 160
Ala Ser Met Gly Gly Gly Gly Gly Gly Gly Gly Ala Gly Asn Ser Met
165 170 175
Met Asn Ala Gly Val Phe Ser Asp Phe Gly Arg Gly Gly Gly Gly Gly
180 185 190
Gly Lys Glu Gly Ser Thr Ser Leu Ser Val Asp Val Arg Gly Ala Asn
195 200 205
Ser Gly Ala Gln Ser Gly Asp Gly Glu Tyr Leu Lys Gly Thr Glu Glu
210 215 220
Glu Gly Ser
225
<210> 21
<211> 558
<212> DNA
<213> Oryza sativa
<400> 21
atgcagcagc agccgatgcc gatgcccgcg caggcgccgc cgacggccgg aatcaccacc 60
gagcagatcc aaaagtatct ggatgaaaac aagcagctta ttttggctat tttggaaaat 120
cagaatctgg gaaagttggc agaatgtgct cagtatcaag cgcagcttca gaagaatctc 180
ttgtacttgg ctgcaattgc tgatactcaa ccgcagacca ctataagccg tccccagatg 240
gtgccgcatg gtgcatcgcc ggggttaggg gggcaataca tgtcgcaggt gccaatgttc 300
ccccccagga cccctctaac gccccagcag atgcaggagc agcagctgca gcaacagcaa 360
gcccagctgc tctcgttcgg cggtcagatg gttatgaggc ctggcgttgt gaatggcatt 420
cctcagcttc tgcaaggcga aatgcaccgc ggagcagatc accagaacgc tggcggggcc 480
acctcggagc cttccgagag ccacaggagc accggcaccg aaaatgacgg tggaagcgac 540
ttcggcgatc aatcctaa 558
<210> 22
<211> 185
<212> PRT
<213> Oryza sativa
<400> 22
Met Gln Gln Gln Pro Met Pro Met Pro Ala Gln Ala Pro Pro Thr Ala
1 5 10 15
Gly Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu Asn Lys Gln
20 25 30
Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn Leu Gly Lys Leu Ala Glu
35 40 45
Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu Leu Tyr Leu Ala
50 55 60
Ala Ile Ala Asp Thr Gln Pro Gln Thr Thr Ile Ser Arg Pro Gln Met
65 70 75 80
Val Pro His Gly Ala Ser Pro Gly Leu Gly Gly Gln Tyr Met Ser Gln
85 90 95
Val Pro Met Phe Pro Pro Arg Thr Pro Leu Thr Pro Gln Gln Met Gln
100 105 110
Glu Gln Gln Leu Gln Gln Gln Gln Ala Gln Leu Leu Ser Phe Gly Gly
115 120 125
Gln Met Val Met Arg Pro Gly Val Val Asn Gly Ile Pro Gln Leu Leu
130 135 140
Gln Gly Glu Met His Arg Gly Ala Asp His Gln Asn Ala Gly Gly Ala
145 150 155 160
Thr Ser Glu Pro Ser Glu Ser His Arg Ser Thr Gly Thr Glu Asn Asp
165 170 175
Gly Gly Ser Asp Phe Gly Asp Gln Ser
180 185
<210> 23
<211> 618
<212> DNA
<213> Oryza sativa
<400> 23
atgcagcagc agatggccat gccggcgggg gccgccgccg ccgcggtgcc gccggcggcc 60
ggcatcacca ccgagcagat ccaaaagtat ttggatgaaa ataaacagct aattttggcc 120
atcctggaaa atcaaaacct agggaagttg gctgaatgtg ctcagtacca agctcagctt 180
caaaagaatc tcttgtatct ggctgccatt gcagatgccc aaccacctca gaatccagga 240
agtcgccctc agatgatgca gcctggtgct accccaggtg ctgggcatta catgtcccaa 300
gtaccgatgt tccctccaag aactccctta accccacaac agatgcaaga gcagcagcag 360
cagcaactcc agcaacagca agctcaggct ctagccttcc ccggccagat gctaatgaga 420
ccaggtactg tcaatggcat gcaatctatc ccagttgctg accctgctcg cgcagccgat 480
cttcagacgg cagcaccggg ctcggtagat ggccgaggaa acaagcagga tgcaacctcg 540
gagccttccg ggaccgagag ccacaagagt gcgggagcag ataacgacgc aggcggtgac 600
atagcggaga agtcctga 618
<210> 24
<211> 205
<212> PRT
<213> Oryza sativa
<400> 24
Met Gln Gln Gln Met Ala Met Pro Ala Gly Ala Ala Ala Ala Ala Val
1 5 10 15
Pro Pro Ala Ala Gly Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp
20 25 30
Glu Asn Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn Leu Gly
35 40 45
Lys Leu Ala Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu
50 55 60
Leu Tyr Leu Ala Ala Ile Ala Asp Ala Gln Pro Pro Gln Asn Pro Gly
65 70 75 80
Ser Arg Pro Gln Met Met Gln Pro Gly Ala Thr Pro Gly Ala Gly His
85 90 95
Tyr Met Ser Gln Val Pro Met Phe Pro Pro Arg Thr Pro Leu Thr Pro
100 105 110
Gln Gln Met Gln Glu Gln Gln Gln Gln Gln Leu Gln Gln Gln Gln Ala
115 120 125
Gln Ala Leu Ala Phe Pro Gly Gln Met Leu Met Arg Pro Gly Thr Val
130 135 140
Asn Gly Met Gln Ser Ile Pro Val Ala Asp Pro Ala Arg Ala Ala Asp
145 150 155 160
Leu Gln Thr Ala Ala Pro Gly Ser Val Asp Gly Arg Gly Asn Lys Gln
165 170 175
Asp Ala Thr Ser Glu Pro Ser Gly Thr Glu Ser His Lys Ser Ala Gly
180 185 190
Ala Asp Asn Asp Ala Gly Gly Asp Ile Ala Glu Lys Ser
195 200 205
<210> 25
<211> 540
<212> DNA
<213> Solanum tuberosum
<400> 25
atgcagcagc agcacctgat gcagatgcag cccatgatgg cagcctatta tcccaacaat 60
gtcactactg atcatattca acagttcctg gatgagaaca aatcacttat tctgaagatt 120
gttgagagcc agaactctgg gaaaataagt gaatgtgcag agtcccaagc taaacttcag 180
agaaatctta tgtaccttgc agctattgct gattcacagc cccagcctcc tagtatgcat 240
tcacagttag cttctggtgg gatgatgcag ggaggggcac attatatgca gcaacaacaa 300
gctcaacaac tcacaacgca atcgcttatg gctgcagcaa gatcctcctc ctcaatgctc 360
tatggacaac aacaacaaca acaacaacaa caactatcat cattgcaaca acagcaagca 420
gcctttcata gccagcaact cggaatgagc agctctggtg gaggaagcag tagtggactt 480
cacatgctac aaagcgaaaa cactcatagt gctagcactg gtggtgggtg gtttccctga 540
<210> 26
<211> 179
<212> PRT
<213> Solanum tuberosum
<400> 26
Met Gln Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr
1 5 10 15
Tyr Pro Asn Asn Val Thr Thr Asp His Ile Gln Gln Phe Leu Asp Glu
20 25 30
Asn Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys
35 40 45
Ile Ser Glu Cys Ala Glu Ser Gln Ala Lys Leu Gln Arg Asn Leu Met
50 55 60
Tyr Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Pro Ser Met His
65 70 75 80
Ser Gln Leu Ala Ser Gly Gly Met Met Gln Gly Gly Ala His Tyr Met
85 90 95
Gln Gln Gln Gln Ala Gln Gln Leu Thr Thr Gln Ser Leu Met Ala Ala
100 105 110
Ala Arg Ser Ser Ser Ser Met Leu Tyr Gly Gln Gln Gln Gln Gln Gln
115 120 125
Gln Gln Gln Leu Ser Ser Leu Gln Gln Gln Gln Ala Ala Phe His Ser
130 135 140
Gln Gln Leu Gly Met Ser Ser Ser Gly Gly Gly Ser Ser Ser Gly Leu
145 150 155 160
His Met Leu Gln Ser Glu Asn Thr His Ser Ala Ser Thr Gly Gly Gly
165 170 175
Trp Phe Pro
<210> 27
<211> 684
<212> DNA
<213> Zea mays
<400> 27
atgcagcagc aacacctgat gcagatgaac cagaacatga tggggggcta cacctctcct 60
gccgccgtga ccaccgatct catccagcag cacctggacg agaacaagca gctgatcctg 120
gccatcctcg acaaccagaa caatggcaag gcggaggagt gcgaacggca ccaagctaag 180
ctccagcaca acctcatgta cctggccgcc atcgctgaca gccagccgcc acagaccgcg 240
ccactatcac agtacccgtc caacctgatg atgcagccgg gccctcggta catgccaccg 300
cagtccgggc agatgatgaa cccgcagtcg ctgatggcgg cgcggtcctc catgatgtac 360
gcgcacccgt ccctgtcgcc actccagcag cagcaggcgg cgcacggaca gctgggtatg 420
gctccagggg gcggcggtgg cggcacgacc agcgggttca gcatcctcca cggcgaggcc 480
agcatgggcg gtggtggtgc tggcgcaggc gccggcaaca acatgatgaa cgccggcatg 540
ttctcgggct ttggccgcag cggcagtggc gccaaggaag ggtcgacctc tctgtcggtt 600
gacgtccggg gtggaaccag ctccggcgcg cagagcgggg acggcgagta cctcaaagtc 660
ggcaccgagg aagaaggcag ttag 684
<210> 28
<211> 227
<212> PRT
<213> Zea mays
<400> 28
Met Gln Gln Gln His Leu Met Gln Met Asn Gln Asn Met Met Gly Gly
1 5 10 15
Tyr Thr Ser Pro Ala Ala Val Thr Thr Asp Leu Ile Gln Gln His Leu
20 25 30
Asp Glu Asn Lys Gln Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Asn
35 40 45
Gly Lys Ala Glu Glu Cys Glu Arg His Gln Ala Lys Leu Gln His Asn
50 55 60
Leu Met Tyr Leu Ala Ala Ile Ala Asp Ser Gln Pro Pro Gln Thr Ala
65 70 75 80
Pro Leu Ser Gln Tyr Pro Ser Asn Leu Met Met Gln Pro Gly Pro Arg
85 90 95
Tyr Met Pro Pro Gln Ser Gly Gln Met Met Asn Pro Gln Ser Leu Met
100 105 110
Ala Ala Arg Ser Ser Met Met Tyr Ala His Pro Ser Leu Ser Pro Leu
115 120 125
Gln Gln Gln Gln Ala Ala His Gly Gln Leu Gly Met Ala Pro Gly Gly
130 135 140
Gly Gly Gly Gly Thr Thr Ser Gly Phe Ser Ile Leu His Gly Glu Ala
145 150 155 160
Ser Met Gly Gly Gly Gly Ala Gly Ala Gly Ala Gly Asn Asn Met Met
165 170 175
Asn Ala Gly Met Phe Ser Gly Phe Gly Arg Ser Gly Ser Gly Ala Lys
180 185 190
Glu Gly Ser Thr Ser Leu Ser Val Asp Val Arg Gly Gly Thr Ser Ser
195 200 205
Gly Ala Gln Ser Gly Asp Gly Glu Tyr Leu Lys Val Gly Thr Glu Glu
210 215 220
Glu Gly Ser
225
<210> 29
<211> 549
<212> DNA
<213> Zea mays
<400> 29
atgcagcagc cgatgcacat gcagccacag gcgccggcga taaccccagc tgccggaatc 60
agcacggagc agatccaaaa gtatctggat gagaataagc agcttatttt ggctattttg 120
gaaaatcaga acctaggaaa attggcagaa tgtgctcagt atcaatcaca acttcagaag 180
aacctcttgt atctcgctgc aatcgcagat gctcaaccgc agactgctgt aagccgccct 240
cagatggcgc cgcctggtgg atcgcctgga gtagggcagt acatgtcaca ggtgcctatg 300
ttcccaccga ggacacctct tacaccccag cagatgcagg agcagcagct tcagcagcag 360
caggctcagt tgctaaactt cagtggccaa atggttgcta gaccaggcat ggtcaacggc 420
atggctcagt ccatgcaagc tcagctacca ccgggtgtga acaagcagga tgctggtggg 480
gtcgcctctg agccctcggg caccgagagc cacaggagca ctggtggtga cgatggtgga 540
agcgactag 549
<210> 30
<211> 182
<212> PRT
<213> Zea mays
<400> 30
Met Gln Gln Pro Met His Met Gln Pro Gln Ala Pro Ala Ile Thr Pro
1 5 10 15
Ala Ala Gly Ile Ser Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu Asn
20 25 30
Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn Leu Gly Lys Leu
35 40 45
Ala Glu Cys Ala Gln Tyr Gln Ser Gln Leu Gln Lys Asn Leu Leu Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ala Gln Pro Gln Thr Ala Val Ser Arg Pro
65 70 75 80
Gln Met Ala Pro Pro Gly Gly Ser Pro Gly Val Gly Gln Tyr Met Ser
85 90 95
Gln Val Pro Met Phe Pro Pro Arg Thr Pro Leu Thr Pro Gln Gln Met
100 105 110
Gln Glu Gln Gln Leu Gln Gln Gln Gln Ala Gln Leu Leu Asn Phe Ser
115 120 125
Gly Gln Met Val Ala Arg Pro Gly Met Val Asn Gly Met Ala Gln Ser
130 135 140
Met Gln Ala Gln Leu Pro Pro Gly Val Asn Lys Gln Asp Ala Gly Gly
145 150 155 160
Val Ala Ser Glu Pro Ser Gly Thr Glu Ser His Arg Ser Thr Gly Gly
165 170 175
Asp Asp Gly Gly Ser Asp
180
<210> 31
<211> 1173
<212> DNA
<213> Homo sapiens
<400> 31
atgggcggca acatgtctgt ggctttcgcg gccccgaggc agcgaggcaa gggggagatc 60
actcccgctg cgattcagaa gatgttggat gacaataacc atcttattca gtgtataatg 120
gactctcaga ataaaggaaa gacctcagag tgttctcagt atcagcagat gttgcacaca 180
aacttggtat accttgctac aatagcagat tctaatcaaa atatgcagtc tcttttacca 240
gcaccaccca cacagaatat gcctatgggt cctggaggga tgaatcagag cggccctccc 300
ccacctccac gctctcacaa catgccttca gatggaatgg taggtggggg tcctcctgca 360
ccgcacatgc agaaccagat gaacggccag atgcctgggc ctaaccatat gcctatgcag 420
ggacctggac ccaatcaact caatatgaca aacagttcca tgaatatgcc ttcaagtagc 480
catggatcca tgggaggtta caaccattct gtgccatcat cacagagcat gccagtacag 540
aatcagatga caatgagtca gggacaacca atgggaaact atggtcccag accaaatatg 600
agtatgcagc caaaccaagg tccaatgatg catcagcagc ctccttctca gcaatacaat 660
atgccacagg gaggcggaca gcattaccaa ggacagcagc cacctatggg aatgatgggt 720
caagttaacc aaggcaatca tatgatgggt cagagacaga ttcctcccta tagacctcct 780
caacagggcc caccacagca gtactcaggc caggaagact attacgggga ccaatacagt 840
catggtggac aaggtcctcc agaaggcatg aaccagcaat attaccctga tggaaattca 900
cagtatggcc aacagcaaga tgcataccag ggaccacctc cacaacaggg atatccaccc 960
cagcagcagc agtacccagg gcagcaaggt tacccaggac agcagcaggg ctacggtcct 1020
tcacagggtg gtccaggtcc tcagtatcct aactacccac agggacaagg tcagcagtat 1080
ggaggatata gaccaacaca gcctggacca ccacagccac cccagcagag gccttatgga 1140
tatgaccagg gacagtatgg aaattaccag cag 1173
<210> 32
<211> 391
<212> PRT
<213> Homo sapiens
<400> 32
Met Gly Gly Asn Met Ser Val Ala Phe Ala Ala Pro Arg Gln Arg Gly
1 5 10 15
Lys Gly Glu Ile Thr Pro Ala Ala Ile Gln Lys Met Leu Asp Asp Asn
20 25 30
Asn His Leu Ile Gln Cys Ile Met Asp Ser Gln Asn Lys Gly Lys Thr
35 40 45
Ser Glu Cys Ser Gln Tyr Gln Gln Met Leu His Thr Asn Leu Val Tyr
50 55 60
Leu Ala Thr Ile Ala Asp Ser Asn Gln Asn Met Gln Ser Leu Leu Pro
65 70 75 80
Ala Pro Pro Thr Gln Asn Met Pro Met Gly Pro Gly Gly Met Asn Gln
85 90 95
Ser Gly Pro Pro Pro Pro Pro Arg Ser His Asn Met Pro Ser Asp Gly
100 105 110
Met Val Gly Gly Gly Pro Pro Ala Pro His Met Gln Asn Gln Met Asn
115 120 125
Gly Gln Met Pro Gly Pro Asn His Met Pro Met Gln Gly Pro Gly Pro
130 135 140
Asn Gln Leu Asn Met Thr Asn Ser Ser Met Asn Met Pro Ser Ser Ser
145 150 155 160
His Gly Ser Met Gly Gly Tyr Asn His Ser Val Pro Ser Ser Gln Ser
165 170 175
Met Pro Val Gln Asn Gln Met Thr Met Ser Gln Gly Gln Pro Met Gly
180 185 190
Asn Tyr Gly Pro Arg Pro Asn Met Ser Met Gln Pro Asn Gln Gly Pro
195 200 205
Met Met His Gln Gln Pro Pro Ser Gln Gln Tyr Asn Met Pro Gln Gly
210 215 220
Gly Gly Gln His Tyr Gln Gly Gln Gln Pro Pro Met Gly Met Met Gly
225 230 235 240
Gln Val Asn Gln Gly Asn His Met Met Gly Gln Arg Gln Ile Pro Pro
245 250 255
Tyr Arg Pro Pro Gln Gln Gly Pro Pro Gln Gln Tyr Ser Gly Gln Glu
260 265 270
Asp Tyr Tyr Gly Asp Gln Tyr Ser His Gly Gly Gln Gly Pro Pro Glu
275 280 285
Gly Met Asn Gln Gln Tyr Tyr Pro Asp Gly Asn Ser Gln Tyr Gly Gln
290 295 300
Gln Gln Asp Ala Tyr Gln Gly Pro Pro Pro Gln Gln Gly Tyr Pro Pro
305 310 315 320
Gln Gln Gln Gln Tyr Pro Gly Gln Gln Gly Tyr Pro Gly Gln Gln Gln
325 330 335
Gly Tyr Gly Pro Ser Gln Gly Gly Pro Gly Pro Gln Tyr Pro Asn Tyr
340 345 350
Pro Gln Gly Gln Gly Gln Gln Tyr Gly Gly Tyr Arg Pro Thr Gln Pro
355 360 365
Gly Pro Pro Gln Pro Pro Gln Gln Arg Pro Tyr Gly Tyr Asp Gln Gly
370 375 380
Gln Tyr Gly Asn Tyr Gln Gln
385 390
<210> 33
<211> 627
<212> DNA
<213> Allium cepa
<400> 33
atgcagcagc cgcagccagc gatgggaacc atgggctcgg tgccacctac tagcatcacc 60
accgaacaga ttcaaaggta cttggatgag aacaaacagt taatattggc aattttggat 120
aatcaaaatt taggaagact gaatgagtgt gctcaatatc aagctcagct tcaaaagaat 180
ctgctttacc tggcagcaat agctgatgct cagcctcagt ctcctgcggt gcgtctgcag 240
atgatgcctc aaggtgcagc tgccacgcct caagctggaa accaatttat gcagcagcag 300
agccctaatt tccctcccaa aacaggaatg caatttactc ctcaacaagt acaagaattg 360
cagcagcaac agctacaaca tcagccacat atgatgcctc catttcaagg tcaaatgggt 420
atgagaccta tgaatggaat gcaggcagca atgcatgcag attcatctct tgcttataac 480
actaacaata agcaagatgc aggaaacgca gcttatgaaa atactgctgc caacacagat 540
ggttccattc aaaagaaaac agcaaatgat gatttagacc cttctgcagc aaaccctaga 600
aggtctgaag atgccaaatc atcatga 627
<210> 34
<211> 208
<212> PRT
<213> Allium cepa
<400> 34
Met Gln Gln Pro Gln Pro Ala Met Gly Thr Met Gly Ser Val Pro Pro
1 5 10 15
Thr Ser Ile Thr Thr Glu Gln Ile Gln Arg Tyr Leu Asp Glu Asn Lys
20 25 30
Gln Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Leu Gly Arg Leu Asn
35 40 45
Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu Leu Tyr Leu
50 55 60
Ala Ala Ile Ala Asp Ala Gln Pro Gln Ser Pro Ala Val Arg Leu Gln
65 70 75 80
Met Met Pro Gln Gly Ala Ala Ala Thr Pro Gln Ala Gly Asn Gln Phe
85 90 95
Met Gln Gln Gln Ser Pro Asn Phe Pro Pro Lys Thr Gly Met Gln Phe
100 105 110
Thr Pro Gln Gln Val Gln Glu Leu Gln Gln Gln Gln Leu Gln His Gln
115 120 125
Pro His Met Met Pro Pro Phe Gln Gly Gln Met Gly Met Arg Pro Met
130 135 140
Asn Gly Met Gln Ala Ala Met His Ala Asp Ser Ser Leu Ala Tyr Asn
145 150 155 160
Thr Asn Asn Lys Gln Asp Ala Gly Asn Ala Ala Tyr Glu Asn Thr Ala
165 170 175
Ala Asn Thr Asp Gly Ser Ile Gln Lys Lys Thr Ala Asn Asp Asp Leu
180 185 190
Asp Pro Ser Ala Ala Asn Pro Arg Arg Ser Glu Asp Ala Lys Ser Ser
195 200 205
<210> 35
<211> 633
<212> DNA
<213> Aquilegia formosa x Aquilegia pubescens
<400> 35
atgcaacaca tgcagatgca gcccatgatg ccaccttata gtgccaacag cgtcactact 60
gatcatatcc aacagtactt ggatgaaaat aaggcgttga ttctgaagat acttgagaac 120
caaaattcgg gaaaagttag tgaatgtgca gagaaccaag caagacttca acgaaatctt 180
atgtatctgg ctgcaattgc tgattctcaa ccacagcctc ccaatatgca tgctcagtac 240
tctaatgcgg gtataccacc tggtgcacat tacctacaac accaacaggc ccaacagatg 300
acacaacagt cgctcatggc tgctcgatca aatatgctgt atgctcagcc aatcacagga 360
atgcagcaac agcaagcaat gcatagccag cttggcatga gctctggtgg taacagtgga 420
ctccacatga tgcacaatga gggcagcatg ggaggtagtg gggcacttgg aagctattct 480
gattatggcc gtggcagtgg tggtggagta actatcgcta gcaaacaaga tggtggaagt 540
ggttctggtg aaggacgagg tggaaactct ggaggccaaa gtgcagatgg aggtgaatct 600
ctttacctga aaaacagtga cgaagggaac taa 633
<210> 36
<211> 210
<212> PRT
<213> Aquilegia formosa x Aquilegia pubescens
<400> 36
Met Gln His Met Gln Met Gln Pro Met Met Pro Pro Tyr Ser Ala Asn
1 5 10 15
Ser Val Thr Thr Asp His Ile Gln Gln Tyr Leu Asp Glu Asn Lys Ala
20 25 30
Leu Ile Leu Lys Ile Leu Glu Asn Gln Asn Ser Gly Lys Val Ser Glu
35 40 45
Cys Ala Glu Asn Gln Ala Arg Leu Gln Arg Asn Leu Met Tyr Leu Ala
50 55 60
Ala Ile Ala Asp Ser Gln Pro Gln Pro Pro Asn Met His Ala Gln Tyr
65 70 75 80
Ser Asn Ala Gly Ile Pro Pro Gly Ala His Tyr Leu Gln His Gln Gln
85 90 95
Ala Gln Gln Met Thr Gln Gln Ser Leu Met Ala Ala Arg Ser Asn Met
100 105 110
Leu Tyr Ala Gln Pro Ile Thr Gly Met Gln Gln Gln Gln Ala Met His
115 120 125
Ser Gln Leu Gly Met Ser Ser Gly Gly Asn Ser Gly Leu His Met Met
130 135 140
His Asn Glu Gly Ser Met Gly Gly Ser Gly Ala Leu Gly Ser Tyr Ser
145 150 155 160
Asp Tyr Gly Arg Gly Ser Gly Gly Gly Val Thr Ile Ala Ser Lys Gln
165 170 175
Asp Gly Gly Ser Gly Ser Gly Glu Gly Arg Gly Gly Asn Ser Gly Gly
180 185 190
Gln Ser Ala Asp Gly Gly Glu Ser Leu Tyr Leu Lys Asn Ser Asp Glu
195 200 205
Gly Asn
210
<210> 37
<211> 615
<212> DNA
<213> Brachypodium distachyon
<400> 37
atgcagcagg cgatgtccat gtccccgggg tcggccggcg cggtgccgcc tccggccggc 60
atcaccacag agcagatcca aaagtatttg gatgaaaata agcaacttat tttggccatc 120
ctggaaaatc agaacctagg aaagttgact gaatgtgctc agtatcaagc tcaacttcag 180
aagaatctct tgtatctggc tgccattgcg gatgcccaac caccacagaa ccctggaagt 240
cgcccccaga tggtgcagcc tggtggtatg ccaggtgcag ggcattacat gtcgcaagta 300
ccaatgttcc ctccaagaac ccctttaacc ccacaacaga tgcaagagca acagcaccag 360
cagcttcagc agcagcaagc acaggctctt gctttcccca gccagatggt catgagacca 420
ggtactgtga acggcatgca gcctatgcaa gctgatctcc aagcagcagc agcagcacct 480
ggcctggcag acagccgagg aagtaagcag gacgcagcgg tagctggggc catctcggaa 540
ccttctggca ccgagagtca caagagtaca ggagcggatc atgaggcagg tggcgatgta 600
gctgagcaat cctaa 615
<210> 38
<211> 204
<212> PRT
<213> Brachypodium distachyon
<400> 38
Met Gln Gln Ala Met Ser Met Ser Pro Gly Ser Ala Gly Ala Val Pro
1 5 10 15
Pro Pro Ala Gly Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu
20 25 30
Asn Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn Leu Gly Lys
35 40 45
Leu Thr Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu Leu
50 55 60
Tyr Leu Ala Ala Ile Ala Asp Ala Gln Pro Pro Gln Asn Pro Gly Ser
65 70 75 80
Arg Pro Gln Met Val Gln Pro Gly Gly Met Pro Gly Ala Gly His Tyr
85 90 95
Met Ser Gln Val Pro Met Phe Pro Pro Arg Thr Pro Leu Thr Pro Gln
100 105 110
Gln Met Gln Glu Gln Gln His Gln Gln Leu Gln Gln Gln Gln Ala Gln
115 120 125
Ala Leu Ala Phe Pro Ser Gln Met Val Met Arg Pro Gly Thr Val Asn
130 135 140
Gly Met Gln Pro Met Gln Ala Asp Leu Gln Ala Ala Ala Ala Ala Pro
145 150 155 160
Gly Leu Ala Asp Ser Arg Gly Ser Lys Gln Asp Ala Ala Val Ala Gly
165 170 175
Ala Ile Ser Glu Pro Ser Gly Thr Glu Ser His Lys Ser Thr Gly Ala
180 185 190
Asp His Glu Ala Gly Gly Asp Val Ala Glu Gln Ser
195 200
<210> 39
<211> 636
<212> DNA
<213> Brassica napus
<400> 39
atgcagcagc agcagcagca gcagcagcag cctccgcaaa tgtttccgat ggctccttcg 60
atgccgccaa ctaacatcac caccgaacag atccaaaagt accttgagga gaacaagaag 120
ctgataatgg caatcatgga aaatcagaat cttggcaagc ttgcagagtg tgcacagtac 180
caagctcttc tccagaagaa cttaatgtac ctcgctgcta ttgctgatgc tcaacctcct 240
ccatctaccg ctggagctac accaccacca gctatggctt cccagatggg ggcaccgcat 300
cctgggatgc aaccgccgag ctactttatg caacacccac aagcttcagg gatggctcaa 360
caagcaccac ccgctggtat cttccctccg agaggtcctt tgcagtttgg tagcccacac 420
cagcttcagg atccgcaaca gcagcatatg catcaacagg ctatgcaagg acacatgggg 480
atgcgaccaa tgggtatcaa caacaacaat gggatgcagc atcagatgca gcaacaacaa 540
ccagaaacct ctcttggagg aagcgctgca aacgtggggc ttagaggtgg aaagcaagat 600
ggagcagatg gacaaggaaa agatgatggc aaatga 636
<210> 40
<211> 203
<212> PRT
<213> Brassica napus
<400> 40
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Gly Tyr Tyr
1 5 10 15
Pro Ser Asn Val Thr Ser Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Ser Glu Cys Ala Glu Asn Gln Ala Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Pro Ser Val His Ser
65 70 75 80
Gln Tyr Gly Ser Ala Gly Gly Gly Leu Ile Gln Gly Glu Gly Ala Ser
85 90 95
His Tyr Leu Gln Gln Gln Gln Ala Thr Gln Gln Gln Gln Met Thr Gln
100 105 110
Gln Ser Leu Met Ala Ala Arg Ser Ser Met Met Tyr Gln Gln Gln Gln
115 120 125
Gln Pro Tyr Ala Thr Leu Gln His Gln Gln Leu His His Ser Gln Leu
130 135 140
Gly Met Ser Ser Ser Ser Gly Gly Gly Ser Ser Gly Leu His Ile Leu
145 150 155 160
Gln Gly Glu Ala Gly Gly Phe His Glu Phe Gly Arg Gly Lys Pro Glu
165 170 175
Met Gly Ser Gly Glu Gly Arg Gly Gly Ser Ser Gly Asp Gly Gly Glu
180 185 190
Thr Leu Tyr Leu Lys Ser Ser Asp Asp Gly Asn
195 200
<210> 41
<211> 636
<212> DNA
<213> Citrus sinensis
<400> 41
atgcagcagc caccgcaaat gatccctgtt atgccttcat ttccacccac caacatcacc 60
acagagcaga ttcaaaagta ccttgatgag aacaaaaagt tgattttggc aattttggac 120
aatcaaaatc ttggaaagct tacagaatgt gcccactatc aagctcagct tcaaaagaat 180
ttaatgtatt tagctgcaat tgctgatgca caaccacaag caccaacaat gcctcctcag 240
atggctccac atcctgcaat gcaagctagt gggtattaca tgcaacatcc tcaggcggca 300
gcaatggctc agcaacaagg aatctttccc caaaagatgc cattacaatt caataaccct 360
catcaactac aggatcctca acagcagcta caccaacatc aagccatgca agcacaaatg 420
ggaatgagac cgggtgccac taacaatggt atgcatccca tgcatgctga aagctctctt 480
ggaggtggca gcagtggagg acccccttca gcatcaggcc caggtgacat acgtggtgga 540
aataagcaag atgcctcgga ggctgggact actggtgctg atggccaggg cagttcggct 600
ggtgggcatg gtggggatgg agaggaggca aagtga 636
<210> 42
<211> 211
<212> PRT
<213> Citrus sinensis
<400> 42
Met Gln Gln Pro Pro Gln Met Ile Pro Val Met Pro Ser Phe Pro Pro
1 5 10 15
Thr Asn Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu Asn Lys
20 25 30
Lys Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Leu Gly Lys Leu Thr
35 40 45
Glu Cys Ala His Tyr Gln Ala Gln Leu Gln Lys Asn Leu Met Tyr Leu
50 55 60
Ala Ala Ile Ala Asp Ala Gln Pro Gln Ala Pro Thr Met Pro Pro Gln
65 70 75 80
Met Ala Pro His Pro Ala Met Gln Ala Ser Gly Tyr Tyr Met Gln His
85 90 95
Pro Gln Ala Ala Ala Met Ala Gln Gln Gln Gly Ile Phe Pro Gln Lys
100 105 110
Met Pro Leu Gln Phe Asn Asn Pro His Gln Leu Gln Asp Pro Gln Gln
115 120 125
Gln Leu His Gln His Gln Ala Met Gln Ala Gln Met Gly Met Arg Pro
130 135 140
Gly Ala Thr Asn Asn Gly Met His Pro Met His Ala Glu Ser Ser Leu
145 150 155 160
Gly Gly Gly Ser Ser Gly Gly Pro Pro Ser Ala Ser Gly Pro Gly Asp
165 170 175
Ile Arg Gly Gly Asn Lys Gln Asp Ala Ser Glu Ala Gly Thr Thr Gly
180 185 190
Ala Asp Gly Gln Gly Ser Ser Ala Gly Gly His Gly Gly Asp Gly Glu
195 200 205
Glu Ala Lys
210
<210> 43
<211> 597
<212> DNA
<213> Euphorbia esula
<400> 43
atgcagcagc aaccgcagat gatgcctatg atgccttcat atccaccagc aaacattacc 60
acggagcaaa tccaaaagta tcttgatgaa aataaaaaat tgattttggc gatcttggat 120
aatcaaaatc ttggaaaact cgctgagtgt gcacagtatc aagccctgct gcaaaaaaat 180
ctgatgtatt tagccgcaat tgctgatgca caaccccaga ccccacccat gccacctcag 240
atgtccccac atccggctat gcaacaagga gcatattaca tgcaacatcc tcaggctgca 300
gcagcagcaa tggctcatca gtcgggtatt ttcccaccaa agatgtctcc gttacaattc 360
aataatcctc atcaaataca ggacccccag cagttacatc aagcagccct ccaagggcaa 420
atgggaatga ggcccatggg gcccaataac gggatgcatc cgatgcaccc cgaggcaaat 480
cttggaggat ctaatgatgg tcgtggagga aacaaacagg atgctccgga gacgggagca 540
tcgggaggtg atgggcaagg caattctggt ggtgatgggg ctgaagatgg gaaatga 597
<210> 44
<211> 198
<212> PRT
<213> Euphorbia esula
<400> 44
Met Gln Gln Gln Pro Gln Met Met Pro Met Met Pro Ser Tyr Pro Pro
1 5 10 15
Ala Asn Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu Asn Lys
20 25 30
Lys Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Leu Gly Lys Leu Ala
35 40 45
Glu Cys Ala Gln Tyr Gln Ala Leu Leu Gln Lys Asn Leu Met Tyr Leu
50 55 60
Ala Ala Ile Ala Asp Ala Gln Pro Gln Thr Pro Pro Met Pro Pro Gln
65 70 75 80
Met Ser Pro His Pro Ala Met Gln Gln Gly Ala Tyr Tyr Met Gln His
85 90 95
Pro Gln Ala Ala Ala Ala Ala Met Ala His Gln Ser Gly Ile Phe Pro
100 105 110
Pro Lys Met Ser Pro Leu Gln Phe Asn Asn Pro His Gln Ile Gln Asp
115 120 125
Pro Gln Gln Leu His Gln Ala Ala Leu Gln Gly Gln Met Gly Met Arg
130 135 140
Pro Met Gly Pro Asn Asn Gly Met His Pro Met His Pro Glu Ala Asn
145 150 155 160
Leu Gly Gly Ser Asn Asp Gly Arg Gly Gly Asn Lys Gln Asp Ala Pro
165 170 175
Glu Thr Gly Ala Ser Gly Gly Asp Gly Gln Gly Asn Ser Gly Gly Asp
180 185 190
Gly Ala Glu Asp Gly Lys
195
<210> 45
<211> 642
<212> DNA
<213> Glycine max
<400> 45
atgcagcaga caccgccaat gattcctatg atgccttctt tcccacctac gaacataacc 60
accgagcaga ttcaaaaata ccttgatgag aacaagaagc tgattctggc aatattggac 120
aatcaaaatc ttggaaaact tgcagaatgt gcccagtacc aagctcagct tcaaaagaat 180
ttgatgtatt tagctgcaat tgctgatgcc cagcctcaaa ccccggccat gcctccgcag 240
atggcaccgc accctgccat gcaaccagga ttctatatgc aacatcctca ggctgctgca 300
gcagcaatgg ctcagcagca gcaaggaatg ttcccccaga aaatgccatt gcaatttggc 360
aatccacatc aaatgcagga acaacaacag cagctacacc agcaggccat ccaaggtcaa 420
atgggactta gacctggaga tataaataat ggcatgcatc caatgcacag tgaggctgct 480
cttggaggtg gaaacagcgg tggtccacct tcggctactg gtccaaacga tgcacgtggt 540
ggaagcaagc aagatgcctc tgaggctgga acagctggtg gagacggcca aggcagctcc 600
gcggctgctc ataacagtgg agatggtgaa gaggcaaagt ga 642
<210> 46
<211> 213
<212> PRT
<213> Glycine max
<400> 46
Met Gln Gln Thr Pro Pro Met Ile Pro Met Met Pro Ser Phe Pro Pro
1 5 10 15
Thr Asn Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu Asn Lys
20 25 30
Lys Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Leu Gly Lys Leu Ala
35 40 45
Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu Met Tyr Leu
50 55 60
Ala Ala Ile Ala Asp Ala Gln Pro Gln Thr Pro Ala Met Pro Pro Gln
65 70 75 80
Met Ala Pro His Pro Ala Met Gln Pro Gly Phe Tyr Met Gln His Pro
85 90 95
Gln Ala Ala Ala Ala Ala Met Ala Gln Gln Gln Gln Gly Met Phe Pro
100 105 110
Gln Lys Met Pro Leu Gln Phe Gly Asn Pro His Gln Met Gln Glu Gln
115 120 125
Gln Gln Gln Leu His Gln Gln Ala Ile Gln Gly Gln Met Gly Leu Arg
130 135 140
Pro Gly Asp Ile Asn Asn Gly Met His Pro Met His Ser Glu Ala Ala
145 150 155 160
Leu Gly Gly Gly Asn Ser Gly Gly Pro Pro Ser Ala Thr Gly Pro Asn
165 170 175
Asp Ala Arg Gly Gly Ser Lys Gln Asp Ala Ser Glu Ala Gly Thr Ala
180 185 190
Gly Gly Asp Gly Gln Gly Ser Ser Ala Ala Ala His Asn Ser Gly Asp
195 200 205
Gly Glu Glu Ala Lys
210
<210> 47
<211> 633
<212> DNA
<213> Glycine soya
<400> 47
atgcagcaga caccgcctat gattcctatg atgccttcgt tcccacctac gaacataacc 60
accgagcaga ttcaaaaata ccttgatgag aacaagaagc tgattctggc aatattggac 120
aatcaaaatc ttggaaaact tgcagaatgt gcccagtacc aagctcagct tcaaaagaat 180
ttgatgtatt tagctgcaat tgctgatgcc cagcctcaaa caccagccat gcctccacag 240
atggcaccac accctgccat gcaaccagga ttctatatgc aacatcctca ggctgcagca 300
gcagcaatgg ctcagcagca gcagcaagga atgttccccc agaaaatgcc attgcaattt 360
ggcaatccac atcaaatgca ggaacaacag cagcagctac accagcaagc catccaaggt 420
caaatgggac tgagacctgg aggaataaat aatggcatgc atccaatgca caatgagggc 480
ggcaacagcg gtggtccacc ctcggctacc ggtccgaacg acgcacgtgg tggaagcaag 540
caagatgctt ctgaggctgg aacagctggt ggagatggcc aaggcagctc tgcagctgct 600
cataacagtg gagatggtga agaggcaaag tga 633
<210> 48
<211> 210
<212> PRT
<213> Glycine soya
<400> 48
Met Gln Gln Thr Pro Pro Met Ile Pro Met Met Pro Ser Phe Pro Pro
1 5 10 15
Thr Asn Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu Asn Lys
20 25 30
Lys Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Leu Gly Lys Leu Ala
35 40 45
Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu Met Tyr Leu
50 55 60
Ala Ala Ile Ala Asp Ala Gln Pro Gln Thr Pro Ala Met Pro Pro Gln
65 70 75 80
Met Ala Pro His Pro Ala Met Gln Pro Gly Phe Tyr Met Gln His Pro
85 90 95
Gln Ala Ala Ala Ala Ala Met Ala Gln Gln Gln Gln Gln Gly Met Phe
100 105 110
Pro Gln Lys Met Pro Leu Gln Phe Gly Asn Pro His Gln Met Gln Glu
115 120 125
Gln Gln Gln Gln Leu His Gln Gln Ala Ile Gln Gly Gln Met Gly Leu
130 135 140
Arg Pro Gly Gly Ile Asn Asn Gly Met His Pro Met His Asn Glu Gly
145 150 155 160
Gly Asn Ser Gly Gly Pro Pro Ser Ala Thr Gly Pro Asn Asp Ala Arg
165 170 175
Gly Gly Ser Lys Gln Asp Ala Ser Glu Ala Gly Thr Ala Gly Gly Asp
180 185 190
Gly Gln Gly Ser Ser Ala Ala Ala His Asn Ser Gly Asp Gly Glu Glu
195 200 205
Ala Lys
210
<210> 49
<211> 690
<212> DNA
<213> Gossypium hirsutum
<400> 49
atgcagcagc acctgatgca gatgcagccc atgatggcag cttattatcc caacaacgtc 60
actactgatc atattcaaca gtatctcgat gagaacaagt cattgatctt aaagattgtt 120
gagagccaga attctgggaa attgagtgaa tgtgctgaga accaagcaag gctgcagcga 180
aacctcatgt acctggctgc cattgcggat tctcaacccc aaccacccac cgtgcatgca 240
cagtttccat ctggtggtat catgcagcca ggagctgggc actacatgca gcaccaacaa 300
gctcaacaaa tgacacaaca gtcgcttatg gctgctcggt cctcaatgtt gtattctcag 360
caaccatttt ctgcactgca acaacaacag cagcaagctt tgcacagtca gcttggcatg 420
agctctggcg gaagcacagg ccttcatatg ctgcaaactg aatctagtac tgcaggtggc 480
agtggagcac ttggggccgg agggtttcct gattttggac gtggttcttc tggagaaggc 540
atccatggtg gcaggccaat ggcaggtgga agcaagcaag atatcgggag tgccggctca 600
gctgaaggtc gtggaggaag ctctggtggt cagggtggtg gtgatggggg tgaaaccctt 660
tacttaaaag cagccgatga tgggaactga 690
<210> 50
<211> 229
<212> PRT
<213> Gossypium hirsutum
<400> 50
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr Tyr
1 5 10 15
Pro Asn Asn Val Thr Thr Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Ser Glu Cys Ala Glu Asn Gln Ala Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Pro Thr Val His Ala
65 70 75 80
Gln Phe Pro Ser Gly Gly Ile Met Gln Pro Gly Ala Gly His Tyr Met
85 90 95
Gln His Gln Gln Ala Gln Gln Met Thr Gln Gln Ser Leu Met Ala Ala
100 105 110
Arg Ser Ser Met Leu Tyr Ser Gln Gln Pro Phe Ser Ala Leu Gln Gln
115 120 125
Gln Gln Gln Gln Ala Leu His Ser Gln Leu Gly Met Ser Ser Gly Gly
130 135 140
Ser Thr Gly Leu His Met Leu Gln Thr Glu Ser Ser Thr Ala Gly Gly
145 150 155 160
Ser Gly Ala Leu Gly Ala Gly Gly Phe Pro Asp Phe Gly Arg Gly Ser
165 170 175
Ser Gly Glu Gly Ile His Gly Gly Arg Pro Met Ala Gly Gly Ser Lys
180 185 190
Gln Asp Ile Gly Ser Ala Gly Ser Ala Glu Gly Arg Gly Gly Ser Ser
195 200 205
Gly Gly Gln Gly Gly Gly Asp Gly Gly Glu Thr Leu Tyr Leu Lys Ala
210 215 220
Ala Asp Asp Gly Asn
225
<210> 51
<211> 642
<212> DNA
<213> Gossypium hirsutum
<400> 51
atgccgcagc caccgcaaat gattcctgtg atgccttcat atccacctac taatatcact 60
actgaacaga ttcagaagta ccttgatgag aataagaagt tgattttggc aattttggac 120
aatcagaatc ttggaaaact cgctgaatgc gcccagtatc aagctcagct gcaaaagaat 180
ttgatgtatt tagctgcaat tgcggatgct caacctcaat caacgccagc aatgtcgcct 240
cagatggcac cgcatccagc aatgcaaccc ggaggatatt ttatgcaaca tcctcaagct 300
gctgcaatgt cacagcaacc tggcatgtac cctcaaaagg tgccattgca attcaatagt 360
ccgcatcaaa tgcaggaccc tcagcacctc ctatatcagc agcatcaaca agcaatgcaa 420
ggtcaaatgg gaatcaggcc tgggggaccc aataatagca tgcatcccat gcattcagag 480
gctagccttg gaggcggcag cagtggtggt ccccctcaac cttcaggccc aagtgatgga 540
cgtgctggaa acaagcaaga gggctccgaa gctggtggta atgggcaggg cagcacaact 600
ggtgggcatg gtggcggtga tggagcggat gaggcaaagt ga 642
<210> 52
<211> 213
<212> PRT
<213> Gossypium hirsutum
<400> 52
Met Pro Gln Pro Pro Gln Met Ile Pro Val Met Pro Ser Tyr Pro Pro
1 5 10 15
Thr Asn Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu Asn Lys
20 25 30
Lys Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Leu Gly Lys Leu Ala
35 40 45
Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu Met Tyr Leu
50 55 60
Ala Ala Ile Ala Asp Ala Gln Pro Gln Ser Thr Pro Ala Met Ser Pro
65 70 75 80
Gln Met Ala Pro His Pro Ala Met Gln Pro Gly Gly Tyr Phe Met Gln
85 90 95
His Pro Gln Ala Ala Ala Met Ser Gln Gln Pro Gly Met Tyr Pro Gln
100 105 110
Lys Val Pro Leu Gln Phe Asn Ser Pro His Gln Met Gln Asp Pro Gln
115 120 125
His Leu Leu Tyr Gln Gln His Gln Gln Ala Met Gln Gly Gln Met Gly
130 135 140
Ile Arg Pro Gly Gly Pro Asn Asn Ser Met His Pro Met His Ser Glu
145 150 155 160
Ala Ser Leu Gly Gly Gly Ser Ser Gly Gly Pro Pro Gln Pro Ser Gly
165 170 175
Pro Ser Asp Gly Arg Ala Gly Asn Lys Gln Glu Gly Ser Glu Ala Gly
180 185 190
Gly Asn Gly Gln Gly Ser Thr Thr Gly Gly His Gly Gly Gly Asp Gly
195 200 205
Ala Asp Glu Ala Lys
210
<210> 53
<211> 561
<212> DNA
<213> Hordeum vulgare
<400> 53
atgcagcaag cgatgcccat gccgccggcg gcggcggcgc ctgggatgcc tccttctgcc 60
ggcctcagca ccgagcagat ccaaaagtac ctggatgaaa ataaacaact aattttggct 120
atcttggaaa atcagaacct gggaaagttg gcggaatgtg ctcagtatca agctcagctt 180
cagaagaatc ttttgtattt ggctgcgatt gctgatactc agccacagac ctctgtaagc 240
cgtcctcaga tggcaccacc tgctgcatcc ccaggggcag ggcattacat gtcacaggtg 300
ccaatgttcc ctccgaggac ccctctaacg cctcagcaga tgcaggagca gcaactacag 360
caacaacagg ctcagatgct tccgtttgct ggtcaaatgg ttgcgagacc cggggctgtc 420
aatggcattc cccaggcccc tcaagttgaa caaccagcct atgcagcagg tggggccagt 480
tccgagcctt ctggcaccga gagccacagg agcactggcg ccgataacga tggtgggagc 540
ggcttggctg accagtccta a 561
<210> 54
<211> 186
<212> PRT
<213> Hordeum vulgare
<400> 54
Met Gln Gln Ala Met Pro Met Pro Pro Ala Ala Ala Ala Pro Gly Met
1 5 10 15
Pro Pro Ser Ala Gly Leu Ser Thr Glu Gln Ile Gln Lys Tyr Leu Asp
20 25 30
Glu Asn Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn Leu Gly
35 40 45
Lys Leu Ala Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu
50 55 60
Leu Tyr Leu Ala Ala Ile Ala Asp Thr Gln Pro Gln Thr Ser Val Ser
65 70 75 80
Arg Pro Gln Met Ala Pro Pro Ala Ala Ser Pro Gly Ala Gly His Tyr
85 90 95
Met Ser Gln Val Pro Met Phe Pro Pro Arg Thr Pro Leu Thr Pro Gln
100 105 110
Gln Met Gln Glu Gln Gln Leu Gln Gln Gln Gln Ala Gln Met Leu Pro
115 120 125
Phe Ala Gly Gln Met Val Ala Arg Pro Gly Ala Val Asn Gly Ile Pro
130 135 140
Gln Ala Pro Gln Val Glu Gln Pro Ala Tyr Ala Ala Gly Gly Ala Ser
145 150 155 160
Ser Glu Pro Ser Gly Thr Glu Ser His Arg Ser Thr Gly Ala Asp Asn
165 170 175
Asp Gly Gly Ser Gly Leu Ala Asp Gln Ser
180 185
<210> 55
<211> 555
<212> DNA
<213> Lactuca serriola
<220>
<221> misc_feature
<222> (253)..(253)
<223> n is a, c, g, or t
<400> 55
atgaagcagc cgatgatgcc gaatccaatg atgtcttctt cgtttcctcc tacaaacatc 60
accaccgatc agatccaaaa gttccttgat gaaaacaagc aactaattat agcaataatg 120
agcaacctaa atcttggaaa gcttgctgaa tgtgcccagt accaagctct actccaaaaa 180
aatttgatgt atctagcagc cattgcagat gctcaaccac ctacacctac accaacacta 240
aatatctctt atnagatggg cccggttcca catccaggga tgccacagca aggtggattt 300
tacatggcgc agcagcaccc tcaggcggct gtaatgacgg ctcagccacc ttctggtttt 360
ccacaaccga tgcctggtat gcaatttaac agcccacagg ctattcaagg gcagatgggc 420
gggaggtccg gtgggccgcc aagctcagcc gctagtgatg tctggagagg aagcatgcaa 480
gatggtggtg gtggtgctgc tgctgatggt ggtaaggatg gtcatgctgg cggtggacct 540
gaggaagcaa agtaa 555
<210> 56
<211> 184
<212> PRT
<213> Lactuca serriola
<220>
<221> misc_feature
<222> (85)..(85)
<223> Xaa can be any naturally occurring amino acid
<400> 56
Met Lys Gln Pro Met Met Pro Asn Pro Met Met Ser Ser Ser Phe Pro
1 5 10 15
Pro Thr Asn Ile Thr Thr Asp Gln Ile Gln Lys Phe Leu Asp Glu Asn
20 25 30
Lys Gln Leu Ile Ile Ala Ile Met Ser Asn Leu Asn Leu Gly Lys Leu
35 40 45
Ala Glu Cys Ala Gln Tyr Gln Ala Leu Leu Gln Lys Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ala Gln Pro Pro Thr Pro Thr Pro Thr Leu
65 70 75 80
Asn Ile Ser Tyr Xaa Met Gly Pro Val Pro His Pro Gly Met Pro Gln
85 90 95
Gln Gly Gly Phe Tyr Met Ala Gln Gln His Pro Gln Ala Ala Val Met
100 105 110
Thr Ala Gln Pro Pro Ser Gly Phe Pro Gln Pro Met Pro Gly Met Gln
115 120 125
Phe Asn Ser Pro Gln Ala Ile Gln Gly Gln Met Gly Gly Arg Ser Gly
130 135 140
Gly Pro Pro Ser Ser Ala Ala Ser Asp Val Trp Arg Gly Ser Met Gln
145 150 155 160
Asp Gly Gly Gly Gly Ala Ala Ala Asp Gly Gly Lys Asp Gly His Ala
165 170 175
Gly Gly Gly Pro Glu Glu Ala Lys
180
<210> 57
<211> 627
<212> DNA
<213> Lycopersicon esculentum
<400> 57
atgcagcagc acctgatgca gatgcagccc atgatggcag cttactatcc aacgaacgtc 60
actactgacc atattcaaca gtatttggat gaaaacaaat cactcattct gaagattgtt 120
gagagccaga actctgggaa actcagtgaa tgtgcggaga accaagctag gcttcagagg 180
aatctgatgt accttgctgc gattgctgat tcacaacctc aaccttctag catgcattct 240
cagttctctt ctggtgggat gatgcagcca gggacacaca gttacttgca gcagcagcag 300
cagcaacaac aagcgcaaca aatggcaaca caacaactca tggctgcaag atcctcgtcg 360
atgctctatg gacaacagca gcagcaatct cagttatcgc aatatcaaca aggcttgcat 420
agtagccaac tcggcatgag ttctggcagt ggcggaagca ctggacttca tcacatgctt 480
caaagtgaat catcacctca tggtggtggt ttctctcatg acttcggccg cgcaaataag 540
caagacattg ggagtagtat gtctgctgaa gggcgcggcg gaagttcagg tggtgagaat 600
ctttatctga aagcttctga ggattga 627
<210> 58
<211> 208
<212> PRT
<213> Lycopersicon esculentum
<400> 58
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr Tyr
1 5 10 15
Pro Thr Asn Val Thr Thr Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Ser Glu Cys Ala Glu Asn Gln Ala Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Ser Ser Met His Ser
65 70 75 80
Gln Phe Ser Ser Gly Gly Met Met Gln Pro Gly Thr His Ser Tyr Leu
85 90 95
Gln Gln Gln Gln Gln Gln Gln Gln Ala Gln Gln Met Ala Thr Gln Gln
100 105 110
Leu Met Ala Ala Arg Ser Ser Ser Met Leu Tyr Gly Gln Gln Gln Gln
115 120 125
Gln Ser Gln Leu Ser Gln Tyr Gln Gln Gly Leu His Ser Ser Gln Leu
130 135 140
Gly Met Ser Ser Gly Ser Gly Gly Ser Thr Gly Leu His His Met Leu
145 150 155 160
Gln Ser Glu Ser Ser Pro His Gly Gly Gly Phe Ser His Asp Phe Gly
165 170 175
Arg Ala Asn Lys Gln Asp Ile Gly Ser Ser Met Ser Ala Glu Gly Arg
180 185 190
Gly Gly Ser Ser Gly Gly Glu Asn Leu Tyr Leu Lys Ala Ser Glu Asp
195 200 205
<210> 59
<211> 624
<212> DNA
<213> Malus domestica
<400> 59
atgcagcagc caccacaaat gatccccgtc atgccttcat ttcctcccac caacatcacc 60
accgaacaaa ttcagaagta ccttgatgac aacaaaaagt tgattctggc aatattggat 120
aatcaaaatc ttggaaaact tgctgagtgt gctcagtacc aggctctgct tcaaaagaat 180
ctgatgtatt tagcagcaat tgccgatgcg caaccacagg caccagctgc ccctccccag 240
atggccccac atcctgctat gcaacaggca ggatattaca tgcaacatcc tcaggcagca 300
gcaatggctc agcaacaggg tattttctcc ccaaagatgc cgatgcaatt caataacatg 360
catcaaatgc acgatccaca gcagcaccaa caagccatgc aagggcaaat gggaatgaga 420
cctggagggc ctaacggcat gccttccatg cttcatactg aggccacaca tggtggtggt 480
agtggcggcc caaattcagc tggagaccca aatgatgggc gtggaggaag caagcaagac 540
gcctctgagt ctggggcagg tggtgatggc caggggacct cagccggcgg gcgtggaact 600
ggtgatggag aggacggcaa gtga 624
<210> 60
<211> 207
<212> PRT
<213> Malus domestica
<400> 60
Met Gln Gln Pro Pro Gln Met Ile Pro Val Met Pro Ser Phe Pro Pro
1 5 10 15
Thr Asn Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Asp Asn Lys
20 25 30
Lys Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Leu Gly Lys Leu Ala
35 40 45
Glu Cys Ala Gln Tyr Gln Ala Leu Leu Gln Lys Asn Leu Met Tyr Leu
50 55 60
Ala Ala Ile Ala Asp Ala Gln Pro Gln Ala Pro Ala Ala Pro Pro Gln
65 70 75 80
Met Ala Pro His Pro Ala Met Gln Gln Ala Gly Tyr Tyr Met Gln His
85 90 95
Pro Gln Ala Ala Ala Met Ala Gln Gln Gln Gly Ile Phe Ser Pro Lys
100 105 110
Met Pro Met Gln Phe Asn Asn Met His Gln Met His Asp Pro Gln Gln
115 120 125
His Gln Gln Ala Met Gln Gly Gln Met Gly Met Arg Pro Gly Gly Pro
130 135 140
Asn Gly Met Pro Ser Met Leu His Thr Glu Ala Thr His Gly Gly Gly
145 150 155 160
Ser Gly Gly Pro Asn Ser Ala Gly Asp Pro Asn Asp Gly Arg Gly Gly
165 170 175
Ser Lys Gln Asp Ala Ser Glu Ser Gly Ala Gly Gly Asp Gly Gln Gly
180 185 190
Thr Ser Ala Gly Gly Arg Gly Thr Gly Asp Gly Glu Asp Gly Lys
195 200 205
<210> 61
<211> 639
<212> DNA
<213> Medicago trunculata
<400> 61
atgcagcaga cacctcaaat gattcctatg atgccttcat tcccacaaca aacaaacata 60
accactgagc agattcaaaa atatcttgat gagaacaaga agctgatcct ggcaatattg 120
gacaatcaaa atcttggaaa acttgcagaa tgtgcccagt accaagctca gcttcagaag 180
aatttgatgt atttagctgc aattgctgac gcgcagccac aaacaccggc cttgcctcca 240
cagatggccc cgcaccctgc gatgcaacaa ggattctata tgcaacatcc tcaggctgca 300
gcaatggctc agcaacaagg aatgttcccc caaaaaatgc caatgcagtt cggtaatccg 360
catcaaatgc aggatcagca gcatcagcag caacaacagc agctacatca gcaagctatg 420
caaggtcaaa tgggacttag acctggaggg ataaataacg gcatgcatcc aatgcacaac 480
gaggctgctc tcggaggtag cggcagtggt ggtcaaatga cgggcgtggt ggtggagcaa 540
gcaagatgct tcggagctgg gacagccggc ggtgatggtc aaggaacctc tgccgcagct 600
gcgcacaaca gtggagatgc ttcagaagaa ggaaagtaa 639
<210> 62
<211> 213
<212> PRT
<213> Medicago trunculata
<400> 62
Met Gln Gln Thr Pro Gln Met Ile Pro Met Met Pro Ser Phe Pro Gln
1 5 10 15
Gln Thr Asn Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu Asn
20 25 30
Lys Lys Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Leu Gly Lys Leu
35 40 45
Ala Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ala Gln Pro Gln Thr Pro Ala Leu Pro Pro
65 70 75 80
Gln Met Ala Pro His Pro Ala Met Gln Gln Gly Phe Tyr Met Gln His
85 90 95
Pro Gln Ala Ala Ala Met Ala Gln Gln Gln Gly Met Phe Pro Gln Lys
100 105 110
Met Pro Met Gln Phe Gly Asn Pro His Gln Met Gln Asp Gln Gln His
115 120 125
Gln Gln Gln Gln Gln Gln Leu His Gln Gln Ala Met Gln Gly Gln Met
130 135 140
Gly Leu Arg Pro Gly Gly Ile Asn Asn Gly Met His Pro Met His Asn
145 150 155 160
Glu Ala Ala Leu Gly Gly Ser Gly Ser Gly Gly Pro Asn Asp Gly Arg
165 170 175
Gly Gly Gly Ser Lys Gln Asp Ala Ser Glu Ala Gly Thr Ala Gly Gly
180 185 190
Asp Gly Gln Gly Thr Ser Ala Ala Ala Ala His Asn Ser Gly Asp Ala
195 200 205
Ser Glu Glu Gly Lys
210
<210> 63
<211> 624
<212> DNA
<213> Panicum virgatum
<400> 63
atgcagcagc agatgcccat gcagtcggcg cccccggcga ccggcatcac caccgagcag 60
atccaaaagt atttggatga aaataagcag cttattttgg ccatcctgga aaatcagaac 120
ttaggaaagt tggctgaatg tgctcagtat caagctcagc ttcaaaagaa tctcttgtac 180
ctggctgcga ttgcagatgc ccaaccccaa ccaccacaga accctgcaag tcgcccacag 240
atgatgcaac ctggcatggt accaggtgca gggcattaca tgtcccaagt accaatgttc 300
ccgccaagaa caccattaac cccgcaacag atgcaagaac agcagcagca gcagcagcag 360
cttcaacagc agcaagcaca ggctcttgct ttcccgggac agatggtcat gagacctacc 420
attaatggca tgcagcctat gcaagccgac cctgctgccg ccgccgccag cctacagcag 480
tcagcacctg gccctactga tgggcgagga ggcaagcaag atgcaactgc tggggtgagc 540
acagagcctt ctggcaccga gagccacaag agcacaaccg cagcagatca cgatgtgggc 600
actgatgtcg cggagaaatc ctaa 624
<210> 64
<211> 207
<212> PRT
<213> Panicum virgatum
<400> 64
Met Gln Gln Gln Met Pro Met Gln Ser Ala Pro Pro Ala Thr Gly Ile
1 5 10 15
Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu Asn Lys Gln Leu Ile
20 25 30
Leu Ala Ile Leu Glu Asn Gln Asn Leu Gly Lys Leu Ala Glu Cys Ala
35 40 45
Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu Leu Tyr Leu Ala Ala Ile
50 55 60
Ala Asp Ala Gln Pro Gln Pro Pro Gln Asn Pro Ala Ser Arg Pro Gln
65 70 75 80
Met Met Gln Pro Gly Met Val Pro Gly Ala Gly His Tyr Met Ser Gln
85 90 95
Val Pro Met Phe Pro Pro Arg Thr Pro Leu Thr Pro Gln Gln Met Gln
100 105 110
Glu Gln Gln Gln Gln Gln Gln Gln Leu Gln Gln Gln Gln Ala Gln Ala
115 120 125
Leu Ala Phe Pro Gly Gln Met Val Met Arg Pro Thr Ile Asn Gly Met
130 135 140
Gln Pro Met Gln Ala Asp Pro Ala Ala Ala Ala Ala Ser Leu Gln Gln
145 150 155 160
Ser Ala Pro Gly Pro Thr Asp Gly Arg Gly Gly Lys Gln Asp Ala Thr
165 170 175
Ala Gly Val Ser Thr Glu Pro Ser Gly Thr Glu Ser His Lys Ser Thr
180 185 190
Thr Ala Ala Asp His Asp Val Gly Thr Asp Val Ala Glu Lys Ser
195 200 205
<210> 65
<211> 747
<212> DNA
<213> Picea sitchensis
<400> 65
atgcagcagc atctcatgca aatgcagccc atgatggcgg catacgcctc caacaacatc 60
accactgatc acatccagaa gtacctggat gagaacaagc agttgattct ggcaattctg 120
gacaaccaaa atcttggaaa gctcaatgag tgtgctcagt accaagcaaa acttcagcag 180
aatttgatgt atctggctgc gattgctgat tctcaaccac aagcacaaac tgcacatgct 240
cagattcctc ctaatgcagt gatgcagtct ggtgggcatt acatgcagca ccagcaggca 300
cagcaacaag tgactcctca gtctctgatg gcagctagat cttccatgct gtattctcag 360
cagccgatgg ctgctttgca tcaagctcag caacaacagc agcagcagca tcagcagcaa 420
caacaatctc ttcacagcca gcttggcata aattctggag gaagcagtgg attgcatatg 480
ttgcatggtg agacaaacat gggatgtaat gggcctctct catctggggg cttccctgaa 540
tttgggcgtg ggtctgctac ctctgctgaa ggtatgcagg ccaacagggg cttcactata 600
gatcgtggtt caaataagca ggatggagta ggatcagaga atgcccatcc aggtgctggt 660
gatggaagag ggagttcaac tggagggcag aatgcagatg agtcagaacc atcatacctg 720
aaagcctccg aagaagaagg aaactag 747
<210> 66
<211> 248
<212> PRT
<213> Picea sitchensis
<400> 66
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr Ala
1 5 10 15
Ser Asn Asn Ile Thr Thr Asp His Ile Gln Lys Tyr Leu Asp Glu Asn
20 25 30
Lys Gln Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Leu Gly Lys Leu
35 40 45
Asn Glu Cys Ala Gln Tyr Gln Ala Lys Leu Gln Gln Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Ala Gln Thr Ala His Ala
65 70 75 80
Gln Ile Pro Pro Asn Ala Val Met Gln Ser Gly Gly His Tyr Met Gln
85 90 95
His Gln Gln Ala Gln Gln Gln Val Thr Pro Gln Ser Leu Met Ala Ala
100 105 110
Arg Ser Ser Met Leu Tyr Ser Gln Gln Pro Met Ala Ala Leu His Gln
115 120 125
Ala Gln Gln Gln Gln Gln Gln Gln His Gln Gln Gln Gln Gln Ser Leu
130 135 140
His Ser Gln Leu Gly Ile Asn Ser Gly Gly Ser Ser Gly Leu His Met
145 150 155 160
Leu His Gly Glu Thr Asn Met Gly Cys Asn Gly Pro Leu Ser Ser Gly
165 170 175
Gly Phe Pro Glu Phe Gly Arg Gly Ser Ala Thr Ser Ala Glu Gly Met
180 185 190
Gln Ala Asn Arg Gly Phe Thr Ile Asp Arg Gly Ser Asn Lys Gln Asp
195 200 205
Gly Val Gly Ser Glu Asn Ala His Pro Gly Ala Gly Asp Gly Arg Gly
210 215 220
Ser Ser Thr Gly Gly Gln Asn Ala Asp Glu Ser Glu Pro Ser Tyr Leu
225 230 235 240
Lys Ala Ser Glu Glu Glu Gly Asn
245
<210> 67
<211> 735
<212> DNA
<213> Pinus taeda
<400> 67
atgcagcagc acctcatgca aatgcagccc atgatggcgg cctacgcctc caacaatatc 60
accactgatc acatccagaa gtacctggat gagaacaagc agttgattct ggcaattttg 120
gacaaccaaa atctcggaaa gctcaatgag tgtgctcaat accaagcaaa acttcagcag 180
aatttgatgt atctggctgc tattgctgat tctcaacctc aagcacaaac tgcacatgct 240
cagattcctc caaatgcggt gatgcagtct ggtgggcatt acatgcagca tcaacaggca 300
cagcaacaag ttactcctca gtctctgatg gcagctagat cttccatact gtatgctcag 360
caacaacagc agcagcagca tcagcagcat cagcagcaac agcagcaaca acagtctctt 420
cacagccagc ttggcataaa ttctggagga agcagcggtt tgcatatgtt gcatggtgag 480
acaaacatgg gatgtaatgg gcctctgtca tctgggggat tccctgaatt tgggcgtggg 540
tctgctacct ctgctgatgg tatgcaggtg aacaggggct ttgctataga tcgtggttca 600
aacaagcagg atggagttgg atcagagaat gcccatgctg gtgctggtga tggaagaggg 660
agttcaactg gagggcagaa tgcagatgag tcagaaccat catacctgaa ggcctccgag 720
gaagaaggaa actag 735
<210> 68
<211> 244
<212> PRT
<213> Pinus taeda
<400> 68
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr Ala
1 5 10 15
Ser Asn Asn Ile Thr Thr Asp His Ile Gln Lys Tyr Leu Asp Glu Asn
20 25 30
Lys Gln Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Leu Gly Lys Leu
35 40 45
Asn Glu Cys Ala Gln Tyr Gln Ala Lys Leu Gln Gln Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Ala Gln Thr Ala His Ala
65 70 75 80
Gln Ile Pro Pro Asn Ala Val Met Gln Ser Gly Gly His Tyr Met Gln
85 90 95
His Gln Gln Ala Gln Gln Gln Val Thr Pro Gln Ser Leu Met Ala Ala
100 105 110
Arg Ser Ser Ile Leu Tyr Ala Gln Gln Gln Gln Gln Gln Gln His Gln
115 120 125
Gln His Gln Gln Gln Gln Gln Gln Gln Gln Ser Leu His Ser Gln Leu
130 135 140
Gly Ile Asn Ser Gly Gly Ser Ser Gly Leu His Met Leu His Gly Glu
145 150 155 160
Thr Asn Met Gly Cys Asn Gly Pro Leu Ser Ser Gly Gly Phe Pro Glu
165 170 175
Phe Gly Arg Gly Ser Ala Thr Ser Ala Asp Gly Met Gln Val Asn Arg
180 185 190
Gly Phe Ala Ile Asp Arg Gly Ser Asn Lys Gln Asp Gly Val Gly Ser
195 200 205
Glu Asn Ala His Ala Gly Ala Gly Asp Gly Arg Gly Ser Ser Thr Gly
210 215 220
Gly Gln Asn Ala Asp Glu Ser Glu Pro Ser Tyr Leu Lys Ala Ser Glu
225 230 235 240
Glu Glu Gly Asn
<210> 69
<211> 663
<212> DNA
<213> Populus tremula
<400> 69
atgcaacagc acctgatgca gatgcagccc atgatggcag cctattaccc cagcaacgtc 60
actactgatc atattcaaca gtatctggac gaaaacaagt cattgatttt gaagattgtt 120
gagagccaga attcagggaa actcagtgag tgtgcagaga accaagcaag actgcaacaa 180
aatctcatgt acttggctgc aattgctgat tgtcagcccc aaccacctac catgcatgcc 240
cagttccctt ccagcggcat tatgcagcca ggagcacatt acatgcagca tcaacaagct 300
caacagatga caccacaagc ccttatggct gcacgctctt ctatgctgca gtatgctcaa 360
cagccattct cagcgcttca acaacagcaa gccttacaca gccagctcgg catgagctct 420
ggtggaagcg caggacttca tatgatgcaa agcgaggcta acactgcagg aggcagtgga 480
gctcttggtg ctggacgatt tcctgatttt ggcatggatg cctccagtag aggaatcgca 540
agtgggagca agcaagatat tcggagtgca gggtctagtg aagggcgagg aggaagctct 600
ggaggccagg gtggtgatgg aggtgaaacc ctttacttga aatctgctga tgatgggaac 660
tga 663
<210> 70
<211> 220
<212> PRT
<213> Populus tremula
<400> 70
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr Tyr
1 5 10 15
Pro Ser Asn Val Thr Thr Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Ser Glu Cys Ala Glu Asn Gln Ala Arg Leu Gln Gln Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Cys Gln Pro Gln Pro Pro Thr Met His Ala
65 70 75 80
Gln Phe Pro Ser Ser Gly Ile Met Gln Pro Gly Ala His Tyr Met Gln
85 90 95
His Gln Gln Ala Gln Gln Met Thr Pro Gln Ala Leu Met Ala Ala Arg
100 105 110
Ser Ser Met Leu Gln Tyr Ala Gln Gln Pro Phe Ser Ala Leu Gln Gln
115 120 125
Gln Gln Ala Leu His Ser Gln Leu Gly Met Ser Ser Gly Gly Ser Ala
130 135 140
Gly Leu His Met Met Gln Ser Glu Ala Asn Thr Ala Gly Gly Ser Gly
145 150 155 160
Ala Leu Gly Ala Gly Arg Phe Pro Asp Phe Gly Met Asp Ala Ser Ser
165 170 175
Arg Gly Ile Ala Ser Gly Ser Lys Gln Asp Ile Arg Ser Ala Gly Ser
180 185 190
Ser Glu Gly Arg Gly Gly Ser Ser Gly Gly Gln Gly Gly Asp Gly Gly
195 200 205
Glu Thr Leu Tyr Leu Lys Ser Ala Asp Asp Gly Asn
210 215 220
<210> 71
<211> 678
<212> DNA
<213> Saccharum officinarum
<400> 71
atgcagcagc aacacctgat gcagatgaac cagaacatga ttgggggcta cacctctcct 60
gccgctgtga caaccgatct catccagcag tacctggatg agaacaagca gctgatcctg 120
gccatcctcg acaaccagaa caatggcaag gtggaggagt gcgaacggca ccaagctaag 180
ctccagcaca acctcatgta cctggccgcc atcgccgaca gccagccacc acagactgca 240
ccactatcac aatacccgtc caacctgatg atgcagccgg gccctcggta catgccaccg 300
cagtccgggc agatgatgag cccgcagtcg ctaatggcgg cgcggtcctc catgatgtac 360
gcgcacccgt ccatgtcacc actccagcag cagcaggcag cgcacgggca gctgggcatg 420
gcttcagggg gcggcggtgg cacgaccagt gggttcaaca tcctccatgg cgaggccagt 480
atgggcggtg ctggtggcgc ttgtgccggc aacaacatga tgaacgccgg catgttctca 540
ggctttggcc gcagcggcag tggcgccaag gagggatcga cctcgctgtc ggttgacgtc 600
cgtggtggca ccagctccgg cgcgcaaagc ggggacggcg agtacctgaa agcaggcacc 660
gaggaagaag gcagttaa 678
<210> 72
<211> 225
<212> PRT
<213> Saccharum officinarum
<400> 72
Met Gln Gln Gln His Leu Met Gln Met Asn Gln Asn Met Ile Gly Gly
1 5 10 15
Tyr Thr Ser Pro Ala Ala Val Thr Thr Asp Leu Ile Gln Gln Tyr Leu
20 25 30
Asp Glu Asn Lys Gln Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Asn
35 40 45
Gly Lys Val Glu Glu Cys Glu Arg His Gln Ala Lys Leu Gln His Asn
50 55 60
Leu Met Tyr Leu Ala Ala Ile Ala Asp Ser Gln Pro Pro Gln Thr Ala
65 70 75 80
Pro Leu Ser Gln Tyr Pro Ser Asn Leu Met Met Gln Pro Gly Pro Arg
85 90 95
Tyr Met Pro Pro Gln Ser Gly Gln Met Met Ser Pro Gln Ser Leu Met
100 105 110
Ala Ala Arg Ser Ser Met Met Tyr Ala His Pro Ser Met Ser Pro Leu
115 120 125
Gln Gln Gln Gln Ala Ala His Gly Gln Leu Gly Met Ala Ser Gly Gly
130 135 140
Gly Gly Gly Thr Thr Ser Gly Phe Asn Ile Leu His Gly Glu Ala Ser
145 150 155 160
Met Gly Gly Ala Gly Gly Ala Cys Ala Gly Asn Asn Met Met Asn Ala
165 170 175
Gly Met Phe Ser Gly Phe Gly Arg Ser Gly Ser Gly Ala Lys Glu Gly
180 185 190
Ser Thr Ser Leu Ser Val Asp Val Arg Gly Gly Thr Ser Ser Gly Ala
195 200 205
Gln Ser Gly Asp Gly Glu Tyr Leu Lys Ala Gly Thr Glu Glu Glu Gly
210 215 220
Ser
225
<210> 73
<211> 561
<212> DNA
<213> Saccharum officinarum
<400> 73
atgcagcagc cgatgcccat gcagccgcag gcgccggaga tgaccccggc cgccggaatc 60
accacggagc agatccaaaa gtatctggat gagaataagc agcttatttt ggctattttg 120
gaaaatcaga acctaggaaa attggcagaa tgtgctcagt atcaatcaca acttcagaag 180
aacctcttgt atctcgctgc aatcgcagat gcccaaccac agactgctgt aagccgccct 240
cagatggcgc cgcctggtgc attgcctgga gtagggcagt acatgtcaca ggtgcctatg 300
ttcccaccga ggacacctct aacaccccag cagatgcagg agcagcaact tcagcagcag 360
caggctcagc tgctaaattt cagtggccta atggttgcta gacctggcat ggtcaacggc 420
atgcctcagt ccattcaagt tcagcaagct cagccaccac cagcagggaa caaacaggat 480
gctggtgggg tcgcctcgga gccctcgggc attgagaacc acaggagcac tggtggtgat 540
aatgatggtg gaagcgacta g 561
<210> 74
<211> 186
<212> PRT
<213> Saccharum officinarum
<400> 74
Met Gln Gln Pro Met Pro Met Gln Pro Gln Ala Pro Glu Met Thr Pro
1 5 10 15
Ala Ala Gly Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu Asn
20 25 30
Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn Leu Gly Lys Leu
35 40 45
Ala Glu Cys Ala Gln Tyr Gln Ser Gln Leu Gln Lys Asn Leu Leu Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ala Gln Pro Gln Thr Ala Val Ser Arg Pro
65 70 75 80
Gln Met Ala Pro Pro Gly Ala Leu Pro Gly Val Gly Gln Tyr Met Ser
85 90 95
Gln Val Pro Met Phe Pro Pro Arg Thr Pro Leu Thr Pro Gln Gln Met
100 105 110
Gln Glu Gln Gln Leu Gln Gln Gln Gln Ala Gln Leu Leu Asn Phe Ser
115 120 125
Gly Leu Met Val Ala Arg Pro Gly Met Val Asn Gly Met Pro Gln Ser
130 135 140
Ile Gln Val Gln Gln Ala Gln Pro Pro Pro Ala Gly Asn Lys Gln Asp
145 150 155 160
Ala Gly Gly Val Ala Ser Glu Pro Ser Gly Ile Glu Asn His Arg Ser
165 170 175
Thr Gly Gly Asp Asn Asp Gly Gly Ser Asp
180 185
<210> 75
<211> 642
<212> DNA
<213> Saccharum officinarum
<400> 75
atgcagcagc agatgcccat gccgccggcg cccgctgcgg cggcggcgcc cccggcggcc 60
ggcatcacca ccgagcagat ccaaaagtat ttggacgaaa ataagcaact tattttggcc 120
atcctggaaa atcagaactt aggaaagttg gctgaatgtg ctcagtatca agctcaactt 180
caaaagaacc tcttgtacct ggctgcgatt gctgatgccc aaccccagcc accacaaaac 240
cctgcaggtc gccctcagat gatgcaacct ggtatagtgc caggtgcggg gcattacatg 300
tcacaagtac caatgttccc tccaagaact ccattaaccc cacagcagat gcaagagcag 360
cagcagcaac agcttcagca gcagcaagcg caggctctta cattccctgg acagatggtc 420
atgagaccag ctaccatcaa cggcatacag cagcctatgc aagctgaccc tgcccgggca 480
gcggagctgc aacaaccacc acctatccca gctgacgggc gagtaagcaa gcagcaggac 540
acaacggctg gcgtgagctc agagccttct gccaatgaga gccacaagac cacaactgga 600
gcagatagtg aggcaggtgg tgacgtggcg gagaaatcct aa 642
<210> 76
<211> 213
<212> PRT
<213> Saccharum officinarum
<400> 76
Met Gln Gln Gln Met Pro Met Pro Pro Ala Pro Ala Ala Ala Ala Ala
1 5 10 15
Pro Pro Ala Ala Gly Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp
20 25 30
Glu Asn Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn Leu Gly
35 40 45
Lys Leu Ala Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu
50 55 60
Leu Tyr Leu Ala Ala Ile Ala Asp Ala Gln Pro Gln Pro Pro Gln Asn
65 70 75 80
Pro Ala Gly Arg Pro Gln Met Met Gln Pro Gly Ile Val Pro Gly Ala
85 90 95
Gly His Tyr Met Ser Gln Val Pro Met Phe Pro Pro Arg Thr Pro Leu
100 105 110
Thr Pro Gln Gln Met Gln Glu Gln Gln Gln Gln Gln Leu Gln Gln Gln
115 120 125
Gln Ala Gln Ala Leu Thr Phe Pro Gly Gln Met Val Met Arg Pro Ala
130 135 140
Thr Ile Asn Gly Ile Gln Gln Pro Met Gln Ala Asp Pro Ala Arg Ala
145 150 155 160
Ala Glu Leu Gln Gln Pro Pro Pro Ile Pro Ala Asp Gly Arg Val Ser
165 170 175
Lys Gln Gln Asp Thr Thr Ala Gly Val Ser Ser Glu Pro Ser Ala Asn
180 185 190
Glu Ser His Lys Thr Thr Thr Gly Ala Asp Ser Glu Ala Gly Gly Asp
195 200 205
Val Ala Glu Lys Ser
210
<210> 77
<211> 645
<212> DNA
<213> Solanum tuberosum
<400> 77
atgcagcagc acctgatgca gatgcagccc atgatggcag cttactatcc aacgaacgtc 60
actactgacc atattcaaca gtatttggat gagaacaaat cactcattct gaaaattgtt 120
gagagccaaa actcgggaaa actcagtgaa tgtgcagaga accaagctag gcttcagagg 180
aatctgatgt accttgctgc tattgctgat tcacaacctc agccttctag catgcattct 240
cagttctctt ctggtgggat gatgcagcca gggacacaca gttacctgca gcagcagcag 300
cagcaacaac aagcgcaaca aatggcaaca caacaactca tggctgcaag atcctcatca 360
atgctctatg gacaacaaca gcagcagcag cagcagtctc agttatcaca atttcaacaa 420
ggcttgcata gtagccaact tggcatgagt tctggcagtg gtggaagcac tggacttcat 480
cacatgcttc aaagtgaatc atcacctcat ggtggtggtt tctctcatga cttcggccgt 540
gcaaataagc aagacattgg gagtagtatg tctgctgaag ggcgcggcgg aagctcaggt 600
ggtgatggtg gtgagaatct ttatctgaaa gcttctgagg attga 645
<210> 78
<211> 214
<212> PRT
<213> Solanum tuberosum
<400> 78
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr Tyr
1 5 10 15
Pro Thr Asn Val Thr Thr Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Ser Glu Cys Ala Glu Asn Gln Ala Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Ser Ser Met His Ser
65 70 75 80
Gln Phe Ser Ser Gly Gly Met Met Gln Pro Gly Thr His Ser Tyr Leu
85 90 95
Gln Gln Gln Gln Gln Gln Gln Gln Ala Gln Gln Met Ala Thr Gln Gln
100 105 110
Leu Met Ala Ala Arg Ser Ser Ser Met Leu Tyr Gly Gln Gln Gln Gln
115 120 125
Gln Gln Gln Gln Ser Gln Leu Ser Gln Phe Gln Gln Gly Leu His Ser
130 135 140
Ser Gln Leu Gly Met Ser Ser Gly Ser Gly Gly Ser Thr Gly Leu His
145 150 155 160
His Met Leu Gln Ser Glu Ser Ser Pro His Gly Gly Gly Phe Ser His
165 170 175
Asp Phe Gly Arg Ala Asn Lys Gln Asp Ile Gly Ser Ser Met Ser Ala
180 185 190
Glu Gly Arg Gly Gly Ser Ser Gly Gly Asp Gly Gly Glu Asn Leu Tyr
195 200 205
Leu Lys Ala Ser Glu Asp
210
<210> 79
<211> 645
<212> DNA
<213> Sorghum bicolor
<400> 79
atgcagcagc agatgcccat gccgccggcg cccgctgcgg cggcggcgac ggcgcccccg 60
gcggccggca tcaccaccga gcagatccag aagtatttgg acgaaaataa gcaacttatt 120
ttggccatcc tagaaaatca gaacttagga aagttggctg aatgtgctca gtatcaagct 180
caacttcaaa agaacctctt gtacctggct gcgattgctg atgcccaacc ccgaccaccg 240
caaaaccctg caggtcgccc tcagatgatg caacctggta tagtgccagg tgcagggcat 300
tacatgtcac aagtaccaat gttccctcca agaactccat taaccccaca gcaaatgcaa 360
gagcagcagc agcaacagct tcagcagcag caagcgcagg ctcttgcatt ccctgggcag 420
atggtcatga gaccagctac catcaacggc atgcagcagc ctatgcaggc tgaccctgcc 480
cgggcagcgg agctgcaaca gccagcatct gtcccagccg acgggcgagt aagcaagcag 540
gacacagcgg ctggggtgag ctcagagcct tctgccaatg agagccacaa gaccacaacc 600
ggagcagata gtgaggcagg tggagacgtg gcggagaaat cctaa 645
<210> 80
<211> 214
<212> PRT
<213> Sorghum bicolor
<400> 80
Met Gln Gln Gln Met Pro Met Pro Pro Ala Pro Ala Ala Ala Ala Ala
1 5 10 15
Thr Ala Pro Pro Ala Ala Gly Ile Thr Thr Glu Gln Ile Gln Lys Tyr
20 25 30
Leu Asp Glu Asn Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn
35 40 45
Leu Gly Lys Leu Ala Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys
50 55 60
Asn Leu Leu Tyr Leu Ala Ala Ile Ala Asp Ala Gln Pro Arg Pro Pro
65 70 75 80
Gln Asn Pro Ala Gly Arg Pro Gln Met Met Gln Pro Gly Ile Val Pro
85 90 95
Gly Ala Gly His Tyr Met Ser Gln Val Pro Met Phe Pro Pro Arg Thr
100 105 110
Pro Leu Thr Pro Gln Gln Met Gln Glu Gln Gln Gln Gln Gln Leu Gln
115 120 125
Gln Gln Gln Ala Gln Ala Leu Ala Phe Pro Gly Gln Met Val Met Arg
130 135 140
Pro Ala Thr Ile Asn Gly Met Gln Gln Pro Met Gln Ala Asp Pro Ala
145 150 155 160
Arg Ala Ala Glu Leu Gln Gln Pro Ala Ser Val Pro Ala Asp Gly Arg
165 170 175
Val Ser Lys Gln Asp Thr Ala Ala Gly Val Ser Ser Glu Pro Ser Ala
180 185 190
Asn Glu Ser His Lys Thr Thr Thr Gly Ala Asp Ser Glu Ala Gly Gly
195 200 205
Asp Val Ala Glu Lys Ser
210
<210> 81
<211> 558
<212> DNA
<213> Triticum aestivum
<400> 81
atgcagcaag cgatgcccat gccgccggcg gcggcggcgc cggggatgcc tccgtctgct 60
ggcctcagca ccgagcagat ccaaaagtac ctggatgaaa ataagcaact aattttggct 120
atcttggaaa atcagaacct gggaaagttg gcggaatgtg ctcagtatca agctcagctt 180
cagaagaatc ttttgtattt ggctgcaatc gctgatactc agccacagac cactgtaagc 240
cgtcctcaga tggcaccacc tagtgcatcc ccaggggcag ggcattacat gtcacaggtg 300
ccaatgttcc ctccgaggac ccctctaacg cctcagcaga tgcaggagca gcaactacag 360
cagcaacagg ctcagatgct tccgtttgct ggtcaaatgg ttgcgagacc tggggctgtc 420
aatggcatgc ctcaggcccc tcaagttgaa ccagcctatg cagcaggtgg ggccagttct 480
gagccttctg gcactgagag ccacaggagc actggtgccg ataatgacgg ggggagcggc 540
tgggctgatc agtcctaa 558
<210> 82
<211> 185
<212> PRT
<213> Triticum aestivum
<400> 82
Met Gln Gln Ala Met Pro Met Pro Pro Ala Ala Ala Ala Pro Gly Met
1 5 10 15
Pro Pro Ser Ala Gly Leu Ser Thr Glu Gln Ile Gln Lys Tyr Leu Asp
20 25 30
Glu Asn Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn Leu Gly
35 40 45
Lys Leu Ala Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu
50 55 60
Leu Tyr Leu Ala Ala Ile Ala Asp Thr Gln Pro Gln Thr Thr Val Ser
65 70 75 80
Arg Pro Gln Met Ala Pro Pro Ser Ala Ser Pro Gly Ala Gly His Tyr
85 90 95
Met Ser Gln Val Pro Met Phe Pro Pro Arg Thr Pro Leu Thr Pro Gln
100 105 110
Gln Met Gln Glu Gln Gln Leu Gln Gln Gln Gln Ala Gln Met Leu Pro
115 120 125
Phe Ala Gly Gln Met Val Ala Arg Pro Gly Ala Val Asn Gly Met Pro
130 135 140
Gln Ala Pro Gln Val Glu Pro Ala Tyr Ala Ala Gly Gly Ala Ser Ser
145 150 155 160
Glu Pro Ser Gly Thr Glu Ser His Arg Ser Thr Gly Ala Asp Asn Asp
165 170 175
Gly Gly Ser Gly Trp Ala Asp Gln Ser
180 185
<210> 83
<211> 603
<212> DNA
<213> Triticum aestivum
<400> 83
atgcagcagg cgatgtcctt gcccccggga gcggtcggcg cggtgtcctc gccggccggc 60
atcaccaccg agcagatcca aaagtatttg gatgaaaata agcaacttat tttggccatc 120
cttgaaaatc agaacctagg aaagttggct gaatgtgctc agtatcaagc tcaactccaa 180
aagaatctct tgtatctagc tgctatcgcg gatgcccaac caccacagaa ccctacaagt 240
caccctcaga tggtgcagcc tggtagtatg caaggtgcag ggcattacat gtcacaagta 300
ccaatgttcc ctccaagaac gcctttaacc ccacagcaga tgcaagagca gcagcaccag 360
cagcttcagc agcagcaagc ccaggccctt tctttccccg cccaggtggt catgagacca 420
ggcaccgtca acggcatgca gcagcctatg caagcagccg gcgacctcca gccagcagca 480
gcacctggag ggagcaagca ggacgccgca gtggctgggg ccagctcgga accatctggc 540
accaagagcc acaagaacgc gggagcagag gaggtgggcg ctgatgtagc agaacaatcc 600
taa 603
<210> 84
<211> 200
<212> PRT
<213> Triticum aestivum
<400> 84
Met Gln Gln Ala Met Ser Leu Pro Pro Gly Ala Val Gly Ala Val Ser
1 5 10 15
Ser Pro Ala Gly Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu
20 25 30
Asn Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn Leu Gly Lys
35 40 45
Leu Ala Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu Leu
50 55 60
Tyr Leu Ala Ala Ile Ala Asp Ala Gln Pro Pro Gln Asn Pro Thr Ser
65 70 75 80
His Pro Gln Met Val Gln Pro Gly Ser Met Gln Gly Ala Gly His Tyr
85 90 95
Met Ser Gln Val Pro Met Phe Pro Pro Arg Thr Pro Leu Thr Pro Gln
100 105 110
Gln Met Gln Glu Gln Gln His Gln Gln Leu Gln Gln Gln Gln Ala Gln
115 120 125
Ala Leu Ser Phe Pro Ala Gln Val Val Met Arg Pro Gly Thr Val Asn
130 135 140
Gly Met Gln Gln Pro Met Gln Ala Ala Gly Asp Leu Gln Pro Ala Ala
145 150 155 160
Ala Pro Gly Gly Ser Lys Gln Asp Ala Ala Val Ala Gly Ala Ser Ser
165 170 175
Glu Pro Ser Gly Thr Lys Ser His Lys Asn Ala Gly Ala Glu Glu Val
180 185 190
Gly Ala Asp Val Ala Glu Gln Ser
195 200
<210> 85
<211> 672
<212> DNA
<213> Vitis vinifera
<400> 85
atgcagcagc acctgatgca gatgcagccc atgatggcag cctattaccc cagcaacgtc 60
accactgatc acattcagca gtatcttgat gaaaacaagt cattgattct gaagattgtt 120
gagagccaga attcaggaaa attgactgaa tgtgcagaga accaggcaag actacagaga 180
aacctcatgt acctggctgc aattgctgat tctcaacccc aaccacccac catgcatgct 240
cagttccctc ctagtggcat tgttcagcca ggagctcact acatgcaaca ccaacaagct 300
caacaaatga caccacagtc gctcctggct gcacgctcct ccatgctgta cacccaacaa 360
ccattttcgg ccctgcaaca acaacaagcc atccatagcc agcttggcat gggctctggt 420
ggaagtgcag gacttcacat gctgcaaagc gaggggagta atccaggagg caatggaaca 480
ctggggactg gtgggtttcc tgatttcagc cgtggaactt ctggagaagg cctgcaggct 540
gcaggcaggg gaatggctgg tgggagcaag caagatatgg gaaatgcaga agggcgagga 600
gggaactcag gaggtcaggg tggggatgga ggtgagactc tttacttgaa agctgctgaa 660
gatgggaatt ga 672
<210> 86
<211> 223
<212> PRT
<213> Vitis vinifera
<400> 86
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr Tyr
1 5 10 15
Pro Ser Asn Val Thr Thr Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Thr Glu Cys Ala Glu Asn Gln Ala Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Pro Thr Met His Ala
65 70 75 80
Gln Phe Pro Pro Ser Gly Ile Val Gln Pro Gly Ala His Tyr Met Gln
85 90 95
His Gln Gln Ala Gln Gln Met Thr Pro Gln Ser Leu Leu Ala Ala Arg
100 105 110
Ser Ser Met Leu Tyr Thr Gln Gln Pro Phe Ser Ala Leu Gln Gln Gln
115 120 125
Gln Ala Ile His Ser Gln Leu Gly Met Gly Ser Gly Gly Ser Ala Gly
130 135 140
Leu His Met Leu Gln Ser Glu Gly Ser Asn Pro Gly Gly Asn Gly Thr
145 150 155 160
Leu Gly Thr Gly Gly Phe Pro Asp Phe Ser Arg Gly Thr Ser Gly Glu
165 170 175
Gly Leu Gln Ala Ala Gly Arg Gly Met Ala Gly Gly Ser Lys Gln Asp
180 185 190
Met Gly Asn Ala Glu Gly Arg Gly Gly Asn Ser Gly Gly Gln Gly Gly
195 200 205
Asp Gly Gly Glu Thr Leu Tyr Leu Lys Ala Ala Glu Asp Gly Asn
210 215 220
<210> 87
<211> 663
<212> DNA
<213> Zea mays
<400> 87
atgcagcagc agatgcccat gccgccggcg cccgctgccg ccgcggcggc ggcgcccccg 60
gcggcaggca tcactaccga gcagatccag aagtatttgg acgaaaataa gcaacttatt 120
ttggccatcc tggaaaatca gaacttaggg aagttggctg aatgtgctca gtatcaagct 180
caacttcaaa agaacctctt gtacctggct gcgattgctg atgcccaacc ccagcctccg 240
caaaaccctg caggtcgccc tcagatgatg cagcctggta tagtgccagg tgcggggcat 300
tacatgtcac aagtaccaat gttccctcca agaaccccat taaccccaca gcagatgcag 360
gagcagcagc aacaacaaca gtttcagcag cagcagcagc aagtgcaggc tcttacattt 420
cctggacaga tggtcatgag accaggcacc atcaacggca tgcagcagca gcagcctatg 480
caggctgacc ctgcccgggc agcagcggag ctgcagcagg cagcacctat cccagctgac 540
gggcgaggaa gcaagcagga caccgcgggt ggggcgagct cagagccttc tgccaatgag 600
agccacaaga gcgccaccgg agcagatacc gaggcaggtg gcgacgtggc cgagaaatcc 660
taa 663
<210> 88
<211> 220
<212> PRT
<213> Zea mays
<400> 88
Met Gln Gln Gln Met Pro Met Pro Pro Ala Pro Ala Ala Ala Ala Ala
1 5 10 15
Ala Ala Pro Pro Ala Ala Gly Ile Thr Thr Glu Gln Ile Gln Lys Tyr
20 25 30
Leu Asp Glu Asn Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn
35 40 45
Leu Gly Lys Leu Ala Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys
50 55 60
Asn Leu Leu Tyr Leu Ala Ala Ile Ala Asp Ala Gln Pro Gln Pro Pro
65 70 75 80
Gln Asn Pro Ala Gly Arg Pro Gln Met Met Gln Pro Gly Ile Val Pro
85 90 95
Gly Ala Gly His Tyr Met Ser Gln Val Pro Met Phe Pro Pro Arg Thr
100 105 110
Pro Leu Thr Pro Gln Gln Met Gln Glu Gln Gln Gln Gln Gln Gln Phe
115 120 125
Gln Gln Gln Gln Gln Gln Val Gln Ala Leu Thr Phe Pro Gly Gln Met
130 135 140
Val Met Arg Pro Gly Thr Ile Asn Gly Met Gln Gln Gln Gln Pro Met
145 150 155 160
Gln Ala Asp Pro Ala Arg Ala Ala Ala Glu Leu Gln Gln Ala Ala Pro
165 170 175
Ile Pro Ala Asp Gly Arg Gly Ser Lys Gln Asp Thr Ala Gly Gly Ala
180 185 190
Ser Ser Glu Pro Ser Ala Asn Glu Ser His Lys Ser Ala Thr Gly Ala
195 200 205
Asp Thr Glu Ala Gly Gly Asp Val Ala Glu Lys Ser
210 215 220
<210> 89
<211> 2193
<212> DNA
<213> Oryza sativa
<400> 89
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140
cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200
tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260
gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320
ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380
gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440
aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500
ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560
atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620
acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680
cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740
ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800
gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860
tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920
attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980
tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040
cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100
agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160
tggtgtagct tgccactttc accagcaaag ttc 2193
<210> 90
<211> 12
<212> PRT
<213> Artificial sequence
<220>
<223> box I
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa can be either Gln or Lys
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa can be either Tyr, Met, Phe or His
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa can be either Asp or Glu
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa can be either Glu or Asp
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> Xaa can be either Lys or Asn
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa can be any amino acid
<400> 90
Ile Gln Xaa Xaa Leu Asp Xaa Asn Xaa Xaa Leu Ile
1 5 10
<210> 91
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> box II
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa can be either Met, Leu or Val
<220>
<221> misc_feature
<222> (7)..(7)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa can be either Ala or Thr
<400> 91
Asn Leu Xaa Tyr Leu Ala Xaa Ile Ala Asp
1 5 10
<210> 92
<211> 53
<212> DNA
<213> Artificial sequence
<220>
<223> primer: prm06681
<400> 92
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgca acagcacctg atg 53
<210> 93
<211> 50
<212> DNA
<213> Artificial sequence
<220>
<223> primer: prm06682
<400> 93
ggggaccact ttgtacaaga aagctgggtc atcattaaga ttccttgtgc 50
<210> 94
<211> 53
<212> DNA
<213> Artificial sequence
<220>
<223> primer: prm06685
<400> 94
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgca gcagcagcag tct 53
<210> 95
<211> 50
<212> DNA
<213> Artificial sequence
<220>
<223> primer: prm06686
<400> 95
ggggaccact ttgtacaaga aagctgggtt ctttggatcc ttttcacttg 50
<210> 96
<211> 55
<212> DNA
<213> Artificial sequence
<220>
<223> primer: prm06683
<400> 96
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgca gcaatctcca cagat 55
<210> 97
<211> 52
<212> DNA
<213> Artificial sequence
<220>
<223> primer: prm06684
<400> 97
ggggaccact ttgtacaaga aagctgggtt cctctatttc attttccttc ag 52
Claims (56)
- 식물에서 N-말단에서 C-말단까지 (i) 서열 2의 SYT N-말단 상동성(SYT N-terminal Homology; SNH) 도메인에 대해 40% 이상의 서열 동일성을 갖는 SNH 도메인; (ii) Met-풍부 도메인; 및 (iii) QG-풍부 도메인을 포함하는 활막 육종 전위(synovial sarcoma translocation; SYT) 폴리펩티드 또는 그의 상동체를 코딩하는 핵산의 발현을 증가시키고, 임의로 증가된 수확량을 갖는 식물을 선별하는 것을 포함하며, 증가된 수확량이 종자 수확량의 증가, 뿌리 생물량(biomass)의 증가, 및 열매, 견과 및 콩 중 하나 이상의 생물량의 증가로 이루어진 군으로부터 선택되는 것인, 상응하는 야생형 식물에 비해 식물 수확량을 증가시키는 방법.
- 제1항에 있어서, 상기 SNH 도메인이 서열 1로 나타내어지는 것인 방법.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 SYT 폴리펩티드 또는 그의 상동체가 (i) 서열 90; (ii) 서열 91; 및 (iii) SNH 도메인 앞의 N-말단에서 Met-풍부 도메인 중 하나 이상을 추가로 포함하는 것인 방법.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 증가된 발현이 유전적 변형을 도입함으로써 초래되는 것인 방법.
- 제5항에 있어서, 상기 유전적 변형이 T-DNA 활성화, TILLING, 부위-특이적 돌연변이 유발 또는 방향성 분자진화 중 하나에 의해 초래되는 것인 방법.
- 활막 육종 전위(synovial sarcoma translocation; SYT) 핵산 또는 그의 변이체를 식물, 식물의 부분 또는 식물 세포에 도입 및 과발현시키는 것을 포함하고, 상기 SYT 핵산은 N-말단에서 C-말단까지 (i) 서열 2의 SYT N-말단 상동성(SYT N-terminal Homology; SNH) 도메인에 대해 40% 이상의 서열 동일성을 갖는 SNH 도메인; (ii) Met-풍부 도메인; 및 (iii) QG-풍부 도메인을 포함하는 활막 육종 전위(SYT) 폴리펩티드 또는 그의 상동체를 코딩하는 것인, 상응하는 야생형 식물에 비해 종자 수확량의 증가, 뿌리 생물량(biomass)의 증가, 및 열매, 견과 및 콩 중 하나 이상의 생물량의 증가로 이루어진 군으로부터 선택되는 수확량을 증가시키는 방법.
- 제7항에 있어서, 상기 변이체가 SYT 핵산의 일부 또는 SYT 핵산과 혼성화할 수 있는 서열인 방법.
- 제7항에 있어서, 상기 SNH 도메인이 서열 1로 나타내어지는 것인 방법.
- 제7항 내지 제10항 중 어느 한 항에 있어서, 상기 SYT 폴리펩티드 또는 그의 상동체가 (i) 서열 90; (ii) 서열 91; 및 (iii) SNH 도메인 앞의 N-말단에서 Met-풍부 도메인 중 하나 이상을 추가로 포함하는 것인 방법.
- 삭제
- 제7항 내지 제10항 중 어느 한 항에 있어서, 상기 SYT 핵산 또는 그의 변이체가 식물 기원의 것인 방법.
- 제7항 내지 제10항 중 어느 한 항에 있어서, 상기 변이체가 서열 4, 서열 6 및 서열 8의 SYT 단백질의 오르토로그(orthologue) 또는 파라로그(paralogue)를 코딩하는 것인 방법.
- 제7항 내지 제10항 중 어느 한 항에 있어서, 상기 SYT 핵산 또는 그의 변이체가 구성적(constitutive) 프로모터에 작동가능하게 연결된 것인 방법.
- 제15항에 있어서, 상기 구성적 프로모터가 식물로부터 유래된 것인 방법.
- 제16항에 있어서, 상기 구성적 프로모터가 GOS2 프로모터인 방법.
- 삭제
- 제1항 내지 제3항 및 제7항 내지 제10항 중 어느 한 항에 있어서, 상기 증가된 종자 수확량이 증가된 총 종자 수확량, 증가된 천립중(thousand kernel weight; TKW) 또는 둘 다인 방법.
- 제1항 내지 제3항 및 제7항 내지 제10항 중 어느 한 항에 따른 방법에 의해 수득가능하며, 식물-유래 프로모터에 작동가능하게 연결된 SYT 핵산을 발현하는, 종자 수확량의 증가, 뿌리 생물량(biomass)의 증가, 및 열매, 견과 및 콩 중 하나 이상의 생물량의 증가로 이루어진 군으로부터 선택되는 증가된 수확량을 갖는 식물, 식물의 부분 또는 식물 세포.
- (i) N-말단에서 C-말단까지 (i) 서열 2의 SYT N-말단 상동성(SYT N-terminal Homology; SNH) 도메인에 대해 40% 이상의 서열 동일성을 갖는 SNH 도메인; (ii) Met-풍부 도메인; 및 (iii) QG-풍부 도메인을 포함하는 활막 육종 전위(synovial sarcoma translocation; SYT) 폴리펩티드 또는 그의 상동체를 코딩하는 것인, SYT 핵산 또는 그의 변이체;(ii) 상기 (i)의 핵산 서열의 발현을 구동시킬 수 있는 식물-유래 프로모터인 하나 이상의 조절 서열; 및 임의로는(iii) 전사 종결 서열을 포함하는 구조물.
- 제21항에 있어서, 상기 조절 서열이 단자엽 식물로부터 유래된 구성적 프로모터인 구조물.
- 제22항에 있어서, 상기 구성적 프로모터가 GOS2 프로모터인 구조물.
- 제23항에 있어서, 상기 GOS2 프로모터가 서열 89로 나타내어지는 것인 구조물.
- 제21항 내지 제24항 중 어느 한 항에 따른 구조물로 형질전환되고, 식물-유래 프로모터에 작동가능하게 연결된 SYT 핵산을 발현하는 식물, 식물의 부분 또는 식물 세포.
- (i) N-말단에서 C-말단까지 (i) 서열 2의 SYT N-말단 상동성(SYT N-terminal Homology; SNH) 도메인에 대해 40% 이상의 서열 동일성을 갖는 SNH 도메인; (ii) Met-풍부 도메인; 및 (iii) QG-풍부 도메인을 포함하는 활막 육종 전위(synovial sarcoma translocation; SYT) 폴리펩티드 또는 그의 상동체를 코딩하는 것인, SYT 핵산 또는 그의 변이체를, 식물 또는 식물 세포에 도입 및 과발현시키는 단계; 및(ii) 식물 성장 및 발달을 촉진시키는 조건하에서 식물 세포를 재배하는 단계를 포함하는,종자 수확량의 증가, 뿌리 생물량(biomass)의 증가, 및 열매, 견과 및 콩 중 하나 이상의 생물량의 증가로 이루어진 군으로부터 선택되는 증가된 수확량을 갖는 트랜스제닉 식물의 생산 방법.
- 제26항에 있어서, 상기 재배 단계 (ii)로부터 수득된 식물을 교배함으로써 종자를 비롯한 식물 및 식물의 부분의 1대 이상의 이후 세대를 생산하는 것을 포함하는 방법.
- (i) N-말단에서 C-말단까지 (i) 서열 2의 SYT N-말단 상동성(SYT N-terminal Homology; SNH) 도메인에 대해 40% 이상의 서열 동일성을 갖는 SNH 도메인; (ii) Met-풍부 도메인; 및 (iii) QG-풍부 도메인을 포함하는 활막 육종 전위(synovial sarcoma translocation; SYT) 폴리펩티드 또는 그의 상동체를 코딩하는, 식물 또는 식물의 부분 내에 도입된 SYT 핵산 또는 그의 변이체로부터 생성되고, 식물-유래 프로모터에 작동가능하게 연결된 SYT 핵산을 발현하는, 상응하는 야생형 식물에 비해 종자 수확량의 증가, 뿌리 생물량(biomass)의 증가, 및 열매, 견과 및 콩 중 하나 이상의 생물량의 증가로 이루어진 군으로부터 선택되는 증가된 수확량을 갖는 트랜스제닉 식물 또는 식물의 부분.
- 제28항에 있어서, 상기 식물이 단자엽 식물 또는 곡물인 트랜스제닉 식물 또는 식물의 부분.
- 식물-유래 프로모터에 작동가능하게 연결된 SYT 핵산을 포함하는, 제20항에 따른 식물의 수확가능한 부분.
- 제30항에 있어서, 상기 수확가능한 부분이 종자인 식물의 수확가능한 부분.
- 제29항에 따른 식물로부터 유래된 생성물.
- 삭제
- 삭제
- 삭제
- 제5항에 있어서, 상기 증가된 발현이 SYT 폴리펩티드 또는 그의 상동체를 코딩하는 유전자의 유전자좌에서 유전적 변형을 도입함으로써 초래되는 것인 방법.
- 삭제
- 제13항에 있어서, 상기 SYT 핵산 또는 그의 변이체가 쌍자엽 식물로부터의 것인 방법.
- 제13항에 있어서, 상기 SYT 핵산 또는 그의 변이체가 브라시카세아에(Brassicaceae) 족으로부터의 것인 방법.
- 제13항에 있어서, 상기 SYT 핵산 또는 그의 변이체가 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터의 것인 방법.
- 제13항에 있어서, 상기 식물이 단자엽 식물인 방법.
- 삭제
- 제26항에 있어서, 상기 트랜스제닉 식물이 단자엽 식물인 방법.
- 삭제
- 제29항에 있어서, 상기 단자엽 식물이 사탕수수인 트랜스제닉 식물 또는 식물의 부분.
- 제29항에 있어서, 상기 곡물이 벼, 옥수수, 밀, 보리, 기장, 호밀, 귀리 또는 수수인 트랜스제닉 식물 또는 식물의 부분.
- 제20항에 있어서, 상기 식물이 단자엽 식물 또는 곡물이고, 식물-유래 프로모터에 작동가능하게 연결된 SYT 핵산을 포함하는 식물, 식물의 부분 또는 식물 세포.
- 제25항에 있어서, 상기 식물이 단자엽 식물 또는 곡물인 식물, 식물의 부분 또는 식물 세포.
- 제30항에 따른 식물의 수확가능한 부분으로부터 유래된 생성물.
- 제31항에 따른 식물의 수확가능한 부분으로부터 유래된 생성물.
- 제25항에 따른 식물의 수확가능한 부분.
- 제51항에 있어서, 상기 수확가능한 부분이 종자인 식물의 수확가능한 부분.
- 제52항에 따른 식물의 수확가능한 부분으로부터 유래된 생성물.
- 제28항에 따른 식물의 수확가능한 부분.
- 제54항에 있어서, 상기 수확가능한 부분이 종자인 식물의 수확가능한 부분.
- 제55항에 따른 식물의 수확가능한 부분으로부터 유래된 생성물.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05100537 | 2005-01-27 | ||
EP05100537.9 | 2005-01-27 | ||
US64904105P | 2005-02-01 | 2005-02-01 | |
US60/649,041 | 2005-02-01 | ||
US73040305P | 2005-10-26 | 2005-10-26 | |
US60/730,403 | 2005-10-26 | ||
PCT/EP2006/050489 WO2006079655A2 (en) | 2005-01-27 | 2006-01-27 | Plants having increased yield and a method for making the same |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137028798A Division KR20130122989A (ko) | 2005-01-27 | 2006-01-27 | 증가된 수확량을 갖는 식물 및 이의 생산 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070111458A KR20070111458A (ko) | 2007-11-21 |
KR101356311B1 true KR101356311B1 (ko) | 2014-02-06 |
Family
ID=35501397
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137028798A KR20130122989A (ko) | 2005-01-27 | 2006-01-27 | 증가된 수확량을 갖는 식물 및 이의 생산 방법 |
KR1020077017270A KR101356311B1 (ko) | 2005-01-27 | 2006-01-27 | 증가된 수확량을 갖는 식물 및 이의 생산 방법 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137028798A KR20130122989A (ko) | 2005-01-27 | 2006-01-27 | 증가된 수확량을 갖는 식물 및 이의 생산 방법 |
Country Status (16)
Country | Link |
---|---|
US (2) | US8426683B2 (ko) |
EP (2) | EP1844151A2 (ko) |
JP (2) | JP2008528014A (ko) |
KR (2) | KR20130122989A (ko) |
CN (1) | CN101111600A (ko) |
AR (1) | AR052101A1 (ko) |
AU (1) | AU2006208779B2 (ko) |
BR (1) | BRPI0607211A2 (ko) |
CA (1) | CA2595672A1 (ko) |
IL (1) | IL184655A0 (ko) |
MX (1) | MX2007008962A (ko) |
NZ (1) | NZ556605A (ko) |
PH (1) | PH12013501782A1 (ko) |
RU (1) | RU2463351C2 (ko) |
WO (1) | WO2006079655A2 (ko) |
ZA (1) | ZA200706184B (ko) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1844151A2 (en) | 2005-01-27 | 2007-10-17 | CropDesign N.V. | Plants having increased yield and a method for making the same |
ES2451669T3 (es) * | 2006-08-02 | 2014-03-28 | Cropdesign N.V. | Plantas que tienen características mejoradas y un procedimiento de fabricación de las mismas |
EP2199396A1 (en) * | 2006-08-02 | 2010-06-23 | CropDesign N.V. | Plants transformed with SYT-polypeptide having increased yield under abiotic stress and a method for making the same |
US20110061116A1 (en) * | 2007-07-31 | 2011-03-10 | University Of Utah Research Foundation | Animal Model of Synovial Sarcoma |
AU2008300478B2 (en) * | 2007-09-21 | 2014-11-06 | Basf Plant Science Gmbh | Plants having increased yield-related traits and a method for making the same |
US20090106857A1 (en) * | 2007-10-19 | 2009-04-23 | Pioneer Hi-Bred International, Inc. | Maize Stress-Responsive NAC Transcription Factors and Promoter and Methods of Use |
MX2011002028A (es) * | 2008-08-29 | 2011-08-17 | Basf Plant Science Co Gmbh | Plantas que tienen rasgos relacionados con rendimiento mejoradas y un metodo para producirlas. |
KR101315068B1 (ko) * | 2011-02-07 | 2013-10-08 | 한국생명공학연구원 | 시네코시스티스 속 PCC6803 유래 SbtA 유전자 및 이의 용도 |
MX2013013134A (es) * | 2011-05-09 | 2014-03-12 | Basf Plant Science Co Gmbh | Plantas que tienen mejores rasgos relacionados con el rendimiento y un metodo para producirlas. |
KR101273279B1 (ko) * | 2011-08-25 | 2013-06-11 | 경북대학교 산학협력단 | 벼 유래의 mdhar 유전자의 수확량 및 환경 스트레스 조절자로서의 용도 |
KR101493978B1 (ko) * | 2013-10-08 | 2015-02-17 | 대한민국 | 콩 품종인식을 위한 Indel 마커 |
ES2927871T3 (es) | 2014-02-21 | 2022-11-11 | Syngenta Participations Ag | Loci genéticos asociados con una mayor fertilidad en el maíz |
KR101635497B1 (ko) * | 2014-10-06 | 2016-07-01 | 김용재 | 종자수가 감소한 신품종 수박 및 이의 육종 방법 |
EP3214921A4 (en) * | 2014-11-04 | 2018-08-08 | Agresearch Limited | Methods for monocot plant improvement |
WO2022152660A1 (en) * | 2021-01-12 | 2022-07-21 | Vib Vzw | Means and methods for producing drought tolerant cereals |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE196311T1 (de) | 1993-12-09 | 2000-09-15 | Univ Jefferson | Verbindungen und verfahren zur ortsspezifischen mutation in eukaryotischen zellen |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
US6395547B1 (en) | 1994-02-17 | 2002-05-28 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
AU758055B2 (en) * | 1997-12-11 | 2003-03-13 | Syngenta Limited | Genetic method |
US7345217B2 (en) | 1998-09-22 | 2008-03-18 | Mendel Biotechnology, Inc. | Polynucleotides and polypeptides in plants |
US20050086718A1 (en) | 1999-03-23 | 2005-04-21 | Mendel Biotechnology, Inc. | Plant transcriptional regulators of abiotic stress |
EP1033405A3 (en) | 1999-02-25 | 2001-08-01 | Ceres Incorporated | Sequence-determined DNA fragments and corresponding polypeptides encoded thereby |
MXPA01010930A (es) | 1999-04-29 | 2003-06-30 | Syngenta Ltd | Plantas resistentes a herbicidas. |
US20100293669A2 (en) | 1999-05-06 | 2010-11-18 | Jingdong Liu | Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement |
CN1279172C (zh) | 1999-07-22 | 2006-10-11 | 独立行政法人农业生物资源研究所 | 转化水稻植物的方法 |
KR100350215B1 (ko) | 2000-12-02 | 2002-08-28 | (주)제노마인 | 삼투 스트레스에 대한 저항성을 증진시키는 식물의 신규전사 조절 인자 |
JP2002356498A (ja) * | 2001-04-24 | 2002-12-13 | Hokkaido Technology Licence Office Co Ltd | 滑膜肉腫抗原ペプチド |
CN1678748B (zh) | 2002-09-05 | 2011-11-16 | 作物培植股份有限公司 | 发育被改变的植物以及制备这种植物的方法 |
EP1578976B1 (en) | 2002-12-24 | 2011-08-17 | CropDesign N.V. | Plants having modified growth characteristics and a method for making the same |
JP2004350553A (ja) | 2003-05-28 | 2004-12-16 | Japan Science & Technology Agency | シロイヌナズナのan3遺伝子 |
US20070107082A1 (en) | 2003-06-03 | 2007-05-10 | Cropdesign N.V. | Transgenic monocotyledonous plants overexpressing a nhx protein and having improved growth characteristics and a method for making the same |
AU2005261646B2 (en) * | 2004-07-12 | 2012-02-02 | Cropdesign N.V. | Plants having improved growth characteristics and method for making the same |
CN101018865B (zh) | 2004-07-16 | 2011-11-09 | 克罗普迪塞恩股份有限公司 | 具有改良生长特性的植物及其制备方法 |
EP1844151A2 (en) | 2005-01-27 | 2007-10-17 | CropDesign N.V. | Plants having increased yield and a method for making the same |
EP2199396A1 (en) | 2006-08-02 | 2010-06-23 | CropDesign N.V. | Plants transformed with SYT-polypeptide having increased yield under abiotic stress and a method for making the same |
NL1033850C2 (nl) | 2007-05-15 | 2008-11-18 | 3Force B V | Brandersysteem met voorgemengde branders en vlam-overdrachtsmiddelen. |
AU2008300478B2 (en) | 2007-09-21 | 2014-11-06 | Basf Plant Science Gmbh | Plants having increased yield-related traits and a method for making the same |
-
2006
- 2006-01-27 EP EP06701687A patent/EP1844151A2/en not_active Withdrawn
- 2006-01-27 AU AU2006208779A patent/AU2006208779B2/en not_active Ceased
- 2006-01-27 CN CNA200680003316XA patent/CN101111600A/zh active Pending
- 2006-01-27 KR KR1020137028798A patent/KR20130122989A/ko not_active Application Discontinuation
- 2006-01-27 US US11/795,976 patent/US8426683B2/en not_active Expired - Fee Related
- 2006-01-27 KR KR1020077017270A patent/KR101356311B1/ko not_active IP Right Cessation
- 2006-01-27 MX MX2007008962A patent/MX2007008962A/es active IP Right Grant
- 2006-01-27 WO PCT/EP2006/050489 patent/WO2006079655A2/en active Application Filing
- 2006-01-27 JP JP2007552650A patent/JP2008528014A/ja active Pending
- 2006-01-27 RU RU2007132124/10A patent/RU2463351C2/ru not_active IP Right Cessation
- 2006-01-27 CA CA002595672A patent/CA2595672A1/en not_active Abandoned
- 2006-01-27 EP EP10176562A patent/EP2298920A1/en not_active Withdrawn
- 2006-01-27 NZ NZ556605A patent/NZ556605A/en not_active IP Right Cessation
- 2006-01-27 BR BRPI0607211-9A patent/BRPI0607211A2/pt not_active Application Discontinuation
- 2006-01-27 AR ARP060100317A patent/AR052101A1/es not_active Application Discontinuation
-
2007
- 2007-07-17 IL IL184655A patent/IL184655A0/en unknown
- 2007-07-26 ZA ZA200706184A patent/ZA200706184B/xx unknown
-
2012
- 2012-10-18 JP JP2012230978A patent/JP2013055943A/ja active Pending
-
2013
- 2013-03-19 US US13/847,251 patent/US20130269049A1/en not_active Abandoned
- 2013-08-28 PH PH12013501782A patent/PH12013501782A1/en unknown
Non-Patent Citations (3)
Title |
---|
Plant Molecular Biology Reporter, 15권, 1호, 16-21쪽(1997년) * |
PNAS, 101권, 36호, 13374-13379쪽(2004.09.07.) * |
The Plant Journal, 2권, 6호, 837-844쪽(1992년) * |
Also Published As
Publication number | Publication date |
---|---|
AU2006208779A1 (en) | 2006-08-03 |
CN101111600A (zh) | 2008-01-23 |
IL184655A0 (en) | 2007-12-03 |
PH12013501782A1 (en) | 2015-12-02 |
ZA200706184B (en) | 2008-11-26 |
KR20070111458A (ko) | 2007-11-21 |
NZ556605A (en) | 2010-03-26 |
JP2008528014A (ja) | 2008-07-31 |
KR20130122989A (ko) | 2013-11-11 |
JP2013055943A (ja) | 2013-03-28 |
US20130269049A1 (en) | 2013-10-10 |
RU2463351C2 (ru) | 2012-10-10 |
EP1844151A2 (en) | 2007-10-17 |
BRPI0607211A2 (pt) | 2009-12-22 |
US20100212041A1 (en) | 2010-08-19 |
AR052101A1 (es) | 2007-02-28 |
WO2006079655A2 (en) | 2006-08-03 |
CA2595672A1 (en) | 2006-08-03 |
WO2006079655A3 (en) | 2006-11-23 |
EP2298920A1 (en) | 2011-03-23 |
US8426683B2 (en) | 2013-04-23 |
MX2007008962A (es) | 2007-09-18 |
AU2006208779B2 (en) | 2011-03-31 |
RU2007132124A (ru) | 2009-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101356311B1 (ko) | 증가된 수확량을 갖는 식물 및 이의 생산 방법 | |
EP1817419B1 (en) | Plants having increased yield and a method for making the same | |
US20120137386A1 (en) | Plants Having Modulated Carbon Partitioning and a Method for Making the Same | |
AU2010254594B2 (en) | Plants having improved growth characteristics and method for making the same | |
AU2005225561B2 (en) | Plants having improved growth characteristics and method for making the same | |
US20110145954A1 (en) | Plants Having Improved Growth Characteristics and Method for Making the Same | |
EP1753286A1 (en) | Plants having improved growth characteristics and a method for making the same | |
EP1580275A1 (en) | Plants having improved growth characteristics and method for making the same | |
MX2007006110A (en) | Plants having increased yield and a method for making the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
A107 | Divisional application of patent | ||
AMND | Amendment | ||
J201 | Request for trial against refusal decision | ||
B701 | Decision to grant | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |