KR20230088741A - 단위생식 유전자의 변형된 프로모터 - Google Patents
단위생식 유전자의 변형된 프로모터 Download PDFInfo
- Publication number
- KR20230088741A KR20230088741A KR1020237015218A KR20237015218A KR20230088741A KR 20230088741 A KR20230088741 A KR 20230088741A KR 1020237015218 A KR1020237015218 A KR 1020237015218A KR 20237015218 A KR20237015218 A KR 20237015218A KR 20230088741 A KR20230088741 A KR 20230088741A
- Authority
- KR
- South Korea
- Prior art keywords
- plant
- gene
- par
- promoter
- sequence
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 414
- 230000001776 parthenogenetic effect Effects 0.000 title claims abstract description 71
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 63
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 61
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 61
- 239000013598 vector Substances 0.000 claims abstract description 53
- 238000004519 manufacturing process Methods 0.000 claims abstract description 36
- 230000001939 inductive effect Effects 0.000 claims abstract description 17
- 210000004027 cell Anatomy 0.000 claims description 170
- 238000000034 method Methods 0.000 claims description 141
- 102100037171 Protein JTB Human genes 0.000 claims description 137
- 101001028689 Homo sapiens Protein JTB Proteins 0.000 claims description 136
- 230000008186 parthenogenesis Effects 0.000 claims description 102
- 230000027455 binding Effects 0.000 claims description 81
- 102100030780 Transcriptional activator Myb Human genes 0.000 claims description 53
- 210000001938 protoplast Anatomy 0.000 claims description 48
- 238000011144 upstream manufacturing Methods 0.000 claims description 48
- 238000012217 deletion Methods 0.000 claims description 34
- 230000037430 deletion Effects 0.000 claims description 34
- 230000004048 modification Effects 0.000 claims description 23
- 238000012986 modification Methods 0.000 claims description 23
- 108700019146 Transgenes Proteins 0.000 claims description 20
- 238000003780 insertion Methods 0.000 claims description 20
- 230000037431 insertion Effects 0.000 claims description 20
- 238000002703 mutagenesis Methods 0.000 claims description 20
- 231100000350 mutagenesis Toxicity 0.000 claims description 20
- 238000003205 genotyping method Methods 0.000 claims description 14
- 238000013518 transcription Methods 0.000 claims description 14
- 230000035897 transcription Effects 0.000 claims description 14
- 238000012216 screening Methods 0.000 claims description 11
- 230000000644 propagated effect Effects 0.000 claims description 3
- 230000001172 regenerating effect Effects 0.000 claims description 3
- 241000196324 Embryophyta Species 0.000 description 529
- 108700028369 Alleles Proteins 0.000 description 116
- 101100518265 Escherichia coli (strain K12) ompC gene Proteins 0.000 description 91
- 101100276603 Synechococcus elongatus (strain PCC 7942 / FACHB-805) cysH gene Proteins 0.000 description 91
- 108020004414 DNA Proteins 0.000 description 62
- 235000003228 Lactuca sativa Nutrition 0.000 description 62
- 240000001949 Taraxacum officinale Species 0.000 description 60
- 235000005187 Taraxacum officinale ssp. officinale Nutrition 0.000 description 57
- 235000018102 proteins Nutrition 0.000 description 51
- 102000004169 proteins and genes Human genes 0.000 description 51
- 235000006754 Taraxacum officinale Nutrition 0.000 description 50
- 239000002773 nucleotide Substances 0.000 description 39
- 125000003729 nucleotide group Chemical group 0.000 description 39
- 108091026890 Coding region Proteins 0.000 description 38
- 230000009261 transgenic effect Effects 0.000 description 38
- 241000208822 Lactuca Species 0.000 description 35
- 240000008415 Lactuca sativa Species 0.000 description 35
- 210000001519 tissue Anatomy 0.000 description 35
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 34
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 32
- 230000001568 sexual effect Effects 0.000 description 31
- 150000001413 amino acids Chemical class 0.000 description 28
- 230000009466 transformation Effects 0.000 description 28
- 235000013601 eggs Nutrition 0.000 description 25
- 241000894007 species Species 0.000 description 25
- 108020005345 3' Untranslated Regions Proteins 0.000 description 24
- 241000245665 Taraxacum Species 0.000 description 24
- 229940024606 amino acid Drugs 0.000 description 22
- 235000001014 amino acid Nutrition 0.000 description 22
- 230000002068 genetic effect Effects 0.000 description 22
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 22
- 108010026333 seryl-proline Proteins 0.000 description 22
- 230000004720 fertilization Effects 0.000 description 21
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 19
- 239000003550 marker Substances 0.000 description 18
- 230000035772 mutation Effects 0.000 description 18
- 210000002257 embryonic structure Anatomy 0.000 description 17
- 108091033409 CRISPR Proteins 0.000 description 16
- 238000009395 breeding Methods 0.000 description 16
- 230000001105 regulatory effect Effects 0.000 description 16
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 15
- 238000009396 hybridization Methods 0.000 description 15
- 210000001161 mammalian embryo Anatomy 0.000 description 15
- 108091081024 Start codon Proteins 0.000 description 14
- 230000001488 breeding effect Effects 0.000 description 14
- 108010054155 lysyllysine Proteins 0.000 description 14
- 230000021121 meiosis Effects 0.000 description 14
- 108010053725 prolylvaline Proteins 0.000 description 14
- 230000006798 recombination Effects 0.000 description 14
- 238000005215 recombination Methods 0.000 description 14
- 208000020584 Polyploidy Diseases 0.000 description 13
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 13
- 108010047857 aspartylglycine Proteins 0.000 description 13
- 108010077112 prolyl-proline Proteins 0.000 description 13
- 239000011701 zinc Substances 0.000 description 13
- 229910052725 zinc Inorganic materials 0.000 description 13
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 12
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 12
- 108091028043 Nucleic acid sequence Proteins 0.000 description 12
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 12
- 210000000349 chromosome Anatomy 0.000 description 12
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 11
- 108700039609 IRW peptide Proteins 0.000 description 11
- 239000012634 fragment Substances 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 108010020688 glycylhistidine Proteins 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 238000012360 testing method Methods 0.000 description 11
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 10
- 241000880493 Leptailurus serval Species 0.000 description 10
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 10
- 238000003556 assay Methods 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 10
- 230000018109 developmental process Effects 0.000 description 10
- 108020004999 messenger RNA Proteins 0.000 description 10
- 239000000126 substance Substances 0.000 description 10
- 230000002103 transcriptional effect Effects 0.000 description 10
- 238000010354 CRISPR gene editing Methods 0.000 description 9
- 101100288095 Klebsiella pneumoniae neo gene Proteins 0.000 description 9
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 9
- 108010008355 arginyl-glutamine Proteins 0.000 description 9
- 108010062796 arginyllysine Proteins 0.000 description 9
- 238000002869 basic local alignment search tool Methods 0.000 description 9
- 230000001965 increasing effect Effects 0.000 description 9
- 210000001672 ovary Anatomy 0.000 description 9
- 210000001082 somatic cell Anatomy 0.000 description 9
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 8
- WLRYGVYQFXRJDA-DCAQKATOSA-N Gln-Pro-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 WLRYGVYQFXRJDA-DCAQKATOSA-N 0.000 description 8
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 8
- 244000068988 Glycine max Species 0.000 description 8
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 8
- 241000218922 Magnoliophyta Species 0.000 description 8
- 208000035199 Tetraploidy Diseases 0.000 description 8
- 108010038633 aspartylglutamate Proteins 0.000 description 8
- 238000011161 development Methods 0.000 description 8
- 108010037850 glycylvaline Proteins 0.000 description 8
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 8
- 230000011278 mitosis Effects 0.000 description 8
- 210000004940 nucleus Anatomy 0.000 description 8
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 8
- 108010048818 seryl-histidine Proteins 0.000 description 8
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 7
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 7
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 7
- 235000010469 Glycine max Nutrition 0.000 description 7
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 7
- 108010025815 Kanamycin Kinase Proteins 0.000 description 7
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 7
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 7
- NVNPWELENFJOHH-CIUDSAMLSA-N Ser-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)N NVNPWELENFJOHH-CIUDSAMLSA-N 0.000 description 7
- 244000061456 Solanum tuberosum Species 0.000 description 7
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 7
- 108091023040 Transcription factor Proteins 0.000 description 7
- 102000040945 Transcription factor Human genes 0.000 description 7
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 7
- 108010005233 alanylglutamic acid Proteins 0.000 description 7
- 108010068380 arginylarginine Proteins 0.000 description 7
- 108010077245 asparaginyl-proline Proteins 0.000 description 7
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 7
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 7
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 7
- 108010027338 isoleucylcysteine Proteins 0.000 description 7
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 7
- 108010009298 lysylglutamic acid Proteins 0.000 description 7
- 230000001131 transforming effect Effects 0.000 description 7
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 6
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 6
- 241000208838 Asteraceae Species 0.000 description 6
- RWAZRMXTVSIVJR-YUMQZZPRSA-N Cys-Gly-His Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC1=CNC=N1)C(O)=O RWAZRMXTVSIVJR-YUMQZZPRSA-N 0.000 description 6
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 6
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 6
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 6
- MIHTTYXBXIRRGV-AVGNSLFASA-N His-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N MIHTTYXBXIRRGV-AVGNSLFASA-N 0.000 description 6
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 6
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 6
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 6
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 6
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 6
- 235000002595 Solanum tuberosum Nutrition 0.000 description 6
- 240000008042 Zea mays Species 0.000 description 6
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 6
- 108010068265 aspartyltyrosine Proteins 0.000 description 6
- 230000010165 autogamy Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000000684 flow cytometry Methods 0.000 description 6
- 108010078144 glutaminyl-glycine Proteins 0.000 description 6
- 108010050848 glycylleucine Proteins 0.000 description 6
- 108010081551 glycylphenylalanine Proteins 0.000 description 6
- 108010003700 lysyl aspartic acid Proteins 0.000 description 6
- 108010064235 lysylglycine Proteins 0.000 description 6
- 230000001404 mediated effect Effects 0.000 description 6
- 108090000765 processed proteins & peptides Proteins 0.000 description 6
- 108010031719 prolyl-serine Proteins 0.000 description 6
- 108010015796 prolylisoleucine Proteins 0.000 description 6
- 238000002708 random mutagenesis Methods 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 108010061238 threonyl-glycine Proteins 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 238000011282 treatment Methods 0.000 description 6
- 108020003589 5' Untranslated Regions Proteins 0.000 description 5
- 241000589158 Agrobacterium Species 0.000 description 5
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 5
- 241000219194 Arabidopsis Species 0.000 description 5
- 241000219195 Arabidopsis thaliana Species 0.000 description 5
- 240000007124 Brassica oleracea Species 0.000 description 5
- 235000010523 Cicer arietinum Nutrition 0.000 description 5
- 244000045195 Cicer arietinum Species 0.000 description 5
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 5
- 108020005004 Guide RNA Proteins 0.000 description 5
- 244000020551 Helianthus annuus Species 0.000 description 5
- 235000003222 Helianthus annuus Nutrition 0.000 description 5
- ZXJFURYTPZMUNY-VKOGCVSHSA-N Ile-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 ZXJFURYTPZMUNY-VKOGCVSHSA-N 0.000 description 5
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 5
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 5
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 5
- 240000007594 Oryza sativa Species 0.000 description 5
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 5
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 5
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 5
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 5
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 5
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 5
- 244000062793 Sorghum vulgare Species 0.000 description 5
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 5
- 108010087924 alanylproline Proteins 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 235000013339 cereals Nutrition 0.000 description 5
- 235000020971 citrus fruits Nutrition 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 235000013399 edible fruits Nutrition 0.000 description 5
- 238000010362 genome editing Methods 0.000 description 5
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 5
- 239000004009 herbicide Substances 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 5
- 108010017391 lysylvaline Proteins 0.000 description 5
- 238000003976 plant breeding Methods 0.000 description 5
- 108010029020 prolylglycine Proteins 0.000 description 5
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 5
- IAKHMKGGTNLKSZ-INIZCTEOSA-N (S)-colchicine Chemical compound C1([C@@H](NC(C)=O)CC2)=CC(=O)C(OC)=CC=C1C1=C2C=C(OC)C(OC)=C1OC IAKHMKGGTNLKSZ-INIZCTEOSA-N 0.000 description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 4
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 4
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 4
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 4
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 4
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 4
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 4
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 4
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 4
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 4
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 4
- COWITDLVHMZSIW-CIUDSAMLSA-N Asn-Lys-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O COWITDLVHMZSIW-CIUDSAMLSA-N 0.000 description 4
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 4
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 4
- CSEJMKNZDCJYGJ-XHNCKOQMSA-N Asp-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O CSEJMKNZDCJYGJ-XHNCKOQMSA-N 0.000 description 4
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 4
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 4
- BKOIIURTQAJHAT-GUBZILKMSA-N Asp-Pro-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 BKOIIURTQAJHAT-GUBZILKMSA-N 0.000 description 4
- 240000008100 Brassica rapa Species 0.000 description 4
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 4
- 235000002566 Capsicum Nutrition 0.000 description 4
- 241000207199 Citrus Species 0.000 description 4
- 235000009849 Cucumis sativus Nutrition 0.000 description 4
- 240000008067 Cucumis sativus Species 0.000 description 4
- XCDDSPYIMNXECQ-NAKRPEOUSA-N Cys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CS XCDDSPYIMNXECQ-NAKRPEOUSA-N 0.000 description 4
- 208000035240 Disease Resistance Diseases 0.000 description 4
- 235000017048 Garcinia mangostana Nutrition 0.000 description 4
- 240000006053 Garcinia mangostana Species 0.000 description 4
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 4
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 4
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 4
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 4
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 4
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 4
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 4
- 239000004471 Glycine Substances 0.000 description 4
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 4
- JJHWJUYYTWYXPL-PYJNHQTQSA-N His-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CN=CN1 JJHWJUYYTWYXPL-PYJNHQTQSA-N 0.000 description 4
- WEWCEPOYKANMGZ-MMWGEVLESA-N Ile-Cys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N WEWCEPOYKANMGZ-MMWGEVLESA-N 0.000 description 4
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 4
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 4
- SSJBMGCZZXCGJJ-DCAQKATOSA-N Lys-Asp-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O SSJBMGCZZXCGJJ-DCAQKATOSA-N 0.000 description 4
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 4
- DBMLDOWSVHMQQN-XGEHTFHBSA-N Met-Ser-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DBMLDOWSVHMQQN-XGEHTFHBSA-N 0.000 description 4
- 101100107522 Mus musculus Slc1a5 gene Proteins 0.000 description 4
- 241000209049 Poa pratensis Species 0.000 description 4
- 241000209504 Poaceae Species 0.000 description 4
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 4
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 4
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 4
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 4
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 4
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 4
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 4
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 4
- XPVIVVLLLOFBRH-XIRDDKMYSA-N Ser-Trp-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@@H](N)CO)C(O)=O XPVIVVLLLOFBRH-XIRDDKMYSA-N 0.000 description 4
- PXIPVTKHYLBLMZ-UHFFFAOYSA-N Sodium azide Chemical compound [Na+].[N-]=[N+]=[N-] PXIPVTKHYLBLMZ-UHFFFAOYSA-N 0.000 description 4
- 208000026487 Triploidy Diseases 0.000 description 4
- 108010064997 VPY tripeptide Proteins 0.000 description 4
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 4
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 4
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 4
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 4
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 108010047495 alanylglycine Proteins 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 230000011681 asexual reproduction Effects 0.000 description 4
- 238000013465 asexual reproduction Methods 0.000 description 4
- 230000003115 biocidal effect Effects 0.000 description 4
- 230000031018 biological processes and functions Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- RNFNDJAIBTYOQL-UHFFFAOYSA-N chloral hydrate Chemical compound OC(O)C(Cl)(Cl)Cl RNFNDJAIBTYOQL-UHFFFAOYSA-N 0.000 description 4
- 229960002327 chloral hydrate Drugs 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 244000038559 crop plants Species 0.000 description 4
- 108010016616 cysteinylglycine Proteins 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 4
- 108010089804 glycyl-threonine Proteins 0.000 description 4
- 108010057821 leucylproline Proteins 0.000 description 4
- 235000009973 maize Nutrition 0.000 description 4
- 230000013011 mating Effects 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 210000000287 oocyte Anatomy 0.000 description 4
- 210000004681 ovum Anatomy 0.000 description 4
- 210000002706 plastid Anatomy 0.000 description 4
- 108010004914 prolylarginine Proteins 0.000 description 4
- 230000033458 reproduction Effects 0.000 description 4
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 235000009434 Actinidia chinensis Nutrition 0.000 description 3
- 244000298715 Actinidia chinensis Species 0.000 description 3
- KXEVYGKATAMXJJ-ACZMJKKPSA-N Ala-Glu-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KXEVYGKATAMXJJ-ACZMJKKPSA-N 0.000 description 3
- NOGFDULFCFXBHB-CIUDSAMLSA-N Ala-Leu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NOGFDULFCFXBHB-CIUDSAMLSA-N 0.000 description 3
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 3
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 3
- DWYROCSXOOMOEU-CIUDSAMLSA-N Ala-Met-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DWYROCSXOOMOEU-CIUDSAMLSA-N 0.000 description 3
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 3
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 3
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 3
- 235000016682 Arachis ipaensis Nutrition 0.000 description 3
- 241000886191 Arachis ipaensis Species 0.000 description 3
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 3
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 3
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 3
- QNYWYYNQSXANBL-WDSOQIARSA-N Arg-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N QNYWYYNQSXANBL-WDSOQIARSA-N 0.000 description 3
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 3
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 3
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 3
- YYSYDIYQTUPNQQ-SXTJYALSSA-N Asn-Ile-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YYSYDIYQTUPNQQ-SXTJYALSSA-N 0.000 description 3
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 3
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 3
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 3
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 3
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 3
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 3
- FIAKNCXQFFKSSI-ZLUOBGJFSA-N Asp-Ser-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O FIAKNCXQFFKSSI-ZLUOBGJFSA-N 0.000 description 3
- 241000335053 Beta vulgaris Species 0.000 description 3
- 241000219198 Brassica Species 0.000 description 3
- 235000011303 Brassica alboglabra Nutrition 0.000 description 3
- 235000011302 Brassica oleracea Nutrition 0.000 description 3
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 3
- 240000008574 Capsicum frutescens Species 0.000 description 3
- 240000006740 Cichorium endivia Species 0.000 description 3
- 241000219109 Citrullus Species 0.000 description 3
- 108091035707 Consensus sequence Proteins 0.000 description 3
- 241000219112 Cucumis Species 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- PLUBXMRUUVWRLT-UHFFFAOYSA-N Ethyl methanesulfonate Chemical compound CCOS(C)(=O)=O PLUBXMRUUVWRLT-UHFFFAOYSA-N 0.000 description 3
- CKNUKHBRCSMKMO-XHNCKOQMSA-N Gln-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O CKNUKHBRCSMKMO-XHNCKOQMSA-N 0.000 description 3
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 3
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 3
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 3
- JPHYJQHPILOKHC-ACZMJKKPSA-N Glu-Asp-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JPHYJQHPILOKHC-ACZMJKKPSA-N 0.000 description 3
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 3
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 3
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 3
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 3
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 3
- DCBSZJJHOTXMHY-DCAQKATOSA-N Glu-Pro-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DCBSZJJHOTXMHY-DCAQKATOSA-N 0.000 description 3
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 3
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 3
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 3
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 3
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 3
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 3
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 3
- HHSOPSCKAZKQHQ-PEXQALLHSA-N Gly-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN HHSOPSCKAZKQHQ-PEXQALLHSA-N 0.000 description 3
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 3
- FEUPVVCGQLNXNP-IRXDYDNUSA-N Gly-Phe-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FEUPVVCGQLNXNP-IRXDYDNUSA-N 0.000 description 3
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 3
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 3
- 241000219146 Gossypium Species 0.000 description 3
- 244000299507 Gossypium hirsutum Species 0.000 description 3
- LSQHWKPPOFDHHZ-YUMQZZPRSA-N His-Asp-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N LSQHWKPPOFDHHZ-YUMQZZPRSA-N 0.000 description 3
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 3
- GIRSNERMXCMDBO-GARJFASQSA-N His-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O GIRSNERMXCMDBO-GARJFASQSA-N 0.000 description 3
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 3
- AWTDTFXPVCTHAK-BJDJZHNGSA-N Ile-Cys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N AWTDTFXPVCTHAK-BJDJZHNGSA-N 0.000 description 3
- PMMMQRVUMVURGJ-XUXIUFHCSA-N Ile-Leu-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O PMMMQRVUMVURGJ-XUXIUFHCSA-N 0.000 description 3
- 241001412304 Ixeris Species 0.000 description 3
- IASQBRJGRVXNJI-YUMQZZPRSA-N Leu-Cys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)NCC(O)=O IASQBRJGRVXNJI-YUMQZZPRSA-N 0.000 description 3
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 3
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 3
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 3
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 3
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 3
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 3
- KZJQUYFDSCFSCO-DLOVCJGASA-N Lys-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N KZJQUYFDSCFSCO-DLOVCJGASA-N 0.000 description 3
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 3
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 3
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 3
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 3
- UQJOKDAYFULYIX-AVGNSLFASA-N Lys-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 UQJOKDAYFULYIX-AVGNSLFASA-N 0.000 description 3
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 3
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 3
- VZBXCMCHIHEPBL-SRVKXCTJSA-N Met-Glu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN VZBXCMCHIHEPBL-SRVKXCTJSA-N 0.000 description 3
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 3
- IILAGWCGKJSBGB-IHRRRGAJSA-N Met-Phe-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IILAGWCGKJSBGB-IHRRRGAJSA-N 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 3
- 101100406879 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) par-2 gene Proteins 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- 241000209094 Oryza Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- XEXSSIBQYNKFBX-KBPBESRZSA-N Phe-Gly-His Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=CC=C1 XEXSSIBQYNKFBX-KBPBESRZSA-N 0.000 description 3
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 3
- 108020005120 Plant DNA Proteins 0.000 description 3
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 3
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 3
- LXLFEIHKWGHJJB-XUXIUFHCSA-N Pro-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 LXLFEIHKWGHJJB-XUXIUFHCSA-N 0.000 description 3
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 3
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 3
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 3
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 3
- MDAWMJUZHBQTBO-XGEHTFHBSA-N Pro-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1)O MDAWMJUZHBQTBO-XGEHTFHBSA-N 0.000 description 3
- VEUACYMXJKXALX-IHRRRGAJSA-N Pro-Tyr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VEUACYMXJKXALX-IHRRRGAJSA-N 0.000 description 3
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 3
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 3
- 240000005809 Prunus persica Species 0.000 description 3
- 241000209056 Secale Species 0.000 description 3
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 3
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 3
- MESDJCNHLZBMEP-ZLUOBGJFSA-N Ser-Asp-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MESDJCNHLZBMEP-ZLUOBGJFSA-N 0.000 description 3
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 3
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 3
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 3
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 3
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 3
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 3
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 3
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 3
- 235000002634 Solanum Nutrition 0.000 description 3
- 241000207763 Solanum Species 0.000 description 3
- 240000003768 Solanum lycopersicum Species 0.000 description 3
- 235000002597 Solanum melongena Nutrition 0.000 description 3
- 244000061458 Solanum melongena Species 0.000 description 3
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 3
- 238000002105 Southern blotting Methods 0.000 description 3
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 3
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 3
- SHOMROOOQBDGRL-JHEQGTHGSA-N Thr-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SHOMROOOQBDGRL-JHEQGTHGSA-N 0.000 description 3
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 3
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 3
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 3
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 3
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 3
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 3
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 3
- SBYQHZCMVSPQCS-RCWTZXSCSA-N Thr-Val-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O SBYQHZCMVSPQCS-RCWTZXSCSA-N 0.000 description 3
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 3
- 235000007218 Tripsacum dactyloides Nutrition 0.000 description 3
- 244000082267 Tripsacum dactyloides Species 0.000 description 3
- 235000021307 Triticum Nutrition 0.000 description 3
- NOBINHCGDUHOBV-NAZCDGGXSA-N Trp-His-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NOBINHCGDUHOBV-NAZCDGGXSA-N 0.000 description 3
- NLLARHRWSFNEMH-NUTKFTJISA-N Trp-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NLLARHRWSFNEMH-NUTKFTJISA-N 0.000 description 3
- AKXBNSZMYAOGLS-STQMWFEESA-N Tyr-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AKXBNSZMYAOGLS-STQMWFEESA-N 0.000 description 3
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 3
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 3
- XEYUMGGWQCIWAR-XVKPBYJWSA-N Val-Gln-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N XEYUMGGWQCIWAR-XVKPBYJWSA-N 0.000 description 3
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 3
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 3
- 241000209149 Zea Species 0.000 description 3
- 102000019374 Zinc finger C2H2-type Human genes 0.000 description 3
- 108050006929 Zinc finger C2H2-type Proteins 0.000 description 3
- 230000036579 abiotic stress Effects 0.000 description 3
- 230000000692 anti-sense effect Effects 0.000 description 3
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 3
- 239000001390 capsicum minimum Substances 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 108010060199 cysteinylproline Proteins 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 3
- 238000012239 gene modification Methods 0.000 description 3
- 230000005017 genetic modification Effects 0.000 description 3
- 235000013617 genetically modified food Nutrition 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- 108010079547 glutamylmethionine Proteins 0.000 description 3
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 3
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 3
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 3
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 3
- 230000002363 herbicidal effect Effects 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 101150044508 key gene Proteins 0.000 description 3
- 108010034529 leucyl-lysine Proteins 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 108010056582 methionylglutamic acid Proteins 0.000 description 3
- 238000000386 microscopy Methods 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 230000010152 pollination Effects 0.000 description 3
- 102000040430 polynucleotide Human genes 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 239000002157 polynucleotide Substances 0.000 description 3
- 108010070643 prolylglutamic acid Proteins 0.000 description 3
- 230000005855 radiation Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 230000014639 sexual reproduction Effects 0.000 description 3
- 238000012225 targeting induced local lesions in genomes Methods 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- PCDUALPXEOKZPE-DXCABUDRSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoic acid Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O PCDUALPXEOKZPE-DXCABUDRSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- ZBMRKNMTMPPMMK-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid;azane Chemical compound [NH4+].CP(O)(=O)CCC(N)C([O-])=O ZBMRKNMTMPPMMK-UHFFFAOYSA-N 0.000 description 2
- YHQDZJICGQWFHK-UHFFFAOYSA-N 4-nitroquinoline N-oxide Chemical compound C1=CC=C2C([N+](=O)[O-])=CC=[N+]([O-])C2=C1 YHQDZJICGQWFHK-UHFFFAOYSA-N 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- SKHCUBQVZJHOFM-NAKRPEOUSA-N Ala-Arg-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SKHCUBQVZJHOFM-NAKRPEOUSA-N 0.000 description 2
- PXKLCFFSVLKOJM-ACZMJKKPSA-N Ala-Asn-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXKLCFFSVLKOJM-ACZMJKKPSA-N 0.000 description 2
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 2
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 2
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 2
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 2
- HUUOZYZWNCXTFK-INTQDDNPSA-N Ala-His-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N HUUOZYZWNCXTFK-INTQDDNPSA-N 0.000 description 2
- HQJKCXHQNUCKMY-GHCJXIJMSA-N Ala-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C)N HQJKCXHQNUCKMY-GHCJXIJMSA-N 0.000 description 2
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 2
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 2
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 2
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 2
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 2
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 2
- 241000234282 Allium Species 0.000 description 2
- 235000011446 Amygdalus persica Nutrition 0.000 description 2
- 244000099147 Ananas comosus Species 0.000 description 2
- 235000007119 Ananas comosus Nutrition 0.000 description 2
- 241001148566 Antennaria <beetle> Species 0.000 description 2
- 101000662893 Arabidopsis thaliana Telomere repeat-binding factor 1 Proteins 0.000 description 2
- 101000662890 Arabidopsis thaliana Telomere repeat-binding factor 2 Proteins 0.000 description 2
- 101000662891 Arabidopsis thaliana Telomere repeat-binding factor 3 Proteins 0.000 description 2
- 101000662896 Arabidopsis thaliana Telomere repeat-binding factor 4 Proteins 0.000 description 2
- 101000662897 Arabidopsis thaliana Telomere repeat-binding factor 5 Proteins 0.000 description 2
- YFWTXMRJJDNTLM-LSJOCFKGSA-N Arg-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFWTXMRJJDNTLM-LSJOCFKGSA-N 0.000 description 2
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 2
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 2
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 2
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 2
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 2
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 2
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 2
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 2
- QEHMMRSQJMOYNO-DCAQKATOSA-N Arg-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N QEHMMRSQJMOYNO-DCAQKATOSA-N 0.000 description 2
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 2
- KZXPVYVSHUJCEO-ULQDDVLXSA-N Arg-Phe-Lys Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 KZXPVYVSHUJCEO-ULQDDVLXSA-N 0.000 description 2
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 2
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 2
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 2
- HOIFSHOLNKQCSA-FXQIFTODSA-N Asn-Arg-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O HOIFSHOLNKQCSA-FXQIFTODSA-N 0.000 description 2
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 2
- NLCDVZJDEXIDDL-BIIVOSGPSA-N Asn-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O NLCDVZJDEXIDDL-BIIVOSGPSA-N 0.000 description 2
- XVVOVPFMILMHPX-ZLUOBGJFSA-N Asn-Asp-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XVVOVPFMILMHPX-ZLUOBGJFSA-N 0.000 description 2
- ASCGFDYEKSRNPL-CIUDSAMLSA-N Asn-Glu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O ASCGFDYEKSRNPL-CIUDSAMLSA-N 0.000 description 2
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 2
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 2
- GIQCDTKOIPUDSG-GARJFASQSA-N Asn-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N)C(=O)O GIQCDTKOIPUDSG-GARJFASQSA-N 0.000 description 2
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 2
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 2
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 2
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 2
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 2
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 2
- CBWCQCANJSGUOH-ZKWXMUAHSA-N Asn-Val-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O CBWCQCANJSGUOH-ZKWXMUAHSA-N 0.000 description 2
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 2
- KDFQZBWWPYQBEN-ZLUOBGJFSA-N Asp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N KDFQZBWWPYQBEN-ZLUOBGJFSA-N 0.000 description 2
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 2
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 2
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 2
- ZSJFGGSPCCHMNE-LAEOZQHASA-N Asp-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N ZSJFGGSPCCHMNE-LAEOZQHASA-N 0.000 description 2
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 2
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 2
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 2
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 2
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 2
- HCOQNGIHSXICCB-IHRRRGAJSA-N Asp-Tyr-Arg Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O HCOQNGIHSXICCB-IHRRRGAJSA-N 0.000 description 2
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 2
- 244000075850 Avena orientalis Species 0.000 description 2
- 235000007319 Avena orientalis Nutrition 0.000 description 2
- 235000021533 Beta vulgaris Nutrition 0.000 description 2
- 102100021277 Beta-secretase 2 Human genes 0.000 description 2
- 235000011331 Brassica Nutrition 0.000 description 2
- 244000060924 Brassica campestris Species 0.000 description 2
- 235000005637 Brassica campestris Nutrition 0.000 description 2
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 2
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 2
- 235000011292 Brassica rapa Nutrition 0.000 description 2
- 241000219193 Brassicaceae Species 0.000 description 2
- 101100180402 Caenorhabditis elegans jun-1 gene Proteins 0.000 description 2
- 244000105627 Cajanus indicus Species 0.000 description 2
- 235000010773 Cajanus indicus Nutrition 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 2
- 235000007516 Chrysanthemum Nutrition 0.000 description 2
- 241000723343 Cichorium Species 0.000 description 2
- 235000018536 Cichorium endivia Nutrition 0.000 description 2
- 241000723377 Coffea Species 0.000 description 2
- 241001573881 Corolla Species 0.000 description 2
- 244000241257 Cucumis melo Species 0.000 description 2
- 235000009842 Cucumis melo Nutrition 0.000 description 2
- 235000010071 Cucumis prophetarum Nutrition 0.000 description 2
- 235000009854 Cucurbita moschata Nutrition 0.000 description 2
- 240000004244 Cucurbita moschata Species 0.000 description 2
- 241000219104 Cucurbitaceae Species 0.000 description 2
- WVJHEDOLHPZLRV-CIUDSAMLSA-N Cys-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N WVJHEDOLHPZLRV-CIUDSAMLSA-N 0.000 description 2
- XABFFGOGKOORCG-CIUDSAMLSA-N Cys-Asp-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XABFFGOGKOORCG-CIUDSAMLSA-N 0.000 description 2
- QYKJOVAXAKTKBR-FXQIFTODSA-N Cys-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N QYKJOVAXAKTKBR-FXQIFTODSA-N 0.000 description 2
- VKAWJBQTFCBHQY-GUBZILKMSA-N Cys-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N VKAWJBQTFCBHQY-GUBZILKMSA-N 0.000 description 2
- DZSICRGTVPDCRN-YUMQZZPRSA-N Cys-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N DZSICRGTVPDCRN-YUMQZZPRSA-N 0.000 description 2
- DQUWSUWXPWGTQT-DCAQKATOSA-N Cys-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CS DQUWSUWXPWGTQT-DCAQKATOSA-N 0.000 description 2
- KZZYVYWSXMFYEC-DCAQKATOSA-N Cys-Val-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KZZYVYWSXMFYEC-DCAQKATOSA-N 0.000 description 2
- 101150115720 DUO1 gene Proteins 0.000 description 2
- 244000000626 Daucus carota Species 0.000 description 2
- 235000002767 Daucus carota Nutrition 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- 241001250566 Eutrema salsugineum Species 0.000 description 2
- 241000220485 Fabaceae Species 0.000 description 2
- 235000016622 Filipendula ulmaria Nutrition 0.000 description 2
- 244000061544 Filipendula vulgaris Species 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 206010071602 Genetic polymorphism Diseases 0.000 description 2
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 2
- TWHDOEYLXXQYOZ-FXQIFTODSA-N Gln-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N TWHDOEYLXXQYOZ-FXQIFTODSA-N 0.000 description 2
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 2
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 2
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 2
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 2
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 2
- JNENSVNAUWONEZ-GUBZILKMSA-N Gln-Lys-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JNENSVNAUWONEZ-GUBZILKMSA-N 0.000 description 2
- TWIAMTNJOMRDAK-GUBZILKMSA-N Gln-Lys-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O TWIAMTNJOMRDAK-GUBZILKMSA-N 0.000 description 2
- OUBUHIODTNUUTC-WDCWCFNPSA-N Gln-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OUBUHIODTNUUTC-WDCWCFNPSA-N 0.000 description 2
- XMWNHGKDDIFXQJ-NWLDYVSISA-N Gln-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O XMWNHGKDDIFXQJ-NWLDYVSISA-N 0.000 description 2
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 2
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 2
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 2
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 2
- XHWLNISLUFEWNS-CIUDSAMLSA-N Glu-Gln-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XHWLNISLUFEWNS-CIUDSAMLSA-N 0.000 description 2
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 2
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 2
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 2
- UMHRCVCZUPBBQW-GARJFASQSA-N Glu-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UMHRCVCZUPBBQW-GARJFASQSA-N 0.000 description 2
- TWYFJOHWGCCRIR-DCAQKATOSA-N Glu-Pro-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYFJOHWGCCRIR-DCAQKATOSA-N 0.000 description 2
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 2
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 2
- RQZGFWKQLPJOEQ-YUMQZZPRSA-N Gly-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN)CN=C(N)N RQZGFWKQLPJOEQ-YUMQZZPRSA-N 0.000 description 2
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 2
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 2
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 2
- QGZSAHIZRQHCEQ-QWRGUYRKSA-N Gly-Asp-Tyr Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QGZSAHIZRQHCEQ-QWRGUYRKSA-N 0.000 description 2
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 2
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 2
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 2
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 2
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 2
- UUWOBINZFGTFMS-UWVGGRQHSA-N Gly-His-Met Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(O)=O UUWOBINZFGTFMS-UWVGGRQHSA-N 0.000 description 2
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 2
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 2
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 2
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 2
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 2
- 235000009438 Gossypium Nutrition 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 244000043261 Hevea brasiliensis Species 0.000 description 2
- 241001473402 Hieracium Species 0.000 description 2
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 2
- VHHYJBSXXMPQGZ-AVGNSLFASA-N His-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N VHHYJBSXXMPQGZ-AVGNSLFASA-N 0.000 description 2
- VBOFRJNDIOPNDO-YUMQZZPRSA-N His-Gly-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N VBOFRJNDIOPNDO-YUMQZZPRSA-N 0.000 description 2
- PGRPSOUCWRBWKZ-DLOVCJGASA-N His-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 PGRPSOUCWRBWKZ-DLOVCJGASA-N 0.000 description 2
- BCZFOHDMCDXPDA-BZSNNMDCSA-N His-Lys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CN=CN2)N)O BCZFOHDMCDXPDA-BZSNNMDCSA-N 0.000 description 2
- TVMNTHXFRSXZGR-IHRRRGAJSA-N His-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O TVMNTHXFRSXZGR-IHRRRGAJSA-N 0.000 description 2
- KYFGGRHWLFZXPU-KKUMJFAQSA-N His-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N KYFGGRHWLFZXPU-KKUMJFAQSA-N 0.000 description 2
- STGQSBKUYSPPIG-CIUDSAMLSA-N His-Ser-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 STGQSBKUYSPPIG-CIUDSAMLSA-N 0.000 description 2
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 2
- PFOUFRJYHWZJKW-NKIYYHGXSA-N His-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O PFOUFRJYHWZJKW-NKIYYHGXSA-N 0.000 description 2
- 240000005979 Hordeum vulgare Species 0.000 description 2
- 235000007340 Hordeum vulgare Nutrition 0.000 description 2
- FADXGVVLSPPEQY-GHCJXIJMSA-N Ile-Cys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FADXGVVLSPPEQY-GHCJXIJMSA-N 0.000 description 2
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 2
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 2
- PWDSHAAAFXISLE-SXTJYALSSA-N Ile-Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O PWDSHAAAFXISLE-SXTJYALSSA-N 0.000 description 2
- ZUPJCJINYQISSN-XUXIUFHCSA-N Ile-Met-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUPJCJINYQISSN-XUXIUFHCSA-N 0.000 description 2
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 2
- FXJLRZFMKGHYJP-CFMVVWHZSA-N Ile-Tyr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FXJLRZFMKGHYJP-CFMVVWHZSA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- 240000007741 Lagenaria siceraria Species 0.000 description 2
- 235000009797 Lagenaria vulgaris Nutrition 0.000 description 2
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 2
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 2
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 2
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 2
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 2
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 2
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 2
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 2
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 2
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 2
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 2
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 2
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 2
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 2
- 241000234435 Lilium Species 0.000 description 2
- 235000004431 Linum usitatissimum Nutrition 0.000 description 2
- 240000006240 Linum usitatissimum Species 0.000 description 2
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 2
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 2
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 2
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 2
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 2
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 2
- FGMHXLULNHTPID-KKUMJFAQSA-N Lys-His-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CN=CN1 FGMHXLULNHTPID-KKUMJFAQSA-N 0.000 description 2
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 2
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 2
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 2
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 2
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 2
- YCJCEMKOZOYBEF-OEAJRASXSA-N Lys-Thr-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YCJCEMKOZOYBEF-OEAJRASXSA-N 0.000 description 2
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 2
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 2
- 240000003183 Manihot esculenta Species 0.000 description 2
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 2
- 240000004658 Medicago sativa Species 0.000 description 2
- DLAFCQWUMFMZSN-GUBZILKMSA-N Met-Arg-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N DLAFCQWUMFMZSN-GUBZILKMSA-N 0.000 description 2
- OLWAOWXIADGIJG-AVGNSLFASA-N Met-Arg-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(O)=O OLWAOWXIADGIJG-AVGNSLFASA-N 0.000 description 2
- BQVJARUIXRXDKN-DCAQKATOSA-N Met-Asn-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 BQVJARUIXRXDKN-DCAQKATOSA-N 0.000 description 2
- OFNCSQNBSWGGNV-DCAQKATOSA-N Met-Cys-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 OFNCSQNBSWGGNV-DCAQKATOSA-N 0.000 description 2
- MYKLINMAGAIRPJ-CIUDSAMLSA-N Met-Gln-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MYKLINMAGAIRPJ-CIUDSAMLSA-N 0.000 description 2
- UYAKZHGIPRCGPF-CIUDSAMLSA-N Met-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N UYAKZHGIPRCGPF-CIUDSAMLSA-N 0.000 description 2
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 2
- RIIFMEBFDDXGCV-VEVYYDQMSA-N Met-Thr-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O RIIFMEBFDDXGCV-VEVYYDQMSA-N 0.000 description 2
- VWFHWJGVLVZVIS-QXEWZRGKSA-N Met-Val-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O VWFHWJGVLVZVIS-QXEWZRGKSA-N 0.000 description 2
- OVTOTTGZBWXLFU-QXEWZRGKSA-N Met-Val-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O OVTOTTGZBWXLFU-QXEWZRGKSA-N 0.000 description 2
- 240000005561 Musa balbisiana Species 0.000 description 2
- FUSGACRLAFQQRL-UHFFFAOYSA-N N-Ethyl-N-nitrosourea Chemical compound CCN(N=O)C(N)=O FUSGACRLAFQQRL-UHFFFAOYSA-N 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- GQPLMRYTRLFLPF-UHFFFAOYSA-N Nitrous Oxide Chemical compound [O-][N+]#N GQPLMRYTRLFLPF-UHFFFAOYSA-N 0.000 description 2
- 241000218222 Parasponia andersonii Species 0.000 description 2
- 241000209046 Pennisetum Species 0.000 description 2
- 108010033276 Peptide Fragments Proteins 0.000 description 2
- 102000007079 Peptide Fragments Human genes 0.000 description 2
- 241000219833 Phaseolus Species 0.000 description 2
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 2
- 244000046052 Phaseolus vulgaris Species 0.000 description 2
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 2
- NAOVYENZCWFBDG-BZSNNMDCSA-N Phe-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 NAOVYENZCWFBDG-BZSNNMDCSA-N 0.000 description 2
- GXDPQJUBLBZKDY-IAVJCBSLSA-N Phe-Ile-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GXDPQJUBLBZKDY-IAVJCBSLSA-N 0.000 description 2
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 2
- ZUQACJLOHYRVPJ-DKIMLUQUSA-N Phe-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZUQACJLOHYRVPJ-DKIMLUQUSA-N 0.000 description 2
- BNRFQGLWLQESBG-YESZJQIVSA-N Phe-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BNRFQGLWLQESBG-YESZJQIVSA-N 0.000 description 2
- 241000242943 Pilosella aurantiaca Species 0.000 description 2
- 241000219843 Pisum Species 0.000 description 2
- 241000219000 Populus Species 0.000 description 2
- 241000168036 Populus alba Species 0.000 description 2
- 241000218976 Populus trichocarpa Species 0.000 description 2
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 2
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 2
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 2
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 2
- YTWNSIDWAFSEEI-RWMBFGLXSA-N Pro-His-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N3CCC[C@@H]3C(=O)O YTWNSIDWAFSEEI-RWMBFGLXSA-N 0.000 description 2
- NFLNBHLMLYALOO-DCAQKATOSA-N Pro-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 NFLNBHLMLYALOO-DCAQKATOSA-N 0.000 description 2
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 2
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 2
- ABSSTGUCBCDKMU-UWVGGRQHSA-N Pro-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 ABSSTGUCBCDKMU-UWVGGRQHSA-N 0.000 description 2
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 2
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 2
- DWPXHLIBFQLKLK-CYDGBPFRSA-N Pro-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 DWPXHLIBFQLKLK-CYDGBPFRSA-N 0.000 description 2
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 2
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 2
- WVXQQUWOKUZIEG-VEVYYDQMSA-N Pro-Thr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O WVXQQUWOKUZIEG-VEVYYDQMSA-N 0.000 description 2
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 2
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 2
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 2
- 244000294611 Punica granatum Species 0.000 description 2
- 235000014360 Punica granatum Nutrition 0.000 description 2
- 244000184734 Pyrus japonica Species 0.000 description 2
- 238000003559 RNA-seq method Methods 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 101150050559 SOAT1 gene Proteins 0.000 description 2
- 101100361282 Schizosaccharomyces pombe (strain 972 / ATCC 24843) rpm1 gene Proteins 0.000 description 2
- 241000811843 Senecio cambrensis Species 0.000 description 2
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 2
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 2
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 2
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 2
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 2
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 2
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 2
- RJHJPZQOMKCSTP-CIUDSAMLSA-N Ser-His-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O RJHJPZQOMKCSTP-CIUDSAMLSA-N 0.000 description 2
- ZFVFHHZBCVNLGD-GUBZILKMSA-N Ser-His-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFVFHHZBCVNLGD-GUBZILKMSA-N 0.000 description 2
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 2
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 2
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 2
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 2
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 2
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 2
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 2
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 2
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 2
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 2
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 2
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 2
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 2
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 2
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 2
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 241000208292 Solanaceae Species 0.000 description 2
- 235000002560 Solanum lycopersicum Nutrition 0.000 description 2
- 241000245671 Taraxacum sp. Species 0.000 description 2
- 244000269722 Thea sinensis Species 0.000 description 2
- 244000299461 Theobroma cacao Species 0.000 description 2
- 235000009470 Theobroma cacao Nutrition 0.000 description 2
- VIBXMCZWVUOZLA-OLHMAJIHSA-N Thr-Asn-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VIBXMCZWVUOZLA-OLHMAJIHSA-N 0.000 description 2
- NOWXWJLVGTVJKM-PBCZWWQYSA-N Thr-Asp-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O NOWXWJLVGTVJKM-PBCZWWQYSA-N 0.000 description 2
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 2
- WLDUCKSCDRIVLJ-NUMRIWBASA-N Thr-Gln-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O WLDUCKSCDRIVLJ-NUMRIWBASA-N 0.000 description 2
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 2
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 2
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 2
- UBDDORVPVLEECX-FJXKBIBVSA-N Thr-Gly-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UBDDORVPVLEECX-FJXKBIBVSA-N 0.000 description 2
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 2
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 2
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 2
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 2
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 2
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 2
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 2
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 2
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 2
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 2
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 244000186513 Trema orientalis Species 0.000 description 2
- 235000015724 Trifolium pratense Nutrition 0.000 description 2
- 240000002913 Trifolium pratense Species 0.000 description 2
- 241000209140 Triticum Species 0.000 description 2
- 244000098338 Triticum aestivum Species 0.000 description 2
- SCQBNMKLZVCXNX-ZFWWWQNUSA-N Trp-Arg-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N SCQBNMKLZVCXNX-ZFWWWQNUSA-N 0.000 description 2
- YTYHAYZPOARHAP-HOCLYGCPSA-N Trp-Lys-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N YTYHAYZPOARHAP-HOCLYGCPSA-N 0.000 description 2
- NZFCWALTLNFHHC-JYJNAYRXSA-N Tyr-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NZFCWALTLNFHHC-JYJNAYRXSA-N 0.000 description 2
- XUIOBCQESNDTDE-FQPOAREZSA-N Tyr-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XUIOBCQESNDTDE-FQPOAREZSA-N 0.000 description 2
- 244000078534 Vaccinium myrtillus Species 0.000 description 2
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 2
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 2
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 2
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 2
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 2
- MLADEWAIYAPAAU-IHRRRGAJSA-N Val-Lys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MLADEWAIYAPAAU-IHRRRGAJSA-N 0.000 description 2
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 2
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 2
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 2
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 2
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 2
- 230000009418 agronomic effect Effects 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000004790 biotic stress Effects 0.000 description 2
- -1 but not limited to Proteins 0.000 description 2
- 229960001338 colchicine Drugs 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000002405 diagnostic procedure Methods 0.000 description 2
- 108010009297 diglycyl-histidine Proteins 0.000 description 2
- 230000019827 double fertilization forming a zygote and endosperm Effects 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 230000013020 embryo development Effects 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 230000023428 female meiosis Effects 0.000 description 2
- 238000010230 functional analysis Methods 0.000 description 2
- 230000035784 germination Effects 0.000 description 2
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 2
- 108010019407 glycyl-arginyl-glycyl-aspartic acid Proteins 0.000 description 2
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 238000003306 harvesting Methods 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 108010028295 histidylhistidine Proteins 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 238000007852 inverse PCR Methods 0.000 description 2
- 235000021374 legumes Nutrition 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 2
- 230000017346 meiosis I Effects 0.000 description 2
- 230000023439 meiosis II Effects 0.000 description 2
- 230000008627 meiotic prophase Effects 0.000 description 2
- MBABOKRGFJTBAE-UHFFFAOYSA-N methyl methanesulfonate Chemical compound COS(C)(=O)=O MBABOKRGFJTBAE-UHFFFAOYSA-N 0.000 description 2
- 230000000394 mitotic effect Effects 0.000 description 2
- 239000003147 molecular marker Substances 0.000 description 2
- 230000001338 necrotic effect Effects 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 235000021018 plums Nutrition 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 230000003234 polygenic effect Effects 0.000 description 2
- 230000032361 posttranscriptional gene silencing Effects 0.000 description 2
- 235000012015 potatoes Nutrition 0.000 description 2
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 2
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 2
- 108010020432 prolyl-prolylisoleucine Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 235000013526 red clover Nutrition 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 230000001850 reproductive effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000005204 segregation Methods 0.000 description 2
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 230000000392 somatic effect Effects 0.000 description 2
- 235000013616 tea Nutrition 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 230000014621 translational initiation Effects 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 1
- SEFVRKXJJPMVHQ-YUMQZZPRSA-N (2s)-2-[[2-[[(2s)-2-[(2-aminoacetyl)amino]-5-(diaminomethylideneamino)pentanoyl]amino]acetyl]amino]butanedioic acid Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O SEFVRKXJJPMVHQ-YUMQZZPRSA-N 0.000 description 1
- RVLOMLVNNBWRSR-KNIFDHDWSA-N (2s)-2-aminopropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound C[C@H](N)C(O)=O.NCCCC[C@H](N)C(O)=O RVLOMLVNNBWRSR-KNIFDHDWSA-N 0.000 description 1
- SCAKQYSGEIHPLV-IUCAKERBSA-N (4S)-4-[(2-aminoacetyl)amino]-5-[(2S)-2-(carboxymethylcarbamoyl)pyrrolidin-1-yl]-5-oxopentanoic acid Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SCAKQYSGEIHPLV-IUCAKERBSA-N 0.000 description 1
- CUVSTAMIHSSVKL-UWVGGRQHSA-N (4s)-4-[(2-aminoacetyl)amino]-5-[[(2s)-6-amino-1-(carboxymethylamino)-1-oxohexan-2-yl]amino]-5-oxopentanoic acid Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN CUVSTAMIHSSVKL-UWVGGRQHSA-N 0.000 description 1
- 239000001707 (E,7R,11R)-3,7,11,15-tetramethylhexadec-2-en-1-ol Substances 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- WOJJIRYPFAZEPF-YFKPBYRVSA-N 2-[[(2s)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]propanoyl]amino]acetate Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)CN WOJJIRYPFAZEPF-YFKPBYRVSA-N 0.000 description 1
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 1
- XJFPXLWGZWAWRQ-UHFFFAOYSA-N 2-[[2-[[2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O XJFPXLWGZWAWRQ-UHFFFAOYSA-N 0.000 description 1
- 235000009436 Actinidia deliciosa Nutrition 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- CCUAQNUWXLYFRA-IMJSIDKUSA-N Ala-Asn Chemical compound C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O CCUAQNUWXLYFRA-IMJSIDKUSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- ZIBWKCRKNFYTPT-ZKWXMUAHSA-N Ala-Asn-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZIBWKCRKNFYTPT-ZKWXMUAHSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 1
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 1
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 1
- SHKGHIFSEAGTNL-DLOVCJGASA-N Ala-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 SHKGHIFSEAGTNL-DLOVCJGASA-N 0.000 description 1
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- HYIDEIQUCBKIPL-CQDKDKBSSA-N Ala-Phe-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N HYIDEIQUCBKIPL-CQDKDKBSSA-N 0.000 description 1
- OSRZOHXQCUFIQG-FPMFFAJLSA-N Ala-Phe-Pro Chemical compound C([C@H](NC(=O)[C@@H]([NH3+])C)C(=O)N1[C@H](CCC1)C([O-])=O)C1=CC=CC=C1 OSRZOHXQCUFIQG-FPMFFAJLSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 1
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- UCDOXFBTMLKASE-HERUPUMHSA-N Ala-Ser-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N UCDOXFBTMLKASE-HERUPUMHSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- QKHWNPQNOHEFST-VZFHVOOUSA-N Ala-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N)O QKHWNPQNOHEFST-VZFHVOOUSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 1
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 1
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- 235000005254 Allium ampeloprasum Nutrition 0.000 description 1
- 240000006108 Allium ampeloprasum Species 0.000 description 1
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 1
- 240000002234 Allium sativum Species 0.000 description 1
- 108020004491 Antisense DNA Proteins 0.000 description 1
- 240000007087 Apium graveolens Species 0.000 description 1
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 description 1
- 206010002961 Aplasia Diseases 0.000 description 1
- 241000244940 Apostasia Species 0.000 description 1
- 241001176675 Apostasia shenzhenica Species 0.000 description 1
- 235000010591 Appio Nutrition 0.000 description 1
- 241000610258 Arabidopsis lyrata Species 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- 235000010777 Arachis hypogaea Nutrition 0.000 description 1
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 1
- KJGNDQCYBNBXDA-GUBZILKMSA-N Arg-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N KJGNDQCYBNBXDA-GUBZILKMSA-N 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- WESHVRNMNFMVBE-FXQIFTODSA-N Arg-Asn-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)CN=C(N)N WESHVRNMNFMVBE-FXQIFTODSA-N 0.000 description 1
- ZTKHZAXGTFXUDD-VEVYYDQMSA-N Arg-Asn-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZTKHZAXGTFXUDD-VEVYYDQMSA-N 0.000 description 1
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 1
- NTAZNGWBXRVEDJ-FXQIFTODSA-N Arg-Asp-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NTAZNGWBXRVEDJ-FXQIFTODSA-N 0.000 description 1
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 1
- FBLMOFHNVQBKRR-IHRRRGAJSA-N Arg-Asp-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FBLMOFHNVQBKRR-IHRRRGAJSA-N 0.000 description 1
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 1
- HJAICMSAKODKRF-GUBZILKMSA-N Arg-Cys-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O HJAICMSAKODKRF-GUBZILKMSA-N 0.000 description 1
- MTANSHNQTWPZKP-KKUMJFAQSA-N Arg-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)O MTANSHNQTWPZKP-KKUMJFAQSA-N 0.000 description 1
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 1
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 1
- 108010010777 Arg-Gly-Asp-Gly Proteins 0.000 description 1
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 1
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 1
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 1
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 1
- OFIYLHVAAJYRBC-HJWJTTGWSA-N Arg-Ile-Phe Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O OFIYLHVAAJYRBC-HJWJTTGWSA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 1
- HNJNAMGZQZPSRE-GUBZILKMSA-N Arg-Pro-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O HNJNAMGZQZPSRE-GUBZILKMSA-N 0.000 description 1
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 1
- ADPACBMPYWJJCE-FXQIFTODSA-N Arg-Ser-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O ADPACBMPYWJJCE-FXQIFTODSA-N 0.000 description 1
- LFAUVOXPCGJKTB-DCAQKATOSA-N Arg-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N LFAUVOXPCGJKTB-DCAQKATOSA-N 0.000 description 1
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- OGZBJJLRKQZRHL-KJEVXHAQSA-N Arg-Thr-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OGZBJJLRKQZRHL-KJEVXHAQSA-N 0.000 description 1
- ZCSHHTFOZULVLN-SZMVWBNQSA-N Arg-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 ZCSHHTFOZULVLN-SZMVWBNQSA-N 0.000 description 1
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 1
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 1
- SWLOHUMCUDRTCL-ZLUOBGJFSA-N Asn-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N SWLOHUMCUDRTCL-ZLUOBGJFSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 1
- LXTGAOAXPSJWOU-DCAQKATOSA-N Asn-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N LXTGAOAXPSJWOU-DCAQKATOSA-N 0.000 description 1
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 1
- POOCJCRBHHMAOS-FXQIFTODSA-N Asn-Arg-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O POOCJCRBHHMAOS-FXQIFTODSA-N 0.000 description 1
- APHUDFFMXFYRKP-CIUDSAMLSA-N Asn-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N APHUDFFMXFYRKP-CIUDSAMLSA-N 0.000 description 1
- KXEGPPNPXOKKHK-ZLUOBGJFSA-N Asn-Asp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KXEGPPNPXOKKHK-ZLUOBGJFSA-N 0.000 description 1
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 1
- XWFPGQVLOVGSLU-CIUDSAMLSA-N Asn-Gln-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XWFPGQVLOVGSLU-CIUDSAMLSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- FUHFYEKSGWOWGZ-XHNCKOQMSA-N Asn-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O FUHFYEKSGWOWGZ-XHNCKOQMSA-N 0.000 description 1
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 1
- MSBDSTRUMZFSEU-PEFMBERDSA-N Asn-Glu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MSBDSTRUMZFSEU-PEFMBERDSA-N 0.000 description 1
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 1
- BKDDABUWNKGZCK-XHNCKOQMSA-N Asn-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O BKDDABUWNKGZCK-XHNCKOQMSA-N 0.000 description 1
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 1
- AITGTTNYKAWKDR-CIUDSAMLSA-N Asn-His-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O AITGTTNYKAWKDR-CIUDSAMLSA-N 0.000 description 1
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 1
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 1
- XFJKRRCWLTZIQA-XIRDDKMYSA-N Asn-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N XFJKRRCWLTZIQA-XIRDDKMYSA-N 0.000 description 1
- UYRPHDGXHKBZHJ-CIUDSAMLSA-N Asn-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N UYRPHDGXHKBZHJ-CIUDSAMLSA-N 0.000 description 1
- HMUKKNAMNSXDBB-CIUDSAMLSA-N Asn-Met-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMUKKNAMNSXDBB-CIUDSAMLSA-N 0.000 description 1
- AEZCCDMZZJOGII-DCAQKATOSA-N Asn-Met-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O AEZCCDMZZJOGII-DCAQKATOSA-N 0.000 description 1
- UOUHBHOBGDCQPQ-IHPCNDPISA-N Asn-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CC(=O)N)N UOUHBHOBGDCQPQ-IHPCNDPISA-N 0.000 description 1
- UYCPJVYQYARFGB-YDHLFZDLSA-N Asn-Phe-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UYCPJVYQYARFGB-YDHLFZDLSA-N 0.000 description 1
- JTXVXGXTRXMOFJ-FXQIFTODSA-N Asn-Pro-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O JTXVXGXTRXMOFJ-FXQIFTODSA-N 0.000 description 1
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 1
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 1
- QYRMBFWDSFGSFC-OLHMAJIHSA-N Asn-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QYRMBFWDSFGSFC-OLHMAJIHSA-N 0.000 description 1
- JPPLRQVZMZFOSX-UWJYBYFXSA-N Asn-Tyr-Ala Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 JPPLRQVZMZFOSX-UWJYBYFXSA-N 0.000 description 1
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 1
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 1
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 1
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 1
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 1
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- XACXDSRQIXRMNS-OLHMAJIHSA-N Asp-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)O XACXDSRQIXRMNS-OLHMAJIHSA-N 0.000 description 1
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 1
- JGDBHIVECJGXJA-FXQIFTODSA-N Asp-Asp-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JGDBHIVECJGXJA-FXQIFTODSA-N 0.000 description 1
- FRSGNOZCTWDVFZ-ACZMJKKPSA-N Asp-Asp-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O FRSGNOZCTWDVFZ-ACZMJKKPSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- RSMIHCFQDCVVBR-CIUDSAMLSA-N Asp-Gln-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N RSMIHCFQDCVVBR-CIUDSAMLSA-N 0.000 description 1
- LJRPYAZQQWHEEV-FXQIFTODSA-N Asp-Gln-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O LJRPYAZQQWHEEV-FXQIFTODSA-N 0.000 description 1
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 1
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 1
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- OGTCOKZFOJIZFG-CIUDSAMLSA-N Asp-His-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O OGTCOKZFOJIZFG-CIUDSAMLSA-N 0.000 description 1
- CRNKLABLTICXDV-GUBZILKMSA-N Asp-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N CRNKLABLTICXDV-GUBZILKMSA-N 0.000 description 1
- YRBGRUOSJROZEI-NHCYSSNCSA-N Asp-His-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O YRBGRUOSJROZEI-NHCYSSNCSA-N 0.000 description 1
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 1
- TZOZNVLBTAFJRW-UGYAYLCHSA-N Asp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N TZOZNVLBTAFJRW-UGYAYLCHSA-N 0.000 description 1
- KQBVNNAPIURMPD-PEFMBERDSA-N Asp-Ile-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KQBVNNAPIURMPD-PEFMBERDSA-N 0.000 description 1
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 1
- AITKTFCQOBRJTG-CIUDSAMLSA-N Asp-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N AITKTFCQOBRJTG-CIUDSAMLSA-N 0.000 description 1
- MYOHQBFRJQFIDZ-KKUMJFAQSA-N Asp-Leu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYOHQBFRJQFIDZ-KKUMJFAQSA-N 0.000 description 1
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 1
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 1
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 1
- NZWDWXSWUQCNMG-GARJFASQSA-N Asp-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)C(=O)O NZWDWXSWUQCNMG-GARJFASQSA-N 0.000 description 1
- SJLDOGLMVPHPLZ-IHRRRGAJSA-N Asp-Met-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SJLDOGLMVPHPLZ-IHRRRGAJSA-N 0.000 description 1
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 1
- PWAIZUBWHRHYKS-MELADBBJSA-N Asp-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)O)N)C(=O)O PWAIZUBWHRHYKS-MELADBBJSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 1
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- GWWSUMLEWKQHLR-NUMRIWBASA-N Asp-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GWWSUMLEWKQHLR-NUMRIWBASA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 244000003416 Asparagus officinalis Species 0.000 description 1
- 235000005340 Asparagus officinalis Nutrition 0.000 description 1
- 101100437175 Aspergillus niger (strain ATCC 1015 / CBS 113.46 / FGSC A1144 / LSHB Ac4 / NCTC 3858a / NRRL 328 / USDA 3528.7) azaC gene Proteins 0.000 description 1
- 235000016068 Berberis vulgaris Nutrition 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 241000743776 Brachypodium distachyon Species 0.000 description 1
- 244000178993 Brassica juncea Species 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000004221 Brassica oleracea var gemmifera Nutrition 0.000 description 1
- 235000017647 Brassica oleracea var italica Nutrition 0.000 description 1
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 1
- 244000308368 Brassica oleracea var. gemmifera Species 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 235000004936 Bromus mango Nutrition 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 235000008697 Cannabis sativa Nutrition 0.000 description 1
- 235000012766 Cannabis sativa ssp. sativa var. sativa Nutrition 0.000 description 1
- 235000012765 Cannabis sativa ssp. sativa var. spontanea Nutrition 0.000 description 1
- 241001610404 Capsella rubella Species 0.000 description 1
- 235000007862 Capsicum baccatum Nutrition 0.000 description 1
- 240000001844 Capsicum baccatum Species 0.000 description 1
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 1
- 244000020518 Carthamus tinctorius Species 0.000 description 1
- 241001495673 Cenchrus ciliaris Species 0.000 description 1
- 241000220271 Cephalotus follicularis Species 0.000 description 1
- 240000005250 Chrysanthemum indicum Species 0.000 description 1
- 244000189548 Chrysanthemum x morifolium Species 0.000 description 1
- 235000007542 Cichorium intybus Nutrition 0.000 description 1
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 description 1
- 235000008733 Citrus aurantifolia Nutrition 0.000 description 1
- 235000005979 Citrus limon Nutrition 0.000 description 1
- 244000131522 Citrus pyriformis Species 0.000 description 1
- 240000000560 Citrus x paradisi Species 0.000 description 1
- 235000013162 Cocos nucifera Nutrition 0.000 description 1
- 244000060011 Cocos nucifera Species 0.000 description 1
- 240000004270 Colocasia esculenta var. antiquorum Species 0.000 description 1
- 206010010144 Completed suicide Diseases 0.000 description 1
- 241000218631 Coniferophyta Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 108010051219 Cre recombinase Proteins 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- 241000219122 Cucurbita Species 0.000 description 1
- 240000007371 Cuscuta campestris Species 0.000 description 1
- 244000019459 Cynara cardunculus Species 0.000 description 1
- 235000019106 Cynara scolymus Nutrition 0.000 description 1
- YFXFOZPXVFPBDH-VZFHVOOUSA-N Cys-Ala-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)CS)C(O)=O YFXFOZPXVFPBDH-VZFHVOOUSA-N 0.000 description 1
- MBPKYKSYUAPLMY-DCAQKATOSA-N Cys-Arg-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MBPKYKSYUAPLMY-DCAQKATOSA-N 0.000 description 1
- DCXGXDGGXVZVMY-GHCJXIJMSA-N Cys-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CS DCXGXDGGXVZVMY-GHCJXIJMSA-N 0.000 description 1
- YMBAVNPKBWHDAW-CIUDSAMLSA-N Cys-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N YMBAVNPKBWHDAW-CIUDSAMLSA-N 0.000 description 1
- BPHKULHWEIUDOB-FXQIFTODSA-N Cys-Gln-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BPHKULHWEIUDOB-FXQIFTODSA-N 0.000 description 1
- HQZGVYJBRSISDT-BQBZGAKWSA-N Cys-Gly-Arg Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQZGVYJBRSISDT-BQBZGAKWSA-N 0.000 description 1
- KPENUVBHAKRDQR-GUBZILKMSA-N Cys-His-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPENUVBHAKRDQR-GUBZILKMSA-N 0.000 description 1
- HAYVLBZZBDCKRA-SRVKXCTJSA-N Cys-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N HAYVLBZZBDCKRA-SRVKXCTJSA-N 0.000 description 1
- WTNLLMQAFPOCTJ-GARJFASQSA-N Cys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CS)N)C(=O)O WTNLLMQAFPOCTJ-GARJFASQSA-N 0.000 description 1
- MKMKILWCRQLDFJ-DCAQKATOSA-N Cys-Lys-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MKMKILWCRQLDFJ-DCAQKATOSA-N 0.000 description 1
- KGIHMGPYGXBYJJ-SRVKXCTJSA-N Cys-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CS KGIHMGPYGXBYJJ-SRVKXCTJSA-N 0.000 description 1
- NLDWTJBJFVWBDQ-KKUMJFAQSA-N Cys-Lys-Phe Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NLDWTJBJFVWBDQ-KKUMJFAQSA-N 0.000 description 1
- GFMJUESGWILPEN-MELADBBJSA-N Cys-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CS)N)C(=O)O GFMJUESGWILPEN-MELADBBJSA-N 0.000 description 1
- XBELMDARIGXDKY-GUBZILKMSA-N Cys-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CS)N XBELMDARIGXDKY-GUBZILKMSA-N 0.000 description 1
- NDNZRWUDUMTITL-FXQIFTODSA-N Cys-Ser-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NDNZRWUDUMTITL-FXQIFTODSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- 101150082102 DIP gene Proteins 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 1
- 238000007900 DNA-DNA hybridization Methods 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 241000208175 Daucus Species 0.000 description 1
- 208000005156 Dehydration Diseases 0.000 description 1
- 102100028576 Deleted in azoospermia protein 3 Human genes 0.000 description 1
- 241000859983 Dendrobium catenatum Species 0.000 description 1
- 235000002723 Dioscorea alata Nutrition 0.000 description 1
- 235000007056 Dioscorea composita Nutrition 0.000 description 1
- 235000009723 Dioscorea convolvulacea Nutrition 0.000 description 1
- 235000005362 Dioscorea floribunda Nutrition 0.000 description 1
- 235000004868 Dioscorea macrostachya Nutrition 0.000 description 1
- 235000005361 Dioscorea nummularia Nutrition 0.000 description 1
- 235000005360 Dioscorea spiculiflora Nutrition 0.000 description 1
- 241001499783 Dorcoceras hygrometricum Species 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 101150111720 EPSPS gene Proteins 0.000 description 1
- 102000002322 Egg Proteins Human genes 0.000 description 1
- 108010000912 Egg Proteins Proteins 0.000 description 1
- 235000001950 Elaeis guineensis Nutrition 0.000 description 1
- 244000127993 Elaeis melanococca Species 0.000 description 1
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 description 1
- 239000005977 Ethylene Substances 0.000 description 1
- 244000166124 Eucalyptus globulus Species 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 235000010099 Fagus sylvatica Nutrition 0.000 description 1
- 240000000731 Fagus sylvatica Species 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 235000004204 Foeniculum vulgare Nutrition 0.000 description 1
- 240000006927 Foeniculum vulgare Species 0.000 description 1
- 240000009088 Fragaria x ananassa Species 0.000 description 1
- 108010072062 GEKG peptide Proteins 0.000 description 1
- 241001441858 Genlisea aurea Species 0.000 description 1
- 241000735332 Gerbera Species 0.000 description 1
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 1
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 1
- RGXXLQWXBFNXTG-CIUDSAMLSA-N Gln-Arg-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O RGXXLQWXBFNXTG-CIUDSAMLSA-N 0.000 description 1
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 1
- RGRMOYQUIJVQQD-SRVKXCTJSA-N Gln-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N RGRMOYQUIJVQQD-SRVKXCTJSA-N 0.000 description 1
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 1
- RKAQZCDMSUQTSS-FXQIFTODSA-N Gln-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RKAQZCDMSUQTSS-FXQIFTODSA-N 0.000 description 1
- IXFVOPOHSRKJNG-LAEOZQHASA-N Gln-Asp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IXFVOPOHSRKJNG-LAEOZQHASA-N 0.000 description 1
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 1
- XFKUFUJECJUQTQ-CIUDSAMLSA-N Gln-Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XFKUFUJECJUQTQ-CIUDSAMLSA-N 0.000 description 1
- AJDMYLOISOCHHC-YVNDNENWSA-N Gln-Gln-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AJDMYLOISOCHHC-YVNDNENWSA-N 0.000 description 1
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 1
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 1
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 1
- XSBGUANSZDGULP-IUCAKERBSA-N Gln-Gly-Lys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O XSBGUANSZDGULP-IUCAKERBSA-N 0.000 description 1
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 1
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 1
- YRWWJCDWLVXTHN-LAEOZQHASA-N Gln-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N YRWWJCDWLVXTHN-LAEOZQHASA-N 0.000 description 1
- ZNTDJIMJKNNSLR-RWRJDSDZSA-N Gln-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZNTDJIMJKNNSLR-RWRJDSDZSA-N 0.000 description 1
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 1
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 1
- GURIQZQSTBBHRV-SRVKXCTJSA-N Gln-Lys-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GURIQZQSTBBHRV-SRVKXCTJSA-N 0.000 description 1
- QMVCEWKHIUHTSD-GUBZILKMSA-N Gln-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QMVCEWKHIUHTSD-GUBZILKMSA-N 0.000 description 1
- RWCBJYUPAUTWJD-NHCYSSNCSA-N Gln-Met-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O RWCBJYUPAUTWJD-NHCYSSNCSA-N 0.000 description 1
- PBYFVIQRFLNQCO-GUBZILKMSA-N Gln-Pro-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O PBYFVIQRFLNQCO-GUBZILKMSA-N 0.000 description 1
- MQJDLNRXBOELJW-KKUMJFAQSA-N Gln-Pro-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O MQJDLNRXBOELJW-KKUMJFAQSA-N 0.000 description 1
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 1
- GTBXHETZPUURJE-KKUMJFAQSA-N Gln-Tyr-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GTBXHETZPUURJE-KKUMJFAQSA-N 0.000 description 1
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 1
- RCCDHXSRMWCOOY-GUBZILKMSA-N Glu-Arg-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCCDHXSRMWCOOY-GUBZILKMSA-N 0.000 description 1
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 1
- SRZLHYPAOXBBSB-HJGDQZAQSA-N Glu-Arg-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SRZLHYPAOXBBSB-HJGDQZAQSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- GZWOBWMOMPFPCD-CIUDSAMLSA-N Glu-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N GZWOBWMOMPFPCD-CIUDSAMLSA-N 0.000 description 1
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 1
- WLIPTFCZLHCNFD-LPEHRKFASA-N Glu-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O WLIPTFCZLHCNFD-LPEHRKFASA-N 0.000 description 1
- MIQCYAJSDGNCNK-BPUTZDHNSA-N Glu-Gln-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MIQCYAJSDGNCNK-BPUTZDHNSA-N 0.000 description 1
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- LYCDZGLXQBPNQU-WDSKDSINSA-N Glu-Gly-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O LYCDZGLXQBPNQU-WDSKDSINSA-N 0.000 description 1
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- WVTIBGWZUMJBFY-GUBZILKMSA-N Glu-His-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O WVTIBGWZUMJBFY-GUBZILKMSA-N 0.000 description 1
- ZPASCJBSSCRWMC-GVXVVHGQSA-N Glu-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N ZPASCJBSSCRWMC-GVXVVHGQSA-N 0.000 description 1
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 1
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- LZMQSTPFYJLVJB-GUBZILKMSA-N Glu-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N LZMQSTPFYJLVJB-GUBZILKMSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- UJMNFCAHLYKWOZ-DCAQKATOSA-N Glu-Lys-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UJMNFCAHLYKWOZ-DCAQKATOSA-N 0.000 description 1
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- ZWMYUDZLXAQHCK-CIUDSAMLSA-N Glu-Met-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O ZWMYUDZLXAQHCK-CIUDSAMLSA-N 0.000 description 1
- JHSRJMUJOGLIHK-GUBZILKMSA-N Glu-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N JHSRJMUJOGLIHK-GUBZILKMSA-N 0.000 description 1
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 1
- CBWKURKPYSLMJV-SOUVJXGZSA-N Glu-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CBWKURKPYSLMJV-SOUVJXGZSA-N 0.000 description 1
- ITVBKCZZLJUUHI-HTUGSXCWSA-N Glu-Phe-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ITVBKCZZLJUUHI-HTUGSXCWSA-N 0.000 description 1
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 1
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 1
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 1
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 1
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 1
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 1
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 1
- MZZSCEANQDPJER-ONGXEEELSA-N Gly-Ala-Phe Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MZZSCEANQDPJER-ONGXEEELSA-N 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- AIJAPFVDBFYNKN-WHFBIAKZSA-N Gly-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN)C(=O)N AIJAPFVDBFYNKN-WHFBIAKZSA-N 0.000 description 1
- DUYYPIRFTLOAJQ-YUMQZZPRSA-N Gly-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN DUYYPIRFTLOAJQ-YUMQZZPRSA-N 0.000 description 1
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 1
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 1
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- MVORZMQFXBLMHM-QWRGUYRKSA-N Gly-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 MVORZMQFXBLMHM-QWRGUYRKSA-N 0.000 description 1
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 1
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 1
- BXICSAQLIHFDDL-YUMQZZPRSA-N Gly-Lys-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BXICSAQLIHFDDL-YUMQZZPRSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 1
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 1
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 1
- 239000005562 Glyphosate Substances 0.000 description 1
- 240000000047 Gossypium barbadense Species 0.000 description 1
- 235000009432 Gossypium hirsutum Nutrition 0.000 description 1
- 241001188564 Gymnosoma par Species 0.000 description 1
- 241000208818 Helianthus Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- BIAKMWKJMQLZOJ-ZKWXMUAHSA-N His-Ala-Ala Chemical compound C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O BIAKMWKJMQLZOJ-ZKWXMUAHSA-N 0.000 description 1
- HTZKFIYQMHJWSQ-INTQDDNPSA-N His-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HTZKFIYQMHJWSQ-INTQDDNPSA-N 0.000 description 1
- PROLDOGUBQJNPG-RWMBFGLXSA-N His-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O PROLDOGUBQJNPG-RWMBFGLXSA-N 0.000 description 1
- MAABHGXCIBEYQR-XVYDVKMFSA-N His-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MAABHGXCIBEYQR-XVYDVKMFSA-N 0.000 description 1
- JWLWNCVBBSBCEM-NKIYYHGXSA-N His-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N)O JWLWNCVBBSBCEM-NKIYYHGXSA-N 0.000 description 1
- HAPWZEVRQYGLSG-IUCAKERBSA-N His-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O HAPWZEVRQYGLSG-IUCAKERBSA-N 0.000 description 1
- FDQYIRHBVVUTJF-ZETCQYMHSA-N His-Gly-Gly Chemical compound [O-]C(=O)CNC(=O)CNC(=O)[C@@H]([NH3+])CC1=CN=CN1 FDQYIRHBVVUTJF-ZETCQYMHSA-N 0.000 description 1
- FYTCLUIYTYFGPT-YUMQZZPRSA-N His-Gly-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FYTCLUIYTYFGPT-YUMQZZPRSA-N 0.000 description 1
- JUIOPCXACJLRJK-AVGNSLFASA-N His-Lys-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N JUIOPCXACJLRJK-AVGNSLFASA-N 0.000 description 1
- BZAQOPHNBFOOJS-DCAQKATOSA-N His-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O BZAQOPHNBFOOJS-DCAQKATOSA-N 0.000 description 1
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 1
- UOYGZBIPZYKGSH-SRVKXCTJSA-N His-Ser-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N UOYGZBIPZYKGSH-SRVKXCTJSA-N 0.000 description 1
- FCPSGEVYIVXPPO-QTKMDUPCSA-N His-Thr-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FCPSGEVYIVXPPO-QTKMDUPCSA-N 0.000 description 1
- IXQGOKWTQPCIQM-YJRXYDGGSA-N His-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O IXQGOKWTQPCIQM-YJRXYDGGSA-N 0.000 description 1
- UPJODPVSKKWGDQ-KLHWPWHYSA-N His-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O UPJODPVSKKWGDQ-KLHWPWHYSA-N 0.000 description 1
- PUFNQIPSRXVLQJ-IHRRRGAJSA-N His-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N PUFNQIPSRXVLQJ-IHRRRGAJSA-N 0.000 description 1
- GBMSSORHVHAYLU-QTKMDUPCSA-N His-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N)O GBMSSORHVHAYLU-QTKMDUPCSA-N 0.000 description 1
- 101000915400 Homo sapiens Deleted in azoospermia protein 3 Proteins 0.000 description 1
- 241000209219 Hordeum Species 0.000 description 1
- 241000257303 Hymenoptera Species 0.000 description 1
- 206010020649 Hyperkeratosis Diseases 0.000 description 1
- JXUGDUWBMKIJDC-NAKRPEOUSA-N Ile-Ala-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JXUGDUWBMKIJDC-NAKRPEOUSA-N 0.000 description 1
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 1
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 1
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 1
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 1
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 1
- IIXDMJNYALIKGP-DJFWLOJKSA-N Ile-Asn-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N IIXDMJNYALIKGP-DJFWLOJKSA-N 0.000 description 1
- QIHJTGSVGIPHIW-QSFUFRPTSA-N Ile-Asn-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N QIHJTGSVGIPHIW-QSFUFRPTSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- CTHAJJYOHOBUDY-GHCJXIJMSA-N Ile-Cys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N CTHAJJYOHOBUDY-GHCJXIJMSA-N 0.000 description 1
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 1
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 1
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 1
- BBQABUDWDUKJMB-LZXPERKUSA-N Ile-Ile-Ile Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O BBQABUDWDUKJMB-LZXPERKUSA-N 0.000 description 1
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 1
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 1
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 1
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 1
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 1
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 1
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 1
- 206010021929 Infertility male Diseases 0.000 description 1
- 108700001097 Insect Genes Proteins 0.000 description 1
- 235000006350 Ipomoea batatas var. batatas Nutrition 0.000 description 1
- 235000009496 Juglans regia Nutrition 0.000 description 1
- 240000007049 Juglans regia Species 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 1
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 1
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 1
- RFUBXQQFJFGJFV-GUBZILKMSA-N Leu-Asn-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RFUBXQQFJFGJFV-GUBZILKMSA-N 0.000 description 1
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 1
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 1
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- RRSLQOLASISYTB-CIUDSAMLSA-N Leu-Cys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O RRSLQOLASISYTB-CIUDSAMLSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- IWTBYNQNAPECCS-AVGNSLFASA-N Leu-Glu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IWTBYNQNAPECCS-AVGNSLFASA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- BTNXKBVLWJBTNR-SRVKXCTJSA-N Leu-His-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O BTNXKBVLWJBTNR-SRVKXCTJSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- ZALAVHVPPOHAOL-XUXIUFHCSA-N Leu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N ZALAVHVPPOHAOL-XUXIUFHCSA-N 0.000 description 1
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 1
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 1
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 1
- KTOIECMYZZGVSI-BZSNNMDCSA-N Leu-Phe-His Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 KTOIECMYZZGVSI-BZSNNMDCSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 1
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- FMFNIDICDKEMOE-XUXIUFHCSA-N Leu-Val-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMFNIDICDKEMOE-XUXIUFHCSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- 241000208204 Linum Species 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 1
- BTSXLXFPMZXVPR-DLOVCJGASA-N Lys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BTSXLXFPMZXVPR-DLOVCJGASA-N 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- ZTPWXNOOKAXPPE-DCAQKATOSA-N Lys-Arg-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N ZTPWXNOOKAXPPE-DCAQKATOSA-N 0.000 description 1
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 1
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 1
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 1
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- HIIZIQUUHIXUJY-GUBZILKMSA-N Lys-Asp-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HIIZIQUUHIXUJY-GUBZILKMSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 1
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 1
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 1
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 1
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- DAOSYIZXRCOKII-SRVKXCTJSA-N Lys-His-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O DAOSYIZXRCOKII-SRVKXCTJSA-N 0.000 description 1
- PGLGNCVOWIORQE-SRVKXCTJSA-N Lys-His-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O PGLGNCVOWIORQE-SRVKXCTJSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- PYFNONMJYNJENN-AVGNSLFASA-N Lys-Lys-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PYFNONMJYNJENN-AVGNSLFASA-N 0.000 description 1
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 1
- JQSIGLHQNSZZRL-KKUMJFAQSA-N Lys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N JQSIGLHQNSZZRL-KKUMJFAQSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 1
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 1
- MSSJJDVQTFTLIF-KBPBESRZSA-N Lys-Phe-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O MSSJJDVQTFTLIF-KBPBESRZSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- CRIODIGWCUPXKU-AVGNSLFASA-N Lys-Pro-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O CRIODIGWCUPXKU-AVGNSLFASA-N 0.000 description 1
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 1
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 1
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 1
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 1
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 1
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 208000007466 Male Infertility Diseases 0.000 description 1
- 244000070406 Malus silvestris Species 0.000 description 1
- 235000014826 Mangifera indica Nutrition 0.000 description 1
- 240000007228 Mangifera indica Species 0.000 description 1
- 241000219823 Medicago Species 0.000 description 1
- 235000010624 Medicago sativa Nutrition 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- 241000219828 Medicago truncatula Species 0.000 description 1
- 235000006679 Mentha X verticillata Nutrition 0.000 description 1
- 235000002899 Mentha suaveolens Nutrition 0.000 description 1
- 235000001636 Mentha x rotundifolia Nutrition 0.000 description 1
- LMKSBGIUPVRHEH-FXQIFTODSA-N Met-Ala-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(N)=O LMKSBGIUPVRHEH-FXQIFTODSA-N 0.000 description 1
- AHZNUGRZHMZGFL-GUBZILKMSA-N Met-Arg-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCNC(N)=N AHZNUGRZHMZGFL-GUBZILKMSA-N 0.000 description 1
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 1
- DNDVVILEHVMWIS-LPEHRKFASA-N Met-Asp-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DNDVVILEHVMWIS-LPEHRKFASA-N 0.000 description 1
- FVKRQMQQFGBXHV-QXEWZRGKSA-N Met-Asp-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FVKRQMQQFGBXHV-QXEWZRGKSA-N 0.000 description 1
- FWTBMGAKKPSTBT-GUBZILKMSA-N Met-Gln-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FWTBMGAKKPSTBT-GUBZILKMSA-N 0.000 description 1
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 1
- HZLSUXCMSIBCRV-RVMXOQNASA-N Met-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N HZLSUXCMSIBCRV-RVMXOQNASA-N 0.000 description 1
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 1
- WTHGNAAQXISJHP-AVGNSLFASA-N Met-Lys-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WTHGNAAQXISJHP-AVGNSLFASA-N 0.000 description 1
- XGIQKEAKUSPCBU-SRVKXCTJSA-N Met-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCSC)N XGIQKEAKUSPCBU-SRVKXCTJSA-N 0.000 description 1
- VQILILSLEFDECU-GUBZILKMSA-N Met-Pro-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O VQILILSLEFDECU-GUBZILKMSA-N 0.000 description 1
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 1
- IIHMNTBFPMRJCN-RCWTZXSCSA-N Met-Val-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IIHMNTBFPMRJCN-RCWTZXSCSA-N 0.000 description 1
- 108091092878 Microsatellite Proteins 0.000 description 1
- 241000409625 Morus notabilis Species 0.000 description 1
- 235000006161 Mucuna pruriens Nutrition 0.000 description 1
- 244000111261 Mucuna pruriens Species 0.000 description 1
- 235000003805 Musa ABB Group Nutrition 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000016538 Myb domains Human genes 0.000 description 1
- 108050006056 Myb domains Proteins 0.000 description 1
- 101710147844 Myb protein Proteins 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 241000208125 Nicotiana Species 0.000 description 1
- 241000228653 Nicotiana attenuata Species 0.000 description 1
- 241000208136 Nicotiana sylvestris Species 0.000 description 1
- 101100123122 Nicotiana tabacum PARA gene Proteins 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 108091005461 Nucleic proteins Chemical group 0.000 description 1
- 235000010676 Ocimum basilicum Nutrition 0.000 description 1
- 240000007926 Ocimum gratissimum Species 0.000 description 1
- 235000017090 Oryza barthii Nutrition 0.000 description 1
- 240000003010 Oryza longistaminata Species 0.000 description 1
- 235000007189 Oryza longistaminata Nutrition 0.000 description 1
- 240000002582 Oryza sativa Indica Group Species 0.000 description 1
- 235000005044 Oryza sativa Indica Group Nutrition 0.000 description 1
- 235000005043 Oryza sativa Japonica Group Nutrition 0.000 description 1
- 239000005587 Oryzalin Substances 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 241000209117 Panicum Species 0.000 description 1
- 240000008114 Panicum miliaceum Species 0.000 description 1
- 235000007199 Panicum miliaceum Nutrition 0.000 description 1
- 235000006443 Panicum miliaceum subsp. miliaceum Nutrition 0.000 description 1
- 235000009037 Panicum miliaceum subsp. ruderale Nutrition 0.000 description 1
- 206010034133 Pathogen resistance Diseases 0.000 description 1
- 244000038248 Pennisetum spicatum Species 0.000 description 1
- 244000115721 Pennisetum typhoides Species 0.000 description 1
- 235000007195 Pennisetum typhoides Nutrition 0.000 description 1
- 244000062780 Petroselinum sativum Species 0.000 description 1
- 240000007377 Petunia x hybrida Species 0.000 description 1
- QEPZQAPZKIPVDV-KKUMJFAQSA-N Phe-Cys-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N QEPZQAPZKIPVDV-KKUMJFAQSA-N 0.000 description 1
- NKLDZIPTGKBDBB-HTUGSXCWSA-N Phe-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O NKLDZIPTGKBDBB-HTUGSXCWSA-N 0.000 description 1
- HNFUGJUZJRYUHN-JSGCOSHPSA-N Phe-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HNFUGJUZJRYUHN-JSGCOSHPSA-N 0.000 description 1
- ONORAGIFHNAADN-LLLHUVSDSA-N Phe-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N ONORAGIFHNAADN-LLLHUVSDSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 1
- SCKXGHWQPPURGT-KKUMJFAQSA-N Phe-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O SCKXGHWQPPURGT-KKUMJFAQSA-N 0.000 description 1
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 1
- RYQWALWYQWBUKN-FHWLQOOXSA-N Phe-Phe-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RYQWALWYQWBUKN-FHWLQOOXSA-N 0.000 description 1
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 1
- RVEVENLSADZUMS-IHRRRGAJSA-N Phe-Pro-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RVEVENLSADZUMS-IHRRRGAJSA-N 0.000 description 1
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 1
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 1
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 1
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 1
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 1
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 1
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 1
- GLUYKHMBGKQBHE-JYJNAYRXSA-N Phe-Val-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 GLUYKHMBGKQBHE-JYJNAYRXSA-N 0.000 description 1
- GNZCMRRSXOBHLC-JYJNAYRXSA-N Phe-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N GNZCMRRSXOBHLC-JYJNAYRXSA-N 0.000 description 1
- XBCOOBCTVMMQSC-BVSLBCMMSA-N Phe-Val-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 XBCOOBCTVMMQSC-BVSLBCMMSA-N 0.000 description 1
- BLUHKGOSFDHHGX-UHFFFAOYSA-N Phytol Natural products CC(C)CCCC(C)CCCC(C)CCCC(C)C=CO BLUHKGOSFDHHGX-UHFFFAOYSA-N 0.000 description 1
- 240000008299 Pinus lambertiana Species 0.000 description 1
- 241000758706 Piperaceae Species 0.000 description 1
- 235000010582 Pisum sativum Nutrition 0.000 description 1
- 240000004713 Pisum sativum Species 0.000 description 1
- 108020005089 Plant RNA Proteins 0.000 description 1
- 235000015266 Plantago major Nutrition 0.000 description 1
- 108091036407 Polyadenylation Proteins 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 1
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 1
- HPXVFFIIGOAQRV-DCAQKATOSA-N Pro-Arg-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O HPXVFFIIGOAQRV-DCAQKATOSA-N 0.000 description 1
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 1
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 1
- QSKCKTUQPICLSO-AVGNSLFASA-N Pro-Arg-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O QSKCKTUQPICLSO-AVGNSLFASA-N 0.000 description 1
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 1
- VPVHXWGPALPDGP-GUBZILKMSA-N Pro-Asn-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPVHXWGPALPDGP-GUBZILKMSA-N 0.000 description 1
- SMCHPSMKAFIERP-FXQIFTODSA-N Pro-Asn-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 SMCHPSMKAFIERP-FXQIFTODSA-N 0.000 description 1
- TXPUNZXZDVJUJQ-LPEHRKFASA-N Pro-Asn-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O TXPUNZXZDVJUJQ-LPEHRKFASA-N 0.000 description 1
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 1
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 1
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 1
- UEHYFUCOGHWASA-HJGDQZAQSA-N Pro-Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 UEHYFUCOGHWASA-HJGDQZAQSA-N 0.000 description 1
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 1
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 1
- GBRUQFBAJOKCTF-DCAQKATOSA-N Pro-His-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O GBRUQFBAJOKCTF-DCAQKATOSA-N 0.000 description 1
- KLSOMAFWRISSNI-OSUNSFLBSA-N Pro-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 KLSOMAFWRISSNI-OSUNSFLBSA-N 0.000 description 1
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 1
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 1
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 1
- HBBBLSVBQGZKOZ-GUBZILKMSA-N Pro-Met-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O HBBBLSVBQGZKOZ-GUBZILKMSA-N 0.000 description 1
- HOTVCUAVDQHUDB-UFYCRDLUSA-N Pro-Phe-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 HOTVCUAVDQHUDB-UFYCRDLUSA-N 0.000 description 1
- FHZJRBVMLGOHBX-GUBZILKMSA-N Pro-Pro-Asp Chemical compound OC(=O)C[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H]1CCCN1)C(O)=O FHZJRBVMLGOHBX-GUBZILKMSA-N 0.000 description 1
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 1
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 1
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 1
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 1
- GBUNEGKQPSAMNK-QTKMDUPCSA-N Pro-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2)O GBUNEGKQPSAMNK-QTKMDUPCSA-N 0.000 description 1
- GNFHQWNCSSPOBT-ULQDDVLXSA-N Pro-Trp-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCC(=O)N)C(=O)O GNFHQWNCSSPOBT-ULQDDVLXSA-N 0.000 description 1
- WWXNZNWZNZPDIF-SRVKXCTJSA-N Pro-Val-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 WWXNZNWZNZPDIF-SRVKXCTJSA-N 0.000 description 1
- OOZJHTXCLJUODH-QXEWZRGKSA-N Pro-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 OOZJHTXCLJUODH-QXEWZRGKSA-N 0.000 description 1
- STGVYUTZKGPRCI-GUBZILKMSA-N Pro-Val-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 STGVYUTZKGPRCI-GUBZILKMSA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 1
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 1
- 235000009827 Prunus armeniaca Nutrition 0.000 description 1
- 244000018633 Prunus armeniaca Species 0.000 description 1
- 241001290151 Prunus avium subsp. avium Species 0.000 description 1
- 235000006029 Prunus persica var nucipersica Nutrition 0.000 description 1
- 235000006040 Prunus persica var persica Nutrition 0.000 description 1
- 244000017714 Prunus persica var. nucipersica Species 0.000 description 1
- 241000219492 Quercus Species 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 244000088415 Raphanus sativus Species 0.000 description 1
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 description 1
- 108010034634 Repressor Proteins Proteins 0.000 description 1
- 235000011449 Rosa Nutrition 0.000 description 1
- 235000004789 Rosa xanthina Nutrition 0.000 description 1
- 241000220222 Rosaceae Species 0.000 description 1
- 240000007651 Rubus glaucus Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241000124033 Salix Species 0.000 description 1
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- IYCBDVBJWDXQRR-FXQIFTODSA-N Ser-Ala-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IYCBDVBJWDXQRR-FXQIFTODSA-N 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 1
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 1
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 1
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 1
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 1
- TUYBIWUZWJUZDD-ACZMJKKPSA-N Ser-Cys-Gln Chemical compound OC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCC(N)=O TUYBIWUZWJUZDD-ACZMJKKPSA-N 0.000 description 1
- MOVJSUIKUNCVMG-ZLUOBGJFSA-N Ser-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)O MOVJSUIKUNCVMG-ZLUOBGJFSA-N 0.000 description 1
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 1
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 1
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 1
- CLKKNZQUQMZDGD-SRVKXCTJSA-N Ser-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CN=CN1 CLKKNZQUQMZDGD-SRVKXCTJSA-N 0.000 description 1
- MLSQXWSRHURDMF-GARJFASQSA-N Ser-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N)C(=O)O MLSQXWSRHURDMF-GARJFASQSA-N 0.000 description 1
- CAOYHZOWXFFAIR-CIUDSAMLSA-N Ser-His-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CAOYHZOWXFFAIR-CIUDSAMLSA-N 0.000 description 1
- ZUDXUJSYCCNZQJ-DCAQKATOSA-N Ser-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N ZUDXUJSYCCNZQJ-DCAQKATOSA-N 0.000 description 1
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 1
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 1
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 1
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 1
- GDUZTEQRAOXYJS-SRVKXCTJSA-N Ser-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GDUZTEQRAOXYJS-SRVKXCTJSA-N 0.000 description 1
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 1
- WOJYIMBIKTWKJO-KKUMJFAQSA-N Ser-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CO)N WOJYIMBIKTWKJO-KKUMJFAQSA-N 0.000 description 1
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 1
- QPPYAWVLAVXISR-DCAQKATOSA-N Ser-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QPPYAWVLAVXISR-DCAQKATOSA-N 0.000 description 1
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- 235000008515 Setaria glauca Nutrition 0.000 description 1
- 241001291279 Solanum galapagense Species 0.000 description 1
- 235000007230 Sorghum bicolor Nutrition 0.000 description 1
- 235000009337 Spinacia oleracea Nutrition 0.000 description 1
- 244000300264 Spinacia oleracea Species 0.000 description 1
- 235000009184 Spondias indica Nutrition 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- 101150006914 TRP1 gene Proteins 0.000 description 1
- 241000341871 Taraxacum kok-saghyz Species 0.000 description 1
- HNZBNQYXWOLKBA-UHFFFAOYSA-N Tetrahydrofarnesol Natural products CC(C)CCCC(C)CCCC(C)=CCO HNZBNQYXWOLKBA-UHFFFAOYSA-N 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 1
- MFEBUIFJVPNZLO-OLHMAJIHSA-N Thr-Asp-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MFEBUIFJVPNZLO-OLHMAJIHSA-N 0.000 description 1
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 1
- WDFPMSHYMRBLKM-NKIYYHGXSA-N Thr-Glu-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O WDFPMSHYMRBLKM-NKIYYHGXSA-N 0.000 description 1
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 1
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 1
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 1
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 1
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 1
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 1
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 1
- KDGBLMDAPJTQIW-RHYQMDGZSA-N Thr-Met-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N)O KDGBLMDAPJTQIW-RHYQMDGZSA-N 0.000 description 1
- MXNAOGFNFNKUPD-JHYOHUSXSA-N Thr-Phe-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MXNAOGFNFNKUPD-JHYOHUSXSA-N 0.000 description 1
- JAJOFWABAUKAEJ-QTKMDUPCSA-N Thr-Pro-His Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O JAJOFWABAUKAEJ-QTKMDUPCSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 1
- BCYUHPXBHCUYBA-CUJWVEQBSA-N Thr-Ser-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BCYUHPXBHCUYBA-CUJWVEQBSA-N 0.000 description 1
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 1
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- MYNYCUXMIIWUNW-IEGACIPQSA-N Thr-Trp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MYNYCUXMIIWUNW-IEGACIPQSA-N 0.000 description 1
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 1
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 1
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 1
- BTAJAOWZCWOHBU-HSHDSVGOSA-N Thr-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)C(C)C)C(O)=O)=CNC2=C1 BTAJAOWZCWOHBU-HSHDSVGOSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 235000007303 Thymus vulgaris Nutrition 0.000 description 1
- 240000002657 Thymus vulgaris Species 0.000 description 1
- 235000011941 Tilia x europaea Nutrition 0.000 description 1
- 240000006909 Tilia x europaea Species 0.000 description 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 1
- 241000219870 Trifolium subterraneum Species 0.000 description 1
- UPOGHWJJZAZNSW-XIRDDKMYSA-N Trp-His-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O UPOGHWJJZAZNSW-XIRDDKMYSA-N 0.000 description 1
- LVTKHGUGBGNBPL-UHFFFAOYSA-N Trp-P-1 Chemical compound N1C2=CC=CC=C2C2=C1C(C)=C(N)N=C2C LVTKHGUGBGNBPL-UHFFFAOYSA-N 0.000 description 1
- ARKBYVBCEOWRNR-UBHSHLNASA-N Trp-Ser-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O ARKBYVBCEOWRNR-UBHSHLNASA-N 0.000 description 1
- NLMXVDDEQFKQQU-CFMVVWHZSA-N Tyr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NLMXVDDEQFKQQU-CFMVVWHZSA-N 0.000 description 1
- CRHFOYCJGVJPLE-AVGNSLFASA-N Tyr-Gln-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CRHFOYCJGVJPLE-AVGNSLFASA-N 0.000 description 1
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 1
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 1
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 1
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 1
- CCEVJBJLPRNAFH-BVSLBCMMSA-N Tyr-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N CCEVJBJLPRNAFH-BVSLBCMMSA-N 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 235000003095 Vaccinium corymbosum Nutrition 0.000 description 1
- 235000017537 Vaccinium myrtillus Nutrition 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 1
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 1
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- CWSIBTLMMQLPPZ-FXQIFTODSA-N Val-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N CWSIBTLMMQLPPZ-FXQIFTODSA-N 0.000 description 1
- PFMAFMPJJSHNDW-ZKWXMUAHSA-N Val-Cys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N PFMAFMPJJSHNDW-ZKWXMUAHSA-N 0.000 description 1
- ICFRWCLVYFKHJV-FXQIFTODSA-N Val-Cys-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N ICFRWCLVYFKHJV-FXQIFTODSA-N 0.000 description 1
- FPCIBLUVDNXPJO-XPUUQOCRSA-N Val-Cys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FPCIBLUVDNXPJO-XPUUQOCRSA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 1
- WFENBJPLZMPVAX-XVKPBYJWSA-N Val-Gly-Glu Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O WFENBJPLZMPVAX-XVKPBYJWSA-N 0.000 description 1
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 1
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- PYPZMFDMCCWNST-NAKRPEOUSA-N Val-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N PYPZMFDMCCWNST-NAKRPEOUSA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- BMOFUVHDBROBSE-DCAQKATOSA-N Val-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N BMOFUVHDBROBSE-DCAQKATOSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 1
- OJOMXGVLFKYDKP-QXEWZRGKSA-N Val-Met-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OJOMXGVLFKYDKP-QXEWZRGKSA-N 0.000 description 1
- MGVYZTPLGXPVQB-CYDGBPFRSA-N Val-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MGVYZTPLGXPVQB-CYDGBPFRSA-N 0.000 description 1
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 1
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 1
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 1
- WANVRBAZGSICCP-SRVKXCTJSA-N Val-Pro-Met Chemical compound CSCC[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C)C(O)=O WANVRBAZGSICCP-SRVKXCTJSA-N 0.000 description 1
- QWCZXKIFPWPQHR-JYJNAYRXSA-N Val-Pro-Tyr Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QWCZXKIFPWPQHR-JYJNAYRXSA-N 0.000 description 1
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 1
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 1
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 1
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- 241000895647 Varroa Species 0.000 description 1
- 244000071378 Viburnum opulus Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241000219094 Vitaceae Species 0.000 description 1
- 235000014787 Vitis vinifera Nutrition 0.000 description 1
- 240000006365 Vitis vinifera Species 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 1
- 238000002679 ablation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 108091006088 activator proteins Proteins 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- BOTWFXYSPFMFNR-OALUTQOASA-N all-rac-phytol Natural products CC(C)CCC[C@H](C)CCC[C@H](C)CCCC(C)=CCO BOTWFXYSPFMFNR-OALUTQOASA-N 0.000 description 1
- 239000003816 antisense DNA Substances 0.000 description 1
- 230000001640 apoptogenic effect Effects 0.000 description 1
- 235000021016 apples Nutrition 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 1
- 108010089442 arginyl-leucyl-alanyl-arginine Proteins 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 235000016520 artichoke thistle Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 108010027371 asparaginyl-leucyl-prolyl-arginine Proteins 0.000 description 1
- 108010021908 aspartyl-aspartyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 235000021015 bananas Nutrition 0.000 description 1
- 101150103518 bar gene Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 235000021029 blackberry Nutrition 0.000 description 1
- 210000002459 blastocyst Anatomy 0.000 description 1
- 235000021014 blueberries Nutrition 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 235000009120 camo Nutrition 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 235000005607 chanvre indien Nutrition 0.000 description 1
- 235000019693 cherries Nutrition 0.000 description 1
- 235000003733 chicria Nutrition 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 235000016213 coffee Nutrition 0.000 description 1
- 235000013353 coffee beverage Nutrition 0.000 description 1
- 230000008645 cold stress Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004624 confocal microscopy Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000009402 cross-breeding Methods 0.000 description 1
- 230000010154 cross-pollination Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 235000004879 dioscorea Nutrition 0.000 description 1
- 210000001840 diploid cell Anatomy 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000024346 drought recovery Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 229920001971 elastomer Polymers 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000008995 epigenetic change Effects 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 230000002922 epistatic effect Effects 0.000 description 1
- 241001233957 eudicotyledons Species 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 235000004426 flaxseed Nutrition 0.000 description 1
- ZZUFCTLCJUWOSV-UHFFFAOYSA-N furosemide Chemical compound C1=C(Cl)C(S(=O)(=O)N)=CC(C(O)=O)=C1NCC1=CC=CO1 ZZUFCTLCJUWOSV-UHFFFAOYSA-N 0.000 description 1
- 235000004611 garlic Nutrition 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 238000002873 global sequence alignment Methods 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 1
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 1
- 108010043293 glycyl-prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 229940097068 glyphosate Drugs 0.000 description 1
- 235000002532 grape seed extract Nutrition 0.000 description 1
- 235000021021 grapes Nutrition 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000005802 health problem Effects 0.000 description 1
- 230000008642 heat stress Effects 0.000 description 1
- 239000011487 hemp Substances 0.000 description 1
- 235000008216 herbs Nutrition 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 1
- 230000015784 hyperosmotic salinity response Effects 0.000 description 1
- 208000000509 infertility Diseases 0.000 description 1
- 230000036512 infertility Effects 0.000 description 1
- 231100000535 infertility Toxicity 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 108010077158 leucinyl-arginyl-tryptophan Proteins 0.000 description 1
- 239000004571 lime Substances 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 108010053062 lysyl-arginyl-phenylalanyl-lysine Proteins 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000036244 malformation Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000035140 megagametogenesis Effects 0.000 description 1
- 230000028534 megasporogenesis Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 201000002266 mite infestation Diseases 0.000 description 1
- 239000001272 nitrous oxide Substances 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 238000010397 one-hybrid screening Methods 0.000 description 1
- UNAHYJYOSSSJHH-UHFFFAOYSA-N oryzalin Chemical compound CCCN(CCC)C1=C([N+]([O-])=O)C=C(S(N)(=O)=O)C=C1[N+]([O-])=O UNAHYJYOSSSJHH-UHFFFAOYSA-N 0.000 description 1
- 101150093826 par1 gene Proteins 0.000 description 1
- 101150113864 pat gene Proteins 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 235000011197 perejil Nutrition 0.000 description 1
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- BOTWFXYSPFMFNR-PYDDKJGSSA-N phytol Chemical compound CC(C)CCC[C@@H](C)CCC[C@@H](C)CCC\C(C)=C\CO BOTWFXYSPFMFNR-PYDDKJGSSA-N 0.000 description 1
- 230000019612 pigmentation Effects 0.000 description 1
- 230000037039 plant physiology Effects 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 210000004508 polar body Anatomy 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 210000001850 polyploid cell Anatomy 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 1
- 108010065320 prolyl-lysyl-glutamyl-lysine Proteins 0.000 description 1
- 235000021013 raspberries Nutrition 0.000 description 1
- 230000005849 recognition of pollen Effects 0.000 description 1
- 230000037425 regulation of transcription Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000009394 selective breeding Methods 0.000 description 1
- 230000010153 self-pollination Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 210000003765 sex chromosome Anatomy 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 239000010421 standard material Substances 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 235000021012 strawberries Nutrition 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 239000001585 thymus vulgaris Substances 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000012250 transgenic expression Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 230000014599 transmission of virus Effects 0.000 description 1
- ZSDSQXJSNMTJDA-UHFFFAOYSA-N trifluralin Chemical compound CCCN(CCC)C1=C([N+]([O-])=O)C=C(C(F)(F)F)C=C1[N+]([O-])=O ZSDSQXJSNMTJDA-UHFFFAOYSA-N 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 1
- 230000009417 vegetative reproduction Effects 0.000 description 1
- 238000013466 vegetative reproduction Methods 0.000 description 1
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 229920002554 vinyl polymer Polymers 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H5/00—Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
- A01H5/12—Leaves
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8287—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H1/00—Processes for modifying genotypes ; Plants characterised by associated natural traits
- A01H1/02—Methods or apparatus for hybridisation; Artificial pollination ; Fertility
- A01H1/021—Methods of breeding using interspecific crosses, i.e. interspecies crosses
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H1/00—Processes for modifying genotypes ; Plants characterised by associated natural traits
- A01H1/02—Methods or apparatus for hybridisation; Artificial pollination ; Fertility
- A01H1/022—Genic fertility modification, e.g. apomixis
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H1/00—Processes for modifying genotypes ; Plants characterised by associated natural traits
- A01H1/06—Processes for producing mutations, e.g. treatment with chemicals or with radiation
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H5/00—Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
- A01H5/10—Seeds
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H6/00—Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
- A01H6/14—Asteraceae or Compositae, e.g. safflower, sunflower, artichoke or lettuce
- A01H6/1472—Lactuca sativa [lettuce]
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
- C12N15/8218—Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Botany (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Environmental Sciences (AREA)
- Developmental Biology & Embryology (AREA)
- Cell Biology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Physiology (AREA)
- Gastroenterology & Hepatology (AREA)
- Virology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Natural Medicines & Medicinal Plants (AREA)
- Animal Husbandry (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Saccharide Compounds (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 돌연변이 유전자를 생산하는 방법을 제공하며, 여기서 상기 유전자는 변형된 프로모터를 포함하고, 상기 유전자는 식물에 단위생식 표현형을 유도할 수 있다. 본 발명은 또한 상기 돌연변이 유전자, 이를 포함하는 분리된 핵산 분자, 구조물 또는 벡터를 제공한다. 또한, 본 발명은 상기 돌연변이 유전자를 포함하는 단위생식 식물의 제조 방법 및 이에 따라 얻어진 단위생식 식물을 제공한다.
Description
본 발명은 생명공학 분야, 특히 식물 육종을 포함하는 식물 생명공학에 관한 것이다. 본 발명은 특히 예를 들어 아포믹시스(apomixis) 및 반수체(haploid) 유도와 관련되고 이에 유용한 유전자의 확인 및 용도에 관한 것이다. 본 발명은 특히 단위생식과 관련된 유전자의 돌연변이 프로모터에 관한 것이다. 본 발명은 추가로 식물 및 농작물에서 단위생식을 유도하는 방법, 특히 아포메이오틱(apomeiotic) 유전자(들)와 조합된 아포믹시스를 위한, 또는 염색체가 배가 반수체(doubled haploids)를 생성하기 위해 배가될 수 있는 반수체 식물의 생산을 위한 상기 유전자 및/또는 상기 프로모터의 용도에 관한 것이다.
아포믹시스(또한 무배우 생식(agamospermy)라고도 함)는 종자를 통한 무성 식물 번식이다. 아포믹시스는 약 400종의 현화 식물(flowering plant) 종에서 보고되었다(Bicknell and Koltunow, 2004). 현화 식물의 아포믹시스는 두 가지 형태로 발생한다.
(1) 배아가 단위생식에 의해 비감소, 미수정 난세포에서 발생하는 배우체 아포믹시스(gametophytic apomixis);
(2) 배아가 포자체 세포에서 체세포로 발생하는 포자체 아포믹시스(sporophytic apomixis).
배우체 아포믹시스의 예는 민들레(타락사컴(Taraxacum) sp.), 조팝나물(히에라시움(Hieracium) sp.), 켄터키 블루 그래스(포아 프라텐시스(Poa pratensis)) 및 이스턴 감마그래스(트리프사컴 닥틸로이데스(Tripsacum dactyloides))이다. 포자체 아포믹시스의 예는 감귤류(시트러스(Citrus) sp.)와 망고스틴(가르시니아 망고스타나(Garcinia mangostana))이다. 배우체 아포믹시스는 두 가지 발달 과정을 포함한다.
(1) 감수분열 재조합 및 감소의 회피(아포메이오시스); 및
(2) 수정 없이 난세포가 배아로 발달함(단위생식).
아포믹트적으로(Apomictically) 생산된 종자는 모체 식물(parental plant)과 유전적으로 동일하다. 아포믹시스가 식물 육종에 매우 유용할 수 있다는 것은 오랫동안 인식되어 왔다(Asker, 1979; Hermsen, 1980; Asker 및 Jerling, 1990; Vielle-Calzada 등, 1995). 작물에 아포믹시스 도입의 가장 분명한 이점은 이종 F1 잡종의 진정한 육종이다. 대부분의 작물에서 F1 잡종은 최고의 성과를 내는 품종이다. 그러나, 유성 작물에서 F1 잡종은 F1 잡종의 자가 수정이 F2 자손 식물의 게놈에서 재조합에 의해 헤테로시스(heterosis)의 손실을 일으키기 때문에, 근친교배 동형접합 부모를 교배하여 각 세대마다 다시 생산되어야 한다. 유성 F1 종자 생산은 반복적이고, 복잡하며, 비용이 많이 드는 과정이다. 대조적으로, 아포미틱 F1 잡종은 영원히 번식할 것이다. 즉, F1 잡종의 유전적 고정과 종자를 통한 균일한 자손 식물체의 생산이 가능해진다.
아포믹시스에 의한 F1 고정은 유전적 복잡성에 관계없이 어느 유전자형이 한 단계에서 참으로 번식할 수 있는 아포믹시스의 일반적인 속성의 특수한 경우이다. 이것은 아포믹시스가 다유전자성(polygenic) 양적 특성의 즉각적인 고정에 사용될 수 있음을 의미한다. 대부분의 수확량 형질은 다유전자성이라는 점에 유의해야 한다. 아포믹시스는 여러 특성(예: 다양한 저항성, 여러 트랜스진 또는 여러 정량적 특성 유전자좌)의 스태킹(또는 피라미딩)에 사용할 수 있다. 아포믹시스가 없으면, 이러한 특성 세트를 고정하기 위해, 각 특성 유전자좌는 개별적으로 동형접합체로 만들어지고 나중에 결합되어야 한다. 형질에 관련된 유전자좌의 수가 증가함에 따라, 교배에 의해 이러한 형질 유전자좌를 동형접합성으로 만드는 것은 시간 소모적이고 논리적으로 도전적이어서 비용이 많이 든다. 더욱이, 대립형질 사이의 특정 상위성 상호작용은 동형접합성에 의해 소실된다. 아포믹시스를 사용하면 이러한 유형의 비가산적 유전 변이를 고정하는 것이 가능하다. 따라서, 아포믹시스, 종자를 통한 클론 번식은 식물 육종, 상업적 종자 생산 및 농업에서 패러다임 전환을 일으킬 가능성이 있다(van Dijk 등 2016).
복잡성에 관계없이 어느 유전자형을 즉시 고정하는 것 외에도 아포믹시스의 중요한 추가 농업 용도가 있다. 성적 종간 잡종과 자가 배수체는 종종 감수분열 문제로 인해 불임을 겪는다. 아포믹시스는 감수분열을 건너뛰기 때문에, 아포믹시스를 사용하면 종간 잡종과 자가 배수체의 이러한 문제를 해결할 수 있다. 아포믹시스는 암컷 교잡을 방지하기 때문에, 웅성 불임과 결합된 아포믹시스는 트랜스제닉 작물의 야생 근연종에서 트랜스유전자 이입을 방지하는 트랜스유전자 억제를 위해 제안되었다(Daniell, 2002). 곤충 수분 작물(예: Brassica)에서 비정형 종자 세트는 수분 매개자 서비스 부족으로 인해 제한되지 않는다. 이는 수분을 공급하는 벌 개체군의 증가하는 건강 문제(바로아 응애 감염, 아프리카 킬러 벌 등)에 비추어 더욱 중요해지고 있다. 감자와 같은 덩이줄기 번식 작물에서, 아포믹시스는 클론적으로 우월한 유전자형을 유지하지만, 현재의 바이러스 전파 위험과 청정 생산, 봉쇄 및 인증 관련 비용을 줄이거나 심지어 제거한다. 또한 아포믹틱(apomictic) 종자의 저장 비용은 덩이줄기 또는 기타 영양 번식 식물 부분보다 훨씬 적다. 관상용에서 아포믹시스는 노동 집약적이고 값비싼 조직 배양 번식을 대체할 수 있다. 일반적으로 아포믹시스는 품종 개발 및 식물 번식 비용을 크게 줄이는 것으로 생각된다.
불행하게도 아포믹시스는 어떤 주요 작물에서도 발생하지 않는다. 유성 작물에 아포믹시스를 도입하려는 수많은 시도가 있었다. 예를 들어, 아포믹시스 유전자의 이입, 유성 모델 종의 돌연변이, 혼성화에 의한 아포믹시스의 드노보(de novo) 발생, 후보 유전자의 클로닝 등이 있다. 넓은 교배를 통해 야생 아포믹틱(apomicts)에서 작물 종으로의 아포믹스 유전자의 도입은 지금까지 성공하지 못했다(예: apomixis from Tripsacum dactyloides into maize - Savidan, Y., 2001; Morgan 등, 1998; WO97/10704). 돌연변이 유성 모델 종 돌연변이를 일으키는 것과 관련하여, WO2007/066214에는 애기장대에서 Dyad로 불리는 세포자멸 돌연변이의 사용이 기술되어 있다. 그러나, Dyad는 침투성이 매우 낮은 열성 돌연변이이다. 작물 종에서 이 돌연변이는 제한적으로 사용된다. 2개의 유성 생태형 사이의 교배에 의한 아포믹시스 드 노보(apomixis de novo)의 생성은 농경학적으로 흥미로운 아포믹틱을 초래하지 않았다(US2004/0168216 A1 및 US2005/0155111 A1). 옥수수(maize)에서 트랜스포존 태깅에 의한 후보 아포믹시스 유전자의 클로닝은 US2004/0148667에 기재되어 있다. 신장 유전자(elongate gene)의 오르토로그가 청구되었으며, 이는 아포믹시스를 유발하는 것으로 추정된다. 그러나, Barrell과 Grossniklaus(2005)에 따르면 신장 유전자는 감수분열 II를 건너뛰므로, 모계 유전자형을 유지하지 못하여, 이는 훨씬 덜 유용하다.
US2006/0179498에는 소위 역 육종(Reverse Breeding)이 아포믹시스에 대한 대안이 될 것이라고 설명되어 있다. 그러나, 이것은 기술적으로 복잡한 시험관 내 실험실 절차인 반면, 아포믹시스는 식물 자체에 의해 수행되는 생체 내 절차이다. 더욱이, 역 육종의 경우, 일단 부모 계열이 재구성되면(이중 배우자 동형접합체) 교배가 여전히 수행되어야 한다.
자연 아포믹틱의 아포믹시스는 일반적으로 유전학적 근거를 갖는다(Ozias-Akins 및 Van Dijk, 2007 검토). 따라서, 대안적인 방법은 자연 아포믹틱 종에서 아포믹시스 유전자를 분리하는 것일 수 있다. 그러나, 이것은 쉬운 일이 아니며, 왜냐하면 자연적인 아포믹틱은 종종 배수체 게놈을 가지고 있고, 배수체에서의 위치 클로닝은 매우 어렵기 때문이다. 다른 복잡한 요인은 아포믹시스 특이적 염색체 영역에서의 재조합 억제, 반복 서열 및 교배에서의 분리 왜곡이다.
본원에 기술된 바와 같이, 현 기술 상태의 제한 중 적어도 일부가 없는 작물에서 아포믹시스를 유도하기 위한 절차가 필요하다. 특히, 아포믹틱 식물 및 아포믹틱 종자의 생산 방법이 필요하다. 또한, 아포믹시스 또는 (이중) 반수체를 작물에 도입하는데 사용하기에 적합하고 아포믹틱 경로를 실질적으로 모방할 수 있는 아포믹시스, 특히 단위생식의 발달 과정에 관여하는 유전자 및 단백질을 제공할 필요가 있다.
본 발명자들은 단위생식 유전자좌 및 유전자, 단위생식 표현형(본원에서 단위생식 대립유전자 또는 Par 대립유전자로 나타냄)과 관련된 대립유전자 및 비-단위생식 표현형(본원에서 단위생식 유전자 또는 par 대립유전자의 성적 대립유전자로 나타냄), 이들의 유전자 서열, 즉 프로모터 서열, 5'UTR, 코딩 서열, 3'UTR 서열 및 코딩된 단백질 서열을 확인하고 분리했다.
본 발명은 상기 par 대립유전자의 프로모터 서열을 변경함으로써, par 대립유전자를 Par 대립유전자로 변형 또는 변경하는 방법을 제공한다. 본 발명은 바람직하게는 무작위 또는 표적 돌연변이유발에 의해, 그리고 선택적으로 형질전환에 의해 내인성 par 대립유전자를 Par 대립유전자로 변형시키는데 특히 유용하다. 생성된 돌연변이 대립유전자는 식물 및/또는 그의 후손을 수정 없이 난세포를 배아로 발달시키는 능력을 갖거나, 증가된 능력을 갖는 식물로 형질전환시킬 수 있다.
도 1. 단위생식 돌연변이와 유성 상추의 Taraxacum CRISPR/Cas9 상실(loss)의 컴플리멘테이션 및 형질전환 실험. a) 타락사컴(Taraxacum) LOP 돌연변이의 컴플리멘테이션을 위해 사용되는 상이한 프로모터-유전자 구조 및 성공적으로 컴플리멘테이션된 계열(line)의 수. 상추(lettuce)의 ToPar 프로모터와 성적 상동체 및 Taraxacum Par 유전자가 있는 Arabidopsis 난세포(EC1.1) 프로모터가 표시된다. b) Arabidopsis 난세포 EC1.1 프로모터에 의해 구동되는 타락사컴(Taraxacum) ToPar 유전자로 상추를 형질전환하는 것과 유사함). c), d), e), pEC1.1::Par 구조물로 형질전환된 상추의 디카피테이티드(decapitated) 꽃차례(inflorescence)의 배아 유사 구조. c) 디카피테이션(decapitation) 75시간 후 대조구 비형질 상추의 배낭. 수정되지 않은 난세포(ec)와 중앙 세포(cc) 핵이 보인다. d) 디카피테이션 75시간 후 배아와 유사한 구조가 발달하는 배낭. e) 여러 개의 배아와 유사한 구조를 가진 배낭. 별표는 개별 배아와 유사한 구조를 보여준다. f) 자가수분 5일 후 대조구 비형질전환 상추로부터 배낭의 유세포 분석. g) 디카피테이션 5일 후 pEC1.1::Par 구조물을 보유하는 트랜스제닉 상추로부터의 배낭의 유동 세포 분석.
도 2. 타락사컴( Taraxacum ) Par/par 프로모터의 다형성. Par 대립유전자 및 3개의 성적 대립유전자: 타락사컴 오피시날레(Taraxacum officinale)(Topar)의 par-1 및 par-2 및 고무 민들레 타락사컴 코크사기즈(Taraxacum koksaghyz)(Tkpar)의 성적 대립유전자의 ATG 시작 코돈(밑줄)의 350 bp 업스트림 영역의 ClustalW 정렬. 1335bp MITE 삽입이 ToPar 프로모터에서 제거되었다. MITE의 삽입 부위인 6 bp 다이렉터 리피트(direct repeat)에 밑줄이 그어져 있다. 13개의 SNP 중 3개는 PAR 프로모터와 성적 프로모터 사이에 있으며(굵은 글씨와 밑줄); 10개는 성적 프로모터들 사이에서 발생한다.
도 2. 타락사컴( Taraxacum ) Par/par 프로모터의 다형성. Par 대립유전자 및 3개의 성적 대립유전자: 타락사컴 오피시날레(Taraxacum officinale)(Topar)의 par-1 및 par-2 및 고무 민들레 타락사컴 코크사기즈(Taraxacum koksaghyz)(Tkpar)의 성적 대립유전자의 ATG 시작 코돈(밑줄)의 350 bp 업스트림 영역의 ClustalW 정렬. 1335bp MITE 삽입이 ToPar 프로모터에서 제거되었다. MITE의 삽입 부위인 6 bp 다이렉터 리피트(direct repeat)에 밑줄이 그어져 있다. 13개의 SNP 중 3개는 PAR 프로모터와 성적 프로모터 사이에 있으며(굵은 글씨와 밑줄); 10개는 성적 프로모터들 사이에서 발생한다.
본원에서 사용되는 용어 "유전자좌(locus)"(복수형: 유전자좌들(loci))는 예를 들어 유전자 또는 유전적 마커가 발견되는 염색체 상의 특정 위치(또는 장소)를 의미한다. 예를 들어, "단위생식 유전자좌"는 단위생식 유전자가 위치하는 게놈 내의 위치를 의미한다. 두 가지 기능적 변이가 단위생식 유전자에 대해 확인되었다. 즉, 단위생식 유전자의 단위생식 대립유전자 또는 Par 대립유전자로서 본원에 표시된, 단위생식 표현형에 기여하는 대립유전자, 및/또는 본 명세서에서 단위생식 유전자의 성적 대립유전자 또는 par 대립유전자로서 본원에 표시된 이의 성적 대응물(들).
유전자, 대립유전자, 단백질 또는 핵산이 "단위생식에서 기능적"인 것은 본원에서 단위생식 표현형에 기여하고/하거나 난세포를 배아로 발달시키는 식물 또는 식물 세포에 대한 능력을 증가시키거나 전환시키는 것으로 이해되어야 한다.
"단위생식 유전자"는 단위생식과 연관된 유전자이고, 여기서 "연관된"은 단위생식 또는 비-단위생식(유성) 표현형을 나타내는 것으로 본원에서 이해되어야 한다. 단위생식을 부여하는 (우성) 대립유전자(Par 대립유전자)와 그 2개의 유성 대응물(par 대립유전자 또는 단위생식 유전자의 유성 대립유전자)의 유전자 서열이 3배체 아포믹틱 타락사컴 오피시날레(Taraxacum officinale) 분리물 A68에서 처음으로 확인되었으며, 이는 PCT/EP2020/064991에 기술되어 있으며, 본 명세서에 참고로 포함된다. 바람직하게는, Par 대립유전자는 단위생식을 개시한다. 단위생식을 부여하는 (우성) 대립유전자는 SEQ ID NO: 5의 유전적 서열을 갖고, SEQ ID NO: 2의 서열을 갖는 프로모터, SEQ ID NO: 3의 서열을 갖는 코딩 서열 및 SEQ ID NO: 4의 서열을 갖는 3'UTR을 포함한다. 유성 대립유전자 중 하나는 SEQ ID NO: 10의 유전적 서열을 갖고, SEQ ID NO: 7의 서열을 갖는 프로모터, SEQ ID NO: 8의 서열을 갖는 코딩 서열 및 SEQ ID NO: 9의 서열을 갖는 3'UTR을 포함한다. 다른 유성 대립유전자는 SEQ ID NO: 15의 유전적 서열을 갖고, SEQ ID NO: 12의 서열을 갖는 프로모터, SEQ ID NO: 13의 서열을 갖는 코딩 서열 및 SEQ ID NO: 14의 서열을 갖는 3'UTR을 포함한다. 이들 단위생식 유전자에 의해 암호화된 단백질(PAR 단백질로 표시됨)의 특징적 특징에 기초하여 다른 종에서 이종상동성(Orthologous) 유전자가 확인되었다. 난세포에 PAR 단백질이 존재하면 배아 발생 억제제가 억제되어 수정 없이 세포 분열이 유발될 수 있다. 이들 PAR 단백질은 공통 서열 C.{2}C.{7}[K/R]A.{2}GH.[R/N].H를 갖는 징크 핑거 C2H2-타입 도메인(IPR13087), 바람직하게는 징크 핑거 K2-2-유사 도메인을 포함하는 것을 특징으로 하며, 이는 또한 CXXCXXXXXXX[K/R]AXXGHX[R/N]XH(SEQ ID NO: 37)로 주석이 달릴 수 있으며, 여기서 X는 임의의 자연 발생 아미노일 수 있으며, 여기서 [K/R]은 아미노산이 라이신 또는 아르기닌임을 나타내고, R/N]은 아미노산이 아르기닌 또는 아스파라긴임을 나타낸다(Englbrecht 등, 2004 참조). 징크 핑거 C2H2-유형 도메인, 바람직하게는 본원에 정의된 바와 같은 징크 핑거 K2-2-유사 도메인에 더하여, 상기 단백질은 공통 아미노산 서열 DLNXXP(SEQ ID NO: 58) 또는 DLNXP(SEQ ID NO: 59)를 갖는 EAR(Ethylene-responsive element binding factor-associated Amphiphilic Repression) 모티프를 포함하며, 여기서 X는 임의의 자연 발생 아미노산일 수 있다(Kagale 등, 2010; 및 Yang 등, 2018 참조). 바람직하게는 상기 EAR 모티프는 C-말단에 위치한다. 바람직하게는 징크 핑거 C2H2 유형 도메인은 상기 EAR 모티프의 N-말단에 위치한다. 바람직하게는, PAR 단백질은 최대 400개 아미노산의 길이를 갖고, 여기서 상기 단백질은 본원에 표시된 바와 같은 1개 또는 2개의 EAR 모티프 및 본원에 정의된 바와 같은 징크 핑거 K2-2-유사 도메인을 포함한다. 바람직하게는, 단백질은 최대 400개 아미노산의 길이를 가지며, 여기서 상기 단백질은 본원에 표시된 바와 같은 단지 1개 또는 2개의 EAR 모티프 및 본원에 정의된 바와 같은 단지 하나의 징크 핑거 K2-2-유사 도메인을 포함한다. 즉, 본원에 정의된 바와 같은 추가 EAR 모티프를 포함하지 않으며, 본원에 정의된 바와 같은 추가 징크 핑거 K2-2-유사 도메인을 포함하지 않는다. 400개 아미노산의 최대 크기, 본원에 표시된 단 하나 또는 두 개의 EAR 모티프 및 정의된 단일 징크 핑거 K2-2 유사 도메인의 특징 외에도, PAR 단백질은 C.{2}C.{12}H.{3}H의 징크 핑거 공통 서열(이는 CXXCXXXXXXXXXXXXHXXXH (SEQ ID NO: 38)로도 주석이 달릴 수 있음)을 갖는 단 하나의 추가 징크 핑거 도메인을 포함할 수 있으나, 더 바람직하게는 C.{2}C.{12}H.{3}H (SEQ ID NO: 38)의 징크 핑거 공통 서열을 갖는 추가의 징크 핑거 도메인을 포함하지 않는다. 바람직하게는, PAR 단백질은 최대 500개 아미노산의 길이를 갖는다. PAR 단백질은 약 50~500, 100~300 또는 약 150~200개의 아미노산일 수 있다. PAR 단백질은 약 170개의 아미노산 길이를 가질 수 있다. 이종상동성 단위생식 유전자는 이에 한정하는 것은 아니나, 아나나스 코모서스(Ananas comosus)의 PAR 단백질(예: UniProtKB: A0A199URK4), 아포스타시아 센제니카(Apostasia shenzhenica)의 PAR 단백질(예: UniProtKB: A0A2I0AZW3), 아라비돕시스 탈리아나(Arabidopsis thaliana)의 PAR 단백질(예: UniProtKB: Q8GXP9, A0A178V2S4, O81793, A0A178V1Q3, A0MFC1, O81801), 아라비돕시스 리라타 아종 리라타(Arabidopsis lyrata subsp. Lyrata)의 PAR 단백질(예: UniProtKB: D7MC52 또는 D7MCE8), 아라키스 이파엔시스(Arachis ipaensis)의 PAR 단백질(예: SEQ ID NO: 45 또는 SEQ ID NO: 49), 브라키포듐 디스타치온(Brachypodium distachyon)의 PAR 단백질(예: UniProtKB: I1J0D9), 브라시카 올레라세아 var. 올레라세아(Brassica oleracea var. oleracea)(예: UniProtKB: A0A0D3A1Q6 또는 A0A0D3A1Q3), 브라시카 캄페스트리스(Brassica campestris)의 PAR 단백질(예: UniProtKB: A0A398AHT1), 브라시카 라파(Brassica rapa)의 PAR 단백질(예: SEQ ID NO: 47), 브라시카 라파 아종 페키넨시스(Brassica rapa subsp. Pekinensis)의 PAR 단백질(예: UniProtKB: M4D574 또는 M4D571), 브라시카 올레라세아(Brassica oleracea)의 PAR 단백질(예: UniProtKB: A0A3P6ESB1 또는 A0A3P6F726), 브라시카 캄페스트리스(Brassica campestris)의 PAR 단백질(예: UniProtKB: A0A3P5ZMM3 또는 A0A3P5Z1M1), 카자누스 카잔(Cajanus cajan)의 PAR 단백질(예: 4SE NO: 4SE NO: 46), 캅셀라 루벨라(Capsella rubella)의 PAR 단백질(예: UniProtKB: R0H2J1 또는 R0H0C2), 세팔로터스 폴리큘라리스(Cephalotus follicularis)의 PAR 단백질(예: UniProtKB: A0A1Q3CSK1), 시세르 아리에티넘(Cicer arietinum)의 PAR 단백질(예: UniProtKB: A0A3Q7YBZ1, A0A1S2YZL9, A0A3Q7Y0Z2 또는 A0A1S NO: SEYZ: 55, 56 또는 57), 시코륨 엔디비아(Cichorium endivia)의 PAR 단백질(예: SEQ ID NO: 39), 큐큐미스 사티버스(Cucumis sativus)의 PAR 단백질(예: UniProtKB: A0A0A0KGW4 또는 A0A0A0L0X7), 큐큐미스 멜로(Cucumis melo)의 PAR 단백질(예: UniProtKB: A0A1S3BLF2 또는 A0A1S3B298), 큐큐미스 사티버스(Cucumis sativus)의 PAR 단백질(예: UniProtKB: A0A0A0KAW8), 큐르큐르비타 모스차타(Cucurbita moschata)의 PAR 단백질(예: SEQ ID NO: 43), 큐스큐타 캄페스트리스(Cuscuta campestris)의 PAR 단백질(예: UniProtKB: A0A484MGR1), 덴드로븀 카테나텀(Dendrobium catenatum)의 PAR 단백질(예: UniProtKB: A0A2I0V7N9, A0A2I0X 또는 A0A2I0W0Q8), 도르코세라스 하이그로메트리컴(Dorcoceras hygrometricum)의 PAR 단백질(예: UniProtKB: A0A2Z7D3Y1), 유트레마 살서기네움(Eutrema salsugineum)의 PAR 단백질(예: UniProtKB: V4LSH0; 또는 SEQ ID NO: 44), 파거스 실바티카(Fagus sylvatica)의 PAR 단백질(예: UniProtKB: A0A2N9E5Y5, A0A2N9HAB9 또는 A0A2N9H993), 겐리세아 아우레아(Genlisea aurea)의 PAR 단백질(예: KB: S8E1M6), 글리신 맥스(Glycine max)의 PAR 단백질(예: SEQ ID NO: 51, 52, 53 또는 54), 고시피움 히르서텀(Gossypium hirsutum)의 PAR 단백질(예: UniProtKB: A0A1U8LDU9), 헬리안터스 안누스(Helianthus annuus)의 PAR 단백질(예: SEQ ID NO: 21), 헤베아 브라실리엔시스(Hevea brasiliensis)의 PAR 단백질(예: SEQ ID NO: 42), 히에라시움 아우란티아컴(Hieracium aurantiacum)의 PAR 단백질(예: SEQ ID NO: 40), 주글란스 레기아(Juglans regia)의 PAR 단백질(예: UniProtKB: A0A2I4E6B1), 락투카 사티바(Lactuca sativa)의 PAR 단백질(예: UniProtKB: A0A2J6KZF7); 또는 SEQ ID NO: 22), 라제나리아 시세라리아(Lagenaria siceraria)의 PAR 단백질(예: SEQ ID NO: 48), 메디카고 트런카툴라(Medicago truncatula)의 PAR 단백질(예: UniProtKB: G7K024), 모러스 노타빌리스(Morus notabilis)의 PAR 단백질(예: UniProtKB: W9SMY3 또는 W9SMQ7), 뮤큐나 프루리엔스(Mucuna pruriens)의 PAR 단백질(예: UniProtKB: A0A371ELJ8), 니코티아나 아테누아타(Nicotiana attenuata)의 PAR 단백질(예: UniProtKB: A0A1J6IQI6), 니코티아나 실베스트리스(Nicotiana sylvestris)의 PAR 단백질(예: UniProtKB: A0A1U7VXJ0), 니코티아나 타바쿰(Nicotiana tabacum)의 PAR 단백질(예: UniProtKB: A0A1S4A651 또는 A0A1S3YHQ2), 오리자 사티바 아종 자포니카(Oryza sativa subsp. Japonica)의 PAR 단백질(예: UniProtKB: B9FGH8), 오리자 바르티(Oryza barthii)의 PAR 단백질(예: UniProtKB: A0A0D3FWX3), 파니쿰 밀라세움(Panicum miliaceum)의 PAR 단백질(예: UniProtKB: A0A3L6Q010 또는 A0A3L6T1D6), 파라스포니아 안데르소니(Parasponia andersonii)의 PAR 단백질(예: UniProtKB: A0A2P5BMI5), 포풀러스 알바(Populus alba)의 PAR 단백질(예: UniProtKB: A0A4U5PSY9), 포풀러스 트리코카르파(Populus trichocarpa)의 PAR 단백질(예: UniProtKB: B9H661), 푸니카 그라나텀(Punica granatum)의 PAR 단백질(예: UniProtKB: A0A2I0IBB9, A0A218XB85 또는 A0A218W102), 세네시오 캄브렌시스(Senecio cambrensis)의 PAR 단백질(예: SEQ ID NO: 41), 프루너스 페르시카(Prunus persica)의 PAR 단백질(예: SEQ ID NO: 50), 트레마 오리엔탈레(Trema orientale)의 PAR 단백질(예: UniProtKB: A0A2P5EB04), 트리폴리움 프라텐스(Trifolium pratense)의 PAR 단백질(예: UniProtKB: A0A2K3N851), 트리폴리움 서브테라늄(Trifolium subterraneum)의 PAR 단백질(예: UniProtKB: A0A2Z6MYD3 또는 A0A2Z6MDR7), 트리폴리움 프라텐스(Trifolium pratense)의 PAR 단백질(예: UniProtKB: A0A2K3PR44), 비티스 비니페라(Vitis vinifera)의 PAR 단백질(예: UniProtKB: A0A438C778, A0A438ESC4 또는 A0A438DBR4) 및 지 메이스(Zea mays)의 PAR 단백질(예: UniProtKB: A0A1D6HF46, B6UAC5, A0A3L6F4S1, A0A3L6EMC6, A0A3L6EMC6, K7UHQ6 또는 A0A1D6KHZ4)로 구성된 군으로부터 선택된 PAR 단백질 중 어느 하나를 암호화하는 유전자일 수 있다. 이러한 유전자는 또한 악티니디아 키넨시스(Actinidia chinensis)의 PAR 단백질(예를 들어, UniProtKB: A0A2R6S2S9), 베타 불가리스(Beta vulgaris)의 PAR 단백질(예를 들어, UniProtKB: XP_010690656.1), 솔라눔 투베로섬(Solanum tuberosum)의 PAR 단백질(예를 들어, UniProtKB : XP_015159151.1), 솔라눔 리코페리시컴(Solanum lycopersicum)의 PAR 단백질(예: UniProtKB: A0A3Q7GXB3, Solyc05g055500 또는 Solyc06g060480), 캡시컴 바카텀(Capsicum baccatum)의 PAR 단백질(예: UniProtKB: A0A2G2WJR7), 솔라넘 멜롱게나(Solanum melongena)의 PAR 단백질(예: UniProtKB: AVC18974.1), 글리신 소자(Glycine soja)의 PAR 단백질(예: GeneBank 수탁: XP_028201014.1, XP_006596577.1 또는 UniprotKB: A0A445M3M6), 아라키스 히포가에아(Arachis hypogaea)의 PAR 단백질(예: UniProtKB: A0A444WUX5), 파세올러스 불가리스(Phaseolus vulgaris)의 PAR 단백질(예: UniProtKB: V7CIF6), 다우커스 카로타(Daucus carota)의 PAR 단백질 (예: GeneBank 수탁: XP_017245413.1), 트리티컴 아에스티범(Triticum aestivum)의 PAR 단백질(예: UniProtKB: A0A3B6RP64), 오리자 사티바 아종 인디카(Oryza sativa subsp. indica)의 PAR 단백질(예: UniProtKB: A2YH63), 오리자 사티바 아종 자포니카(Oryza sativa subsp. japonica)의 PAR 단백질(예: UniProtKB: Q5Z7P5) 및 테오브로마 카카오(Theobroma cacao)의 PAR 단백질(예: UniProtKB: A0A061DL63)로 구성된 군으로부터 선택된 PAR 단백질을 암호화할 수 있다. 선택적으로, 이종상동성 유전자(orthologous gene)는 각각, SEQ ID NO: 1, 6 및 11 중 어느 하나와, 및/또는 본원에 제공된 상기 이종상동성 유전자들(orthologues) 중 어느 하나와 바람직하게는 예를 들어, 기본 매개변수가 있고 전체 길이에 걸쳐 비교되는 Needleman 및 Wunsch 알고리즘(전역 서열 정렬)을 사용하여 쌍으로 정렬될 경우, 적어도 약 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99% 이상의 동일성을 갖는 아미노산 서열을 포함하거나 또는 이로 구성되는 PAR 단백질을 암호화하는 유전자이다.
본원에서 사용되는 용어 "대립유전자(들)"는 특정 유전자좌에 있는 유전자의 하나 이상의 대안적 형태 중 임의의 것을 의미한다. 유기체의 2배체 및/또는 배수체 세포에서, 주어진 유전자의 대립유전자는 염색체에서의 특정 위치 또는 유전자좌에 위치하며, 여기서 하나의 대립유전자는 상동 염색체 세트의 각 염색체에 존재한다. 2배체 및/또는 배수체 유기체 또는 식물 종은 특정 유전자좌에서 다수의 상이한 대립유전자를 포함할 수 있다.
본원에서 사용되는 용어 "우성 대립유전자"는 하나의 대립유전자(즉, 우성 대립유전자)의 효과가 동일한 유전자좌에서 두 번째 대립유전자(즉, 열성 대립유전자)의 기여를 차폐하는 하나의 유전자의 대립유전자들 사이의 관계를 의미한다. 상염색체(성염색체 이외의 모든 염색체)에 있는 유전자의 경우, 대립유전자 및 관련 형질은 상염색체 우성 또는 상염색체 열성이다. 우성은 멘델의 유전과 고전 유전학의 핵심 개념이다. 선택적으로, 우성 대립유전자는 기능성 단백질을 코딩하는 반면 열성 대립유전자는 그렇지 않다. 선택적으로, 우성 대립유전자 및 열성 대립유전자는 동일하거나 실질적으로 동일한 기능성 단백질을 암호화할 수 있는 반면, 우성 대립유전자만이 열성 대립유전자와 달리 특정 상황 하에서 및/또는 특정 조직에서 특정 양의 상기 기능성 단백질을 발현할 수 있어, 단위생식과 같은 특정 표현형을 변환한다.
본 명세서에서 "암컷 난소"(복수형: "난소")라는 용어는 포자가 형성되는 인클로저를 의미한다. 단일 세포로 구성될 수도 있고 다세포일 수도 있다. 모든 식물, 균류 및 기타 많은 혈통은 수명 주기의 어느 시점에서 난소를 형성한다. 난소는 유사분열 또는 감수분열에 의해 포자를 생산할 수 있다. 일반적으로 각 난소 내에서 거대포자 모세포의 감수분열은 4개의 반수체 거대포자를 생성한다. 겉씨식물과 속씨식물에서는 이 4개의 거대포자 중 하나만이 성숙기에 기능하고, 나머지 3개는 퇴화한다. 이에 속하는 거대포자는 유사분열하여 암컷 배우체(megagametophyte)로 발달하여 결국 하나의 난세포를 생성한다.
본원에 사용된 용어 "암 배우자"는 유성 생식을 하는 유기체에서 수정(수태) 동안 정상적인 (성적) 환경에서 다른 ("수(male)") 세포와 융합하는 세포를 의미한다. 두 가지 형태학적으로 구별되는 유형의 배우자를 생산하고, 각 개체가 한 유형만 생산하는 종에서, 암컷은 더 큰 유형의 배우자(배주(오범(ovum)) 또는 난세포라고 함)를 생산하는 모든 개체이다. 식물에서 암컷 배주는 꽃의 난소에 의해 생성된다. 성숙하면 반수체 배주는 수정 준비가 된 암컷 생식세포를 생성한다. 수컷 세포는 (대부분 반수체) 꽃가루이며 꽃밥에 의해 생성된다.
"유전 마커(genetic marker)" 또는 "다형성 마커(polymorphic marker)"라는 용어는 염색체의 특정 위치를 "마킹"하는 데 사용할 수 있는 게놈 DNA에서의 영역을 의미한다. 유전 마커가 유전자에 밀접하게 연결되어 있거나, 유전자 '상에' 있는 경우, 유전자가 발견된 DNA를 "마킹"하므로, (분자) 마커 분석에서, 예를 들어, 마커 보조 육종/선택(MAS) 방법에서 유전자의 존재를 선택하거나 이에 대해 선택하는 데 사용할 수 있다. 유전 마커의 예는 AFLP(증폭 단편 길이 다형성, EP534858), 미소부수체, RFLP(제한 단편 길이 다형성), STS(서열 태그 부위), SNP(단일 뉴클레오티드 다형성), SFP(단일 특징 다형성; 참조: Borevitz 등, 2003), SCAR(서열 특성화된 증폭 영역), CAPS 마커(절단된 증폭 다형성 서열) 등이다. 마커가 유전자에서 멀리 떨어져 있을수록, 마커와 유전자 사이에서 재조합(교차)이 발생하여 연결 (및 마커와 유전자의 공동 분리)이 손실될 가능성이 높아진다. 유전자좌 사이의 거리는 재조합 빈도로 측정되며, cM 단위로 표시된다(centiMorgans; 1cM은 1%의 두 마커 사이의 감수 분열 재조합 빈도임). 게놈 크기는 종마다 크게 다르기 때문에, 1cM(즉, 두 마커 사이의 킬로베이스, kb)으로 표시되는 실제 물리적 거리도 종마다 크게 다르다.
본원에서 "연결된" 마커를 언급할 때, 이는 유전자 자체 "상(on)"의 마커도 포함하는 것으로 이해된다.
"MAS"는 마커 (및 선택적으로 플랭킹이 결여됨)를 포함하는 DNA 영역을 (엘리트) 육종 계열로의 전이를 촉진하기 위해, 식물이 하나 이상의 유전적 및/또는 표현형 마커의 존재 및/또는 부재에 대해 스크리닝되는 "마커 지원 선택(marker assisted selection)"을 의미한다.
"분자 마커 분석" (또는 테스트)은, 예를 들어, 식물 또는 식물 부분에서 Par 또는 par 대립유전자와 같이, 대립유전자의 존재 또는 부재를 (직접 또는 간접적으로) 나타내는 (DNA 기반) 분석을 의미한다. 바람직하게는 특정 대립유전자가 임의의 개별 식물에서 단위생식 유전자좌에서 동형접합성인지 이형접합성인지를 결정할 수 있게 한다. 예를 들어, 일 구현에서, 단위생식 유전자좌에 연결된 핵산은 PCR 프라이머를 사용하여 증폭되고, 증폭 산물은 효소적으로 분해되며, 증폭 산물의 전기영동 분해 패턴에 기초하여, 어느 대립유전자(들)가 임의의 개별 식물에 존재하는지 그리고 단위생식 유전자좌에서 상기 대립유전자의 접합성(즉, 각 유전자좌에서의 유전자형)을 검출할 수 있다. 예는 SCAR 마커(서열 특성화된 증폭 영역), CAPS 마커(절단된 증폭 다형성 서열) 및 유사한 마커 분석이다.
본원에서 사용되는 바와 같이, "이형접합"이라는 용어는 2개의 상이한 대립유전자가 특정 유전자좌에 존재할 때 존재하는 유전적 조건을 의미하지만, 세포 내의 상응하는 상동 염색체 세트에 개별적으로 위치한다. 역으로, 본원에서 사용되는 용어 "동형접합체"는 2개 (또는 배수성의 경우 그 이상)의 동일한 대립유전자가 특정 유전자좌에 존재하지만, 세포 내 상응하는 상동 염색체 세트에 개별적으로 위치할 때 존재하는 유전적 조건을 의미한다.
"변종"은 본원에서 UPOV 협약에 따라 사용되며 가장 낮은 알려진 등급의 단일 식물 분류군 내의 식물 그룹을 의미하며, 이 그룹은 특성의 발현에 의해 정의될 수 있고, 상기 특성 중 적어도 하나의 발현에 의해 임의의 다른 식물 그룹과 구별될 수 있으며, 변경되지 않은(안정적인) 전파에 대한 적합성과 관련하여 하나의 유닛으로 간주된다.
"단백질" 또는 "폴리펩티드"라는 용어는 상호 교환적으로 사용되며, 특정 작용 방식, 크기, 3차원 구조 또는 기원에 대한 언급 없이 아미노산 사슬로 구성된 분자를 의미한다. 따라서, 단백질의 "단편" 또는 "부분"은 여전히 "단백질"로 지칭될 수 있다.
용어 "유전자"는 적합한 조절 영역(예를 들어, 프로모터)에 작동 가능하게 연결된, 세포 내 RNA 분자(예를 들어, mRNA로 프로세싱되는 프리-mRNA)로 전사되는, 영역(전사 영역)을 포함하는 DNA 서열을 의미한다. 따라서, 유전자는 프로모터, 예를 들어, 번역 개시에 관여하는 서열들을 포함하는 5' 리더 서열, (단백질) 코딩 영역(cDNA 또는 게놈 DNA) 및 예를 들어, 전사 종결 부위를 포함하는 3' 비번역 서열과 같은 여러 작동 가능하게 연결된 서열들을 포함할 수 있다.
"키메라 유전자" (또는 재조합 유전자)는 종에서 자연적으로 일반적으로 발견되지 않는 임의의 유전자, 특히 뉴클레오티드 서열의 하나 이상의 부분이 존재하는 유전자에서 서로 자연적으로 연관되지 않은 유전자를 의미한다. 예를 들어, 프로모터는 전사된 영역의 일부 또는 전부 또는 다른 조절 영역과 자연적으로 연관되지 않는다.
"네이티브 유전자(native gene)"는 자연 발생 유전자에서도 발견될 수 있는 프로모터 서열, 코딩 서열 및 임의로 3'-UTR 서열을 포함하는 임의의 유전자를 지칭한다. 선택적으로, 네이티브 유전자의 뉴클레오티드 서열은 자연에서 발견되는 서열과 동일하다. 본원에서 네이티브 유전자는 트랜스진일 수 있음이 이해된다. 이 구현에서, 네이티브 유전자는 식물 종에 존재하며, 식물 종은 자연적으로 상기 네이티브 유전자를 포함하지 않는다.
"내인성 유전자"는 본원에서 이의 자연 환경, 즉 자연적으로 포함된 식물 종에 존재하는 천연 유전자로 이해된다.
"3'UTR" 또는 "3' 비번역 서열"(종종 3' 비번역 영역 또는 3' 말단이라고도 함)은 예를 들어 전사 종결 부위 및 (전부는 아니지만 대부분의 진핵 mRNA에서) 폴리아데닐화 신호(예를 들어, AAUAAA 또는 이의 변이체)를 포함하는 유전자의 코딩 서열의 다운스트림에서 발견되는 뉴클레오티드 서열을 지칭한다. 전사 종료 후, mRNA 전사물은 폴리아데닐화 신호의 다운스트림에서 절단될 수 있고, 폴리(A) 꼬리가 추가될 수 있으며, 이는 mRNA를 세포질(여기서 번역이 일어나는 곳)로 수송하는데 관여한다.
"5'UTR" 또는 "리더 서열" 또는 "5' 비번역 영역"은 mRNA 전사가 시작되는 +1 위치와 코딩 영역의 번역 시작 코돈 사이의 mRNA 전사 및 해당 DNA의 영역이다( 일반적으로 mRNA의 AUG 또는 DNA의 ATG). 5'UTR은 일반적으로 번역, mRNA 안정성 및/또는 전환 및 기타 조절 요소에 중요한 사이트를 포함한다.
"유전자의 발현"은 적절한 조절 영역, 특히 프로모터에 작동 가능하게 연결된 DNA 영역이 생물학적으로 활성인, 즉, 단백질 또는 펩티드 (또는 활성 펩티드 단편)로 번역될 수 있거나 또는 그 자체로 활성인(예: 전사 후 유전자 침묵 또는 RNAi에서) RNA로 전사되는 과정을 의미한다. 활성 단백질은 이의 기능을 수행할 수 있는 단백질을 의미할 수 있으며, 예를 들어, 특정 유전자의 5'UTR의 조절 요소에 결합하여 특정 유전자의 발현을 억제할 수 있다. 특정 구현에서 활성 단백질은 구성적으로 활성인 단백질을 의미한다. 코딩 서열은 바람직하게는 센스-배향이고, 원하는 생물학적 활성 단백질 또는 펩티드, 또는 활성 펩티드 단편을 코딩한다. 유전자 침묵 접근법에서, DNA 서열은 안티센스 배향으로 또는 센스 및 안티센스 배향으로 표적 유전자의 짧은 서열을 포함하는 안티센스 DNA 또는 역반복 DNA의 형태로 존재하는 것이 바람직하다.
"전사 조절 서열"은 본원에서 전사 조절 서열에 작동 가능하게 연결된 (코딩) 서열의 전사 속도를 조절할 수 있는 뉴클레오티드 서열로 정의된다. 따라서, 본원에서 정의된 바와 같은 전사 조절 서열은, 예를 들어 어테뉴에이터 또는 인핸서를 포함하여, 전사 개시(프로모터 요소), 유지 및 전사 조절에 필요한 모든 서열 요소를 포함할 것이다. 대부분 코딩 서열의 업스트림(5') 전사 조절 서열이 언급되지만, 코딩 서열의 다운스트림(3')에서 발견되는 조절 서열도 이 정의에 포함된다.
본원에서 용어 "프로모터"는 전사 개시 부위의 전사 방향에 대해 업스트림에 위치한 하나 이상의 DNA 영역의 전사를 제어하는 기능을 하는 핵산 단편을 의미하며, DNA-의존성 RNA 폴리머라제에 대한 결합 부위, 전사 개시 부위 및 이에 한정하는 것은 아니나 전사 인자 결합 부위, 억제인자 및 활성인자 단백질 결합 부위를 포함하는 임의의 다른 DNA 서열, 및 상기 프로모터로부터 전사의 양을 조절하기 위해 직접 또는 간접적으로 작용하는 것으로 당업자에게 공지된 임의의 다른 뉴클레오티드 서열에 의해 구조적으로 확인된다. 선택적으로 용어 "프로모터"는 본원에서 또한 5'UTR 영역을 포함한다(예를 들어, 프로모터는 본원에서 유전자의 번역 개시 코돈의 하나 이상의 업스트림(5') 부분을 포함할 수 있으며, 왜냐하면 이 영역은 전사 및/또는 번역을 조절하는 데 역할을 할 수 있기 때문이다).
"구성적(constitutive)" 프로모터는 대부분의 생리학적 및 발달 조건 하에서 대부분의 조직에서 활성인 프로모터이다. "유도성" 프로모터는 생리학적으로(예를 들어, 특정 화합물의 외부 적용에 의해) 발달적으로 조절되는 프로모터이다. "조직 특이적" 프로모터는 특정 유형의 조직 또는 세포에서만 활성적인 것이다. "식물 또는 식물 세포에서 활성인 프로모터"는 식물 또는 식물 세포 내에서 전사를 유도하는 프로모터의 일반적인 능력을 의미한다. 프로모터의 시공간적(spatiotemporal) 활성에 대해서는 아무런 영향을 주지 않는다.
본원에서 사용되는 바와 같이, "작동 가능하게 연결된"이라는 용어는 기능적 관계에서 폴리뉴클레오티드 요소의 연결을 의미한다. 핵산은 다른 뉴클레오티드 서열과 기능적 관계로 배치될 때 "작동 가능하게 연결된" 것이다. 예를 들어, 프로모터, 또는 오히려 전사 조절 서열이 코딩 서열의 전사에 영향을 미치는 경우 코딩 서열에 작동 가능하게 연결된다. 작동가능하게 연결된다는 것은 연결되는 DNA 서열이 전형적으로 연속적이며, 필요한 경우 프로모터 서열을 단백질 코딩 서열에 결합시키거나 단백질 코딩 서열을 3'UTR에 결합시키는 것을 의미한다. "핵산 구조물" 또는 "벡터"는 본원에서 재조합 DNA 기술의 사용으로부터 생성되고, 외인성 DNA를 숙주 세포로 전달하는데 사용되는 인공 핵산 분자를 의미하는 것으로 이해된다. 벡터 백본은, 예를 들어, 바이너리 또는 수퍼바이너리 벡터(예를 들어, US 5591616, US 2002138879 및 WO95/06722 참조), 공통합 벡터 또는 T-DNA 벡터일 수 있으며, 이는 당업계에 알려져 있고 본원의 다른 곳에서 설명된 바와 같이, 이 안으로 유전자 또는 키메라 유전자가 통합되거나, 또는 적합한 전사 조절 서열이 이미 존재하는 경우, 원하는 뉴클레오티드 서열(예: 코딩 서열, 안티센스 또는 역반복 서열)만이 전사 조절 서열의 다운스트림에 통합된다. 벡터는 일반적으로 예를 들어 선택 가능한 마커, 다중 복제 사이트 등과 같이 분자 클로닝에서 사용을 용이하게 하기 위해 추가 유전 요소를 포함한다.
"재조합 숙주 세포" 또는 "형질전환된 세포" 또는 "트랜스제닉 세포"는 적어도 하나의 핵산 분자, 특히 원하는 단백질 또는 발현 시 상기 세포에 도입된 본원에 정의된 PAR 단백질과 같은 특정 단백질을 생성하는 뉴클레오티드 서열을 암호화하는 트랜스진 및/또는 키메라 유전자를 코딩하는 것을 포함하는 핵산 분자의 결과로서 발생하는 새로운 개별 세포 (또는 유기체)를 지칭하는 용어이다. "분리된 핵산"은 자연 환경, 예를 들어 시험관 내 또는 재조합 박테리아 또는 식물 숙주 세포에 더 이상 존재하지 않는 핵산을 지칭하는 데 사용된다.
"숙주 세포"는 재조합 숙주 세포가 되기 위해 트랜스진으로 형질전환되는 원래의 세포이다. 숙주 세포는 바람직하게는 식물 세포 또는 박테리아 세포이다. 재조합 숙주 세포는 염색체외(에피솜) 복제 분자로서 핵산 구조물을 함유할 수 있거나, 또는 보다 바람직하게는 숙주 세포의 핵 또는 색소체 게놈에 통합된 유전자 또는 키메라 유전자를 포함한다.
"재조합 식물" 또는 "재조합 식물 부분" 또는 "트랜스제닉 식물"은 유전자가 발현되지 않거나, 또는 모든 세포에서 발현되지 않을 수도 있지만 재조합 유전자 또는 키메라 유전자 또는 트랜스진을 포함하는 식물 또는 식물 부분(예를 들어, 종자 또는 열매 또는 잎)이다.
"엘리트 이벤트"는 식물의 우수한 표현형 및/또는 농경학적 특성을 초래하는 게놈의 위치에 재조합 유전자 또는 트랜스진을 포함하도록 선택된 재조합 식물이다. 통합 부위의 플랭킹 DNA는 통합 부위를 특성화하고, 이벤트를 게놈의 다른 위치에서 동일한 재조합 유전자를 포함하는 다른 트랜스제닉 식물과 구별하기 위해 시퀀싱될 수 있다.
"선택 가능한 마커"라는 용어는 당업자에게 익숙한 용어이며, 발현될 때 선택 가능한 마커를 함유하는 세포 또는 세포들을 선택하기 위해 사용될 수 있는 임의의 유전적 실체를 설명하기 위해 본원에서 사용된다. 선택 가능한 마커 유전자 산물은, 예를 들어 항생제 내성, 또는 더 바람직하게는 제초제 내성 또는 표현형 특성(예: 색소 침착의 변화) 또는 영양 요건과 같은 다른 선택 가능한 특성을 부여한다. "리포터"라는 용어는 주로 녹색 형광 단백질(GFP), eGFP, 루시페라아제, GUS 등과 같은 가시적인 마커를 지칭하는 데 사용된다.
유전자 또는 단백질의 "오르토로그(orthologue)"라는 용어는 본원에서 다른 종에서 발견되는 상동 유전자 또는 단백질을 의미하며, 이는 유전자 또는 단백질과 동일한 기능을 갖지만 (보통) 분기된 유전자(즉, 종분화에 의해 공통 조상에서 진화한 유전자)를 은닉하는 시점부터 서열이 분기된다. 따라서, 탁사라쿰(Taxaracum) 단위생식 유전자의 상동체는 서열 비교(예를 들어, 전체 서열 또는 특정 도메인에 대한 백분율 서열 동일성에 기초함) 및 기능적 분석 모두에 기초하여 다른 식물 종에서 확인될 수 있다.
용어 "상동" 및 "이종"은 핵산 또는 아미노산 서열과 그의 숙주 세포 또는 유기체 사이의 관계, 특히 트랜스제닉 유기체의 맥락에서의 관계를 지칭한다. 따라서, 상동 서열은 숙주 종(예: 상추 유전자로 형질전환된 상추 식물)에서 자연적으로 발견되는 반면, 이종 서열은 숙주 세포(예: 감자 식물로부터의 서열로 형질전환된 상추 식물)에서 자연적으로 발견되지 않는다. 문맥에 따라, 용어 "호모로그" 또는 "상동"은 대안적으로 공통 조상 서열로부터 유래하는 서열을 지칭할 수 있다(예를 들어, 이들은 오르토로그일 수 있음).
"엄격한 혼성화 조건"은 주어진 뉴클레오티드 서열과 실질적으로 동일한 뉴클레오티드 서열을 확인하는 데 사용될 수 있다. 엄격한 조건은 서열에 따라 달라지며 다른 상황에서는 다를 것이다. 일반적으로 엄격한 조건은 정의된 이온 강도 및 pH에서 특정 서열에 대한 열 융점(Tm)보다 약 5℃ 낮도록 선택된다. Tm은 표적 서열의 50%가 완벽하게 일치하는 프로브에 혼성화되는 온도(정의된 이온 강도 및 pH 하에서)이다. 전형적으로 염 농도는 pH 7에서 약 0.02몰이고, 온도는 적어도 60℃인 엄격한 조건이 선택될 것이다. 염 농도를 낮추고 그리고/또는 온도를 높이면 엄격도가 높아진다. RNA-DNA 혼성화를 위한 엄격한 조건(예를 들어, 100nt의 프로브를 사용하는 노던 블롯)은 예를 들어 63℃에서 20분 동안 0.2X SSC에서 적어도 1회 세척 또는 동등한 조건을 포함하는 조건이다. DNA-DNA 혼성화를 위한 엄격한 조건(예: 100nt의 프로브를 사용하는 서던 블롯)은 예를 들어 적어도 50℃, 일반적으로 약 55℃의 온도에서, 20분 동안, 0.2X SSC에서 최소 1회 세척(보통 2회), 또는 동등한 조건을 포함하는 조건이다. 또한 [Sambrook 등(1989) 및 Sambrook과 Russell(2001)]을 참조바란다.
"높은 엄격성" 조건은, 예를 들어, 6x SSC(20x SSC는 3.0M NaCl, 0.3M Na-시트레이트 함유, pH 7.0), 5x Denhardt's(100X Denhardt's는 2% 피콜, 2% 폴리비닐 피롤리돈, 2% 소혈청 알부민 함유), 0.5% SDS(sodium dodecyl sulphate) 및 비 특정 경쟁자로서 20 μg/ml 변성 운반체 DNA(단일 가닥 어류 정자 DNA, 평균 길이 120 - 3000 뉴클레오티드를 가짐)를 함유하는 수용액에서 65℃에서 혼성화하여 제공될 수 있다. 혼성화 후, 0.2-0.1x SSC, 0.1% SDS의 혼성화 온도에서 최종 세척(약 30분)과 함께 높은 엄격성 세척이 여러 단계로 수행될 수 있다.
"중간 엄격성"은 약 60-62℃에서 전술한 용액에서의 혼성화와 동등한 조건을 의미한다. 이 경우 최종 세척은 1x SSC, 0.1% SDS의 혼성화 온도에서 수행된다.
"낮은 엄격성"은 약 50-52℃에서 전술한 용액에서의 혼성화와 동등한 조건을 의미한다. 이 경우 최종 세척은 2x SSC, 0.1% SDS의 혼성화 온도에서 수행된다. 또한 [Sambrook 등(1989) 및 Sambrook과 Russell(2001)]을 참조바란다.
"서열 동일성" 및 "서열 유사성"은 2개의 서열의 길이에 따라 글로벌 또는 로컬 정렬 알고리즘을 사용하여 2개의 펩티드 또는 2개의 뉴클레오티드 서열의 정렬에 의해 결정될 수 있다. 유사한 길이의 서열은 바람직하게 전체 길이에 걸쳐 서열을 최적으로 정렬하는 글로벌 정렬 알고리즘(예: Needleman Wunsch)을 사용하여 정렬되는 반면, 실질적으로 다른 길이의 서열은 바람직하게는 로컬 정렬 알고리즘(예: Smith Waterman)을 사용하여 정렬된다. 이어서, 서열이 (예를 들어 기본 매개변수를 사용하는 프로그램 GAP 또는 BESTFIT에 의해 최적으로 정렬될 때) 서열 동일성의 적어도 특정 최소 백분율(본원에 정의됨)을 공유할 때 서열은 "실질적으로 동일" 또는 "본질적으로 유사"하다고 언급될 수 있다. 서열 동일성의 백분율은 바람직하게는 Sequence Analysis Software Package™(Version 10; Genetics Computer Group, Inc., Madison, Wis.)의 "BESTFIT" 또는 "GAP" 프로그램을 사용하여 결정된다. GAP는 Needleman 및 Wunsch 글로벌 정렬 알고리즘(Needleman and Wunsch, Journal of Molecular Biology 48:443-453, 1970)을 사용하여 전체 길이(전장)에 걸쳐 두 개의 서열을 정렬하여, 일치 수를 최대화하고 간격 수를 최소화한다. 글로벌 정렬은 2개의 서열이 유사한 길이를 가질 때 서열 동일성을 결정하기에 사용하는데 적절하다. 일반적으로, 갭 생성 패널티 = 50(뉴클레오티드) / 8(단백질) 및 갭 확장 패널티 = 3(뉴클레오티드) / 2(단백질)와 함께 GAP 기본 매개변수가 사용된다. 뉴클레오티드의 경우, 사용되는 기본 스코어링 매트릭스는 nwsgapdna이고 단백질의 경우, 기본 스코어링 매트릭스는 Blosum62이다(Henikoff & Henikoff, 1992, PNAS 89, 915-919). 백분율 서열 동일성에 대한 서열 정렬 및 점수는 Accelrys Inc.(9685 Scranton Road, San Diego, CA 92121-3752 USA)에서 입수할 수 있는 GCG Wisconsin Package, Version 10.3과 같은 컴퓨터 프로그램을 사용하거나, 또는 상기 GAP와 동일한 매개변수를 사용하거나 동일한 기본 설정을 사용하여 EmbossWIN 버전 2.10.0의 "needle"(글로벌 Needleman Wunsch 알고리즘 사용) 또는 "water"(로컬 Smith Waterman 알고리즘 사용) 프로그램과 같은 공개 소스 소프트웨어를 사용하여 결정할 수 있다('needle' 및 'water' 모두에 대해 그리고 단백질 및 DNA 정렬 모두에 대해, 기본 갭 개방 페널티는 10.0이고, 기본 갭 확장 페널티는 0.5이고, 기본 스코어링 매트릭스는 단백질의 경우 Blossum62이고, DNA의 경우 DNAFull임). "BESTFIT"는 두 서열 사이의 유사도의 최상의 세그먼트의 최적 정렬을 수행하고, 매치 수를 최대화하기 위해 Smith와 Waterman의 로컬 호몰로지 알로리즘(Smith 및 Waterman, Advances in Applied Mathematics, 2:482-489, 2:482-489, 1981, Smith 등, Nucleic Acids Research 11:2205-2220, 1983)을 사용하여 갭을 삽입하였다. 서열의 전체 길이가 실질적으로 다른 경우 Smith Waterman 알고리즘을 사용하는 것과 같은 로컬 정렬이 선호된다.
본원에 사용된 "서열 동일성"은 2개의 최적으로 정렬된 폴리뉴클레오티드 또는 펩티드 서열이 구성요소, 예를 들어 뉴클레오티드 또는 아미노산의 정렬 창 전체에 걸쳐 불변인 정도를 의미한다. 시험 서열 및 참조 서열의 정렬된 세그먼트에 대한 "동일성 부분"은 2개의 정렬된 서열이 공유하는 동일한 성분의 수를 참조 서열 세그먼트 내 성분들의 총 수, 즉 전체 참조 서열 또는 참조 서열의 더 작게 정의된 부분으로 나눈 것이다. "퍼센트 동일성"은 동일성 분수에 100을 곱한 것이다.
서열 동일성을 결정하기 위한 유용한 방법은 또한 Guide to Huge Computers, Martin J. Bishop, ed., Academic Press, San Diego, 1994 및 Carillo, H. 및 Lipton, D., Applied Math (1988) 48:1073에 개시되어 있다. 보다 구체적으로, 서열 동일성을 결정하기 위한 바람직한 컴퓨터 프로그램은 Md. 20894, 베데스다, 국립보건원 소재 국립 의학 도서관의 국립 센터 생명공학 정보(NCBI)로부터 공개적으로 이용가능한 기본 로컬 정렬 검색 도구(BLAST) 프로그램을 포함하며; BLAST Manual, Altschul 등, NCBI, NLM, NIH; Altschul 등, J. Mol. Biol. 215:403-410 (1990) 참조; BLAST 프로그램 버전 2.0 이상에서는 정렬에 갭(삭제 및 삽입)을 도입할 수 있으며; 펩티드 서열의 경우 BLASTX가 서열 동일성을 결정하는 데 사용할 수 있으며; 그리고, 폴리뉴클레오티드 서열의 경우 BLASTN을 사용하여 서열 동일성을 결정할 수 있다.
대안적으로 백분율 유사성 또는 동일성은 FASTA, BLAST 등과 같은 알고리즘을 사용하여 공개 데이터베이스에 대해 검색하여 결정할 수 있다. 따라서, 본 발명의 핵산 및 단백질 서열은 예를 들어, 다른 패밀리 구성원이나 관련 서열을 확인하기 위해 공개 데이터베이스에 대해 검색을 수행하기 위한 "쿼리 서열"로서 추가로 사용될 수 있다. 이러한 검색은 Altschul 등(1990) J. Mol. Biol. 215:403-10의 BLASTn 및 BLASTx 프로그램(버전 2.0)을 사용하여 수행할 수 있다. BLAST 뉴클레오티드 검색은 NBLAST 프로그램, 점수 = 100, 워드길이 = 12로 수행되어 본 발명의 산화환원효소 핵산 분자에 상동인 뉴클레오티드 서열을 얻을 수 있다. BLAST 단백질 검색은 BLASTx 프로그램, 점수 = 50, 워드길이 = 3으로 수행되어 본 발명의 단백질 분자에 상동인 아미노산 서열을 얻을 수 있다. 비교 목적을 위한 갭 정렬을 얻기 위해, Gapped BLAST가 Altschul 등(1997) Nucleic Acids Res. 25(17): 3389-3402에 기술된 바와 같이 사용될 수 있다. BLAST 및 Gapped BLAST 프로그램을 사용할 때, 각 프로그램의 기본 매개변수(예: BLASTx 및 BLASTn)를 사용할 수 있다. 국립생명공학정보센터 홈페이지(http://www.ncbi.nlm.nih.gov/)를 참조바란다.
본원에 사용된 용어 "식물 유성 생식"은 "거대포자 모세포"로 지칭되는 (예를 들어, 2배체) 체세포가 감수분열을 거쳐 4개의 감소된 거대포자를 생성하는 발달 경로를 의미한다. 이 거대포자 중 하나는 유사분열로 분열하여 거대배우체(배낭이라고도 함)를 형성하는데, 여기에는 감소된 난세포(즉, 모체에 비해 감소된 수의 염색체를 갖는 세포)와 2개의 감소된 극성 핵이 포함된다. 꽃가루 알갱이의 한 정자 세포에 의한 난세포의 수정은 (예: 2배체) 배아를 생성하는 반면, 두 번째 정자 세포에 의한 2개의 극성 핵의 수정은 (예: 3배체) 배유를 생성한다(이중 수정이라고 하는 과정).
본원에서 사용되는 용어 "거대포자 모세포" 또는 "거대포자세포"는 감소, 일반적으로 감수분열에 의해 거대포자를 생성하여 암컷 배우체로 발달할 4개의 반수체 거대포자를 생성하는 세포를 지칭한다. 속씨식물(현화식물이라고도 함)에서, 거대포자 모세포는 대포자형성(megasporogenesis)(핵에서 거대포자 또는 거대포자낭 형성) 및 대배우체형성(megagametogenesis)(거대포자에서 자성배우체(megagametophyte)로의 발달)을 포함하는 2개의 구별된 과정을 통해 자성배우체로 발달하는 거대포자를 생성한다.
본원에서 사용되는 "무성 식물 번식"이라는 용어는 수정 및 배우자 융합 없이 식물 번식이 달성되는 과정이다. 무성 생식은 돌연변이나 체세포 재조합이 발생하는 경우를 제외하고 부모 식물과 그리고 서로에 대해 유전적으로 동일한 새로운 개체를 생성한다. 식물은 영양 생식(즉, 원래 식물의 영양 조각의 발아, 분얼 등 포함)과 아포믹시스를 포함하는 두 가지 주요 무성 생식 유형을 가지고 있다.
본원에서 사용되는 용어 "아포믹시스"는 무성 과정에 의한 종자의 형성을 의미한다. 아포믹시스의 한 형태는 1) 난소에서 감소되지 않은 배낭의 형성을 의미하는 아포메이오시스(apomeiosis) 및 2) 감소되지 않은 배주가 배아로 발달하는 것을 의미하는 단위생식(parthenogenesis)을 특징으로 한다. 수백 종의 야생 식물 종은 무성 생식을 특징으로 하며 무성 번식한다. 아포메이오시스는 모 식물의 체세포 조직과 동일한 염색체 번호와 동일하거나 매우 유사한 유전자형을 가진 감소되지 않은 난세포의 생산으로 이어지는 과정이다. 감소되지 않은 난세포는 감소되지 않은 거대포자(megaspore)(디플로스포리(diplospory)) 또는 체세포 초기 세포(apospory)에서 유래할 수 있다. 디플로스포리의 경우, 거대포자형성은 유사분열 또는 변형된 감수분열로 대체된다. 변형된 감수분열은 바람직하게는 재조합이 없는 1차 분열 복원 유형이다. 대안적으로 변형된 감수분열은 2차 분열 복원 유형일 수 있다. 바람직한 구현예에서, 무형성증은 제1 감수분열에 영향을 미치는 디플로스포러스 유형이다. 아포믹시스는 배우체 아모믹시스(gametophytic apomixis) 및 포자체 아모믹시스(sporophytic apomixis)(곁배(adventive embryony)라고도 함)로 알려진 적어도 두 가지 형태를 포함하여 다양한 형태로 발생하는 것으로 알려져 있다. 배우체 아모믹시스가 발생하는 식물의 예로는 민들레(Taraxacum sp.), 조팝나물(Hieracium sp.), 켄터키블루그래스(Poa pratensis), 이스턴 감마스래스(Tripsacum dactyloides) 등이 포함된다. 포자체 아모믹시스가 발생하는 식물의 예로는 감귤류(Citrus sp.) 망고스틴(Garcinia mangostana) 등이 포함된다.
본원에서 사용되는 용어 "디플로스포리"는 감소되지 않은 배낭이 유사분열에 의해 직접적으로 또는 중단된 감수분열 이벤트에 의해 거대포자 모세포로부터 유도되는 상황을 지칭한다. 세 가지 주요 유형의 디플로스포리류가 보고되었으며, 발생하는 식물의 이름을 따서 명명되었으며, Taraxacum, Ixeris 및 Antennaria 유형이다. Taraxacum 유형에서는, 감수분열 전기가 시작되지만, 그 다음 그 과정이 중단되어 2개의 감소되지 않은 다이애드(dyads)가 생성되며, 그 중 하나는 유사분열에 의해 배낭이 된다. Ixeris 유형에서, 8개 핵의 배낭을 발생시키는 핵의 2개의 추가 유사분열은 등식 분열이 후속하고, 이후에 감수분열 전기가 후속한다. Taraxacum 및 Ixeris 유형은 감수분열의 변형을 수반하기 때문에 감수분열 디플로스포리로 알려져 있다. 이에 반해, 유사분열 디플로스포리라고 불리는 Antennaria 유형에서는 거대포자 모세포가 감수분열을 시작하지 않고, 직접 3회 분열하여 감소되지 않은 배낭을 생성한다. 디플로스포리에 의한 배우체 아모믹시스에서, 감소되지 않은 배우체는 감소되지 않은 거대 포자로부터 생성된다. 이 감소되지 않은 거대포자는 유사분열-유사 분열(유사분열 디스플로리(mitotic displory)) 또는 변형된 감수분열(meiotic displory)로 인해 발생한다. 무포자(apospory)에 의한 배우체 아모믹시스와 디스플로리에 의한 배우체 아모믹시스 모두에서, 감소되지 않은 난세포는 단위 발생적으로 배아로 발달한다. Taraxacum의 아포믹시스는 디플로스포리형으로, 첫 번째 암컷 감수분열(감수분열 I)을 건너뛰어, 모식물과 동일한 유전자형을 가진 2개의 감소되지 않은 거대포자를 형성한다. 이 거대포자 중 하나는 퇴화하고, 다른 살아남은 감소되지 않은 거대포자는 감소되지 않은 난세포를 함유하는 감소되지 않은 거대배우체 (또는 배낭)를 생성한다. 이 감소되지 않은 난세포는 수정 없이 모 식물과 동일한 유전자형을 가진 배아로 발달한다. 배우체 아모믹시스 과정에서 발생하는 종자를 아포믹틱 종자라고 한다.
용어 "디플로스포리 기능"은 식물, 바람직하게는 암컷 난소, 바람직하게는 거대포자 모세포 및/또는 암컷 배우자에서 디플로스포리를 유도하는 능력을 의미한다. 따라서, 디플로스포리 기능이 도입된 식물은 디플로스포리 과정을 수행이 가능한, 즉 감수분열 I 복원을 통해 감소되지 않은 배우자를 생산하는 것이 가능하다.
본원에서 사용되는 용어 "아포믹틱 종자"는 무포자성 식물 종으로부터, 또는 아포믹시스, 특히 디플로스포리를 통해 배우체 아포믹시스를 겪도록 유도된 식물 또는 작물에 의해 얻어지는 종자를 의미한다. 아포믹틱 종자는 진정한 번식이 가능한 부모 식물 및 발아 식물과 복제 및 유전적으로 동일하다는 점에서 특징이 있다. 본 발명에서 "아포믹틱 종자"는 "클론 아포믹틱 종자"를 의미하기도 한다.
본원에서 사용되는 용어 "아포믹틱 식물(들)"은 수정 없이 그 자체로 무성 생식하는 식물을 의미한다. 아포믹틱 식물은 아포믹틱이 되도록 변형된 유성 식물일 수 있으며, 예를 들어, 이는 예를 들어 아포믹틱 식물을 얻기 위해 본원에 교시된 바와 같은 하나 이상의 단위생식 유전자로 유전적으로 변형된 유성 식물, 또는 아포믹틱 식물의 자손인 식물이다. 이 경우, 아포믹트적으로 생산된 자손은 부모 식물과 유전적으로 동일한다.
세포, 식물, 식물 부분 또는 종자의 "클론"은 이들이 유래된 부모 식물뿐만 아니라 이들의 형제와 유전적으로 동일하다는 점에서 특징이 있다. 개별 클론의 게놈 DNA 서열은 거의 동일하지만 돌연변이로 인해 약간의 차이가 발생할 수 있다.
본원에서 사용되는 용어 "진정한 육종" 또는 "진정한 육종 유기체"(순수-육종된 유기체로도 알려짐)는 항상 특정 표현형 형질을 변경되지 않거나 거의 변경되지 않은 상태로 후손에게 물려주는 유기체를 의미한다. 유기체는 이것이 적용되는 각 특성에 대해 진정한 육종이라고 하며, "진정한 육종"이라는 용어는 개별 유전적 특성을 설명하는 데에도 사용된다.
본원에서 사용되는 용어 "F1 잡종"(또는 혈통 1 잡종)은 분명히 다른 부모 유형의 자손의 1세대 자손을 의미한다. 부모 유형은 근친교배일 수도 있고 아닐 수도 있다. F1 잡종은 유전학 및 선택적 육종에 사용되며, F1 크로스브리드(crossbreed)로 나타날 수 있다. 분명히 다른 부모 유형의 자손은 부모로부터의 특성이 조합된 새롭고 균일한 표현형을 생성한다. F1 잡종은 이종증(heterosis)과 같은 뚜렷한 이점과 연관되어 있으며, 따라서 농업 관행에서 매우 바람직한다. 본 발명의 일 구현에서, 본원에 교시된 방법, 유전자, 단백질, 변이체 또는 그의 단편은 그의 유전적 복잡성에 관계없이 F1 잡종의 유전자형을 고정하는데 사용될 수 있고, 한 단계에서 진정 육종할 수 있는 유기체의 생산을 가능하게 한다.
본원에서 사용되는 "수분" 또는 "폴리네이팅"이라는 용어는 꽃가루가 식물의 꽃밥(수컷 부분)에서 암술머리(암컷 부분)로 옮겨져 수정 및 번식을 가능하게 하는 과정을 의미한다. 꽃을 피우는 식물인 속씨식물에 독특하다. 각각의 꽃가루 알갱이는 수컷 반수체 배우체이며, 암컷 배우체로 운반되는 데 적합하며, 여기서 이는 이중 수정 과정에서 수컷 배우자(또는 배우자들)를 생산하여 수정에 영향을 줄 수 있다. 수컷 배우자를 포함하는 성공적인 속씨식물 꽃가루 알갱이(배우체)는 암술머리로 옮겨져, 여기서 이는 발아하고 꽃가루관이 암술대에서 난소까지 자란다. 이의 2개의 배우자는 암배우자를 포함하는 배우체(들)가 심피(carpel) 내에서 유지되는 튜브 아래로 이동한다. 한 핵은 극체와 융합하여 배젖 조직을 생성하고, 다른 핵은 배주와 융합하여 배아를 생성한다.
본원에서 사용되는 용어 "단위생식"은 수정 없이 배아의 성장 및 발달이 일어나는 무성 생식의 형태를 의미한다. 본 발명의 유전자 및 단백질은 바람직하게는 디플로스포리 인자, 예를 들어 유전자 또는 화학적 인자와 조합하여 아포믹틱 자손을 생산할 수 있다.
본원에서 사용되는 용어 "단성생식 표현형"은 식물 및/또는 그의 자손이 수정 없이 난세포로부터 배아를 성장 및 발달시키는 능력을 의미한다.
본원에 사용된 용어 "유전자 피라미드화 또는 스태킹"은 다른 부모 계열로부터 관련되거나 관련되지 않은 유전자들을 한 식물로 조합하는 프로세스를 칭하며, 이는 바람직하거나 유리한 형질(예를 들어, 질병 저항성 형질, 색상, 가뭄 저항성, 해충 저항성 등.)의 기저를 이룬다. 유전자 피라미드화 또는 스태킹은 전통적인 육종 방법을 사용하여 수행하거나, 분자 마커를 사용하여, 원하는 대립 유전자 조합을 포함하는 식물을 식별 및 유지하고, 원하는 대립 유전자 조합이 없는 식물을 폐기함으로써 촉진될 수 있다. 본 발명의 일 구현에서, 본원에 교시된 단위생식 유전자는 아포믹틱 식물을 생산하거나 유성 작물에 아포믹시스를 도입하기 위한 유전자 피라미딩 또는 스태킹 프로그램에 유리하게 사용될 수 있다.
본 문헌 및 그 청구범위에서, "구성하다"라는 동사 및 그 활용형은 비제한적 의미로 단어 뒤에 오는 항목이 포함되지만 구체적으로 언급되지 않은 항목은 제외되지 않는다는 의미로 사용된다. 또한, 부정관사 "a" 또는 "an"에 의한 요소에 대한 언급은 문맥상 요소 중 오직 하나만 존재함을 명백히 요구하지 않는 한, 하나 이상의 요소가 존재할 가능성을 배제하지 않습니다. 따라서 부정관사 "a" 또는 "an"은 일반적으로 "적어도 하나"를 의미한다. 또한, 본원에서 "서열"을 언급할 때 일반적으로 특정 서브유닛(예: 아미노산) 시퀀스를 갖는 실제 물리적 분자를 언급하는 것으로 이해된다.
본원에서 사용되는 바와 같이, 용어 "식물"은 식물 세포, 식물 조직 또는 기관, 식물 원형질체, 식물이 재생될 수 있는 식물 세포 조직 배양물, 식물 캘리(plant calli), 식물 세포 덩어리, 및 배아, 꽃가루, 씨주머니, 과일, 꽃, 잎(예: 수확한 상추 작물), 종자, 뿌리, 뿌리 끝 등과 같이 식물 또는 식물의 부분에서 온전한 식물 세포를 포함한다.
발명의 상세한 설명
본 발명은 돌연변이 유전자가 단위생식에서 기능하는 돌연변이 유전자의 제조 방법을 제공한다. 바람직하게는, 상기 방법은 코딩된 PAR 단백질의 발현을 증가시키기 위해 본원에서 par 대립유전자로서 표시된 단위생식 유전자의 유성 변이체의 프로모터 서열을 돌연변이시키는 단계를 포함한다. 생성된 돌연변이 유전자는 식물에 단위생식 표현형을 유도할 수 있기 때문에 Par 대립유전자로 간주될 수 있다. par 대립유전자가 우성 Par 대립유전자가 결여된 식물 또는 식물 세포의 내인성 대립유전자인 경우, 본 발명의 방법은 단위생식을 나타내지 않는 식물 또는 식물 세포를 상기 par 대립유전자의 프로모터의 변형에 의해 단위생식을 나타내는 식물 또는 식물 세포로 형질전환시킨다. 본 발명은 par 대립유전자의 프로모터 서열을 변형시켜 유성 par 대립유전자를 단위생식 Par 대립유전자로 전환시키는 방법을 제공한다. 본 발명은 하기 단계들을 포함하는, 단위생식에서 기능적인 돌연변이 유전자를 생산하는 방법을 제공한다:
(a) 프로모터에 작동 가능하게 연결된 PAR 단백질을 인코딩하는 서열을 포함하는 유전자를 제공하는 단계; 및
(b) PAR 단백질을 인코딩하는 서열의 업스트림의 서열을 변형하여 인코딩된 PAR 단백질의 발현을 증가시키도록, 바람직하게는 성숙 암컷 배우체에서, 상기 프로모터를 변형시키는 단계.
보다 구체적으로, 본 발명은 하기 단계들을 포함하는, 단위생식에서 기능적인 돌연변이 유전자를 생산하는 방법을 제공한다:
(a) 하나 이상의 전사 인자 MYB 결합 부위를 포함하는 프로모터에 작동 가능하게 연결된 PAR 단백질을 인코딩하는 서열을 포함하는 유전자를 제공하는 단계; 및
(b) 하나 이상의 전사 인자 MYB 결합 부위의 업스트림의 서열을 변형하여 인코딩된 PAR 단백질의 발현을 증가시키도록, 바람직하게는 성숙 암컷 배우체에서, 상기 프로모터를 변형시키는 단계.
PAR 단백질을 인코딩하는 서열의 업스트림의 서열, 바람직하게는 하나 이상의 전사 인자 MYB 결합 부위의 업스트림은 PAR 단백질의 발현을 향상시키는 인핸서 서열을 도입하고/하거나 PAR 단백질의 발현을 억제하는 리프레서 서열을 제거함으로써 변형될 수 있다. 바람직하게는 인핸서 서열이 삽입되며, 바람직하게는 암컷 배우체 특이적 인핸서 서열이 삽입된다. 상기 삽입체는 본원에 정의된 바와 같은 MITE 서열일 수 있다. 대안적으로 또는 추가로, PAR 단백질을 인코딩하는 서열의 업스트림의 프로모터 서열, 바람직하게는 하나 이상의 MYB 결합 부위의 업스트림은 하나 이상의 뉴클레오티드 치환, 삽입 및/또는 결실을 초래하는 (무작위) 돌연변이 유발에 의해 변경되어 하나 이상의 인핸서 서열을 도입하거나 그리고/또는 인코딩된 PAR 단백질의 발현을 증가시킨다.
추가로 또는 대안적으로, 본 발명은 하기 단계들을 포함하는, 단위생식에서 기능적인 돌연변이 유전자를 생산하는 방법을 제공한다:
(a) 하나 이상의 전사 인자 MYB 결합 부위를 포함하는 프로모터에 작동 가능하게 연결된 PAR 단백질을 인코딩하는 서열을 포함하는 유전자를 제공하는 단계; 및
(b) 하나 이상의 전사 인자 MYB 결합 부위 중 적어도 하나를 변형시킴으로써 인코딩된 PAR 단백질의 발현을 증가시키도록 상기 프로모터를 변형시키는 단계.
바람직하게는, 본 발명의 돌연변이 유전자의 변형된 프로모터는 식물에 존재할 때, 변형되지 않은 대응물, 즉 본 발명의 프로모터가 본원에 정의된 바와 같이 수득된 (내인성 또는 천연) 프로모터로에 비해, 상기 프로모터에 작동 가능하게 연결된 코딩 서열에 의해 인코딩된 PAR 단백질의 증가된 발현을 일으킨다. 바람직하게는, 상기 증가된 발현은 적어도 본 발명의 변형된 프로모터 및/또는 돌연변이 유전자를 포함하는 식물의 난세포에서 존재한다. 바람직하게는, 발현의 증가는 원래의 비-돌연변이 유전자(즉, 본 발명의 방법의 단계 (a)의 유전자)에 비해 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90 또는 100%의 증가이다.
일 구현에서, 단계 a)에서 PAR 단백질을 인코딩하는 유전자는 아라비돕시스 탈리아나(Arabidopsis thaliana)에서 기원한 유전자가 아니다. 일 구현에서, 본 발명의 돌연변이 유전자는 MYB 결합 부위 중 하나 이상에서 돌연변이를 갖는 아라비돕시스 탈리아나(Arabidopsis thaliana) DAZ3에서 유래된 돌연변이 프로모터를 포함하지 않는다.
단계 (a)에서 제공되는 유전자는 단위생식 유전자, 바람직하게는 유전자의 유성 변이체, 즉 par 대립유전자이다. 생성된 변이 유전자는 단위생식에 기능적이므로, 본 발명의 방법은 단위생식 유전자의 유성 대립유전자(par allele)를 단위생식에 기능하는 대립유전자(Par allele)로 전환시키는 방법으로도 볼 수 있다.
전사 인자 MYB 결합 부위(또한 본원에서 "MYB 결합 부위"로 표시됨)는 전사 인자 MYB에 의해 인식되고 결합되는 프로모터 내의 서열이다. MYB 단백질은 MYB 결합 부위에서 DNA에 결합하여 전사를 조절하는 능력을 부여하는 다양한 수의 MYB 도메인 반복을 포함하는 DNA 결합 단백질 계열이다.
본 발명자들은 par 대립유전자의 시작 코돈의 업스트림의 약 50-150bps 영역에서 하나 이상의 MYB 결합 부위를 확인하였다. MYB 결합 부위는 본원에서 바람직하게는 NACCNNN, 바람직하게는 AACCNNN, 더 바람직하게는 AACCGNN, 더욱 더 바람직하게는 AACCG[C/T]N, 더욱 더 바람직하게는 AACCG[C/T]C의 뉴클레오티드 서열을 갖는 바람직하게는 7개 뉴클레오티드의 서열로 정의되며, AACCGCC, AACCGTC 또는 [T/A]AACCGCC일 수 있다(Borg 등 2011). 바람직하게는 하나 이상의 MYB 결합 부위는 PAR 단백질을 인코딩하는 서열의 시작 코돈의 업스트림의 약 60-140bps, 70-130bps, 80-120bps 또는 90-110bps, 바람직하게는 시작 코돈의 업스트림의 최대 약 200, 190, 180, 170, 160 또는 150, 140, 130, 120 또는 110개 뉴클레오티드 사이에 위치하며, 훨씬 더 바람직하게는 하나 이상, 바람직하게는 2개의 MYB 결합 부위의 3' 말단은 PAR 단백질을 인코딩하는 서열의 시작 코돈의 업스트림의 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109 또는 110개 뉴클레오티드에 위치한다. 일부 경우에는 두 개의 MYB 결합 부위가 상기 영역에 위치한다. 예를 들어, 상추(락투카 사티바(Lactuca sativa))에서, 첫 번째 MYB 결합 부위는 ATG 시작 코돈의 업스트림의 117-110개 뉴클레오티드 위치에 위치하고, 두 번째 MYB 결합 부위는 ATG 시작 코돈의 업스트림의 104-98개 뉴클레오티드 위치에 위치한다.
MYB 결합 부위는 바람직하게는 전사 인자 MYB의 결합 부위로서 작용하며, 여기서 MYB 전사 인자는 R2R3 전사 인자 또는 R2R3-MYB 전사 인자이고, 여기서 상기 전사 인자 MYB는 DUO1(UniProtKB 어세션 A0A178VEK7)이거나, 또는 이의 변이체, 상동체 또는 오르토로그일 수 있다. 전사 인자는 바람직하게는 SEQ ID NO: 62와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다.
추가로 또는 대안적으로, 본 발명은 또한 식물에 단위생식 표현형을 유도할 수 있는 돌연변이 유전자를 생산하는 방법으로서 간주될 수 있으며, 상기 방법은 하기 단계를 포함한다:
(a) PAR 단백질을 인코딩하는 서열을 포함하는 유전자를 제공하는 단계로서, 상기 서열은 프로모터에 작동 가능하게 연결되며, 상기 프로모터는 선택적으로 하나 이상의 전사 인자 MYB 결합 부위를 포함하는, 단계; 및
(b) 인코딩된 PAR 단백질의 발현을 증가시키기 위해 바람직하게는 하기 중 적어도 하나에 의해 프로모터를 변형시키는 단계:
i) 본원에 정의된 바와 같은 PAR 단백질을 인코딩하는 서열의 시작 코돈의 업스트림, 훨씬 더 바람직하게는 본원에 정의된 하나 이상의 MYB 결합 부위의 업스트림 또는 바로(directly) 업스트림의 프로모터 서열에 삽입체를 도입하여, 바람직하게는 인핸서 서열을 도입하거나 리프레서 서열을 제거함으로써, 인코딩된 PAR 단백질의 발현을 증가시키는 단계;
ii) 본원에 정의된 바와 같은 PAR 단백질을 인코딩하는 서열의 시작 코돈의 업스트림, 훨씬 더 바람직하게는 본원에 정의된 하나 이상의 MYB 결합 부위의 업스트림 또는 바로 업스트림의 프로모터 서열에서 치환 및/또는 결실을 도입하는 단계로서, 여기서 치환 및/또는 결실은 바람직하게는 인핸서 서열을 도입하거나 리프레서 서열을 제거함으로써 인코딩된 PAR 단백질의 발현을 증가시키는, 단계; 및
(iii) (i)와 (ii)의 조합.
본 발명의 방법에서 프로모터를 변형시키는 것은 당업계에 공지된 임의의 통상적인 방법을 사용하여 수행될 수 있으며, 이에 한정하는 것은 아니나, 예를 들어 본원에 정의된 바와 같은 하나 이상의 MYB 결합 부위 바로 업스트림에서 프로모터에 삽입체 또는 결실을 바람직하게는 임의로 상동 재조합을 통한 무작위 또는 표적 돌연변이유발에 의해 도입하는 것일 수 있다.
선택적으로, 프로모터의 삽입, 치환 또는 결실은 본원에 정의된 하나 이상의 MYB 결합 부위를 변형 또는 제거할 수 있다.
따라서, 본 발명은 또한 식물에 단위생식 표현형을 유도할 수 있는 돌연변이 유전자를 생산하는 방법으로 간주될 수 있으며, 상기 방법은 다음 단계를 포함한다:
(a) PAR 단백질을 인코딩하는 서열을 포함하는 유전자를 제공하는 단계로서, 상기 서열은 하나 이상의 전사 인자 MYB 결합 부위를 포함하는 프로모터에 작동 가능하게 연결된, 단계; 및
(b) 본원에 정의된 바와 같은 프로모터에 하나 이상의 MYB 결합 부위의 바로 업스트림에 삽입 또는 결실을 도입함으로써 인코딩된 PAR 단백질의 발현을 증가시키기 위해 하나 이상의 전사 인자 MYB 결합 부위의 업스트림의 서열을 변형시킴으로써 프로모터를 변형시키는 단계.
추가로, 또는 대안적으로, 본 발명의 방법은 본원에 정의된 바와 같은 하나 이상의 MYB 결합 부위를 유도, 변형 또는 제거함으로써 프로모터를 변형시키는 것을 포함할 수 있다.
프로모터가 본원에 정의된 바와 같은 하나 이상, 바람직하게는 2개의 MYB 결합 부위를 포함하는 경우, 선택적으로 이들 하나 이상, 바람직하게는 2개의 MYB 결합 부위는 변형되거나 제거되어, 전사 인자 MYB의 결합을 감소시키며, 그리고/또는 삽입 또는 결실이 이들 하나 이상의 MYB 결합 부위의 업스트림에 도입된다. 본 발명의 방법에서 MYB 결합 부위의 변형은 1, 2, 3, 4, 5, 6 또는 7개의 뉴클레오티드, 바람직하게는 1, 2 또는 3개의 뉴클레오티드, 훨씬 더 바람직하게는 1개의 뉴클레오티드의 변형일 수 있어, 상기 서열은 더 이상 MYB 결합 부위가 아니다. 바람직하게는 상기 변형은 상기 나타낸 바와 같이 7개의 뉴클레오티드 길이 MYB 결합 모티프의 첫 번째, 두 번째, 세 번째, 네 번째 또는 다섯 번째 위치에 위치한 적어도 하나의 돌연변이(뉴클레오티드 교환, 삽입 또는 결실), 즉 모티프 AACCGNN의 A, A, C, C 및 G 중 적어도 하나의 변형이다. 바람직하게는, 상기 변형은 상기 표시된 바와 같이 7개의 뉴클레오티드 길이 MYB 결합 모티프의 첫 번째, 두 번째, 세 번째 또는 네 번째 위치에 위치한 적어도 하나의 돌연변이(뉴클레오티드 교환, 삽입 또는 결실), 즉 모티프 AACCGNN의 A, A, C 및 C 중 적어도 하나의 변형, 선택적으로 이들 위치에서 뉴클레오티드 2개, 3개 또는 4개 모두의 변형이다.
바람직하게는, 변형은 MYB 결합 부위에 대한 전사 인자 MYB의 결합을 감소시키거나 없애는 결과를 가져온다. 바람직하게는, 결합 친화도는 예를 들어 Kelemen 등(상기 참조)에 기술된 바와 같은, 적합한 실험 조건 하에서 시험될 때 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 또는 100% 감소된다. 임의로, MYB 결합 부위의 변형은 상기 MYB 결합 부위의 결실일 수 있다. 상기 변형은 무작위 돌연변이유발(예를 들어, 화학적 또는 방사선 돌연변이유발) 또는 표적 돌연변이유발(예를 들어, CRISPR-엔도뉴클레아제 매개 돌연변이유발)에 의해 수행될 수 있다. 임의로, 유전자에 존재하는 다중(2개, 3개 또는 그 이상) MYB 결합 부위는 본 발명의 방법에서 본원에 정의된 바와 같이 변형된다. 임의로, 돌연변이 유전자는 락투카 사티바(Lactuca sativa)의 변형된 프로모터를 포함하고, 여기서 상기 프로모터는 SEQ ID NO: 17의 서열을 포함하거나 이로 구성된다. 임의로, 돌연변이 유전자는 락투카 사티바(Lactuca sativa) PAR 단백질을 인코딩하는 서열에 작동 가능하게 연결된 상기 프로모터를 포함하며, 바람직하게는 상기 코딩 서열은 SEQ ID NO: 33의 서열을 포함하거나 이로 구성된다. 선택적으로, 돌연변이 유전자는 SEQ ID NO: 35의 서열을 포함하거나 이로 구성된다. 본 발명은 또한 돌연변이 유전자 및/또는 구축물을 포함하는, 식물 또는 식물 세포, 바람직하게는 락투카 사티바(Lactuca sativa) 식물 또는 식물 세포를 포함한다.
일 구현으로, 유성 유전자, 바람직하게는 par 유전자의 프로모터는 하나 이상의 MYB 결합 부위의 업스트림에 삽입체를 도입함으로써 변형될 수 있다. 삽입체는 하나 이상의 MYB 결합 부위 바로 옆에 또는 근접하게 도입될 수 있다. 삽입체와 MYB 결합 부위 사이의 거리, 또는 다중 MYB 결합 부위의 경우, 코딩 서열로부터 가장 업스트림에 위치한 MYB 결합 부위는 바람직하게는 최대 10, 9, 8, 7, 6, 5, 4, 3, 2, 1 또는 0개의 뉴클레오티드이다. 바람직하게는, 삽입체는 하나 이상의 MYB 결합 부위의 바로 업스트림에 도입된다. 본 발명의 방법에서 유전자의 프로모터에 도입될 수 있는 삽입체는 바람직하게는 핵산 삽입물, 바람직하게는 이중 가닥 DNA 삽입물을 포함하고, 여기서 상기 삽입물은 50 내지 2000bp, 100 내지 1900bp, 200 내지 1800bp, 300 내지 1700bp, 400 내지 1600bp, 500 내지 1500bp, 600 내지 1400 bp, 1000 내지 1400, 1200 내지 1400, 또는 1300 내지 1400bp의 길이를 갖는다. 보다 바람직하게, 상기 삽입체는 약 1300bp의 길이를 갖는다. 대안적으로 또는 추가로, 삽입체는 약 1-50bp, 약 5-30bp 또는 약 10-20bp이다. 바람직하게, 상기 삽입체는 본원에 정의된 바와 같은 MYB 결합 부위의 업스트림(5')에 프로모터 내에 도입되며, 바람직하게 MYB 결합 부위와 삽입체, 바람직하게 삽입체의 3'-말단 사이의 거리는 0-200bps, 바람직하게는 최대 0, 10, 20, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190 또는 200bps가 되도록 한다. 바람직하게는, 상기 삽입체는 삽입체의 3' 말단 뉴클레오티드가 SEQ ID NO: 2의 뉴클레오티드 1798 및/또는 SEQ ID NO: 5의 뉴클레오티드 1798의 위치에 상동인 위치에 있도록 국소화된다. 바람직하게는, 상기 삽입체에는 오픈리딩프레임이 없다.
상기 삽입체는 비자율적 전이 요소, 바람직하게는 hAT-유래 비자율 트랜스포존 요소일 수 있다. 삽입물은 인핸서 요소, 바람직하게는 암컷 배우체-특이적 인핸서 요소를 포함할 수 있다. 훨씬 더 바람직하게는, 상기 삽입체는 MITE(Miniature Inverted-Repeat Transposable Elements) 또는 MITE-유사 서열이고, 상기 MITE 또는 MITE-유사 서열은 터미널 역 반복(terminal inverted repeats)(TIRs)에 측면에 있으며(flanked by), 이는 차례로 소 직접 반복(small direct repeats(표적 부위 듀플리케이션, TSDs)에 측면에 있는, 오픈리딩프레임이 없는 내부 서열을 함유하는 것을 특징으로 하는, 비-자율적 요소, 바람직하게는 비-자율적 전이 요소이다. TIR은 서열 CAGGGCCGG 및/또는 CCGGCCCTG를 가질 수 있다. TSD는 서열 ACTGCTAC를 가질 수 있다. MITE, TIR 및 서열에 대한 추가 설명은 Guo et al, Scientific Reports. 2017 Jun 1;7(1):2634를 참조바라며, 이는 본원에 참조로 포함된다. 상기 삽입체, 바람직하게는 상기 MITE 또는 MITE-유사 서열은 SEQ ID NO: 60과 적어도 약 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99% 이상의 동일성을 가질 수 있다. 삽입체는 재조합 및/또는 표적 게놈 편집에 의해 합성적으로 도입될 수 있다.
임의로, 돌연변이 유전자는 락투카 사티바(Lactuca sativa)의 변형된 프로모터를 포함하고, 여기서 상기 프로모터는 서열번호 18의 서열을 포함하거나 이로 구성된다. 임의로, 돌연변이 유전자는 락투카 사티바(Lactuca sativa) PAR 단백질을 인코딩하는 서열에 작동 가능하게 연결된 상기 프로모터를 포함하며, 바람직하게는 상기 코딩 서열은 SEQ ID NO: 33의 서열을 포함하거나 이로 구성된다. 임의로, 돌연변이 유전자는 SEQ ID NO: 36의 서열을 포함하거나 이로 구성된다. 임의로, 돌연변이 유전자는 락투카 사티바(Lactuca sativa)의 변형된 프로모터를 포함하며, 여기서 상기 프로모터는 SEQ ID NO: 18의 서열을 포함하거나 이로 구성되고, 상기 프로모터는 타락사컴 오피시날레(Taraxacum officinale) PAR 단백질을 인코딩하는 서열에 작동 가능하게 연결되며, 바람직하게는 상기 코딩 서열은 SEQ ID NO: 3의 서열을 포함하거나 이로 구성된다. 임의로, 돌연변이 유전자는 SEQ ID NO: 64의 서열을 포함하거나 이로 구성된다. 본 발명은 또한 돌연변이 유전자 및/또는 구조물을 포함하는 식물 또는 식물 세포, 바람직하게 락투카 사티바(Lactuca sativa) 식물 또는 식물 세포를 포함한다.
선택적으로 돌연변이 유전자는 타락사컴 오피시날레(Taraxacum officinale)의 Par 프로모터를 포함하며, 여기서 상기 프로모터는 SEQ ID NO: 2의 서열을 포함하거나 이로 구성된다. 선택적으로, 돌연변이 유전자는 PAR 단백질을 인코딩하는 서열에 작동 가능하게 연결된 상기 프로모터를 포함하며, 여기서 상기 PAR 단백질은 (네이티브) 타락사컴 오피시날레(Taraxacum officinale) PAR 단백질이 아니다. 임의로, 돌연변이 유전자는 본원에서 상기 정의된 바와 같은 오르토로그 PAR 단백질을 인코딩하는 서열에 작동 가능하게 연결된 상기 프로모터를 포함한다. 임의로, 돌연변이 유전자는 타락사컴 오피시날레(Taraxacum officinale)의 Par 프로모터를 포함하고, 여기서 상기 프로모터는 SEQ ID NO: 2의 서열을 포함하거나 이로 구성되고, 여기서 상기 프로모터는 락투카 사티바(Lactuca sativa) PAR 단백질을 인코딩하는 서열에 작동 가능하게 연결되며, 바람직하게는 상기 코딩 서열은 SEQ ID NO: 33의 서열을 포함하거나 이로 구성된다. 선택적으로, 돌연변이 유전자는 SEQ ID NO: 65의 서열을 포함하거나 이로 구성된다.
또 다른 구현에서, 유성 유전자, 바람직하게는 par 유전자의 프로모터는 하나 이상의 MYB 결합 부위의 업스트림에 결실을 도입함으로써 변형될 수 있다. 결실은 하나 이상의 MYB 결합 부위에 가까운 부근 또는 바로 옆에 도입될 수 있다. 결실과 MYB 결합 부위 사이의 거리, 또는 다중 MYB 결합 부위의 경우, 코딩 서열로부터 가장 업스트림에 위치한 MYB 결합 부위는 바람직하게는 최대 200, 150, 50, 40, 30, 20, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개의 뉴클레오티드이다. 바람직하게는, 결실은 하나 이상의 MYB 결합 부위의 바로 업스트림에 도입된다. 본 발명의 방법에서 유전자의 프로모터에 도입될 수 있는 결실은 바람직하게는 핵산 결실, 바람직하게는 이중 가닥 DNA 결실을 포함하며, 여기서 상기 결실은 10 내지 1000bp, 50 내지 900bp, 100 내지 800bp, 200 내지 700bp, 350 내지 600bp, 바람직하게는 약 400bp의 길이를 갖는다. 바람직하게는, 상기 결실은 오픈리딩프레임이 없다. 결실은 재조합 및/또는 표적화 또는 무작위 게놈 편집에 의해 도입될 수 있다. 임의로, 돌연변이 유전자는 락투카 사티바(Lactuca sativa)의 변형된 프로모터를 포함하고, 여기서 상기 프로모터는 SEQ ID NO: 20의 서열을 포함하거나 이로 구성된다. 임의로, 돌연변이 유전자는 락투카 사티바(Lactuca sativa) PAR 단백질을 인코딩하는 서열에 작동가능하게 연결된 상기 프로모터를 포함하며, 바람직하게는 상기 코딩 서열은 SEQ ID NO: 33의 서열을 포함하거나 이로 구성된다. 선택적으로, 돌연변이 유전자는 SEQ ID NO: 61의 서열을 포함하거나 이로 구성된다. 본 발명은 또한 상기 돌연변이 유전자 및/또는 구축물을 포함하는 식물 또는 식물 세포, 바람직하게 락투카 사티바(Lactuca sativa) 식물 또는 식물 세포를 포함한다.
바람직하게는, 본 발명의 방법의 단계 a)의 유전자 및 본 발명의 방법에 의해 얻을 수 있는 돌연변이 유전자는 핵산 분자, 바람직하게는 DNA 분자, 보다 더 바람직하게는 게놈 DNA 분자이거나 그의 일부이다. 임의로, 상기 게놈 DNA 분자는 식물 세포, 바람직하게는 식물 원형질체에 있다. 본 발명의 방법에 의한 그리고 식물 세포에 위치할 때, 유성 유전자의 프로모터의 변형은 대조구 식물과 비교하여 상기 식물 세포로부터 유래된 식물의 단위생식 표현형의 현저한 증가를 초래할 수 있으며, 여기서 바람직하게는 대조구 식물은 단위생식 표현형을 나타내지 않는 반면, 본 발명의 돌연변이 유전자를 포함하는 식물은 단위생식 표현형을 나타낸다. 대조구 식물은 바람직하게는 par 대립유전자의 프로모터가 본원에 정의된 바와 같이 변형되지 않는다는 점에서 상기 식물 세포로부터 유래된 식물과만 상이하다. 바람직하게는, 대조구 식물 또는 대조구 식물 세포는 대조구 식물 또는 대조구 식물 세포가 본원에 정의된 바와 같은 유전적 변형을 포함하지 않는다는 점에서 각각 본 발명의 식물 세포 또는 식물과 상이할 뿐이다.
바람직하게는, 단계 (a)의 유전자는 par 대립유전자이며, 본원에 정의된 바와 같은 par 대립유전자의 프로모터의 변형 및 단위생식을 할 수 없는 식물 세포에 위치할 때, 단위생식 표현형을 나타내는 식물을 초래한다. 본 발명의 방법에 의해 얻을 수 있는 돌연변이 유전자는 단위생식에 기능적이므로, 돌연변이 유전자는 Par 대립유전자로 간주될 수 있으며, 본 발명의 방법은 또한 par 대립유전자를 Par 대립유전자로 전환시키는 방법으로 간주될 수 있다.
임의로, 본 발명의 방법에 의한 프로모터의 변형은 프로모터에 대한 전사 인자 MYB의 결합에 영향을 미쳐 프로모터를 포함하는 유전자에 의해 인코딩되는 PAR 단백질의 발현을 증가시킨다. 임의로, 변형은 전사 인자 MYB의 결합을 감소시키거나 폐지시킨다. 프로모터에 대한 전사 인자 MYB의 결합은 이에 한정하는 것은 아니나, 생체내 이스트 원-하이브리드 시스템(참조 예: Kelemen 등, PLoS One. 2015;10(10): e0141044)와 같이 당해 기술분야의 숙련자에게 알려진 적절한 어느 어세이에 의해 평가될 수 있다.
무작위 돌연변이 유발은 화학적 돌연변이 유발, 감마 방사선, X선 또는 고속 중성자 방사선일 수 있지만 이에 제한되지 않는다. 화학적 돌연변이 유발의 비제한적 예에는 EMS(에틸 메탄술포네이트), MMS(메틸 메탄술포네이트), NaN3(아지드화나트륨) D), ENU(N-에틸-N-니트로소우레아), AzaC(아자시티딘) 및 NQO(4-니트로퀴놀린 1-옥사이드)가 포함되지만 이에 국한되지 않는다. 선택적으로 TILLING(Targeting Induced Local Lesions IN Genomics; McCallum 등, 2000, Nat Biotech 18:455, 및 McCallum 등, 2000, Plant Physiol. 123, 439-442, 둘 다 참조로 본 명세서에 포함됨)과 같은 돌연변이 유발 시스템 본원에 정의된 바와 같은 변형된 유전자를 갖는 식물 계열을 생성하는데 사용될 수 있다. TILLING은 전통적인 화학적 돌연변이 유발(예: EMS 돌연변이 유발)을 사용하며, 이는 돌연변이에 대한 고처리량 스크리닝이 후속된다. 따라서, 원하는 돌연변이 중 하나 이상을 갖는 유전자를 포함하는 식물, 종자 및 조직은 TILLING을 사용하여 얻을 수 있다. 표적 돌연변이 유발은 특정 뉴클레오티드 또는 핵산 서열을 변경하도록 설계될 수 있는 돌연변이 유발이다. 표적 돌연변이 유발은 올리고-다이렉티드 돌연변이 유발, RNA-가이디드 엔도뉴클레아제(예: CRISPR 기술), TALEN 또는 징크 핑거 기술 및 이들의 조합으로부터 선택된 기술로부터 선택될 수 있지만, 이에 제한되지 않는다.
선택적으로, 본 발명의 방법의 단계 (a)의 유전자는 천연 서열이다. 본 발명의 방법의 단계 (a)의 유전자는 바람직하게는 임의로 3'UTR 서열이 뒤따르는 PAR 단백질을 인코딩하는 서열에 작동 가능하게 연결된 프로모터를 포함하거나 이로 구성된다. 단계 (a)에서 제공되는 유전자는 식물 세포, 바람직하게는 단위생식 유전자의 단위생식 대립유전자를 포함하지 않는 식물 원형질체의 일부일 수 있다. 바람직하게는 상기 식물 세포 또는 원형질체는 비-단위발생적이며, 즉 상기 세포 또는 원형질체로부터 재생된 식물은 단위발생 표현형을 나타내지 않는다. 달리 말하면, 단계 (a)에서 제공되는 유전자는 바람직하게는 식물 세포, 바람직하게는 식물 원형질체 내에 포함되며, 여기에서 본원에 정의된 돌연변이는 식물 세포의 단위 생식을 유도하거나 증가시킨다. 즉 상기 돌연변이된 세포 또는 원형질체로부터 재생된 식물은 단위생식 표현형을 나타낸다.
본 발명의 방법의 단계 (a)에서 제공되는 유전자는 바람직하게는 식물 세포에 자연적으로 존재하는 네이티브 유전자일 수 있다. 네이티브 서열은 자연에서 발견되는 서열이며 또한 본원에서 "야생형" 또는 "천연"으로 표시된다. 따라서, 이 구현에서, 프로모터, 코딩 서열 및 선택적 3'UTR은 단일 식물 종으로부터 유래한다.
대안적으로, 본 발명의 방법의 단계 (a)에서 제공된 유전자는 본원에서 키메라 유전자로도 명명된 비-천연 및/또는 합성 유전자이다. 임의로, 상기 키메라 유전자에서, 프로모터는 PAR 단백질 및/또는 3'UTR을 인코딩하는 코딩 서열에 작동 가능하게 연결되며, 여기서 상기 코딩 서열 및/또는 3'UTR은 프로모터에 대해 이종성이다. 비제한적 예로서, 프로모터는 코딩 서열 및/또는 3'UTR로서 다른 식물 종일 수 있다. 선택적으로, 프로모터 및 3'UTR은 단일 식물 종에서 유래하고 코딩 서열은 다른 식물 종에서 유래한다.
바람직하게는, 본 발명의 방법의 단계 (a)에서 제공된 유전자는 식물 세포 또는 원형질체에 존재한다. 따라서, 본 발명의 방법은 유전자의 프로모터를 변형시키는 단계 이전에 단계 (a)의 유전자를 포함하는 원형질체 또는 식물 세포를 제공하는 단계를 포함할 수 있다. 바람직하게는, 유전자는 원형질체 또는 식물 세포의 게놈에 존재하는 내인성 유전자이다. 바람직하게는 상기 원형질체 또는 식물 세포는 식물, 바람직하게는 비-단위생식 식물로부터 분리된다. 바람직하게는 상기 식물은 그의 게놈에 Par 대립유전자를 갖지 않는다. 바람직하게는, 원형질체 또는 식물 세포 내에 있는 단계 (a)에서 제공된 유전자의 프로모터는 표적화된 또는 무작위 돌연변이 유발, 바람직하게는 표적 돌연변이 유발에 의해 본원에서 정의된 바와 같이 변형된다.
본 발명의 방법의 특정 구현에서, 단계 (a)의 유전자를 포함하는 식물 세포는 식물 종자에 위치할 수 있다. 바람직하게는 상기 종자는 그의 게놈에 Par 대립유전자를 갖지 않는다. 바람직하게는, 상기 종자 내에 있는 유전자의 프로모터는 표적 또는 무작위 돌연변이유발, 바람직하게는 무작위 돌연변이유발에 의해 본 발명의 방법에서 변형된다.
유전자의 프로모터를 변형시키는 단계 후에, 본 발명의 방법은 상기 원형질체로부터 식물을 재생시키는 단계 또는 상기 종자로부터 식물을 성장시키는 단계를 포함할 수 있다.
또한, 본 발명의 방법은 스크리닝 및/또는 유전자형 분석 단계를 포함할 수 있다. 유전자형 분석은 변형 단계 후 프로모터의 적어도 일부를 시퀀싱(임의로 게놈 DNA 및/또는 관심 프로모터를 포함하는 표적 서열의 PCR 증폭이 선행됨)하거나 임의의 게놈 변이 분석 방법 또는 이에 한정하는 것은 아니나 SBG(Sequence Based Genotyping) 또는 KeyGene® SNPSelect 분석과 같은 당해 기술분야에 공지된 분자 마커 검정에 의해 수행될 수 있다. 또한 PCR 프라이머가 변형 측면에 있는 식물 DNA를 기반으로 하는 "이벤트 특이적" PCR 진단 방법이 개발될 수 있다(US6563026 참조). 유사하게, 이벤트 특이적 AFLP 핑거프린트 또는 RFLP 핑거프린트는 트랜스제닉 식물 또는 그로부터 유래된 어느 식물, 종자, 조직 또는 세포를 식별하기 위해 개발될 수 있다. 유전자형 분석은 변형 단계 직후 또는 원형질체 또는 종자로부터 캘러스, 조직 또는 식물을 성장시킨 후에 수행할 수 있다.
단위생식의 기능성에 대한 스크리닝은 본 발명의 방법에 의해 수득된 돌연변이 유전자를 포함하는 식물(본원에서 시험 식물로 나타냄)이 수정되지 않은 난세포로부터 배아를 성장시키고 발달시키는 능력을 비교함으로써 직접적으로 평가될 수 있다. 바람직하게는, 이러한 능력은 바람직하게는 본 발명의 방법에 의해 수득된 돌연변이 유전자를 포함하지 않는 시험 식물과 단지 상이한 대조구 식물의 능력과 비교된다. 바람직하게는, 상기 대조구 식물은 Par 대립유전자를 포함하지 않는 식물이다.
대안적으로 또는 추가로, 본 발명의 방법에 의해 수득된 돌연변이 유전자의 단위생식에서의 기능성은 본 발명의 돌연변이 유전자를 포함하는 구축물로 아포믹시스의 소실 식물을 갖는 식물을 보완함으로써 평가될 수 있다. 이러한 아포믹시스의 소실 식물은 기능적 Par 대립유전자를 변형(예를 들어, 결실 또는 녹아웃에 의해)함으로써 아포믹틱 표현형을 상실하도록 변형된 타락사컴 오피시날레(Taraxacum officinale) 분리주 A68일 수 있다. 이러한 아포믹시스의 소실 식물은 본원에 정의된 바와 같은 SEQ ID NO: 23(SEQ ID NO: 32의 PAR 단백질을 인코딩함)이 SEQ ID NO: 24 - 27 중 어느 하나로 변형되었으며, 이는 각각 SEQ ID NO: 28 - 31의 단백질을 인코딩한다(표 1 참조). 타락사컴 오피시날레(Taraxacum officinale) 분리주 A68의 아포믹시스 식물의 이러한 손실은 CRISPR-Cas9/가이드 RNA 복합체를 사용하여 표적화된 게놈 편집에 의해 얻을 수 있으며, 여기서 상기 가이드 RNA(본원에서는 gRNA로도 표시됨)는 본원에 예시된 바와 같은 SEQ ID NO: 19의 표적 특이적 서열을 포함한다. 타락사컴 오피시날레(Taraxacum officinale) 분리주 A68의 Par 대립유전자의 결실은 단위생식의 소실을 초래하고 따라서 아포믹시스의 소실을 초래한다. 본 발명의 방법에 의해 수득된 돌연변이 유전자는 단위생식을 유도하는 능력을 가지며, 상기 돌연변이 유전자를 포함하는 구축물 또는 벡터의 도입 또는 형질감염시 아포믹틱 표현형이 회복(또는 구출)될 것이다. 타락사컴 오피시날레(Taraxacum officinale) 분리주 A68의 경우, 타가 수분(cross pollination) 없이 높은 종자 고정은 아포믹시스에 대한 분명한 징후이다. 불균형한 삼배체 수컷 및 암컷 감수 분열로 인해 성적으로 생산된 난세포 및 꽃가루 알갱이가 매우 낮은 생식력을 갖기 때문에, 이 분리주에서 자가 증식은 대체 설명으로 제외될 수 있다. 바람직하게는, 상기 기술된 보완 검정에서, 본 발명의 돌연변이 유전자는 원래의 비-돌연변이 유전자와 반대로 기능 상실 식물에서 아포믹시스를 회복시킬 수 있다. 바람직하게는, 상기 능력은 아포믹시스가 적어도 200개 중 1개, 100개 중 1개, 100개 중 10개, 100개 중 20개, 100개 중 30개, 100개 중 40개, 100개 중 50개, 100개 중 70개, 100개 중 80개, 100개 중 90개가 회복되거나 또는 돌연변이 유전자로 형질전환된 모든 기능 상실 식물은, 바람직하게는 원래의 비-돌연변이 유전자(즉, 본 발명의 방법의 단계 a)에서 제공된 유전자)로 형질전환된 500개 중 1개 미만, 600개 중 1개, 00개 중 1개, 800개 중 1개, 900개 중 1개 또는 1000개 중 1개 식물에 비해 아포믹시스를 나타낸다.
본 발명은 또한 본 발명의 방법에 의해 얻어지거나 얻을 수 있는 돌연변이 유전자를 제공한다. 바람직하게는, 돌연변이 유전자는 (단지) 그것이 본원에 정의된 바와 같은 프로모터에서 삽입 또는 결실 및/또는 하나 이상의 변형 또는 제거된 MYB 결합 부위를 포함한다는 점에서 내인성 또는 네이티브 유전자와 상이하다. 바람직하게는, 본원에 정의된 바와 같은 변형된 프로모터를 포함하는 본 발명의 돌연변이 유전자는 식물에 단위생식 표현형을 유도할 수 있다. 즉, 바람직하게는 본 발명의 변형된 프로모터를 포함하는 돌연변이 유전자는 단위생식에서 기능적이다.
임의로, 본 발명의 방법의 단계 (a)의 유전자 및/또는 본 발명의 방법에 의해 수득된 돌연변이 유전자는 분리된 핵산 분자 또는 핵산 구조물 또는 (발현) 벡터이거나 그의 일부이다. 본 발명은 또한 상기 돌연변이 유전자를 포함하는 분리된 핵산 분자, 구조물 또는 (발현) 벡터를 제공하며, 여기서 상기 구조물 또는 벡터는 상기 벡터의 구조물로 상기 식물을 형질감염시 돌연변이 유전자를 식물로 전환시킬 수 있다. 상기 핵산 분자는 DNA일 수 있지만 이에 제한되지 않으며, 게놈 DNA일 수 있거나 이로부터 유래될 수 있다. 본 발명은 또한 본 발명의 돌연변이 유전자 및/또는 상기 돌연변이 유전자를 포함하는 분리된 핵산, 구조물 또는 벡터를 원형질체, 식물 세포 또는 식물에 단위생식 표현형을 증가시키거나 유도하기 위해 사용하기 위한 용도를 제공한다.
본 발명의 돌연변이 유전자는 본원에 정의된 바와 같은 키메라 유전자일 수 있으며, 이는 선택적으로 유전자 구조물 또는 핵산 벡터의 일부이다. 본 발명의 돌연변이 유전자는 임의로 분리된 핵산, 구조물 또는 벡터에 포함된다. 본 발명의 일 구현에서, 본 발명의 돌연변이 유전자를 포함하거나 이로 구성된 핵산은 핵산을 숙주 세포로 전달하고 숙주 세포에서 상기 핵산에 의해 인코딩되는 기능적(바람직하게는 단위생식을 유도할 수 있는) 단백질을 생산하기 위해 이러한 핵산을 포함하는 구조물, 및/또는 벡터를 제조하기 위해 사용될 수 있다.
식물 세포에서 본 발명의 돌연변이 유전자의 도입에 적합한 벡터는 본원에서 즉 "발현 벡터"로 지칭된다. 숙주 세포는 바람직하게는 식물 세포이다. 임의로 일시적이지만 바람직하게는 안정한 돌연변이 유전자 서열을 숙주 세포의 게놈으로 도입하기 위한 돌연변이 유전자, 구조물 및/또는 벡터의 구축은 일반적으로 당업계에 공지되어 있다.
본 발명은 또한 본 발명의 방법에 의해 얻어지거나 얻을 수 있는 돌연변이 유전자를 포함하고/하거나 핵산 분자 또는 벡터를 포함하는 식물 세포, 식물 원형질체, 식물 조직, 종자 또는 식물을 제공한다.
본 발명은 또한 본원에 정의된 바와 같은 돌연변이 유전자를 포함하는 돌연변이 유전자, 핵산 분자, 구조물 또는 벡터를 포함하는 식물 세포, 식물 원형질체, 식물 조직, 종자 또는 식물을 제공한다. 임의로, 상기 식물 세포, 식물 원형질체, 식물 조직, 종자 또는 식물은 아포메이오시스, 바람직하게는 아포믹시스를 일으킬 수 있다.
바람직하게는, 본 발명의 핵산은 분리된 핵산이다. 일 구현에서, 본 발명의 핵산은 타락사컴(Taraxacum) 계열(예를 들어, 타락사컴 오피시날레 센수 라토(Tharaxacum officinale sensu lato) 또는 다른 식물 종으로부터 기원할 수 있다. 일 구현에서, 본 발명의 핵산은 타락사컴(Taraxacum) 또는 타락사컴 오피시날레 센수 라토(Tharaxacum officinale sensu lato)와는 다른 기원에서 유래한다.
선택적으로, 본 발명의 방법에 의해 얻어지거나 얻을 수 있는 돌연변이 유전자를 포함하거나 이로 구성된 본 발명의 핵산 또는 핵산 구조물은 단일 식물 세포의 핵 게놈에 안정적으로 삽입될 수 있으며, 이렇게 형질전환된 식물 세포는 변경된 표현형, 즉 단위생식 표현형을 갖는 형질전환된 식물을 생산하기 위해 사용될 수 있다. 비제한적 예에서, 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens)에서 본원에 교시된 돌연변이 유전자를 포함하는 T-DNA 벡터는 식물 세포를 형질전환하기 위해 사용될 수 있으며, 그 후 형질전환된 식물은 예를 들어 EP0116718, EP0270822, PCT 공개 WO84/02913 및 공개된 유럽 특허 출원 EP0242246 및 Gould 등(1991)에 기재된 절차를 사용하여 형질전환된 식물 세포로부터 재생될 수 있다. 아그로박테리움 매개 식물 형질전환을 위한 T-DNA 벡터의 구축은 당업계에 잘 알려져 있다. T-DNA 벡터는 EP0120561 및 EP0120515에 기술된 바와 같은 바이너리 벡터이거나 EP0116718에 기술된 바와 같이 동종 재조합에 의해 아그로박테리움 Ti-플라스미드로 통합될 수 있는 공동-통합 벡터일 수 있다. 상추 형질전환 프로토콜은 예를 들어 Michelmore 등(1987) 및 Chupeau 등(1989)에 기재되어 있다.
경계 서열(Border sequences)은 Gielen 등(1984)에 기재되어 있다. 물론, 직접적인 유전자 전달(예를 들어, EP0223247에 기재된 바와 같음), 꽃가루 매개 형질전환(예를 들어, EP0270356 및 WO85/01856에 기재된 바와 같음), 예를 들어, US4,684,611에 기재된 바와 같은 원형질체 형질전환, 식물 RNA 바이러스 매개 형질전환(예를 들어, EP0067553 및 US4,407,956에 기재된 바와 같음), 리포좀 매개 형질전환(예를 들어, US4,536,475에 기재된 바와 같음)과 같은 절차, 및 다른 방법을 사용하여 식물 세포를 형질전환하기 위해 다른 유형의 벡터가 사용될 수 있다.
추가의 구현에서, 본 발명의 돌연변이 유전자는 체세포 혼성화에 의해 도입될 수 있다. 체세포 혼성화는 원형질체 융합에 의해 수행될 수 있다(예: Holmes, 2018 참조).
본 발명의 돌연변이 유전자는 또한 예를 들어 게놈의 적절한 위치에 이중 가닥 파손을 도입하기 위한 하나 이상의 특정 엔도뉴클레아제(예: CRISPR-엔도뉴클레아제/가이드 RNA 복합체) 및 상기 게놈 내 통합을 위한 본 발명의 돌연변이 유전자를 포함하는 공여체 구조물을 사용하여 게놈에 통합될 수 있다. 당업자는 이중 가닥 파손을 도입하기 위한 이러한 CRISPR-엔도뉴클레아제/가이드 RNA 복합체 및 통합에 적합한 공여체 구조물을 설계하는 방법을 알고 있다(리뷰를 위해 Bortesi and Fischer, 2015 참조).
마찬가지로, 형질전환된 세포로부터 형질전환된 식물의 선택 및 재생은 당업계에 잘 알려져 있다. 명백히, 상이한 종 및 심지어 단일 종의 상이한 품종 또는 재배종에 대해서도, 프로토콜은 높은 빈도로 형질전환체를 재생시키기 위해 특별히 조정된다. 본 발명은 또한 단위생식을 나타내고 본 발명의 돌연변이 유전자를 포함하는 형질전환된 식물의 자손을 포함한다.
핵 게놈의 형질전환 외에, 색소체 게놈, 바람직하게는 엽록체 게놈의 형질전환도 본 발명에 포함된다. 색소체 게놈 형질전환의 한 가지 장점은 트랜스진(들)의 확산 위험이 감소될 수 있다는 것이다. 색소체 게놈 형질전환은 당업계에 공지된 바와 같이 수행될 수 있다. 참조 예: Sidorovet 등(1999) 또는 Lutz 등(2004).
생성된 형질전환된 식물은 돌연변이 유전자를 함유하는 더 많은 형질전환된 식물을 생산하기 위해 통상적인 식물 육종 계획에 사용될 수 있다. 예를 들어, 서던 블롯 분석 또는 PCR 기반 방법 또는 Invader® Technology 분석(Third Wave Technologies, Inc.)을 사용하여 단일 카피 변형체를 선택할 수 있다. 형질전환된 세포 및 식물은 본원에 정의된 바와 같은 변형된 프로모터를 포함하는 것을 특징으로 하는 본 발명의 돌연변이 유전자의 존재에 의해 형질전환되지 않은 세포 및 식물과 쉽게 구별될 수 있다. 돌연변이 유전자의 삽입 부위 옆에 있는 식물 DNA의 서열도 시퀀싱할 수 있으며, 일상적인 사용을 위해 "이벤트 특이적" 검출 방법을 개발할 수 있다. 예를 들어, 통합 서열 및 플랭킹(게놈) 서열에 기초한 엘리트 이벤트 검출 키트(예를 들어 PCR 검출 키트)를 설명하는 WO0141558을 참조바란다.
일 구현에서, 본 발명은 본질적으로 비-단위생식(및 비-아포믹틱)인 식물로부터 기원하는 par 대립유전자로부터 유래되고, 본 발명의 방법에 의해 변형된 돌연변이 유전자를 포함한다. 이러한 식물은 야생 또는 재배 식물일 수 있다. 상기 돌연변이 유전자는 바람직하게는 본 발명의 방법에 의한 프로모터의 변형에 의해 얻어지며, 이는 프로모터에 삽입 또는 결실 및/또는 본원에 정의된 바와 같은 프로모터에 하나 이상의 변형 또는 제거된 MYB 결합 부위를 포함하는 것을 특징으로 한다.
일 구현에서, 본 발명의 돌연변이 유전자, 또는 상기 돌연변이 유전자를 포함하는 핵산, 벡터 또는 구조물은 (유전적으로) 우성 기능을 가지며, 바람직하게는 아미노산 서열 SEQ ID NO: 1, 또는 다른 식물(즉, 타락사컴(Taraxacum) 또는 타락사컴 오피시날레 센수 라토(Tharaxacum officinale sensu lato) 이외의 것)에서 발견되는 이의 오르토로그 또는 단편과 같은 이의 변이체 또는 기능적 단편을 갖는 기능적 단백질을 (과)발현함으로써 제공된다.
바람직하게는, 본 발명의 돌연변이 유전자, 또는 상기 돌연변이 유전자를 포함하는 핵산, 벡터 또는 구조물은 식물에서 생산될 때 기능적이며 단위생식을 유도 및/또는 향상시키는 단백질 또는 이의 기능적 단편(들)을 인코딩한다.
바람직하게는, 변형된 프로모터, 돌연변이 유전자, 핵산, 벡터 및/또는 구조물은 자연 발생하지 않는다, 즉 자연적으로 발생하지 않는다.
본 발명의 방법의 단계 (a)에서 제공되는 유전자는 식물 세포 또는 원형질체의 게놈에 존재하는 내인성 유전자일 수 있다. 바람직하게는, 상기 식물 세포 또는 원형질체는 단위생식 표현형을 갖지 않는 식물(본원에서 기원 식물로 표시됨)로부터 분리되거나 또는 이의 일부이다. 본 발명의 방법에 의해 수득된 돌연변이 유전자를 포함하는 식물 세포 또는 원형질체는 단위생식 표현형을 갖거나 원래 식물과 비교하여 단위생식 표현형의 현저한 증가를 나타내는 식물의 일부이거나 식물로 재생될 수 있다. 따라서, 본 발명은 또한 단위생식 표현형을 식물로 전환시키는 방법 또는 단위생식 표현형을 식물에 증가시키는 방법을 제공한다. 즉, 본 발명의 방법은 단위생식 식물을 생산하기 위해 제공된다.
따라서, 본 발명은 하기 단계를 포함하는 단위생식 식물을 생산하는 방법을 제공한다:
(A) 본원에 정의된 바와 같은 돌연변이 유전자를 생산하는 방법에 의해 얻을 수 있는 돌연변이 유전자를 포함하는 식물 세포 또는 원형질체로부터 식물 조직 또는 식물을 재생 및/또는 성장시키는 단계; 및
(B) 선택적으로, 단계 (A)에서 얻은 식물 조직 또는 식물을 스크리닝 및/또는 유전자형 분석을 하는 단계.
따라서, 본 발명은 또한 단위생식 식물을 생산하는 방법을 제공하며, 상기 방법은 하기 단계를 포함한다:
a) 프로모터에 작동 가능하게 연결된 PAR 단백질을 인코딩하는 유전자를 포함하는 하나 이상의 식물, 식물 원형질체, 식물 세포, 식물 조직 또는 식물 종자를 제공하는 단계로서, 여기서 프로모터는 바람직하게는 하나 이상의 전사 인자 MYB 결합 부위를 포함하는, 단계;
b) 하나 이상의 전사 인자 MYB 결합 부위 및/또는 하나 이상의 전사 인자 MYB 결합 부위의 업스트림의 서열 중 적어도 하나를 변형시킴으로써 프로모터를 변형시켜 인코딩된 PAR 단백질의 발현을 증가시키는 단계;
c) 선택적으로, 단계 b)에서 얻은 변형된 식물 원형질체, 식물 세포, 식물 조직 또는 종자로부터 하나 이상의 식물을 성장시키는 단계; 및
d) 선택적으로, 단계 b)에서 얻은 식물 원형질체, 식물 세포, 식물 조직 또는 종자 또는 단계 b) 또는 c)에서 얻은 식물을 스크리닝 및/또는 유전자형 분석하는 단계.
대안적으로 또는 추가로, 본 발명은 하기 단계를 포함하는 단위생식 식물의 생산 방법을 제공한다:
a) 프로모터에, 선택적으로 하나 이상의 전사 인자 MYB 결합 부위를 포함하는 프로모터에, 작동가능하게 연결된 PAR 단백질을 인코딩하는 유전자를 포함하는 하나 이상의 식물, 식물 원형질체, 식물 세포, 식물 조직 또는 식물 종자를 제공하는 단계;
(b) 인코딩된 PAR 단백질의 발현을 증가시키도록 상기 프로모터를 변형시키는 단계로서, 바람직하게는 하기 중 적어도 하나에 의해 상기 프로모터를 변형시키는 단계:
i) 본원에 정의된 바와 같은 PAR 단백질을 인코딩하는 서열의 시작 코돈의 업스트림, 바람직하게는 하나 이상의 전사 인자 MYB 결합 부위의 업스트림 또는 바로 업스트림의 상기 프로모터 서열에 삽입(insert)을 도입하는 단계로서, 상기 삽입은 바람직하게는 인핸서 서열을 도입하거나, 리프레서 서열을 제거하는, 단계;
ii) 본원에 정의된 바와 같은 PAR 단백질을 인코딩하는 서열의 시작 코돈의 업스트림, 바람직하게는 하나 이상의 전사 인자 MYB 결합 부위의 업스트림 또는 바로 업스트림에 상기 프로모터 서열의 치환 및/또는 결실을 도입하는 단계로서, 여기서 치환 및/또는 결실은 바람직하게는 인핸서 서열을 도입하거나 리프레서 서열을 제거하는, 단계; 및
(iii) (i)와 (ii)의 조합.
c) 선택적으로, 단계 b)에서 얻은 변형된 식물 원형질체, 식물 세포, 식물 조직 또는 종자로부터 하나 이상의 식물을 성장시키는 단계; 및
d) 선택적으로, 단계 b)에서 얻은 식물 원형질체, 식물 세포, 식물 조직 또는 종자 또는 단계 b) 또는 c)에서 얻은 식물을 스크리닝 및/또는 유전자형 분석하는 단계.
본 발명의 방법에 의해 생산된 단위생식 식물은 정상적인 감수분열 기능을 갖는 식물, 즉 아포메이오시스를 나타내지 않는, 바람직하게는 디플로스포러스(diplosporous)가 아니고/거나 디플로스포리(diplospory)를 나타내지 않는 식물일 수 있다. 바람직하게는 상기 식물의 배우체는 이의 체세포와 비교하여 감소된 배수성을 가질 수 있다. 2배체 식물(즉, 2배체 체세포를 가짐)의 경우, 상기 감소된 배수성은 단일 반수체일 수 있다. 본 발명의 방법을 통해 식물에 단위생식을 유도하면, 상기 식물의 배우체는 배수성이 감소된 식물, 바람직하게는 반수체 식물에서 발달할 수 있다. 따라서, 본 발명의 방법은 감소된 배수체를 갖는 식물을 생산하는 방법, 바람직하게는 반수체 식물을 생산하는 방법일 수 있다. 이 방법은 바람직하게는 상기 정의된 바와 같은 방법에 의해 얻을 수 있는 단위생식 식물을 제공하는 단계, 및 상기 식물이 수정 없이 종자를 생산하도록 하는 후속 단계를 포함하여, 상기 종자 중 하나 이상이 발아하여 배수성이 감소된 식물, 바람직하게는 반수체 식물로 재생되도록 한다. 상기 방법은 본원에 정의된 단위생식을 유도한 다음, 상기 식물이 수정 없이 종자를 생산하게 하고, 상기 종자 중 하나 이상이 발아하여 배수성이 감소된 식물, 바람직하게는 반수체 식물(반수체 체세포를 가진 식물)로 재생시키는 단계를 포함할 수 있다.
감소된 배수체를 갖는 게놈, 바람직하게는 반수체 게놈은 자발적으로 배가되거나 바람직하게는 화학적 처리에 의해 유도될 수 있다. 바람직한 화학적 처리는 예를 들어 Touchell DH et al, Front Plant Sci. 2020 Jun 3;11:722(본원에 참조로 포함됨)에 기재되어 있다. 화학적 처리는 콜히친, 오리잘린, 트리플루랄린 및 아산화질소 중 적어도 하나를 사용한 처리일 수 있다. 식물의 화학적 처리는 바람직하게는 배가 반수체 게놈을 갖는 식물을 생성한다.
배가 단일 반수체 식물은 모든 유전자좌에서 동형접합성을 달성하고, 바람직하게는 본원에 기재된 방법을 사용하여, 단일 반수체 게놈의 전체 게놈 복제에 의해 수득될 수 있는 식물이다. 이러한 완전 동형접합 식물은 특히 F1 잡종 종자의 생산에서 부모 식물로 사용하기에 상업적으로 중요하다. 따라서, 본 발명은 또한 본원에 정의된 단위생식 식물을 생산하는 단계를 포함하는 배가 단일 반수체 식물을 생산하는 방법을 제공하며, 임의로 게놈 복제를 화학적으로 유도하는 단계, 배가 단일 반수체 종자를 선택하는 단계, 및 임의로 상기 종자를 배가 반수체 식물로 발아하고 재생하도록 하는 단계를 포함한다.
본 발명의 방법은 배가 단일 반수체 식물의 생산에 제한되지 않는다. 본원에 기재된 바와 같은 방법은 이에 한정하는 것은 아니나 배가 이반수체(di-haploid), 배가 삼중 반수체, 배가 4-반수체, 배가 오반수체 및 배가 육반수체 식물과 같은 다른 배가 반수체 식물의 생산에 동등하게 적합하다.
비제한적인 예로서, 배수체 작물(예를 들어, 4배체 솔라넘 터버로섬(Solanum tuberosum))에서, 본 발명의 방법은 이반수체 자손의 생산에 사용될 수 있다. 이러한 이반수체의 이형 접합 정도는 배수체 부모의 것보다 훨씬 낮을 것이다. 따라서, 2배체 수준에서의 선택은 4배체 수준에서보다 훨씬 더 효율적일 것이다. 본 발명의 방법은 완전히 동형접합성인 이들 이반수체로부터 단일 반수체를 생성하기 위해 추가로 사용될 수 있다. 이반수체는 유전자 지도의 구축을 용이하게 하고, 단계적 전체 게놈 서열의 어셈블리를 가능하게 할 수 있다. 야생 2배체 종의 가치 있는 관심 형질은 본 발명의 방법에 의해 생산된 재배종으로부터 이반수체의 사용을 통해 유전자 이입될 수 있다. 유익한 유전자 이입된 형질을 갖는 수득된 이반수체는 예를 들어 본원에 상기 기재된 바와 같은 화학적 처리를 사용함으로써 배가 이반수체가 만들어질 수 있으며, 이에 의해 관심 형질의 4배체 재배종으로의 이입을 가능하게 한다. 당업자는 유사한 방법이 야생 종의 관심 형질이 유전자이입된 2배체, 3배체, 5배체, 6배체, 7배체, 7배체 등 재배종의 생산에 사용될 수 있음을 쉽게 이해한다.
바람직하게는, 단계 a)에서 PAR 단백질을 인코딩하는 유전자는 par 대립유전자이다. 바람직하게는, 유전자의 프로모터는 본원에 정의된 바와 같이 단계 b)에서 변형되어 par 대립유전자를 Par 대립유전자로 전환시킨다. Par 대립유전자가 우성일 수 있으므로, 단일 par 대립유전자를 식물 또는 식물 세포의 Par 대립유전자로 변경하거나, 예를 들어 상기 식물 또는 식물 세포를 상기 돌연변이 유전자를 포함하는 벡터로 형질감염하여 식물 또는 식물 세포에 본 발명의 돌연변이 유전자를 도입하는 것은 식물을 유성 표현형에서 단위생식 표현형으로 전환시키는데 충분할 수 있으며, 즉 수정 없이 난세포로부터 배아를 성장 및 발달시킬 수 있는 식물 및/또는 이의 자손을 생성할 수 있다. 따라서, 바람직하게는 식물 세포에 존재하는 단일 유성 유전자, 바람직하게는 내인성 유전자가 본 발명의 방법에 의해 변형된다. 임의로, 식물 세포에 존재하는 다수의 유전자, 바람직하게는 내인성 유전자가 본 발명의 방법에 의해 변형된다.
변형된 프로모터가 식물 세포 또는 원형질체에 존재하는 경우, 상기 식물 세포 또는 원형질체는 비-단위생식 표현형을 갖는 것으로부터 단위생식 표현형을 갖는 식물로 전환되는 식물의 일부이거나 식물로 재생될 수 있다. 따라서, 본 발명은 또한 par 대립유전자의 프로모터를 변형시켜 단위생식 표현형을 나타내지 않는 식물에 단위생식 표현형을 부여하는 방법을 제공한다. 즉, 본 발명의 방법은 단위생식을 나타내지 않는 식물을 단위생식을 나타내는 식물로 형질전환시키는 방법이다. 바람직하게는, 단계 a)의 하나 이상의 식물, 식물 원형질체, 식물 세포, 식물 조직 또는 식물 종자는 Par 대립유전자가 결여되고 및/또는 단위생식 표현형을 나타내지 않는다. 유사하게, 본 발명의 방법은 제한된 단위생식을 나타내는 식물을 증가된 단위생식을 갖는 식물로 형질전환시키는 방법이다. 단위생식의 증가 또는 유도는 바람직하게는 적어도 200개 중 1개, 100개 중 1개, 100개 중 10개, 100개 중 20개, 100개 중 30개, 100개 중 40개, 100개 중 50개, 100개 중 60개, 100개 중 70개, 100개 중 80개, 100개 중 90개 또는 본 발명의 돌연변이 유전자로 형질전환된 모든 식물이 단위생식을 나타내는 것을 의미하며, 바람직하게는 원래의 비-돌연변이 유전자(즉, 본 발명의 방법의 단계 a)에서 제공된 유전자)로 형질전환된 식물 500개 중 1개 미만, 600개 중 1개 미만, 700개 중 1개 미만, 800개 중 1개 미만, 900개 중 1개 미만 또는 1000개 중 1개 미만에 비교한 것을 의미한다.
바람직하게는, 본 발명의 방법의 단계 a)의 유전자는 네이티브 유전자이다. 임의로, 본 발명의 방법에 의해 변형될 유전자는 타락사컴 오피시날레(Tharaxacum officinale)의 par 대립유전자이거나 또는 본원에 정의된 임의의 이종상동 단위생식 유전자 중 어느 하나이다. 바람직하게는 상기 par 대립유전자는 Par 대립유전자가 결여되어 단위생식 표현형을 갖지 않는 식물, 식물 원형질체, 식물 세포, 식물 조직 또는 식물 종자에 존재한다. 상기 par 대립유전자를 Par 대립유전자로 부여함으로써, 본 발명의 방법은 바람직하게는 단위생식 표현형을 갖지 않는 식물을 단위생식 표현형을 갖는 식물로 형질전환시킨다.
임의로 다수의 식물, 식물 원형질체, 식물 세포, 식물 조직 또는 식물 종자가 단계 a)에서 제공되고, 단계 b) 후에 본 발명의 변형, 즉, 하나 이상의 MYB 결합 부위의 삽입 또는 결실 및/또는 변형 또는 제거된 하나 이상의 MYB 결합 부위, 바람직하게는 본원에 정의된 바와 같은 유전자형 분석 및/또는 스크리닝에 의해 결정되는, 변형을 포함하는 하나 이상의 식물, 식물 원형질체, 식물 세포, 식물 조직 또는 식물 종자가 선택된다 따라서, 단계 B)에서의 스크리닝은 단위생식 표현형에 대한 스크리닝일 수 있다.
식물 세포(식물 조직, 식물 종자 또는 전체 식물의 일부일 수 있음) 또는 식물 원형질체에서 자연적으로 발생하는 par 대립유전자를 유전적으로 변형하여 상기 par 대립유전자를 Par 대립유전자에 부여하고, 상기 세포 또는 원형질체를 단위생식 식물로 성장 및/또는 발달시키는 것 외에, 단위생식 식물은 식물 또는 식물 세포를 본 발명의 돌연변이 유전자를 포함하는, 즉, 본원에 정의된 PAR 단백질을 인코딩하는 코딩 서열, 선택적으로 3'UTR 서열에 연결된 본원에 정의된 PAR 단백질을 인코딩하는 코딩 서열에 작동 가능하게 연결된 변형된 프로모터를 포함하는, 핵산, 구조물 또는 벡터로 형질전환시켜 얻을 수도 있다.
본 발명의 방법에 의해 수득된 돌연변이 유전자는 형질전환, 유전자이입, 체세포 혼성화 및/또는 원형질체 융합에 의해 하나 이상의 식물 세포에 도입될 수 있다. 그러한 돌연변이 유전자는 외인성 핵산, 즉 상기 식물 세포에서 자연적으로 발생하지 않는 핵산에 위치할 수 있다.
따라서, 본 발명은 또한 단위생식 식물을 생산하는 방법을 제공하며, 상기 방법은 하기 단계를 포함한다:
a. 하나 이상의 식물, 식물 원형질체, 식물 세포, 식물 조직 또는 식물 종자를 제공하는 단계;
b. 하나 이상의 식물, 식물 원형질체, 식물 세포, 식물 조직 또는 식물 종자를 본 발명의 돌연변이 유전자를 포함하는 핵산 구조물로 형질전환시키는 단계;
c. 선택적으로, 단계 b)에서 형질전환된 식물 원형질체, 식물 세포, 식물 조직 또는 종자로부터 하나 이상의 식물을 성장시키는 단계; 및
d. 선택적으로, 단계 b)에서 얻은 식물 원형질체, 식물 세포, 식물 조직 또는 종자 또는 단계 b) 또는 c)에서 얻은 식물을 스크리닝 및/또는 유전형 분석하는 단계.
바람직하게는, 단계 a의 하나 이상의 식물은 Par 대립유전자가 없거나 단위생식 표현형을 나타내지 않는다.
추가 견지에서, 본 발명은 상기 정의된 어느 방법에 의해 수득된 식물(예를 들어, 식물 세포, 기관, 종자 및 식물 부분 포함)에 관한 것이다. 바람직하게는, 이들은 단위생식 식물이거나 또는 네이티브 또는 변형되지 않은 식물과 비교하여 증가된 단위생식을 나타낸다. 바람직하게는, 본 발명의 식물은 기술적 수단, 바람직하게는 본원에 기술된 방법에 의해 얻어진다. 이러한 기술적 수단은 당업자에게 잘 알려져 있으며, 예를 들어 무작위 돌연변이유발, 표적 돌연변이유발 및 핵산 삽입 또는 결실 중 적어도 하나와 같은 유전적 변형을 포함한다.
바람직하게는, 본 발명의 식물은 본질적으로 생물학적 프로세스에 의해 얻어지지 않는다. 바람직하게는, 본 발명의 식물은 본질적으로 생물학적 프로세스에 의해서 얻어지는 것이 배제되지 않는다. 바람직하게는, 본 발명의 식물은 식물에 단위생식을 도입하는 어느 본질적으로 생물학적 프로세스에 의해 얻어지지 않으며, 바람직하게는 직접적으로 이에 의해 얻어지지 않는다. 바람직하게는, 본 발명의 식물은 식물에 단위생식을 도입하는 어느 본질적으로 생물학적인 프로세스에 의해서 얻어지는 것이 배제되지 않는다. 바람직하게는, 본 발명의 식물은 자연 발생 식물이 아닌 것으로, 즉 자연에서 발생하는 식물이 아니다.
일 구현에서, 본 발명의 방법의 유전자의 프로모터는 업스트림 전사 조절 영역, 예를 들어 유전자의 번역 시작 코돈 및/또는 전사 시작 부위의 업스트림의 약 2000 bp 내에 있으며, TAIL-PCR (Liu 등, 1995; Liu 등, 2005), Linker-PCR, 또는 인버스 PCR (IPCR)과 같이 공지된 방법을 사용하여 아포믹틱 식물 및/또는 다른 식물로부터 분리될 수 있다. 본원에 정의된 바와 같은 키메라 유전자는 바람직하게는 SEQ ID NO: 1의 아미노산 서열 또는 이의 기능적 변이체 및/또는 단편을 갖는 본원에 교시된 바와 같은 코딩 서열에 프로모터를 연결함으로써 생성될 수 있으며, 이는 임의로 후속적으로 적합한 3' 말단 비번역 영역("3' 말단" 또는 3'UTR)의 업스트림(즉, 5')에 연결된다. 적합한 3' 말단은 CaMV 35S 유전자("3' 35S"), 노팔린 신타제 유전자("3' nos")(Depicker 등, 1982), 옥토파인 신타제 유전자("3'ocs")(Gielen 등, 1984) 및 T-DNA 유전자 7("3' 유전자 7")(Velten and Schell, 1985)의 3' 말단을 포함하며, 이는 형질전환된 식물 세포 등에서 3'-비번역 DNA 서열로 작용한다. 일 구현에서, 네이티브 단위생식 유전자의 3'UTR 또는 그로부터 유래된 3'UTR이 사용된다. 예를 들어, SEQ ID NO: 4로부터 유래된 임의의 3'UTR, 또는 이의 변이체 또는 단편이 사용될 수 있다. 3'UTR은 SEQ ID NO: 4의 뉴클레오티드 서열을 가질 수 있다.
아그로박테리움으로의 T-DNA 벡터의 도입은 전기천공 또는 트리패렌털(triparental) 교배와 같은 공지된 방법을 사용하여 수행될 수 있다.
본원에 교시된 바와 같은 돌연변이 유전자는 선택적으로 예를 들어 카나마이신 저항성을 인코딩하는 neo(또는 nptII) 유전자(EP0242236)와 같은 선택가능하거나 스코어링가능하여 그 핵산을 포함하는 식물이 쉽게 검출될 수 있도록 마커를 인코딩하는 유전자에 인프래임으로 연결된 하이브리드 유전자 서열로서 식물 게놈에 삽입될 수 있다.
임의로, 본 발명의 돌연변이 유전자는 가능한 (추가적인) 전사 인자 결합 부위를 변형시키도록, 바람직하게는 유전자 전사를 억제하는 전사 인자에 대한 결합 부위를 변형시키도록 변경될 수 있다.
일 구현에서, 본원에 교시된 바와 같은 본 발명의 핵산에 의해 인코딩된 PAR 단백질은 단일 숙주에서, 선택적으로 상이한 프로모터의 조절 하에, 단위생식, 아포메이오시스 또는 아포믹시스를 조절, 바람직하게는 향상 또는 유도하는 다른 단백질과 공동-발현된다. 그러한 다른 유전자는 예를 들어, 본원에 참조로 포함된 WO2017/039452 A1에 기재된 디플로스포리(diplospory)와 같은 아포메이오시스를 부여하는 유전자일 수 있다.
다른 구현에서, 본 발명의 돌연변이 유전자는 바람직하게는 다른 관심 유전자, 예를 들어, 아포메이오시스를 부여하는 유전자(예를 들어, 디플로스포리에 대한 유전자)를 포함하는 생식질에 유전자이입된다. 교배 및 선택을 통해 잡종이 생성되며 관심 있는 여러 유전자가 쌓일 수 있다.
임의로, 본 발명의 방법에 의해 돌연변이되거나 형질전환된 식물은 자멸사할 수 있는 식물이다. 바람직하게는 아포메이오시스가 가능한 식물은 본원에 정의된 단위생식에서 기능하는 돌연변이 유전자를 포함하도록 변형된다. 그러한 돌연변이 또는 변형은 이후에 아포믹틱 식물 또는 식물 세포를 야기할 것이다. 이 경우, 본원에서 정의된 단위생식 식물의 생산 방법 중 단계 B)에서의 스크리닝은 아포믹틱 표현형에 대한 것일 수 있다. 아포메이오시스가 가능한 식물 세포는 아포메이오시스를 부여할 수 있는 핵산을 도입함으로써 얻을 수 있다. 임의로 상기 핵산은 본 발명의 돌연변이 유전자의 도입 전, 함께 또는 후에 식물 세포에 도입된다.
본 발명은 또한
(1) 유성 번식 제1 식물을 제2 식물의 꽃가루와 교차 수정시켜 F1 잡종 종자를 생산하는 단계; 및
(2) 선택적으로 상기 F1 종자로부터 아포믹틱 표현형을 포함하는 종자를 선택하는 단계
포함하는 아포믹틱 잡종 종자를 생산하는 방법을 제공하며,
여기서 상기 제1 및/또는 제2 식물은 아포메이오시스가 가능하며, 상기 제2 식물은 본 발명의 방법에 의해 얻어지거나 얻을 수 있는 단위생식 식물이고, 그리고 여기서 바람직하게는 상기 선택은 유전형 분석에 의해 수행된다. 선택적으로, 상기 방법은 아포믹틱 표현형을 포함하는 종자를 선택하는, 바람직하게는 유전자형 분석에 의해, 아포믹틱 표현형을 포함하는 종자를 선택하는 단계, 및 선택적으로 상기 F1 잡종 종자로부터 적어도 하나의 F1 식물을 성장시키는 단계를 추가로 포함한다
바람직하게는, 선택 목적 및 잡초 제어 옵션을 위해, 본 발명의 트랜스제닉 식물은 또한 활성 성분으로서 글루포시네이트 암모늄(예: Liberty® 또는 BASTA; 저항성은 PAT 또는 bar 유전자에 의해 부여됨; EP 0 242 236 및 EP 0 242 246 참조) 또는 글리포세이트(예: RoundUp®; 저항성은 EPSPS 유전자에 의해 부여됨, 예: EP0 508 909 및 EP 0 507 698 참조)를 기반으로 하는 제초제와 같은 광역 제초제와 같은 제초제에 대한 저항성을 부여하는 단백질을 인코딩하는 DNA로 형질전환된다. 제초제 저항성 유전자(또는 원하는 표현형을 부여하는 다른 유전자)를 선택 가능한 마커로 사용하면 항생제 저항성 유전자의 도입을 피할 수 있다는 장점이 있다.
대안적으로 또는 추가로, 항생제 저항성 유전자와 같은 다른 선택가능한 마커 유전자가 사용될 수 있다. 일반적으로 형질전환된 숙주 식물에서 항생제 저항성 유전자를 유지하는 것이 허용되지 않기 때문에, 이러한 유전자는 형질전환체 선택 후 다시 제거할 수 있다. 트랜스진 제거를 위한 다양한 기술이 존재한다. 제거를 달성하기 위한 한 가지 방법은 트랜스진의 측면에 lox 부위를 배치하고, 선택 후 형질전환된 식물을 CRE 재조합효소-발현 식물과 교배시키는 것이다(참조 예: EP506763B1). 부위 특이적 재조합으로 마커 유전자가 절단된다. 또 다른 부위 특이적 재조합 시스템은 EP686191 및 US5527695에 기재된 FLP/FRT 시스템이다. CRE/LOX 및 FLP/FRT와 같은 부위 특이적 재조합 시스템도 유전자 스태킹 목적으로 사용될 수 있다. 또한, 1-성분 절제 시스템이 기재되어 있다(참조 예: WO9737012 또는 WO9500555).
바람직하게는, 본 발명의 돌연변이 유전자는 향상된 단위생식 표현형을 갖는 트랜스제닉 식물 세포, 식물, 식물 종자 등 및 이의 임의의 유도체/자손을 생성하는데 사용된다. 바람직하게는, 본 발명의 트랜스제닉 식물은 변형되지 않은 대조구 식물과 비교하여 향상된 단위생식을 포함한다. 따라서, 예를 들어 향상된 단위생식을 포함하는 트랜스제닉 상추 식물이 제공된다. 따라서, 본 발명의 돌연변이 유전자를 포함하는 식물은 상기 돌연변이 유전자를 포함하지 않는 동일한 식물과 비교하여 단위생식에서 현저한 증가를 나타낸다. 향상된 단위생식 표현형은 단위생식을 유도할 수 있는 본 발명의 돌연변이 유전자에 의해 인코딩되는 단백질의 적당한 양을 적합한 시간 및/또는 위치에서 발현시킴으로써 미세-조정될 수 있다. 이러한 미세 조정은 가장 적절한 프로모터 변형을 결정하고/하거나 원하는 발현 수준을 나타내는 트랜스제닉 "이벤트"를 선택함으로써 수행될 수 있다.
본 발명의 돌연변이 유전자에 의해 인코딩되는 단백질의 원하는 수준을 발현하는 형질전환체, 잡종 또는 근교계는 예를 들어, 카피 수 분석(서던 블롯 분석), mRNA 전사 수준(예: 본 발명의 돌연변이 유전자에 의해 인코딩되는 단백질을 증폭할 수 있는 프라이머 쌍 또는 플랭킹 프라이머를 사용하는 RT-PCR) 또는 다양한 조직에서 단위생식 단백질의 존재 및 수준을 분석함으로써(예: SDS-PAGE, ELISA 분석 등) 선택된다. 단일 카피 형질전환체는 예를 들어 규제상의 이유로 선택될 수 있고, 돌연변이 유전자의 삽입 부위 측면에 있는 서열이 분석되고, 바람직하게는 "이벤트"를 특성화하기 위해 시퀀싱된다. 본 발명의 돌연변이 유전자에 의해 인코딩된 단백질의 높거나 중간 정도의 발현을 초래하는 트랜스제닉 이벤트는 안정한 트랜스진을 갖는 고성능 엘리트 이벤트가 얻어질 때까지 추가 개발을 위해 선택된다.
본 발명의 돌연변이 유전자를 포함하는 형질전환체는 또한 질병 저항성을 부여하거나 다른 생물적 및/또는 비생물적 스트레스에 대한 저항성을 부여하거나 디플로스포리(diplospory)를 부여하는 유전자와 같은 (다른) 트랜스진을 포함할 수 있다. "스태킹된(stacked)" 트랜스진을 갖는 이러한 식물을 얻기 위해, 다른 트랜스진이 상기 형질전환체에 도입될 수 있거나, 상기 형질전환체가 후속적으로 하나 이상의 다른 유전자로 형질전환될 수 있거나, 대안적으로 여러 키메라 유전자를 사용하여 식물 계열 또는 품종을 형질전환시킬 수 있다. 예를 들어, 여러 트랜스진이 단일 벡터에 존재할 수 있거나 공동 형질전환되는 다른 벡터에 존재할 수 있다.
일 구현에서 하기 유전자들이 본 발명의 돌연변이 유전자와 조합된다: 공지된 질병 저항성 유전자, 특히 괴사성 병원균에 대한 향상된 저항성을 부여하는 유전자, 바이러스 저항성 유전자, 곤충 저항성 유전자, 비생물적 스트레스 저항성 유전자(예를 들어, 가뭄 내성, 염 내성, 내열성 또는 내한성 등), 제초제 저항성 유전자 등. 따라서, 스태킹된 형질전환체는 병원체 저항성, 곤충 저항성, 선충 저항성, 염분, 저온 스트레스, 열 스트레스, 물 스트레스 등에 대한 훨씬 더 넓은 생물적 및/또는 비생물적 스트레스 내성을 가질 수 있다.
전체 식물, 식물 부분(예: 종자, 세포, 조직), 식물 산물(예: 과일) 및 본원에 기술된 임의의 식물의 자손이 본원에 포함되며, 예를 들어 전체 게놈 DNA를 주형으로 사용하고 본 발명의 돌연변이 유전자에 특이적인 PCR 프라이머 쌍을 사용하여 PCR 분석에 의해 및/또는 SBG(Sequence Based Genotyping) 또는 KeyGene® SNPSelect 분석(이에 제한되지 않음)과 같은 게놈 변이 분석을 사용하여 돌연변이 유전자의 존재에 의해 확인될 수 있다. 또한 "이벤트 특이적" PCR 진단 방법이 개발될 수 있는데, 여기서 PCR 프라이머는 삽입된 변형 또는 트랜스진 측면에 있는 식물 DNA를 기반으로 한다(US6563026 참조). 유사하게, 이벤트 특이적 AFLP 핑거프린트 또는 RFLP 핑거프린트는 본 발명의 트랜스제닉 또는 돌연변이 식물, 또는 그로부터 유래된 임의의 식물, 종자, 조직 또는 세포를 식별하는 개발될 수 있다.
본 발명에 따른 트랜스제닉 또는 돌연변이 식물은 바람직하지 않은 표현형, 예를 들어 수확량 감소, 질병에 대한 증가된 감수성(특히 괴사균) 또는 바람직하지 않은 구조적 변화(왜소화, 기형) 등을 나타내지 않는 것으로 이해되며, 그러한 표현형이 1차 형질전환체에서 보이면, 이들은 통상적인 방법으로 제거될 수 있다. 본원에 기재된 임의의 트랜스제닉 또는 돌연변이 식물은 돌연변이 유전자에 대해 이형접합, 동형접합 또는 반접합일 수 있다.
본 발명은 또한 본원에 상세히 기재된 방법에 의해 얻어지거나 얻어질 수 있는 식물, 종자, 식물 부분(예, 식물 세포) 및 식물 산물, 바람직하게는 본 발명의 돌연변이 유전자, 본 발명의 핵산 및/또는 발명의 구조물을 포함하는, 본원에 상세히 기재된 방법에 의해 얻어지거나 얻어질 수 있는 식물, 종자, 식물 부분(예, 식물 세포) 및 식물 산물에 관한 것이다. 바람직하게는 상기 돌연변이 유전자, 핵산 및/또는 구조물은 본원에 기재된 바와 같이 단위생식을 유도할 수 있고 및/또는 단위생식에서 기능적이다. 본 발명의 식물은 바람직하게는 적합한 숙주 식물로서 본원에 열거된 종이다. 본 발명의 식물을 얻기 위한 그러한 방법은 무작위 또는 표적 돌연변이유발, 식물로부터 자손으로 본 발명의 돌연변이 유전자의 유전자이입, 및/또는 본 발명의 돌연변이 유전자에 의한 식물 세포의 형질전환, 및 상기 식물 세포로부터 식물의 후속 재생을 포함하지만 이에 제한되지 않는다.
바람직하게는 식물, 식물 부분 및/또는 식물 산물은 본 발명의 돌연변이 유전자를 포함하는 타락사컴 오피시날레 센수 라토(Tharaxacum officinale sensu lato) 종이 아니다. 바람직하게는, 식물, 식물 부분 및/또는 식물 산물은 쌍떡잎식물이다. 상기 식물 또는 식물 세포는 바람직하게는 본원에 적합한 숙주 식물로서 열거된 종, 바람직하게는 십자화과(Brassicaceae), 박과(Cucurbitaceae), 콩과(Fabaceae), 벼과(Gramineae), 가지과(Solanaceae) 및 국화과(Asteraceae)(Compositae)로 이루어진 군으로부터 선택된 과로부터의 것이다.
바람직하게는 본 발명의 돌연변이 유전자를 포함하는 식물, 식물 부분 및/또는 식물 산물은 유전적 변형 또는 유전자 이입에 의해 얻어지며, 바람직하게는 상기 돌연변이 유전자는 그의 게놈에 위치한다. 바람직하게는 상기 식물, 식물 부분 및/또는 식물 산물은 단위생식이 가능하고/하거나 단위생식을 나타낸다. 훨씬 더 바람직하게는 상기 식물, 식물 부분 및/또는 식물 산물은 추가로 아포메이오시스를 일으킬 수 있다. 본 발명은 본 발명의 식물 또는 식물 세포의 종자, 식물 부분 또는 식물 산물을 제공한다.
본 발명은 또한 본 발명의 식물로부터 유래된 식물 부분 및 식물 산물에 관한 것이며, 여기서 식물 부분 및/또는 식물 산물은 본원에 정의된 바와 같은 본 발명의 돌연변이 유전자, 본원에 정의된 바와 같은 본 발명의 핵산 및/또는 본원에 정의된 바와 같은 본 발명의 구조물을 포함하며, 이는 식물 산물의 식물 부분이 유래된 식물에서 그러한 단백질, 돌연변이 유전자, 핵산 또는 구조물의 존재를 평가할 수 있게 하는 본원에 정의된 바와 같은 단편일 수 있다. 그러한 부분 및/또는 산물은 종자 또는 과일 및/또는 그로부터 파생된 산물(예: 당 또는 단백질)일 수 있다. 이러한 부분, 산물 및/또는 그로부터 파생된 산물은 번식되지 않는 재료일 수 있다.
임의의 식물이 적합한 숙주일 수 있지만, 가장 바람직하게는 숙주 식물 종은 향상된 단위생식으로부터 이익을 얻을 수 있는 식물 종이어야 한다. 적합한 숙주는 임의의 식물 종을 포함한다. 특히, 농경학적 특성이 우수한 품종 또는 육종 계열이 바람직하다. 당업자는 본원에 교시된 바와 같은 돌연변이 유전자 및/또는 이의 변이체 또는 단편이 트랜스제닉 식물을 생성하고 단위생식을 평가함으로써 적합한 대조구 식물과 함께 숙주 식물에 필요한 단위생식의 증가 또는 감소를 부여할 수 있는지 여부를 시험하는 방법을 알고 있다.
적합한 숙주 식물은 예를 들어 십자화과(Brassicaceae), 박과(Cucurbitaceae), 콩과(Fabaceae), 벼과(Gramineae), 가지과(Solanaceae), 국화과(Asteraceae)(Compositae), 장미과(Rosaceae) 또는 포아풀과(Poaceae)에 속하는 숙주를 포함한다.
바람직한 구현에서, 숙주 식물은 타락사컴(Taraxacum), 락투카(Lactuca), 피섬(Pisum), 캡시컴(Capsicum), 솔라넘(Solanum), 큐큐미스(Cucumis), 제아(Zea), 고시피움(Gossypium), 글리신(Glycine), 트리티컴(Tryticum), 오리자(Oryza) 및 소르검(Sorghum)으로 구성된 그룹에서 선택되는 식물 종일 수 있다.
바람직한 구현에서, 본원에 교시된 바와 같은 식물, 식물 부분, 식물 세포 또는 종자는 타락사컴(Taraxacum), 락투카(Lactuca), 피섬(Pisum), 캡시컴(Capsicum), 솔라넘(Solanum), 큐큐미스(Cucumis), 제아(Zea), 고시피움(Gossypium), 글리신(Glycine), 트리티컴(Tryticum), 오리자(Oryza), 알리움(Allium), 브라시카(Brassica), 헬리안터스(Helianthus), 베타(Beta), 시코리움(Cichorium), 크리산테멈(Chrysanthemum), 페니세텀(Pennisetum), 세칼레(Secale), 호르데움(Hordeum), 메디카고(Medicago), 파세올러스(Phaseolus), 로사(Rosa), 릴리움(Lilium), 코페아(Coffea), 리넘(Linum), 카나비스(Canabis), 카사바(Cassava), 다우커스(Daucus), 큐르큐르비타(Cucurbita), 시트룰러스(Citrullus) 및 소르검(Sorghum)로 구성되는 그룹으로부터 선택된 종의 것이다.
적합한 숙주 식물은 예를 들어 옥수수(maize)/콘(corn)(Zea 종), 밀(Triticum 종), 보리(예: Hordeum vulgare), 귀리(예: Avena sativa), 수수(Sorghum bicolor), 호밀(Secale graine), 대두(Glycine spp. 예를 들어 G. max), 목화(Gossypium 종, 예를 들어 G. hirsutum, G. barbadense), 브라시카종(예: B. napus, B. juncea, B. oleracea, B. rapa 등), 해바라기(Helianthus annus), 잇꽃, 참마, 카사바, 알팔파(Medicago sativa), 벼(Oryza 종, 예: O. sativa indica 품종 - 그룹 또는 japonica 품종 그룹), 목초, 기장(Pennisetum spp. 예: P. glaucum), 수종(소나무, 포플러, 전나무, 질경이 등), 차, 커피, 오일팜, 코코넛, 채소 종, 예를 들어 완두콩, 애호박, 콩(예: Phaseolus 종), 고추, 오이, 아티초크, 아스파라거스, 가지, 브로콜리, 마늘, 리크, 상추, 양파, 무, 순무, 토마토, 감자, 브뤼셀 콩나물, 당근, 콜리플라워, 치커리, 셀러리, 시금치, 꽃상추, 회향, 비트, 다육질 열매 맺는 식물(포도, 복숭아, 자두류, 딸기, 망고, 사과, 자두, 체리, 살구, 바나나, 블랙베리, 블루베리, 감귤류, 키위, 무화과, 레몬, 라임, 천도 복숭아, 라즈베리, 수박, 오렌지, 자몽 등), 관상용 수종(예: 장미, 페튜니아, 국화, 백합, 거베라 종), 허브(민트, 파슬리, 바질, 백리향 등), 수목(예: 포퓰러스(Populus), 살릭스(Salix), 퀘르커스(Quercus), 유칼립튜스(Eucalyptus)의 종), 섬유종, 예, 아마(Linum usitatissimum) 및 대마(Cannabis sativa)를 포함한다.
본 발명의 방법에 의해 수득되거나 수득가능한 돌연변이 유전자 또는 상기 돌연변이 유전자를 포함하는 본 발명의 핵산은 단위생식을 부여하기 위해, 아포믹시스를 부여하기 위해, 배수성(ploidy)을 증가시키기 위해, 및/또는 이중 반수체를 생산하기 위해 사용될 수 있다. 바람직하게는 상기 용도는 식물 생명공학 및/또는 육종, 즉 식물 또는 식물 세포 내/상에서이다.
단위생식은 아포믹시스의 요소이고, 단위생식 유전자는 아포믹시스를 생성하기 위해, 바람직하게는 본원에 나열된 적용을 위해 이를 사용하기 위해 아포메이오시스(예를 들어, 디플로스포리(diplospory)) 유전자와 조합하여 사용될 수 있다. 이들 유전자는 형질전환, 유전자이입에 의해 또는 내인성의 적합한 유전자의 변형에 의해 유성 작물에 도입되어 이들을 아포메이오틱(또는 디플로스포러스) 유전자로 전환시킬 수 있다. 아포믹시스 유전자의 구조와 기능에 대한 지식은 또한 아포믹시스 유전자가 되는 방식으로 내인성 유성 생식 유전자를 변형하는 데 사용될 수 있다. 선호되는 용도는 유성 생식이 새로운 유전자형을 생성할 때 아포믹시스가 스위치 오프되고, 엘리트 유전자형을 전파하기 위해 아포믹시스가 필요할 때 스위치 온될 수 있도록 유도성 프로모터 하에 아포믹시스 유전자를 가져오는 것이다.
본 발명의 돌연변이 유전자는 아포믹시스의 성분으로 사용될 수 있다. 기능적 배우체 아포믹시스에는 아포메이오시스와 단위생식이 모두 필요하다. 아포메이오시스는 감수 분열에 영향을 미치는 돌연변이의 조합에 의해 달성될 수 있으며(Crismani 등, 2013), 거대포자에서 염색체 비감소의 결과, 즉 감수 분열보다는 유사 분열이 발생한다. 후생유전학적 변화를 통해 배우체의 운명을 가정하는 체세포(Grimanelli, 2012)는 또한 잠재적으로 비감소 배우자(난세포)를 생성할 수 있는 비감소 포자 유사 세포를 생성한다. 또 다른 구현에서, 아포메이오시스는 자연적 아포메이오시스 유전자의 트랜스제닉 또는 비-트랜스제닉 발현에 의해 달성된다. 감소되지 않은 난세포가 형성되는 어떤 수단에 의해서든, 본 발명의 돌연변이 유전자로부터의 적절한 시간적 및 공간적 발현은 난세포가 수정 없이 접합자로서 행동하고 분열하도록 유도할 수 있다.
본 발명의 돌연변이 유전자는 완전히 새로운 방식으로 사용될 수 있다. 예를 들어 아포믹시스에서 도구로서 직접적이지 않게 사용될 수 있다. 예를 들어 아포믹시스에서 단위생식과 아포메이오시스 모두가 단일 식물에서 결합되는 반면, 한 세대에서 아포메이오시스를 사용하고 다음 세대에서 단위생식을 사용하면, 아포메이오시스에 의해 배수성 수준이 올라가고 단위생식에 의해 배수성 수준이 내려감으로써, 작물의 성적 유전자 풀을 2배체와 배수체 수준에서 연결한다. 이것은 배수체 집단이 더 많은 돌연변이를 견딜 수 있어 돌연변이 유도에 더 좋을 수 있기 때문에 매우 유용한다. 배수체 식물은 또한 더 활발할 수 있다. 그러나, 2배체 개체군은 선택에 더 좋고, 2배체 교배는 유전자 지도 작성, BAC 라이브러리 구성 등에 더 좋다. 배수체의 단위생식은 2배체와 교배될 수 있는 반수체를 생성할 수 있다. 2배체의 이배포자는 배수체 자손을 생산하기 위해 배수체로부터의 꽃가루에 의해 수정될 수 있는 감소되지 않은 2n 난세포를 생성한다. 따라서, 다른 육종 세대에서 아포메이오시스와 단위생식의 교대는 2배체와 배수체 유전자 풀을 연결한다.
아포메이오시스가 없는 본 발명의 돌연변이 유전자의 또 다른 용도는 반수체 생산을 위해 그리고 배가 반수체(DH)의 게놈 배가(예: 자발적 게놈 배가, 콜히친, 나트륨 아지드 또는 기타 화학)에 의해 사용될 수 있는 반수체 자손의 생산이다. 배가 반수체는 유성 F1 잡종을 생산하기 위해 부모로 사용될 수 있다. 배가 반수체는 식물을 동형 접합체로 만드는 가장 빠른 방법이다. 배가 반수체로 식물을 동형접합체로 만들 수 있는 반면, 두 번째로 빠른 방법인 자가생식으로 2배체 식물에서 충분히 높은 수준의 동형접합체에 도달하는 데 5-7세대가 걸린다. 배가 반수체를 생산하는 방법에는 여러 가지가 있다. 일부 식물 종에서 반수체는 미세포자 배양에 의해 생성될 수 있다. 다른 방법은 조사된 꽃가루(멜론)를 사용한 수분 또는 특정 수분 매개자 스톡(옥수수, 감자)을 사용한 수분에 의한 반수체 배아의 생산(자성 발생(gynogenesis)이다. 이러한 방법은 비용, 유전형의 완고함(recalcitrance), 노동 강도 등과 같은 한계가 있다. 일부 작물에는 반수체 생산 방법이 없다(예: 토마토). 단위생식 유전자의 우성 대립유전자로 인해 자성 발생의 빈도가 상당히 증가하여, 반수체 생산 비용이 감소할 수 있다.
다음의 비제한적 실시예는 본 발명의 상이한 구현들을 설명한다. 실시예에서 달리 언급하지 않는 한, 모든 재조합 DNA 기술은 Sambrook 등(1989), Sambrook 및 Russell(2001); 및 Ausubel 등(1994)에 기재된 표준 프로토콜에 따라 수행된다. 식물 분자 작업을 위한 표준 재료 및 방법은 BIOS Scientific Publications Ltd(영국) 및 Blackwell Scientific Publications, UK에서 공동 출판된 R.D.D.Croy의 Plant Molecular Biology Labfax(1993)에 설명되어 있다.
표 1. 본원에 사용된 SEQ ID NOs의 개요
실시예
실시예 1
Par
프로모터에 의한 단위생식 유도
타락사컴(Taraxacum) Par 프로모터가 단위생식의 유전적 조절에 역할을 하는지 테스트하기 위해, 단위생식을 유도하기 위해 유성 종의 Par 코딩 서열 상동체와 결합할 수 있는지 여부를 테스트했다. 타락사컴(Taraxacum) Par 프로모터는 상추, 관련 국화과(Asteraceae) 종 및 중요한 채소 작물 식물에서 상동 유전자(Lspar)의 발현을 구동하는 데 사용되었다. 이 구조물은 A68 계열에서 유래된 3x PAR CRISPR 돌연변이와 2배체 식물 FCH72의 꽃가루 사이의 교배에서 유래된 자가 비호환성, 4배체 타락사컴(Taraxacum) CRISPR/Cas9 단위생식 손실(LOP) 돌연변이로 변형되었으며, 생존 가능한 종자를 생산할 수 없다. Par 대립유전자가 우성이므로, 1차 형질전환 식물체(T0)에 대해 시험을 수행하였다. 놀랍게도 Par::Lspar 구조물은 4개의 독립적인 형질전환체에서 종자 형성 및 4배체(우성 디플로스포리 유전자의 존재로 인해) 자손을 유도했다(표 2). 이것은 타락사컴(Taraxacum) Par 프로모터가 단위생식을 유도하기 위해 상추 유전자를 적용할 수 있음을 입증한다. ToPar 코딩 서열에 특이적인 유전적 다형성(성 대립 유전자 par1 및 par2와 비교할 때)은 상추 유전자에서 발견되지 않았으며, 코딩 서열 다형성이 단위생식의 원인이 되는 것으로 배제되었다. Par ATG 시작 사이트에서 업스트림으로 이동하면, MITE 삽입은 민들레의 세 가지 성적 대립 유전자(par1, par2 및 par TKS ; 도 2)와 비교할 때 아포믹틱 대립 유전자에 고유한 최초의 유전적 다형성을 나타낸다. ATG의 350 bp 업스트림(MITE가 PAR 대립유전자에서 절제된 경우)에 있는 4개의 타락사컴(Taraxacum) 프로모터 사이에서 13개의 SNP만이 발견되며, 그 중 3개만이 Par-대립유전자 특이적이다. 종합하면 Par 유전자의 민들레 대립유전자 사이의 기능적 차이가 코딩 서열이 아닌 프로모터에 의해 발생한다는 강력한 증거를 제공한다. 이전에 입증된 바와 같이, Par 유전자가 난세포 특이적 Arabidopsis EC1(pEC1::Par) 프로모터 하에서 발현되는 다른 구조는 또한 CRISPR/Cas9 LOP 돌연변이의 컴플리멘테이션으로 이어질 수 있으며, 이는 PAR의 난세포 발현이 단위생식을 유발할 수 있다는 가설(PCT/EP2020/064991의 실시예 2 및 표 3 참조)과 일치한다.
이 실험은 유성 상추 유전자의 발현을 유도하는 타락사컴(Taraxacum) Par 프로모터가 단위생식 상실의 타락사컴(Taraxacum) 식물에서 단위생식 표현형을 구조한다는 것을 증명한다. 즉, 유성 상추 유전자의 발현을 유도하는 타락사컴(Taraxacum) Par 프로모터는 단위생식을 유도할 수 있다.
표 2. 상추 Lspar 유전자와 융합된 ToPar 프로모터를 사용한 티. 오피시날레( T. officinale ) 4x CRISPR/Cas9 PAR 결실 돌연변이의 아포믹시스 컴플리멘테이션.
1차 형질전환체를 온실에서 성장시키고, 종자를 수집하고 최대 3개의 종자-머리(SH; 종자-머리당 30개의 종자)의 발아 시험을 수행하였다. 시험된 모든 자손 식물은 재조합 및 감소가 암컷 감수분열에서 발생하지 않았음을 나타내는 우성 DIP 유전자에 대한 PCR 마커를 함유하였다. 자손의 배수체 수준은 유동 세포측정법(FCM)으로 측정되었다. 단위생식에 의해 생산된 묘목(seedling)은 4배체이며; 6배체(6x) 묘목은 자가 수정(감소된 2배체 꽃가루 알갱이로 수정된 4배체 디플로스포러스 난세포)의 결과이다. 8개 계열 중 4개가 단위생식 4배체 자손을 생산했다. 티. 오피시날레(T. officinale)는 자체 비호환성이지만, SI 시스템이 누출될 수 있는 것으로 알려져 있다(Morita 등, 1990; 및 Tas와 Van Dijk, 1999). 때때로 6배체 자손이 35S::GUS 구조물로 형질전환된 대조구 식물에서 관찰되었으며, 이는 자가 수정이 이 유전적 배경에서 (드물게) 발생할 수 있음을 나타낸다. 이것은 논-컴플리멘팅 계열 옐로우 12b의 단일 6배체 자손을 설명할 수 있다.
표 3. 아라비돕시스 EC1.1 프로모터 하에서 ToPAR 유전자에 의한 티. 오피시날레( T. officinale ) 4x CRISPR/Cas9 PAR 결실 돌연변이의 아포믹시스 컴플리멘테이션. 설명은 표 2를 참조바람.
컴플리멘테이션 구조물로 형질전환된 식물 중 하나의 식물은 자생으로 인해 4개의 6x 묘목을 생산했다.
실시예 2
식물 재료
본 실험을 위해 야생형 상추: 아이스버그 타입, 레가시, 타키(일본)(Iceberg type, Legacy, Takii Japan) 및 레드 로메인 타입, 베이커 크릭 헤어룸 종자(Red Romaine type, Baker Creek Heirloom Seeds)를 사용하였다.
DNA 구조물
바이너리 벡터는 다음의 연속적인 요소로 구성된 SEQ ID NO: 34로 표시되는 구조물을 포함하는 T-DNA 영역으로 구축된다: 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 프로모터(SEQ ID NO: 16)는 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 CDS 서열(SEQ ID NO: 33)의 발현을 유도하며, 그 다음 타락사컴 오피시날렌(Taraxacum officinale)의 Par 대립 유전자의 3'UTR의 처음 1000개 염기(SEQ ID NO: 4의 처음 1000개 염기)가 후속되며, 그 다음 35S 종결자 및 네오마이신 포스포트랜스퍼라제 선택을 위한 유전자(nptII)가 후속된다. 이러한 바이너리 벡터를 생성하는 데 적합한 기술은 Gateway®, Golden Gate 또는 Gibson Assembly®이다(예를 들어 Ma 등, 2015 참조). 이 T-DNA를 포함하는 트랜스제닉 계열은 코드 pKG20001로 번호가 매겨진다.
두 번째 바이너리 벡터는 다음 연속 요소들로 구성된 SEQ ID NO: 35로 표시되는 구성을 포함하는 T-DNA 영역으로 구축된다: 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 CDS 서열(SEQ ID NO: 33) 발현을 구동하는 서열 AACCGCCA 및 AACCGTC(SEQ ID NO: 17)를 갖는 두 개의 MYB 결합 부위를 제거하기 위해 수정된 락투카 사티바의 LSAT_8X112340 프로모터, 그 다음 타락사컴 오피시날렌(Taraxacum officinale)의 Par 대립 유전자의 3'UTR의 처음 1000개의 염기(SEQ ID NO: 4의 처음 1000개의 염기)가 후속되며, 그 다음 35S 종결자 및 선택을 위한 네오마이신 포스포트랜스퍼라제 유전자(nptII)가 후속된. 이러한 바이너리 벡터를 생성하는 데 적합한 기술은 Gateway®, Golden Gate 또는 Gibson Assembly®이다(예를 들어 Ma 등, 2015 참조). 이 T-DNA를 포함하는 트랜스제닉 계열은 코드 pKG20002로 번호가 매겨진다.
세 번째 바이너리 벡터는 다음 연속 요소로 구성된 SEQ ID NO: 36으로 표시되는 구조물을 포함하는 T-DNA 영역으로 구축된다: 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 CDS 서열(SEQ ID NO: 33) 발현을 구동하는 타락사컴 오피시날렌(Taraxacum officinale) MITE 프로모터 요소의 Par 대립 유전자가 삽입된 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 프로모터(SEQ ID NO: 18), 그 다음 타락사컴 오피시날렌(Taraxacum officinale)의 Par 대립 유전자의 3'UTR의 처음 1000개 염기(SEQ ID NO: 4의 처음 1000개 염기), 그 다음 35S 종결자 및 선택을 위한 네오마이신 포스포트랜스퍼라제 유전자(nptII)가 후속된다. 이러한 바이너리 벡터를 생성하는 데 적합한 기술은 Gateway®, Golden Gate 또는 Gibson Assembly®이다(예를 들어 Ma 등, 2015 참조). 이 T-DNA를 포함하는 트랜스제닉 계열은 코드 pKG20003으로 번호가 매겨진다.
네 번째 바이너리 벡터는 다음 연속 요소로 구성된 SEQ ID NO: 61로 표시되는 구조물을 포함하는 T-DNA 영역으로 구축된다: 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 CDS 서열(SEQ ID NO: 33) 발현을 구동하는 2개의 MYB 결합 부위의 업스트림의 결실을 갖는 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 프로모터(SEQ ID NO: 20), 그 다음 타락사컴 오피시날렌(Taraxacum officinale)의 Par 대립 유전자의 3'UTR의 처음 1000개 염기(SEQ ID NO: 4의 처음 1000개 염기), 그 다음 35S 종결자 및 선택을 위한 네오마이신 포스포트랜스퍼라제 유전자(nptII)가 후속된다. 이러한 바이너리 벡터를 생성하는 데 적합한 기술은 Gateway®, Golden Gate 또는 Gibson Assembly®이다(예를 들어 Ma 등, 2015 참조). 이 T-DNA를 포함하는 트랜스제닉 계열은 코드 pKG20003으로 번호가 매겨진다.
식물 형질전환 방법
아그로박테리움 형질전환은 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens)를 이용한 상추의 유전자형 독립적 형질전환에 의해 수행된다. 이러한 방법은 당업계에 잘 알려져 있으며, 예를 들어 Curtis 등(1994)에 교시되어 있다. 예를 들어, Michelmore 등(1987) 또는 Chupeau 등(1989)에 기재된 바와 같이, 상추의 유전적 형질전환에 적합한 어느 다른 방법을 사용하여 원하는 T-DNA를 보유하는 식물을 생산할 수 있다.
결과
상기 "DNA 구조물" 섹션에서 기술된 바와 같이 트랜스진의 존재에 대해 양성으로 시험된 식물은 단위생식의 발생에 대해 평가된다. 형질이 우성이므로 1차 형질전환된 식물(T0)에 대해 시험을 수행한다. 교배 또는 자가 수정이 없으면, 단위생식 난세포가 배아로 발달한다. 트랜스진을 보유하는 식물의 어떠한 수정을 방지하기 위해, 식물을 온실에서 재배하고 현미경 관찰 전에 모든 꽃을 수동으로 거세한다. 거세(Emasculation)는 화관이 자라기 전에 총포를 잘라서 수행된다. 비아포믹틱 식물에서 클리어링된 배주의 DIC(Nomarski Differential Interference Microscopy)에 의해 단위생식이 현미경으로 검출된다. 여기서는 클로랄 수화물(chloral hydrate)을 이용한 클리어링 방법을 적용하며; 이 방법은 현미경 이미징을 위해 식물의 배주를 제거하는 데 일반적으로 사용되는 방법이다(참조 예: Franks RG, 2016 참조). 거세 후 75시간에 꽃봉오리를 수확하고 배주를 클로랄 수화물로 제거한다. pKG20002 및 pKG20003의 트랜스제닉 계열에서 이러한 제거된 배주에서 다중 배아가 관찰될 수 있다. 배낭의 풀에 대한 유동 세포 계측법은 이러한 배아가 반수체임을 보여줄 수 있다. 형질전환되지 않은 대조구 식물과 pKG20001의 평가된 트랜스제닉 계열에서 동일한 방식으로 거세되고 영상화되었으며, 배아는 전혀 관찰되지 않았다.
이들 결과는 타락사컴 오피시날레(Taraxacum officinale)의 Par 대립 유전자로부터 MITE 프로모터 요소를 삽입하거나 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 프로모터로부터 MYB 결합 부위를 제거하는 것이 LSAT_8X112340 유전자가 상추에서 반수체 배아 형성을 유도할 수 있도록 발현을 변형시키기에 충분하다는 것을 입증한다.
실시예 3
식물 재료
본 실험에서는 야생형 상추: 레드 로메인 타입, 베이커 크릭 헤어룸 종자(Red Romaine type, Baker Creek Heirloom Seeds)를 사용하였다.
DNA 구조물
다음 연속 요소로 구성된 SEQ ID NO: 63으로 표시되는 구조물을 포함하는 T-DNA 영역으로 바이너리 벡터를 구축했다: 타락사컴 오피시날레(Taraxacum officinale)의 Par CDS 서열(SEQ ID NO: 3)의 발현을 유도하는 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 프로모터(SEQ ID NO: 16), 그 다음 타락사컴 오피시날레(Taraxacum officinale)의 Par 대립 유전자의 3'UTR의 처음 1000개 염기(SEQ ID NO: 4의 처음 1000개 염기), 그 다음 35S 종결자 및 선택을 위한 네오마이신 포스포트랜스퍼라제 유전자(nptII)가 후속된다. 이러한 바이너리 벡터를 생성하는 데 적합한 기술은 Gateway®, Golden Gate 또는 Gibson Assembly®이다(예를 들어 Ma 등, 2015 참조). 이 T-DNA를 보유하는 트랜스제닉 계열은 코드 pKG20004로 번호가 매겨진다.
두 번째 바이너리 벡터는 다음 연속 요소로 구성된 SEQ ID NO: 64로 표시되는 구조물을 포함하는 T-DNA 영역으로 구축되었다: 타락사컴 오피시날레(Taraxacum officinale)의 Par CDS 서열(SEQ ID NO: 3)의 발현을 유도하는 타락사컴 오피시날레(Taraxacum officinale) MITE 프로모터 요소의 Par 대립 유전자가 삽입된 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 프로모터(SEQ ID NO: 18), 그 다음 타락사컴 오피시날레(Taraxacum officinale)의 Par 대립 유전자의 3'UTR의 처음 1000개 염기(SEQ ID NO: 4의 처음 1000개 염기), 그 다음 35S 종결자 및 선택을 위한 네오마이신 포스포트랜스퍼라제 유전자(nptII)가 후속된다. 이러한 바이너리 벡터를 생성하는 데 적합한 기술은 Gateway®, Golden Gate 또는 Gibson Assembly®이다(예를 들어 Ma 등, 2015 참조). 이 T-DNA를 보유하는 트랜스제닉 계열은 코드 pKG20006으로 번호가 매겨진다.
세 번째 벡터는 다음 연속 요소로 구성된 SEQ ID NO: 65로 표시되는 구조물을 포함하는 T-DNA 영역으로 구축되었다: 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 CDS 서열(SEQ ID NO: 33)의 발현을 구동하는 타락사컴 오피시날레(Taraxacum officinale)의 Par 대립 유전자 프로모터(SEQ ID NO: 2), 그 다음 타락사컴 오피시날레(Taraxacum officinale)의 Par 대립 유전자의 3'UTR의 처음 1000개 염기(SEQ ID NO: 4의 처음 1000개 염기), 그 다음 35S 종결자 및 선택을 위한 네오마이신 포스포트랜스퍼라제 유전자(nptII)가 후속된다. 이러한 바이너리 벡터를 생성하는 데 적합한 기술은 Gateway®, Golden Gate 또는 Gibson Assembly®이다(예를 들어 Ma 등, 2015 참조). 이 T-DNA를 보유하는 트랜스제닉 계열은 코드 pKG20008로 번호가 매겨진다.
식물 형질전환 방법
아그로박테리움 형질전환은 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens)를 이용한 상추의 유전자형 독립적 형질전환에 의해 수행된다. 이러한 방법은 당업계에 잘 알려져 있으며, 예를 들어 Curtis 등(1994)에 교시되어 있다. 예를 들어, Michelmore 등(1987) 또는 Chupeau 등(1989)에 기재된 바와 같이, 상추의 유전적 형질전환에 적합한 어느 다른 방법을 사용하여 원하는 T-DNA를 보유하는 식물을 생산할 수 있다.
결과
상기 "DNA 구조물" 섹션에서 기술된 바와 같이 트랜스진의 존재에 대해 양성으로 시험된 식물들을 단위생식의 발생에 대해 평가하였다. 형질이 우성이므로 1차 형질전환 식물(T0)에 대해 시험을 수행하였다. 교배 또는 자가 수정의 부재 하에 단위생식 난세포가 배아로 발달한다. 트랜스진을 보유하는 식물의 어떠한 수정을 방지하기 위해 식물을 온실에서 재배하고, 현미경 관찰 전에 모든 꽃을 손으로 거세했다. 화관이 자라기 전에 총포를 잘라내어 거세술을 수행했다. 비아포믹틱 식물에서 클리어링된 배주의 DIC(Nomarski Differential Interference Microscopy)에 의해 단위생식이 현미경으로 검출된다. 여기서는 클로랄 수화물을 이용한 클리어링 방법을 적용하며; 이 방법은 현미경 이미징을 위해 식물의 배주를 제거하는 데 일반적으로 사용되는 방법이다(참조 예: Franks RG, 2016 참조). 거세 후 75시간에 꽃봉오리를 수확하고 배주를 클로랄 수화물로 제거한다. pKG20005, pKG20006, pKG20007 및 pKG20008의 트랜스제닉 계열에서 이러한 제거된 배주에서 다중 배아가 관찰되었다(표 3 참조). 배낭의 풀에 대한 유동 세포 계측법은 이러한 배아가 반수체임을 보여준다. 표준 GUS 구조물 형질전환 대조구 식물 및 pKG20004의 평가된 트랜스제닉 계열에서 동일한 방식으로 거세되고 영상화되었으며, 배아는 전혀 관찰되지 않았다.
이러한 결과는 타락사컴 오피시날레(Taraxacum officinale)의 Par 대립 유전자로부터의 MITE 프로모터 요소가 LSAT_8X112340 유전자가 상추에서 반수체 배아 형성을 유도할 수 있도록 발현을 변형시키기에 충분하다는 것을 입증했다. 이것은 교배 또는 자가 수정의 부재에서 난세포가 배아로 발달했으므로 상추 LSAT_8X112340 유전자의 프로모터 변형에 의해 상추에서 단위생식을 유도하는 명확한 실시예이다.
표 3: 상추 트랜스제닉 계열의 거세 후 75시간에 꽃봉오리에서 배아 관찰. "유" 표시는 모든 버드(bud)에 적어도 하나의 배아가 있음을 의미한다.
참고문헌
- An et al. (1996) Plant J. 10, 107
- Asker, S. (1979) Progress in apomixis research. Hereditas 91(2): 231-240.
- Asker, S.E. and Jerling, L. (1990) Apomixis in Plants. CRC Press, Boca Raton.
- Ausubel et al. (1994) Current Protocols in Molecular Biology, Volumes 1 and 2, Current Protocols, USA
- Barrell and Grossniklaus (2005) Confocal microscopy of whole ovules for analysis of reproductive development: the elongate1 mutant affects meiosis II. Plant Journal 34: 309 - 320.
- Bicknell and Koltunow 2004 Understanding apomixis: recent advances and remaining conundrums. The Plant Cell 16: S228-S245.
- Borevitz, J.O., Liang, D., Plouffe, D., Chang, H.-S., Zhu, T., Weigel, D., Berry, C.C., Winzeler, E. and Chory, J. (2003) Large-scale identification of single-feature polymorphisms in Arabidopsis. Genome Res. 13: 513-523.
- Bortesi, L. and Fischer, R. (2015) The CRISPR/Cas9 system for plant genome editing and beyond. Biotechnology Advanced 33(1): 41-52.
- Borg et al. (2011) The R2R3 MYB Transcription Factor DUO1 Activates a Male Germline-Specific Regulon Essential for Sperm Cell Differentiation in Arabidopsis. The Plant Cell 23 (2): 534-549
- Chupeau et al. (1989) Transgenic plants of lettuce (Lactuca sativa) obtained through electroporation of protoplasts. Bio/Technology 7, 503-508.
- Crismani W. et al. (2013) J. Exp. Bot. 64:55-65.
- Curtis IS et al. (1994) J. Exp. Bot. 45.10: 1441-1449.
- Daniell, H. (2002) Molecular strategies for gene containment in transgenic crops. Nature biotechnology 20: 581-586.
- Depicker A. and Van Montagu M. (1997) Post-transcriptional gene silencing in plants. Current Opinion in Cell Biology 9: 373-382.
- Depicker et al. (1982) J. Mol. Appl. Genetics 1, 561-573.
- Englbrecht et al. (2004) BMC Genomics, 5 (1): 39
- Franks RG (2016) Methods Mol Biol. 2016;1457:1-7
- Gielen et al. (1984) EMBO J 3, 835-845.
- Guo et al, Scientific reports. 2017 Jun 1;7(1):2634.
- Gould et al. (1991) Plant Physiol. 95,426-434.
- Grimanelli D.(2012) Curr. Opin. Plant Biol. 15:57-62.
- Hashimshony, T., Senderovich, N., Avital, G. et al. CEL-Seq2: sensitive highly-multiplexed single-cell RNA-Seq. Genome Biol 17, 77 (2016).
- Hashimshony T, Wagner F, Sher N, Yanai I. CEL-Seq: single-cell RNA-Seq by multiplexed linear amplification. Cell Rep. 2012;2(3):666-673.
- Henikoff and Henikoff (1992) PNAS 89, 915-919.
- Hermsen, J. G. Th. (1980) Breeding for apomixis in potato: Pursuing a utopian scheme. Euphytica 29:595-607.
- Holmes, M (2018) Historical Studies in the Natural Sciences, 48 (1).pp. 1-23.ISSN 1939-1811
- Hull and Howell (1987) Virology 86,482-493.
- Kagale et al., (2010) Plant Physiology, 152: 1009-1134.
- Liu et al. (1995) Genomics 25(3):674-81.
- Liu et al. (2005) Methods Mol. Biol. 286:341-8.
- Lutz KA et al. (2004) Plant J. 37(6):906-13.
- Ma, Xingliang, et al. "A robust CRISPR/Cas9 system for convenient, high-efficiency multiplex genome editing in monocot and dicot plants." Molecular plant 8.8 (2015): 1274-1284.
- McPherson at al. (2000) PCR-Basics: From Background to Bench, First Edition, Springer Verlag, Germany.
- Michelmore, R.W., Marsh, E., Seely, S. and Landry, B. (1987) Transformation of lettuce (Lactuca sativa) mediated by Agrobacterium tumefaciens. Plant Cell Rep. 6: 439-442.
- Michelmore, R.W., Paran, I. and Kesseli, R.V. (1991) Identification of markers linked to disease resistance genes by bulked segregant analysis: a rapid method to detect markers in specific genomic regions using segregating populations. Proc. Natl. Acad. Sci. 88:9828-9832.
- Morgan, R., Ozias-Akins, P., and Hanna, W.W. (1998) Seed set in an apomictic BC3 pearl millet. Int. J. Plant Sci. 159, 89-97.
- Morita, T. Menken, S.G.J. and Sterk, A.A. (1990) Hybridization between European and Asian dandelions (Taraxacum section Ruderalia and section Mongolica): 1. Crossability and breakdown of self-incompatibility. New Phytol. 114, 519-529.
- Ozias-Akins, P. and P.J. van Dijk. (2007) Mendelian genetics of apomixis in plants. Annu. Rev. Genet. 41:509-537.
- Park et al. (1997) J.Biol. Chem. 272, 6876-6881.
- Plant Molecular Biology Labfax (1993) by R.D.D. Croy, jointly published by BIOS Scientific Publications Ltd (UK) and Blackwell Scientific Publications, UK.
- Sambrook and Russell (2001) Molecular Cloning: A Laboratory Manual, Third Edition, Cold Spring Harbor Laboratory Press, NY.
- Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press.
- Savidan Y. (2001) Transfer of apomixis through wide crosses. In: Savidan Y, Carman J, Dresselhaus T, editors. The flowering of apomixis: From mechanisms to genetic engineering. Mexico: CIMMYT, IRD; pp. 153-167.
- Sidorov VA et al. (1999) Plant J.19: 209-216.
- Smith TF, Waterman MS (1981) J. Mol. Biol 147(1);195-7.
- Tas I.C.Q. and Van Dijk, P.J. (1999) Heredity (Edinb). 83, 707-714
- Vaeck et al. (1987) Nature 328, 33-37.
- Van Baarlen, De Jong, J.H., and Van Dijk, P.J. (2002) Comparative cyto-embryological investigations of sexual and apomictic dandelions (Taraxacum) and their apomictic hybrids. Sex Plant Reprod 15: 31-38.
- Van Dijk, P.J., Rigola, D. and Schauer, S.E. "Plant breeding: surprisingly, less sex is better." Current Biology 26.3 (2016): R122-R124.
- Velten and Schell (1985) Nucleic Acids Research 13, 6981-6998.
- Vielle-Calzada, J-Ph., B.L. Burson, E.C Bashaw, and M. A. Hussey 1995. Early fertilization events in the sexual an aposporous egg apparatus of Pennisetum ciliare (L.) Link, The Plant Journal 8(2):309-316.
- Yang, J. et al. (2018) PlantEAR: Functional Analysis Platform for Plant EAR Motif-Containing Proteins. Front. Genet. 9.
SEQUENCE LISTING
<110> Keygene N.V.
<120> Modified Promoter of a Parthenogenesis Gene
<130> P6097374pct
<150> EP 20201578.0
<151> 2020-10-13
<160> 65
<170> PatentIn version 3.5
<210> 1
<211> 170
<212> PRT
<213> Taraxacum officinale
<400> 1
Met Ala Asp Asn Gly Asn Thr Gly Arg Gln Lys Asp Asp Asp Gly Gly
1 5 10 15
His Asp Gly Pro Arg Gln Asn Pro Thr Thr Pro Pro Ser Pro Ser Arg
20 25 30
Thr Pro Arg Arg Pro Arg Arg Asn Thr Ser Pro Pro Lys His Ser Pro
35 40 45
Gly Ala Ser Ser Ser Thr Met Pro Ala Pro Pro Thr Pro Pro Ala Pro
50 55 60
Thr Gly Ile Thr Gly Ala Ser Ser Ser Ser Val Gly Thr Asn Ile Ile
65 70 75 80
Ser Phe Ile Pro Pro Lys Thr Lys Arg Thr Lys Ser Val Ile Cys Pro
85 90 95
Ile Cys Asn Lys Asp Met Cys His Glu Lys Ala Leu Cys Gly His Ile
100 105 110
Arg Trp His Thr Gln Glu Glu Arg Leu Ala Ala Ser Ile Ala Ile Ala
115 120 125
Arg Ala Leu Ser Ser Asn Val Val Val Ser Gly Asn Gly Asp Glu Asp
130 135 140
Glu Gly Pro Ser Lys Lys Tyr Lys Leu Pro Asp Leu Asn Lys Ser Pro
145 150 155 160
Pro Pro Glu Glu Glu Asp Glu Asp Ala Ala
165 170
<210> 2
<211> 1900
<212> DNA
<213> Taraxacum officinale
<400> 2
taaggccata acaaggttat ttgaacattc gcctaaaccc taaaccaact atatctattc 60
ggatttgtta cgagttttag agtttctaga aaatcagtta tatatcgatt aggcttggtt 120
ctaggttata agaaaaaatg attctctatc cggtatgaca tagagacaaa ccggtctact 180
tttataagaa aatcatattt gaaacaatgt ctagttaata attaattaat atgtgcatgt 240
ttaaatttag aatatcctga atttatattt agtgcgcaac cctatgtaag atcgaactaa 300
ttttaaaccg taaccagaca tgcatgtttg atcagtaata aaaaggctat tatcgtcgaa 360
aatattaaaa caaaatataa tatcttattt ggcgccattt catgtcaacg gttgaaagca 420
agttaccaac gcctccaacc gatcatttct ccggtaacaa ccaactgcta ccagggccgg 480
ccagaaggct gtgcggcttg ggctgtggca caggggcagc agatttagtc catttattat 540
ggtctgctat ttatttgggt ccaataagat cagggcacta aaactcaaat acatcaattc 600
aagtcggcgg caaaagaata aaaagcgcca atttttagaa gacaaggaga cagcacaata 660
atcatgcttt tccaatggcc aattaatttt agcctttgtg aggtataaat atgaatcact 720
ttttctccaa atatcattat tgtaaactag taaagagcgt aaattgtttt atcgctaatc 780
ttcttctttt tcaaatataa ttgtttgatt ctttgtagta ggtacgttaa gttttatatc 840
attcgtcctg gaaacctttt cttatgcccc ttcaatttat gaatttgtgt tttgtattgt 900
cttgctatta atccaatgca aactaattct gccgcatcga tctcacagag ttggagcagc 960
ttaaaaggag ttttggggca acttaaaatg agggtagctt ttttgttgtt gttggtctac 1020
tatttacttt ggtccttatc gttttagttt tgtgttcatt gaggatttga atgactttga 1080
acacaagttt ataaaactaa gtttttgtga ttctaaattt ttgatgtgtg caaccgacta 1140
aatgaatata aaattctgat ttgtgtattt ctgatttctg atttaccggt tattcattat 1200
gtttttctgg atctcatatg aatttagtat ataaaaatct caggttcttc ttactcagtc 1260
tagtatattt tggcattggg gatcagggtt aaaatcatca tttttctaag cactaacaag 1320
ctttaaaacc atcaattaaa agttagttct ccatacctgg aattgtttat tgctttagta 1380
ttcatttcat agtgtcaata ccttacaact gtttattgtt ttcaaatgtt tactgttttg 1440
cactttagtt gtttttagca tgtttcaact ttcaaagtta attgacgata gtgtcatata 1500
cgaaatatca tcactcatac aaaattaaac tggatagaat tttttccgat gaaatctatt 1560
tttaaatagt tacgaatata ataggagact taatatgttt gtttcaaaat tacacaaaaa 1620
caccatggaa atgggcatta gtttgtataa gcatcctttt aaatataaag ctttgttaca 1680
ttgatgcctt ctaaatatat aatattgtaa tgatttgtag taaacaccat ggaaatgggc 1740
attattaaga tgtttcgccc agggcatgaa aaactatcgg accggccctg actgctacta 1800
ataaccgcca ccgcaaaaac ctataaatac aacttccatc acaattctgt cccctactcc 1860
catttcaatc caaaaaaagg ctacacagac atatacagcg 1900
<210> 3
<211> 513
<212> DNA
<213> Taraxacum officinale
<400> 3
atggcagata atggcaacac cggccgtcaa aaggatgacg acggtggcca tgatggacca 60
cgccaaaacc caactactcc accctcccct tcccgcaccc ctcgaagacc aaggcggaac 120
acatcaccgc ccaaacattc tccgggggcg tcttcaagca ccatgccagc gccgcctact 180
ccccctgcgc cgacgggaat caccggtgct tctagttctt ctgtgggtac taatataatt 240
tcatttattc cacccaaaac caaaagaacg aagtcggtga tctgcccgat ctgcaacaaa 300
gatatgtgcc atgagaaggc gctgtgtggc cacatccggt ggcatacaca ggaggaaaga 360
ttggcggcca gcatcgctat agcaagagcg ctatcttcta acgttgttgt ttctggcaat 420
ggcgatgaag atgaaggtcc atctaaaaag tataaactcc cggacctgaa caaatctcca 480
ccgccggagg aggaggacga ggacgctgcc tga 513
<210> 4
<211> 5356
<212> DNA
<213> Taraxacum officinale
<400> 4
ttttcttgcg ggagaggcat gcatgtatgt gtggcctttt tgcaataata ctatgcatgg 60
gagatgcata aagtttatct ttattttttt tagtttaata atgtgtggca aactttatat 120
catttatgat ttcggccatg tactgctaca tcgttctagg atggttattc cctagaattt 180
gctttatgta tttgttttct ttgttaattc ttctcttcct taaacgttat ttcatgtgaa 240
ttgcgatgtc atgatattgc aggaatgtaa cttagaactc aacgataaaa agtgtgttga 300
gatcgtggaa gttgatcatt tatcttgaat tcataagata agcaacatga gataggataa 360
ttaattactg tggggatttc tttttatatt catattattc gttgtaatgc aaatttttaa 420
gtagaataac gaatgtgtct tattatttac ggttaaatgc aaaagatcat taacatatct 480
ccattgattt gtttactgat gtattctcat gtgttctgtt gctaaattct attttgaaaa 540
gtatattcaa ttaaagcaat gcattttaga tataaagcaa ctccataact tataattgtg 600
tagattttta ccaattcaat gtcttaaaag aaaaataaaa attgaaagtt taattaattg 660
ccatagtgat cccgttcccg tcaattatgt gatcaatttt taccagagca aaaccccaca 720
tttcttgtag tgaacaatct gtggatgata accgatcgaa gacttttgtg gggatttcac 780
taaccaacta tttggctctc attaattact attagttata taaggccatc ccaagtattt 840
tggcaatatt caaaacgagt aaactataaa attacacttt tggttcttgt atttctaact 900
tttagaatta tgtatttggt tcttatagtt ttttatttgt atgaattaca ttacttttgg 960
tccacaatat tttttatttt ctataattcc atttttagtc attgtagttt taatttgcaa 1020
taaaaaatta atttatattt ttaatccata tatatagttg gcaatattct atattttagg 1080
ttcagattgt atcttttata aaaaagagtc ttaaaagact aaaccttttg gatccttata 1140
gttttcacaa tcacttgtga tttttttaat gaacatatca tatttcttaa attacatcag 1200
taatctacgt ataacattta atataatttt atttaatcag aaatatagga ttcgtataat 1260
aactttgctg aacttaggct tcatttttaa caaaggataa tgcatcatgc atgacataaa 1320
aatttgtaat atttctaatg tgcatgcact acaagaacct gacccttcat atacattaat 1380
gaatgattct cttttcttat ttaatcttag caagcggttt ggataattgt ctgcacaata 1440
ttaagaattg cactagctag ctaggggagt ccatgacgta ataagcaaat taactagagg 1500
acttgtagga ggcttgatca cttcattgta tatctaatgg cactatcgat atatgattgg 1560
cttgtgtgta tctatggaat ttaacactat taaaaaatat atctttaatg acaatcaaca 1620
acacacagta atttatgact tacaaaatca tgtgtgatta aaaaaaatgt catgtttttt 1680
aaaattatag aggatttacg acttacataa ttatgtgtca taattatatg tcatcttgtg 1740
taatatttat gacttacaaa aatgtatgtc atgttttatc atcataaaat ctataaaaaa 1800
aaatagaaac acgaggatac tttcagtgta tgttatctgt aaaaaaaaat aaaaactcgg 1860
aggacactaa aagtgtagaa acttgacagc ataaacgaat ttatttacct tcatcaaaac 1920
ttattttact tcaatctctg aaccagctcc cttcattaat ctcttcgaga tgtaggttga 1980
ttttaatgct aaatgaactt ttcaaatgta taaataaaac ttttctgtgc cagatttgac 2040
attgatggag atgaagatac acaagtgaat tcacctttca atgatcatac tgacatacca 2100
agtactccta tcccctctcc acctccacaa aacgaacctc aatttcaaaa acgtaactat 2160
catttaaata tttaatcatt tttcaattgg attcatgcgg taatagaagt tactggactt 2220
taaacttttt gtagctgatg agattcatga gcaacagtcc atggacattt tccaaatcaa 2280
caagtttctg atgaggacaa cgtaaaaaaa gtttttcaat tattaaacat atgattttgg 2340
tttttaaaag ataattaatt atggaaaatc ttcagaaaag tctcaatact ttgggtttat 2400
taatgaaaaa gtctcaaaaa aaaatttgaa taaaaaagtc cataaaattg gataaattat 2460
tcgatttagc ccaatttgcc aagtaaatct ggtaaaatta ggctaaatcg aataatttag 2520
ccagtttggt gggccttttt gcgcaaaaac attattttgg gacttaatcg ttaattttcc 2580
ccaaatttca gtttatttac agtcttggag taaaaccgaa cctagtgcgc taattttggc 2640
ttttggtgtt tggaattatt tgggtttatt gggctcggtt tctgaacgag tttgattttt 2700
ggtttcttga ttcaattttt tggttttggg gttgaaccca tggattttcg atttggtttc 2760
ggctttgata atatttttgt gcaatcgttc aaaatatccg agttagattg ggtttaaatg 2820
ttatcaaaac cgaaaccgag ggtagaaccc caaaactgaa cccaatcgaa aatccatagg 2880
ttgaacccca gaaccgaacc caataaactc taaaaaccaa aagccaaaat taaccgataa 2940
aaaacttaaa atacatgttt gttaaatcta gtaaggtgtt tttgacactt tatgtaaatt 3000
atagaaaaaa atggattaac tgtttgctta ttaagataaa aacgacgtaa aaatagaatt 3060
ggattagaaa tgaaccattt ttttacatcg tttactttat ttactaggtt ataacccgtg 3120
tattacacgg gttgacgata aaaaattgta taaaaaaaca acatataatg gtaagtttgt 3180
aatcgtacat gggttgcttc aattttaatt taaaaattgt aattccaaat gaaatatatg 3240
taggatgata taacatactt gtaaatgtaa atgagagttt gttggcattt catacattta 3300
gcccatcaaa tcaaacgcaa aaaatctttt taatcctata atacatgtgg cacaaatata 3360
cgattagcat ttcgctgaga gagaggcttt aagtgaggat gtgaaaaaga aggaacatag 3420
caacttggaa tttaaagatc aaaaaacctt gaaaggcttt tggaatgtaa aaatatagaa 3480
atgaataaat gtggcttctt gtatgtatca agagtaggac ctgtattaga aacataaaaa 3540
atttgtgtct aataaaaatc aacaaaaaca gaacgtaaac gaaagaagtt attggtaaaa 3600
aaagatttca aaaatagttt ttttttgaac cggttcaaaa atagttattt tacttattta 3660
tccatttaat ccaaactttt ttttgtcaaa tatctcatgg aattagttgg ctgcgtcact 3720
cttgtcactg ggcgttataa cttttgcctt gtggtttgca acaccacctt aaataacata 3780
gacaaataac attaaatatc atgataatac ataataactc acaaaagatg cattctatag 3840
aacggtataa ttgattagaa caaaataatc taaatagttt atgaggatta ccttgataat 3900
tcccttggag tgaatactat ccacgatgtc atcttccaaa ggtattcaat ggcttttatt 3960
agaacccaat ttcagaatta cattgatgcc acagttacat tcactaaata tcttcctctt 4020
aggcttttag tttgactata ttttaaccat tttcacatca cactttaacc accccctttg 4080
gttattaatg tcaaaaggaa caaaactcac aaatcaaatg cgtggtgttt atactattgg 4140
tacaatgttt ataaatttct taaaaatgag cacaatttca aaaaacttaa acaaatgtca 4200
atggtcacca tgtggtatta atattataaa gttctaaaaa taccattcca ccccaacatg 4260
gtactaacca gttagaaaat caagaaacag aaacatactc tttaatctaa aacaatataa 4320
tatagggatg tgttatgagt ttagtttcat ctaaccatga attcatatag gattgtacgt 4380
ttctcctcga aattgcaaag aattttgttc gactaagcaa tctacatatt aatggatttg 4440
tatggtttct cggtttgtag gtaagttaag agctaccagg aaagagaaaa tttgcaccat 4500
aggtactaaa cacattctac aatggtggct ttaacgtgag agagaataga gaggtcgaaa 4560
catatttccg ttaaataagc aaacataagt ttctatttgg gatcaataag tttcttccta 4620
tagtggtaaa tggatctgta cttgttaagc tcttaaacat atttgttgtc actgttcact 4680
tcctattttg cagtgctctt ctattactta cattcttctt atgacattct tttaataagg 4740
aaaaataacc acttattcta gtattctatt gttttgttag agtcaatatc agataagaac 4800
ctaaaaaggt gggacaaatt gataacttaa tcaatatatc aaactgtcat atgtctcaag 4860
tctcaaccca aattgatatg tttaagaaaa attcagaaaa gatatgtcca tgggacatgt 4920
gcatgtatat gtataagtgt acattcctaa aaaaagtagg ctcatatgac atgagcatgt 4980
atgtgcttat tgttataaag attacaaatt ttcttaaaaa tgaacacaat ttcaaaatac 5040
ctataccaaa gcccatgatc aacatagcat ctgatattaa tattataaag ctctaaacaa 5100
atctaccccg acatcaagtg gtacttacaa gttggaaaat caagatacaa aaacatagct 5160
tttaatctaa gtaaaaacac aataatatag ggatatgacc tatatgcatg tttaaaatct 5220
taagtctgta aagattgata ggattggaaa actcttctat tcaacacaag aaaagaatta 5280
cagtaggagg agggactctc acactcaact actacaaaaa aaccaaccct cacttactaa 5340
cactctcaca ctagtg 5356
<210> 5
<211> 7769
<212> DNA
<213> Taraxacum officinale
<400> 5
taaggccata acaaggttat ttgaacattc gcctaaaccc taaaccaact atatctattc 60
ggatttgtta cgagttttag agtttctaga aaatcagtta tatatcgatt aggcttggtt 120
ctaggttata agaaaaaatg attctctatc cggtatgaca tagagacaaa ccggtctact 180
tttataagaa aatcatattt gaaacaatgt ctagttaata attaattaat atgtgcatgt 240
ttaaatttag aatatcctga atttatattt agtgcgcaac cctatgtaag atcgaactaa 300
ttttaaaccg taaccagaca tgcatgtttg atcagtaata aaaaggctat tatcgtcgaa 360
aatattaaaa caaaatataa tatcttattt ggcgccattt catgtcaacg gttgaaagca 420
agttaccaac gcctccaacc gatcatttct ccggtaacaa ccaactgcta ccagggccgg 480
ccagaaggct gtgcggcttg ggctgtggca caggggcagc agatttagtc catttattat 540
ggtctgctat ttatttgggt ccaataagat cagggcacta aaactcaaat acatcaattc 600
aagtcggcgg caaaagaata aaaagcgcca atttttagaa gacaaggaga cagcacaata 660
atcatgcttt tccaatggcc aattaatttt agcctttgtg aggtataaat atgaatcact 720
ttttctccaa atatcattat tgtaaactag taaagagcgt aaattgtttt atcgctaatc 780
ttcttctttt tcaaatataa ttgtttgatt ctttgtagta ggtacgttaa gttttatatc 840
attcgtcctg gaaacctttt cttatgcccc ttcaatttat gaatttgtgt tttgtattgt 900
cttgctatta atccaatgca aactaattct gccgcatcga tctcacagag ttggagcagc 960
ttaaaaggag ttttggggca acttaaaatg agggtagctt ttttgttgtt gttggtctac 1020
tatttacttt ggtccttatc gttttagttt tgtgttcatt gaggatttga atgactttga 1080
acacaagttt ataaaactaa gtttttgtga ttctaaattt ttgatgtgtg caaccgacta 1140
aatgaatata aaattctgat ttgtgtattt ctgatttctg atttaccggt tattcattat 1200
gtttttctgg atctcatatg aatttagtat ataaaaatct caggttcttc ttactcagtc 1260
tagtatattt tggcattggg gatcagggtt aaaatcatca tttttctaag cactaacaag 1320
ctttaaaacc atcaattaaa agttagttct ccatacctgg aattgtttat tgctttagta 1380
ttcatttcat agtgtcaata ccttacaact gtttattgtt ttcaaatgtt tactgttttg 1440
cactttagtt gtttttagca tgtttcaact ttcaaagtta attgacgata gtgtcatata 1500
cgaaatatca tcactcatac aaaattaaac tggatagaat tttttccgat gaaatctatt 1560
tttaaatagt tacgaatata ataggagact taatatgttt gtttcaaaat tacacaaaaa 1620
caccatggaa atgggcatta gtttgtataa gcatcctttt aaatataaag ctttgttaca 1680
ttgatgcctt ctaaatatat aatattgtaa tgatttgtag taaacaccat ggaaatgggc 1740
attattaaga tgtttcgccc agggcatgaa aaactatcgg accggccctg actgctacta 1800
ataaccgcca ccgcaaaaac ctataaatac aacttccatc acaattctgt cccctactcc 1860
catttcaatc caaaaaaagg ctacacagac atatacagcg atggcagata atggcaacac 1920
cggccgtcaa aaggatgacg acggtggcca tgatggacca cgccaaaacc caactactcc 1980
accctcccct tcccgcaccc ctcgaagacc aaggcggaac acatcaccgc ccaaacattc 2040
tccgggggcg tcttcaagca ccatgccagc gccgcctact ccccctgcgc cgacgggaat 2100
caccggtgct tctagttctt ctgtgggtac taatataatt tcatttattc cacccaaaac 2160
caaaagaacg aagtcggtga tctgcccgat ctgcaacaaa gatatgtgcc atgagaaggc 2220
gctgtgtggc cacatccggt ggcatacaca ggaggaaaga ttggcggcca gcatcgctat 2280
agcaagagcg ctatcttcta acgttgttgt ttctggcaat ggcgatgaag atgaaggtcc 2340
atctaaaaag tataaactcc cggacctgaa caaatctcca ccgccggagg aggaggacga 2400
ggacgctgcc tgattttctt gcgggagagg catgcatgta tgtgtggcct ttttgcaata 2460
atactatgca tgggagatgc ataaagttta tctttatttt ttttagttta ataatgtgtg 2520
gcaaacttta tatcatttat gatttcggcc atgtactgct acatcgttct aggatggtta 2580
ttccctagaa tttgctttat gtatttgttt tctttgttaa ttcttctctt ccttaaacgt 2640
tatttcatgt gaattgcgat gtcatgatat tgcaggaatg taacttagaa ctcaacgata 2700
aaaagtgtgt tgagatcgtg gaagttgatc atttatcttg aattcataag ataagcaaca 2760
tgagatagga taattaatta ctgtggggat ttctttttat attcatatta ttcgttgtaa 2820
tgcaaatttt taagtagaat aacgaatgtg tcttattatt tacggttaaa tgcaaaagat 2880
cattaacata tctccattga tttgtttact gatgtattct catgtgttct gttgctaaat 2940
tctattttga aaagtatatt caattaaagc aatgcatttt agatataaag caactccata 3000
acttataatt gtgtagattt ttaccaattc aatgtcttaa aagaaaaata aaaattgaaa 3060
gtttaattaa ttgccatagt gatcccgttc ccgtcaatta tgtgatcaat ttttaccaga 3120
gcaaaacccc acatttcttg tagtgaacaa tctgtggatg ataaccgatc gaagactttt 3180
gtggggattt cactaaccaa ctatttggct ctcattaatt actattagtt atataaggcc 3240
atcccaagta ttttggcaat attcaaaacg agtaaactat aaaattacac ttttggttct 3300
tgtatttcta acttttagaa ttatgtattt ggttcttata gttttttatt tgtatgaatt 3360
acattacttt tggtccacaa tattttttat tttctataat tccattttta gtcattgtag 3420
ttttaatttg caataaaaaa ttaatttata tttttaatcc atatatatag ttggcaatat 3480
tctatatttt aggttcagat tgtatctttt ataaaaaaga gtcttaaaag actaaacctt 3540
ttggatcctt atagttttca caatcacttg tgattttttt aatgaacata tcatatttct 3600
taaattacat cagtaatcta cgtataacat ttaatataat tttatttaat cagaaatata 3660
ggattcgtat aataactttg ctgaacttag gcttcatttt taacaaagga taatgcatca 3720
tgcatgacat aaaaatttgt aatatttcta atgtgcatgc actacaagaa cctgaccctt 3780
catatacatt aatgaatgat tctcttttct tatttaatct tagcaagcgg tttggataat 3840
tgtctgcaca atattaagaa ttgcactagc tagctagggg agtccatgac gtaataagca 3900
aattaactag aggacttgta ggaggcttga tcacttcatt gtatatctaa tggcactatc 3960
gatatatgat tggcttgtgt gtatctatgg aatttaacac tattaaaaaa tatatcttta 4020
atgacaatca acaacacaca gtaatttatg acttacaaaa tcatgtgtga ttaaaaaaaa 4080
tgtcatgttt tttaaaatta tagaggattt acgacttaca taattatgtg tcataattat 4140
atgtcatctt gtgtaatatt tatgacttac aaaaatgtat gtcatgtttt atcatcataa 4200
aatctataaa aaaaaataga aacacgagga tactttcagt gtatgttatc tgtaaaaaaa 4260
aataaaaact cggaggacac taaaagtgta gaaacttgac agcataaacg aatttattta 4320
ccttcatcaa aacttatttt acttcaatct ctgaaccagc tcccttcatt aatctcttcg 4380
agatgtaggt tgattttaat gctaaatgaa cttttcaaat gtataaataa aacttttctg 4440
tgccagattt gacattgatg gagatgaaga tacacaagtg aattcacctt tcaatgatca 4500
tactgacata ccaagtactc ctatcccctc tccacctcca caaaacgaac ctcaatttca 4560
aaaacgtaac tatcatttaa atatttaatc atttttcaat tggattcatg cggtaataga 4620
agttactgga ctttaaactt tttgtagctg atgagattca tgagcaacag tccatggaca 4680
ttttccaaat caacaagttt ctgatgagga caacgtaaaa aaagtttttc aattattaaa 4740
catatgattt tggtttttaa aagataatta attatggaaa atcttcagaa aagtctcaat 4800
actttgggtt tattaatgaa aaagtctcaa aaaaaaattt gaataaaaaa gtccataaaa 4860
ttggataaat tattcgattt agcccaattt gccaagtaaa tctggtaaaa ttaggctaaa 4920
tcgaataatt tagccagttt ggtgggcctt tttgcgcaaa aacattattt tgggacttaa 4980
tcgttaattt tccccaaatt tcagtttatt tacagtcttg gagtaaaacc gaacctagtg 5040
cgctaatttt ggcttttggt gtttggaatt atttgggttt attgggctcg gtttctgaac 5100
gagtttgatt tttggtttct tgattcaatt ttttggtttt ggggttgaac ccatggattt 5160
tcgatttggt ttcggctttg ataatatttt tgtgcaatcg ttcaaaatat ccgagttaga 5220
ttgggtttaa atgttatcaa aaccgaaacc gagggtagaa ccccaaaact gaacccaatc 5280
gaaaatccat aggttgaacc ccagaaccga acccaataaa ctctaaaaac caaaagccaa 5340
aattaaccga taaaaaactt aaaatacatg tttgttaaat ctagtaaggt gtttttgaca 5400
ctttatgtaa attatagaaa aaaatggatt aactgtttgc ttattaagat aaaaacgacg 5460
taaaaataga attggattag aaatgaacca tttttttaca tcgtttactt tatttactag 5520
gttataaccc gtgtattaca cgggttgacg ataaaaaatt gtataaaaaa acaacatata 5580
atggtaagtt tgtaatcgta catgggttgc ttcaatttta atttaaaaat tgtaattcca 5640
aatgaaatat atgtaggatg atataacata cttgtaaatg taaatgagag tttgttggca 5700
tttcatacat ttagcccatc aaatcaaacg caaaaaatct ttttaatcct ataatacatg 5760
tggcacaaat atacgattag catttcgctg agagagaggc tttaagtgag gatgtgaaaa 5820
agaaggaaca tagcaacttg gaatttaaag atcaaaaaac cttgaaaggc ttttggaatg 5880
taaaaatata gaaatgaata aatgtggctt cttgtatgta tcaagagtag gacctgtatt 5940
agaaacataa aaaatttgtg tctaataaaa atcaacaaaa acagaacgta aacgaaagaa 6000
gttattggta aaaaaagatt tcaaaaatag tttttttttg aaccggttca aaaatagtta 6060
ttttacttat ttatccattt aatccaaact tttttttgtc aaatatctca tggaattagt 6120
tggctgcgtc actcttgtca ctgggcgtta taacttttgc cttgtggttt gcaacaccac 6180
cttaaataac atagacaaat aacattaaat atcatgataa tacataataa ctcacaaaag 6240
atgcattcta tagaacggta taattgatta gaacaaaata atctaaatag tttatgagga 6300
ttaccttgat aattcccttg gagtgaatac tatccacgat gtcatcttcc aaaggtattc 6360
aatggctttt attagaaccc aatttcagaa ttacattgat gccacagtta cattcactaa 6420
atatcttcct cttaggcttt tagtttgact atattttaac cattttcaca tcacacttta 6480
accaccccct ttggttatta atgtcaaaag gaacaaaact cacaaatcaa atgcgtggtg 6540
tttatactat tggtacaatg tttataaatt tcttaaaaat gagcacaatt tcaaaaaact 6600
taaacaaatg tcaatggtca ccatgtggta ttaatattat aaagttctaa aaataccatt 6660
ccaccccaac atggtactaa ccagttagaa aatcaagaaa cagaaacata ctctttaatc 6720
taaaacaata taatataggg atgtgttatg agtttagttt catctaacca tgaattcata 6780
taggattgta cgtttctcct cgaaattgca aagaattttg ttcgactaag caatctacat 6840
attaatggat ttgtatggtt tctcggtttg taggtaagtt aagagctacc aggaaagaga 6900
aaatttgcac cataggtact aaacacattc tacaatggtg gctttaacgt gagagagaat 6960
agagaggtcg aaacatattt ccgttaaata agcaaacata agtttctatt tgggatcaat 7020
aagtttcttc ctatagtggt aaatggatct gtacttgtta agctcttaaa catatttgtt 7080
gtcactgttc acttcctatt ttgcagtgct cttctattac ttacattctt cttatgacat 7140
tcttttaata aggaaaaata accacttatt ctagtattct attgttttgt tagagtcaat 7200
atcagataag aacctaaaaa ggtgggacaa attgataact taatcaatat atcaaactgt 7260
catatgtctc aagtctcaac ccaaattgat atgtttaaga aaaattcaga aaagatatgt 7320
ccatgggaca tgtgcatgta tatgtataag tgtacattcc taaaaaaagt aggctcatat 7380
gacatgagca tgtatgtgct tattgttata aagattacaa attttcttaa aaatgaacac 7440
aatttcaaaa tacctatacc aaagcccatg atcaacatag catctgatat taatattata 7500
aagctctaaa caaatctacc ccgacatcaa gtggtactta caagttggaa aatcaagata 7560
caaaaacata gcttttaatc taagtaaaaa cacaataata tagggatatg acctatatgc 7620
atgtttaaaa tcttaagtct gtaaagattg ataggattgg aaaactcttc tattcaacac 7680
aagaaaagaa ttacagtagg aggagggact ctcacactca actactacaa aaaaaccaac 7740
cctcacttac taacactctc acactagtg 7769
<210> 6
<211> 227
<212> PRT
<213> Taraxacum officinale
<400> 6
Met Ser Thr Val Lys Ser Lys Leu Ser Thr Pro Pro Thr Asp His Phe
1 5 10 15
Ser Gly Asn His Gln Leu Leu Leu Ile Thr Ala Thr Ala Lys Thr Tyr
20 25 30
Ile Tyr Asn Phe His His Asn Ser Val Pro Tyr Ser His Phe Asn Pro
35 40 45
Lys Lys Ala Thr Gln Thr Tyr Thr Ala Met Ala Asp Asn Gly Asn Thr
50 55 60
Gly Arg Gln Lys Asp Asp Asp Gly Gly His Asp Gly Gly Arg Pro Asn
65 70 75 80
Pro Thr Thr Pro Pro Ser Pro Ser Arg Thr Pro Arg Arg Pro Arg Arg
85 90 95
Thr Thr Ser Pro Pro Lys His Ser Pro Gly Ala Ser Ser Ser Thr Met
100 105 110
Pro Ala Pro Pro Thr Pro Pro Ala Pro Thr Gly Ile Thr Gly Ala Ser
115 120 125
Ser Ser Ser Val Gly Thr Asn Ile Ile Ser Phe Thr Pro Pro Lys Thr
130 135 140
Lys Arg Thr Lys Ser Val Ile Cys Pro Ile Cys Lys Lys Asp Met Cys
145 150 155 160
His Glu Lys Ala Leu Cys Gly His Ile Arg Trp His Thr Gln Glu Glu
165 170 175
Arg Leu Ala Ala Ser Ile Ala Ile Ala Arg Ala Leu Ser Ser Asn Val
180 185 190
Val Val Ser Gly Asn Gly Asp Glu Asp Glu Gly Pro Ser Lys Lys Tyr
195 200 205
Lys Leu Pro Asp Leu Asn Lys Ser Pro Pro Pro Glu Glu Glu Asp Glu
210 215 220
Asp Ala Ala
225
<210> 7
<211> 14519
<212> DNA
<213> Taraxacum officinale
<400> 7
ctgacttggc caacattttt tgttcttccg atcccttcgt aacaatcagt ttaagcacaa 60
ttgaattata tggagataaa taggtgaaat ttggaagacg aggatgggag agtgcgaaga 120
gccaaagaag agaaatgtgg gatagcggcc ggccggttgt taatagaagt gcttagatct 180
tggagacctt ctaatgctta tggaggaacc agatgcttca atttgtaaat ctgcgctgcc 240
cacgtagaat attgaaaaag aaaatcaaat cgatcaataa tgcgaccata tactttagga 300
tttcccactt gtataattct cttattcatt ttcaaatctt tatctaaatt aaggatatcg 360
gcaaaaatat aatcctaatt gtttttcaaa atgataagga ttataaggta acttaattct 420
tgttttattc atatttaatt attattgttt tttatcaatg ttttaaaacc cgggttttga 480
gtcaacccgg tcttgtgaaa aatcccgggt cagccggtca gctgatctac cggttcaata 540
tatttaaata aaatataaat tttcatatag aatttgagtt ttaggctaag aaaatcgggt 600
tttgggctaa ggaaaatcgg gtttaagttt tgggctaatg gattttcggg tcaataacgt 660
ttttttccgt tttttagatc ggttcgaccg cgttttgtgt gaaacccggc cgggttgatc 720
cgagtcaata attggcaaca acccggtata tgttgacccg ctcttgtccc cgggtcccgg 780
ttcaaccggt tggatcggcc gggttgaccc tggttttaaa acactgtttt ttatacaata 840
tatttgtttt tgtttttagt tttgtttttg tttttgattt tgtagatata tttttaattt 900
tatttttatt ttgtataaat atagtcatta caaccgatta tttgtaagtt gagtcggtca 960
aaacgaactt tctgataatt cttatacatt tttcggcgaa acatgaatat tttgatcaac 1020
caatatgctt ttttctaggt tttttaaata aaccgcacgt tcaattgcat attcgcaaac 1080
aatagaactc gaaaacccta atcgagcttg ttttatagaa atctgggttg agtgcataca 1140
taataattaa taactgtgaa aaagtttgtt ttaacatgct aaacctatcg atagtcggtt 1200
ataataatta tatgtaaaca aaatcagaaa caataatgat atatgtcacc caaaaaaata 1260
gttactaaat atatacaaaa tcaaaaacaa cagtaatttc ttttacaaaa aaaagagaac 1320
aatagtgact aactttagaa agaaaaaaaa agaactaaat tactcttata aatcattatc 1380
ttttatataa attggtaaat tggtcatgta atctagaatg tgaattgcgg aatgctttag 1440
tcacattttg aacaaactgg taattattaa tttcgataaa agttcttcaa gaatagtttg 1500
gtcacatttt ggacgacaat ggtgtgtttt ccatagtaag caatacgtaa tgagttcgct 1560
taataggaaa atagatctaa agcttaatga aatcatatgt ataagtaaca tatatttttc 1620
acacgttaca ttgtttgtaa cgtcctcaat ttttttaata tatataacta ggtacactct 1680
aaggtcgtgc taagcacgac ccacgaatgg taatttaggt aatttttcat ccttgactaa 1740
aatacattat gctaataaca aagaattaag aatacaatgc tataatgcat aagtaaataa 1800
aagtacatga tatttctcac atttagtctt tatacataga aaacttacac tggccatttg 1860
caaaaaaaca ttaaatctcc ctaaaaagta gagtttacaa aatgaaagct tgtttttata 1920
gcaaacaata atcaatatgt gaagctatag tatagtaacc tactcatttc aacttttagg 1980
cagtgcagta attacttact catgttaatg gtgaaatgca ttaagataaa cttcattcaa 2040
cggattaaat ctgggttcat tataaatgta ctcttagtta ctcctccatg taactgcatt 2100
tagcgaacaa caaaagctct aataaataat atgaaacaca tgctaattta taaatgacat 2160
catgggtata gatgctgtaa catcctaaac ttttaaaata aataataaat catatttggg 2220
atttaaagta atattttaag ataattgata aataagagaa tgaaatacaa agaggcattt 2280
tatttttagc ctttgattta taaaaaagaa aaaaccttga aattggatgt attttgaaat 2340
gggtaagtat tttaaaagat gtgtaagtta agggggataa atggaaatta aggagataag 2400
catttgacca aagtcaaaat agaaggaaca ataagtcggt cgattgtttt cctgtgtgca 2460
tcttcggacg acagagagac agaaaagaac gagcgagaga cagagaggaa tcgagacaga 2520
gagattatcg agagagagac agcgaagtcg ggagagggag accgagaacg accgagacag 2580
gaggaaaacc gagagacaag gggaggacga ggcagcagca gcctaggctg ctgcgttttt 2640
ggcgacagaa aaccaccgcc agcggcggtg gtggtgagcg acggtggtgg tggagccgag 2700
aaggggttgt ggtggtgtta gaagtgatgg ttcatctcaa tttcttgata atttgccctt 2760
ttggaacaat aaattgaagg taactttcaa agctttagat gattatctct tgaaagtaga 2820
aagcaagggt aatttagtct tcaattatgt tatggagaag ggtaataaca cccaaatgct 2880
aacaaaatca tatagattaa tgtgatttga agttatatag ttcatgaatg tgaaggttga 2940
ctttctgcaa tggtcaaaca tggacatgga catgattata gcatattagc aatgtaatag 3000
gaatggaatc accaattcca ttgttgaaaa tagaaaattt gatgtgtgca gaattttgta 3060
aaatttccca aaacaccaac tttaaggctg cataagtcat gcatgaagaa tgcaaatcag 3120
tccattcttt cgcctaacat caagtccttg caacatagat tacacaggaa aaagaaacag 3180
ccaaatccga gttcgtatga ggattgtatg actgttcaac gtttgtcaaa agttgctgtc 3240
atgctgtcaa accagaattt ttctaagtct gggaaatatg cagaaaatgg gtttgaccag 3300
tttttggagc ttcataactt gatttataca tatccaaatc agttgattct tgagcctaaa 3360
ctgtagagaa agatgaggag aaggcatagg aaaaagaatc aacacatttg gatatcgtat 3420
acaacctgtg caaagggttg aagtaggctc aaaacccatt tttgacataa ttgtcaatta 3480
tatgaattgt gggtaacttt tgccgtaatg aaatgttttg acatataagt gtttatattg 3540
acttataaac atgttaagac tataaacttg ataaagtaac atgtcaaaac ccgaaaatgc 3600
ctatttaggc aaagtatgat gcttaattga gaaatcggtc aaatagcata aaaactaaaa 3660
gtgttctaaa tggtccaaga agactttata cataacttac acatcattag cacatgatgt 3720
gtagtacatg tgaggtttga acacttttat acttggaaaa ttgtcaagta gtcaaaaatg 3780
ggacaaaagg gtaaaattgt ccaaaatgag tatatggcta attaaagcaa gttgagctac 3840
tgaaatgaac ttagataagt attataagga ctataaaagt ataatacttg gttaactatg 3900
agttttgaag gtaatgtcaa tttaaagtaa gttaaccaaa agaaagtaag ttgctaattt 3960
tgggatatat gacccaaatg agttatgcat tggtttttag gttgtgtaat acctataatg 4020
agatatgaat tgattatgag acatgtattg atgataatac aaatgatgta atgaaatagg 4080
ttcgttgcct atcgtggagc aaggagcatg cggattagtg tagctagtct tacctagcta 4140
ctaaggtgag tacgtgtgga ttgttttccc attttcgggt acatggaaaa ataatatttt 4200
tataatgaag tgcctaatgt tttgaaagaa agaatgaatg aaaatacttg atgcttttga 4260
aagaatgttt taaaagaaag taatgttttg aaagaaaaag gtttgatgct ttacgtttga 4320
aaatgaatat gtcttgatat taatgaatgg aatgggtaaa gcatgaatga tataatatgt 4380
aataataaga tgctaaggat ggttatgttt atgatgttca cgtgaatata agaatgttgc 4440
tcgatctaag atgtcccggg tagggattca gaggagccta tcggggtggt acctcccctt 4500
cgcgagatag gttacctaat gtaaatgatg tcaatgtaat ctgatttgtt ctttttgcat 4560
tggtacagac ttggggtata tcagacccaa gtataatatg atatggccat atgataagat 4620
gattaaaaga gtatgtgaaa tgttaaaggt tatgtaaaat gttatatgaa attattcaaa 4680
gagatcttta tggttattat gtctatgaaa aggaagcata taatgttata gatattttat 4740
gtctaaaccc acgtagctca ccagactagt tgtctgacgt atttattttt atgccatgta 4800
tttcaggtta tacacgagga tagactgatg atcgatagaa gctagatgtt acgacggata 4860
gacggagtgg agctttcaag ttctattgta atgatcttac cgtaaattct tatttgcttt 4920
gctatggttg ctgtttgata tataattggt aacacccgag aattgtttta tatatattca 4980
aaaagttttt atttgggacg gtttttgtaa acatgaccaa gtgtcatgaa atatttttaa 5040
aaccatagcg tttttaaaac gataaaatga ggggtgttac agatgcgata atatatctta 5100
ggattatgtc aaatatttat gccaattata catgagagag caagtttata agagttttag 5160
ttattctatc attggatcaa tatagatacg tattaatagt agacagagat gcatgaatat 5220
tatagcagag aactttttgc aaaacctaac ctcactgcat gttgcattca tcaaccccac 5280
ttgtagttgt aacaccatga atatgccaat taagaaatat catgaggtat attgtactgg 5340
aaatgacaaa aagtactaat ttacaataga acgcagtcaa acttggttat tttgtaaatt 5400
ttaagaagca atttacaaaa aataaaacat aataaagaaa aacataacag taaatcacag 5460
acattgctca tggaagagtg actgatcaaa ctgaccgttt attttcttgt ttcttgtaca 5520
actaccaaac gttcctgtat aaccaccaaa tagtcccaga ctttagaaaa tagaacagaa 5580
aaccacagat atacatacat acagccatac attataattt ttaattgaaa aaaatgcata 5640
gaaaaccagt ctcaaataaa gaaccaaata aagaagatac aaatgaaacc tggttatcga 5700
ataaaagagt tagagataat gatttcagca tttgcactca tgtaaacgat atgccattgg 5760
gatccgttgg aaagggtatc gtgaagtgat taaggagaag cggggtgtta gggttttttt 5820
tgcagtttat tgaacaggtt gatcaaattt tgcgccggta gggttaattc cttttcgaac 5880
gggtttctat ctgggtcttt catcaaaatc actcatgttt gtgtctctaa cctttagttg 5940
cagatggata tcagatcaac ggtttcaggc taaatggggg aacaaataac aagaagaaag 6000
cggtgacatc tgtgttcgta ttcgtatggt ggaaggggaa gagtggcgta tgaattggtc 6060
aatgtaaaac atctggaaac aacttctccc aacatgtaaa aggatccgga aaatatgaaa 6120
atgacgatta gagatttcgt tcggatattg ggaatatggt cgcgtctgat tgccctacgg 6180
tgcccaccgt ttgggtttct tgatttgtcg tttagataga tgtcggaggt ctaaattcac 6240
aatcctgttc ttccgcggta attgaaattg ggtaaggcta attgtttaga tcaaatggca 6300
gaggacgatg tgaagttgcg ttgccctata attggctctc gtgaaattga attgcaaatt 6360
tcacaacgat gttagcaaca ataatcgtcg ctctcgcatc ccataccgtc gcaacgtatg 6420
atggtgatcg agattgagag atttagggct agatgtggcg ttggcggaca taggttgtgg 6480
ttgacggaat gaggagaaga cgtgagcgtc gattgaggta gcaacaggcg gagggttaac 6540
ggtgtcatca tggtgaaagg tcgcgcgtcg ttttatggtc gatagatcat ggacgttgtg 6600
agtgaatgcc ggcgcaaaca cggtggagga aagtctatgc tttagttgac ggggcggttt 6660
tctctcggag acggaaagag gacgtcgaaa gaaaggccgg ttggagaaaa tatattaaac 6720
gcgccgacac acgctatcag agaagaccgg ttttcttata taataatgac taggtacgtg 6780
caagggtcgt gctaagcacg acccatggag gcttcttgag aaaattgtaa acacatatca 6840
gataatagcg acgaacttta ctgttattga tatataaagt gattaagcat ggttggccct 6900
aagttaaaac tcaaactact gtaagtatgt aatggtaata atttatcctt ttcagctatc 6960
gatcttagat tgctctgtag tgttgtgtct tagtgctttt cacggttctt ttatatgcat 7020
atagtcacat aaaatcagac acacacatag aataacccac agacaatcac ataaaaatca 7080
gtctgatgag gtattaattt aagcaataag gattgatatt caagcaatta gaggagaata 7140
atatattaat ttcacgtact cctattgtag ttattgtgac aaaacccaac tgtttaattg 7200
tgccattgca aaaagtccac ctgtttaatt tctttatcaa catgtcgttg catcctttta 7260
catgcaaata tttcagaaca tcttcctata atgacccttg agatgaactt tttagaaata 7320
ttgttgctgg ttacattatc agaaaaaaca gagcttatga aaaaagacca aacatagtaa 7380
ctcgtacttc atgtctggta gttcttttga atatttccgt cttttgttcg aaacaatttg 7440
gttgaactgt agtagatctt tcaaactgta tacaacttca caatatgttt tgtaagttca 7500
ttacttctag atcctttcaa aagaagaggt caaactcaaa atttgcataa accagattta 7560
ttgaaggcta attagattag tgttgtaggg ctttttggat ataaataaaa atgaaacata 7620
ggtgctgcaa caggtgcgaa agaatttggt tggacagtag taggtctttc aaactgtata 7680
caactttaca atatgttttg taagttcatt atttctagat cctttcaaaa aaaaggaggt 7740
caaactaaaa aaatttctaa accagattta ttgaaggctg attagattaa cattgcaggg 7800
ctttttggga ataaatataa atgaaagata ggtccaacag aaacgaagga ggtgtgaatt 7860
atgcaacaaa tggaaacaca caattatcgt agtacacatg taattaacag ggatcaattt 7920
ccatttattg ttccatcaat tgccaaattt aaaagataac aaatgcatcc tttttgaatg 7980
gaaaagtatg atacataaaa ccagagagag gtatacattt agtccagaaa cggtggaaat 8040
tactttacct agagttgcgt gaatcaaatg gaaaatcaga ggaagagacc ctaaatcgca 8100
atccatcttc tattccctat agaatcaaat ggaaatttct tacttccgac ctttttcatt 8160
tccacaagtt tgtaatcgat aagatcataa aagaaaaccg atttacatta gcaaatcttt 8220
aaggcacttg tttgtagttc tcaagtatgc gttacgtatg aaattctaga cagaaaaggg 8280
acgacaggga aaataatggt ggaataaata aacaatcaag aatcaaaaga taataatcct 8340
taaaactaac aaaaattcta tcaataagcc ctacaaatga gaaatatgac ggtggagact 8400
cacctgattg cagtggcgga agctcttggg ggctttggta ggccatggcc ccctgttttt 8460
tggaaaattt tcaaaaaaaa aaaaattata tatattatat cattgaataa gtctagactc 8520
aggaaactat gaaagattag aaatagatca agttatctaa atcaaatctc gaaaaatatg 8580
gaaggaatca aaacacaata tttatctcat tgtgaaatca aaaaccctat aaaaaacaca 8640
aatctaacct acaatttaaa tcaaaaacac cataaaaatc aacctaccgt cggattcagc 8700
cgtcgtcgtc ttcttcaccg gaccaccatc caccgccatt gcttcaatcg tgctttctcg 8760
tcaatagctt agtggcttgt tcagctttct tgctctacca atgattttta tacactttcc 8820
agcaccaccg atttgttgaa cggtaatatt atgctccttt atatttttga aatctttgaa 8880
agttcatctg gttttctgtc tctgtaaact gtaaagaaac ttttatgttt tgttaagaaa 8940
atagagagat agagaagaaa gagtattgac gtgcttttcc catatgtctc gaatgccaca 9000
ttaggaaaag acaaaaagaa aacaattagt acattacgct agtgtgatag tactgtatga 9060
ctattagtat gatttacagc tttaataggg attcatagaa aagaacaaaa taaactactt 9120
ataaattaaa aatcgagctt tatttttaat tagtttaaat aaatatttag ctataacata 9180
atatattata tgttttgtat ttataatcaa atataattat ttgtattaca gattagtttg 9240
tataatcaaa tataatgatt catgtttcga aaagattgtt taaatatttt tatatgccat 9300
gttttttaac tgaattatat ttttttgtat gattttcttt acaatttagt ttttctttac 9360
aatttagttt tggcccccct tgtttttttg tttgtgttcc gcccctgcct gattgatgcg 9420
agaaaaggaa agccgccgac atttgtgctt cttcccgcgt taagaaaaat cgcagatgac 9480
attacgattc tttttctaca gaggaatagg ggggttgcga ctttgcgtga tttgttgtta 9540
atgagtgatg cgtcgtccgt tttgatcggt agcccgtgga gactgattta tttgacagat 9600
agatgtcgtt ctcgttgatg atgcaggtgt aattggcggc gttggtgaag cgaagatggc 9660
atagggaatg gctttgcaga ggagaaaagg agtttcacaa atatggatta ttgaatcgtc 9720
gtttcagagt cgcgatggtt agtaatcgat ggatttgggt ttgcacctgt tcaaggggtg 9780
gtgacgtgtc ttactgtaag aaagagtcgc gatggttagt aatcgacgat ggatttgggt 9840
ttgcaacatc gttgacggaa acgacgcggc gatggagaga ggcggtagag ggaatgaaac 9900
gggagattta ccttcaaccg caaacatgtc ttcgttcctc gaaaatcata tgcgcccttt 9960
atgaaaattc cttcacgcgc cgtacacgcg ctcagaaaaa acatagggtt ttcttatata 10020
ataatgacta ggaacgttta tgcgccgtga taatcacggc ccatgagtgg tacaaatgtt 10080
gtaaaactta gaaaatggga aagttgaatg tacaatgtta tgatttattt tattcttcat 10140
agcacaatac ttttgcttta gtgaaagcag ttaaaaagtg gatgtgtcgt tagcaactat 10200
aaacttttaa caaaatatta catacagaac atagaaataa gataaacact aaaaaaatac 10260
aaaatagccg tgttcaacac ggcccacaga atgcaatttg gatatttcta aggaggtgta 10320
aaaaatattg ctattatggg agctaattct aggtatattt tgttactcac atgacatgaa 10380
tattgagtaa ttttgtaaaa ttggtaattt agcttagatt ttcccacaaa gatgagtgtt 10440
aaaactatca aggaggatat atggtacttc ctcaacaaag atgattttga aatatctata 10500
ttttaaatgt aagaactact atcacatgag acaaatattg atattactgg ttaggattac 10560
aacattgata tgtaaaatat tttggtaatg taaattttct aaaaaagctt ggaagtagaa 10620
tgcaacaaca atatatgcta gtattacatg ttgggtgatt ttatgaatgt acttacgtgt 10680
tgatccttat ttaccgtact tgaataattt tatctgatca atgctttacc tatatggcta 10740
tatctagcaa tgtgcattat tcacaaatta tggagtgtaa attcatatag acgtatatga 10800
cagtggatga aaaggaaaac aagtaatttg attgaatcac tgagaaaaaa gcaaaagata 10860
catgcatata aaatgttaca tcaaaataca gaagataaat gaaagaaaga taataatgtg 10920
gagcattcaa aataagtaag aatgtaagtc cttgatagct cgaaattctt ttaagtcttc 10980
cgtgatagcc taatgtttat aatagaagag acattcaaaa tgaataagaa ttatatcacc 11040
taacagtatt taatcctact ctacttggcc attgagcata ttgctattgt taaaaattat 11100
gtccaaatcg catttaactg ttagatgcaa ttctcattgc cgattacact tatatgtatg 11160
tagtaaatta taattaactc tttgtcctgg tcatttgatg tgtcatggat gtttgtaagg 11220
tacaaataat agattacaat aacttaaata taaaattgag ttaatattcc agaattcaca 11280
aaatgtgtaa taacacttat ttataatttc cacgtaatta atgattaact acttagaatc 11340
ctacaagttt ttgtttatca cctttcatat gatcgtataa atgcaacaac ccttaatgca 11400
tttatagttg ttggtctgcc acgaacacct ttttctgttg attatttgtc attattatgt 11460
taaaaaatgt ttgaaaaatg ttaaatggga ttttgttatg gcaaagagat gaacttctcc 11520
aatattgtag ttgcataaat attgccagtt ccatcataca gaataatacc tcttatattg 11580
ggcaatagaa ttatagaaac aataagggtt aaccgactta catgtattga tctctgattc 11640
ttctttacac actggacaaa ttagtctatc atgtcttgca caaccctgtt aaagaaaaca 11700
gtgaaaattg accacgaagg tgtatcctct agtaccaaca ttacatctat cattttaaaa 11760
gggaaatgta tacttatcat atatatctaa tggacgttgc ctttcctcca attgtcactc 11820
ttacatctaa tggaaattat gatcacaatt tacttttaac agcatagata cattcatttg 11880
ttggtaagac acttttggcg gattcattgt attaatcttt catgtaaaaa ttctcattca 11940
agatattagg tttttgttag aacccttgtt atttgaacat gcaacctgaa ttctgattgt 12000
tcccaacacc aacattaata atacctcttc cactagacca tcattccacc ttcaggccct 12060
tgtgttcatt attataagca ctattcggtt tagttctttt atgagtccta tatttacatc 12120
cttaaccatt ttaacaagtc catcatattg ggaattttaa tataaatacc caatgttatt 12180
catttttgtc gcttcagtag atattgacca tactaaagat gagtatttaa tactcataca 12240
acatgaaaga aaaaaatgaa aaactaacag tcacttatgt agccccaatc tccatacaaa 12300
tagcgcttta agaataaacc aatttcaggt gaaattgtag aaaggacata aatctgtaca 12360
tgaaaaaaca ttaacagtta cacataaatt atttgcacag agataaaaag cacaatatgt 12420
gatgagaaga tttaaaagta ggaaagtgaa caaaaataac catcaaaatc caatgttagt 12480
aataaagaaa atgtacgagc gattcataac attcatccaa aacccatatg cgatgttgaa 12540
tgcatatctg gataaaagaa tttaataaac aataagcgcc tgtaaaatca ataaacaaaa 12600
tcaataaaaa tagacctaaa aatgcaaccg acttattgtt tctatacacc aataaatgat 12660
tttcacgaat tttatccaaa gaaagataaa aagtcataaa attgaacggg cttaccgatt 12720
tgaatcgtgg tctgtatctg ccacgcagat cagataacaa tcataatcta catcaaagat 12780
ttcagaaaaa tatgaaactt ccgccattac taatttgata tgaatttctc agagcctaaa 12840
acaaacctaa attactaaaa atcaaacaca ggtttttgac gtttaccttg atttgtgaaa 12900
ataggcattt gggttttttc gtaggatttt ctatgaaaga agccatcaag tttatgacat 12960
tgtaaattaa agcaaagtat gaatatatga aggataggaa aagagatcgg attgtgatga 13020
tccggagaga aaaatacaca aaccagagag aagcgatgtt gtgattgtgg tgtattaatc 13080
tgtttttaaa cctctaacca cttcttgtaa gtccgtaatc agacgaaatg cgcttgaata 13140
ataagtcttt cacgccagtg tcgaggatta atgccgtcaa gggtggtggg gaggtattta 13200
taggaagaaa tgcggtggag gtgaatggag gcgtcgatca aacccaagag gaaacggttt 13260
gtcgaaatag atgcgttggt cattcgccat aagtttgtga aacggtgagt gtatccttgg 13320
cgtcgtttga aagtttgtga aacggtggcg atgctccgtt aaaggaccgg caacggatcg 13380
agcgatatgt aaatgggagg gcagaaatat tgcatacgcg ccggacacgc gcttatggaa 13440
gtgatagtat ggaagtgata ggattttctt atataataat gatataactt aattttaaat 13500
aacatcgtac tatacgtttc aaaataaatt agagttttaa taaaattacg gaatgattaa 13560
accaattaca aacaaatata agtgtcggtg atataaaatt tgtaacaacg aaaacatttc 13620
aaaaaatctg aatgcggaaa tccataacat gagaatacga ttcgtttgca gtcacgccgg 13680
tttcttcacc ttctgagggt cctgaaaaag gttaataaac aatgggtaag ctaaagttta 13740
gtgatcatac acattacttg tctattatat gagttagata cattcacata tcacatacat 13800
acaagcatac acatattaca aaaaatcctc acacatattg ttggtaccaa ctactattta 13860
gtggaccagg ttattcttgg gggtcaattg tggttaacca taaatgtttg gagtttaggt 13920
tccccttggg ggccgaccat aaacacccat atcatatctc tgtctaggtt ctctttgggg 13980
actgactata gacaactttg ctcagattct ccttggagga taaccatcct cgacgagatt 14040
aacaacggac caccactgtt ttcagcttgt aacctgcaac atcaatagtt gcgatcttcg 14100
gcgacaatga tgaaccaaca tcaacacaac agtagtgccg gtatgttagt cgttggataa 14160
tagaggcatc atctgaccct tttagcggtg acttttgttg cctatgaagg tcttatcagt 14220
tatatatcga ttaggcttgg ttctaggtta taagaaaaaa tgattctcta tccggtatga 14280
catagagaca aaccggtcta cttttataag aaaatcatat ttgaaacaat gtcgtgttaa 14340
taattaatat gtgtatgttt aaatttagaa tatcctgaac ttatatttag ttcgcaaccc 14400
tatgtaagat cgaactaatt ttaaaccgta accagacgtg catgtttgat cagtaataaa 14460
aaggctatca tcgtcgaaaa tattaaaaca aaatataata tcttatttgg cgccatttc 14519
<210> 8
<211> 684
<212> DNA
<213> Taraxacum officinale
<400> 8
atgtcaacgg ttaaaagcaa gttatcaacg cctccaaccg atcatttctc cggtaaccac 60
caactgctac taataaccgc caccgcaaaa acctatatat acaacttcca tcacaattct 120
gtcccctact cccatttcaa tccaaaaaag gctacacaga catatacagc gatggcagat 180
aatggcaaca ccggccgtca aaaggatgac gacggtggcc atgatggggg acgcccaaat 240
ccgaccaccc caccctcccc ttcccgcacc ccgcgaagac ccaggcggac cacatcgccg 300
cctaaacatt ctccgggggc gtcttcaagc accatgccag cgccgcctac tccccctgcg 360
ccgacgggaa tcaccggtgc gtctagttct tctgtgggta ctaatataat ttcatttact 420
ccacccaaaa ccaaaagaac gaagtcggtg atttgtccga tctgtaagaa agatatgtgc 480
catgagaagg cgctgtgtgg ccacatccgg tggcatactc aggaagaaag attggcggcc 540
agcattgcta tagcaagagc gctatcttct aacgttgttg tttctggcaa tggcgatgaa 600
gatgaaggtc catctaaaaa gtataaactc ccggacctga acaagtcacc accgccggag 660
gaggaggacg aggacgctgc ctga 684
<210> 9
<211> 4521
<212> DNA
<213> Taraxacum officinale
<400> 9
ttttcttgcg ggagaggcat gtatgtgtgg cctttttgca ataatactat gcatgggaga 60
tgcataaagt ttatctttat tttgttttag tttaataatg tgtggcaaac tttatatcat 120
ttatgatttc ggccatgtac tgctacatcg ttctaggatg gttattccct agaatttgct 180
tttatatatt ttttttcttc gttaattctt ctcttccttt aacgttattt catgtgaatt 240
tgcgatatca tgatattgca ggaacgtaac ttagaactca acgataaaaa gtgtgttgag 300
atcgtggaag ttgatcgttt atcttgaatt cacaagataa gcaacatgag atagaataat 360
taattactgc ggagatttct ttttagattc atcttattcg ttgtaaattg caatgcaaat 420
ttttaagtag aataacgaaa gcgtgttgtt atttacggtt aaatgcaaaa aatcattaac 480
atatctccat aattgatttg tttagtatgc attctcatgt gttctattgc aaaattctat 540
tttgaaattc aattaaagca atgcatttta gatataaagc aattccatca cttaattata 600
ttgggtagat ttttaccaaa tcactgtcct aaaagaaaaa taaaaaatga aagttcaatg 660
ccatagtgat cccgtcaatt atgtgatcaa tttttaccag agcaaaaccc caaaagttaa 720
agagtataat tgcagaacga caacaatctg aggatgatac taactccggt ataaaccgaa 780
tgcttttgtg gggatttcac taatcaacta tttggctctc atcacaaggc cgtgttaatg 840
gattactatt agttataagg ccatcccaag ttgtttggct atattattac cttttaaaaa 900
ccaaaatgtg taaactgtaa aattacactt ttggttcttg tattttctaa tttttagaat 960
tatgtatttg gttcttgtag tttttttatt tgtatgaatc atattagttt tggtccacga 1020
taacttttat tttctataat tacacttttg gtcattgtag ttttaatttg caagaaaaaa 1080
ataatctatc tttttagtcc atatatatag tttgcaatat tctatatttt aggttcaggt 1140
tatatatctt ttacaaaaat actacttatg attttttaat gaatatatca tatttcgtaa 1200
attacataaa cattttatat aattttattt agtcagaact ataggattcg catgataact 1260
ttgctgaact taattgggct tcatttttaa caaaggataa tgcatcatgc atgacataaa 1320
aatttgtaat gtttctaatg tgcatgcact acaagaacct gacccttcat atacattaat 1380
gaatgattct cttttcttat tatatcttag caaacggttt ggataagagt ctgaacaata 1440
ttaagaattg cactagctag ctagtccatg cagcaagcaa attaattaga ggacttttta 1500
agaggcttga tcacttcatt gtatatctaa tggcactgtg gatatatgat tggattgtgt 1560
gtatgtatgg aatttaatat tactaaaaaa tattaatgac aaacaataac acactaattt 1620
ataacttaca aaagcgtgtg tcattaaaga aaatgtcatg tttcttaaaa tatggagaat 1680
ttactactta cataattatg tgtcataaat ttatgtcatc ttgtgtgata tttatgactt 1740
acaaaaatgt atgttatgtt tatcgtcata aaatctgtaa aaaaaaatag aaacatggag 1800
gatactttca aggtgtagaa acttgacagc ataaacgggt ttattacctt catcaaaact 1860
tatcttactt caatctcttg gagatgcagg ttgattttaa tgctaaatga acttttcaaa 1920
tgtataaata tatatctttt gacggatttg acattgatgg agatgaagat acaccagtga 1980
attcaccttt caatgatcat actgacatac caagtactct tatcccctct ccacctccac 2040
agaacgaacc tcaatttcaa aaacgtaact gccgctgttc taaaaacaga aaattttcaa 2100
aaacgtaact atcatttaaa tatttaatca tttttcaatt ggattcatgc tgtaatagaa 2160
gttactggac tttaaacttc ttgtagctga tgagattcat gaacaacagt ccaaggagat 2220
tttccaaatc aacaagtttc tgatgagaac aaggtaaaaa aaataagttt ttcatttaaa 2280
catatgattt tggttttcaa aagataatta attataggaa ctcttctgaa aagtcccaaa 2340
gtttacccgt aaaattgatt ttggtttttt tttaaattga ataaaaaagt ccataaaatt 2400
ggataaatta ttcgatttag cccaatttac ctagtatatc tggtaaaaat tggttaaatc 2460
gaataattta ggcagtttgt tgggcttttt tgcgcaaaaa cattattttg ggacttaatc 2520
gttaattttc cccaagtttc agtttattta cagtattgga ataaaaccga acctagtgcg 2580
ctaattttgt cttttggtgt ttagaattat ttgggtttat tggtctcggt ttctaaacga 2640
gttcggtttt tggtttcttg attcgatttt tggcttttgg gttcaaccca tggattttcg 2700
atttggtttt ggttttgata atattttttg tgcaatcgtt caaaaaatcc gagttagatt 2760
gggtttaaat gttatcaaaa ccaaaaccga tggtagaacc ccaaaactga acccaatcga 2820
aaatccatgg gttgaacctc aaaaacgaac ccaataaatt ctaaaaacca aaatccaaaa 2880
ttagcggata aaaattttaa aatacatatc tactggtaag gtgtttttga caatttatgt 2940
aaattataga aaaaaatgta ttaagtgttt gctatttaag ataaaaatgg cgttaaaaat 3000
agaattggtt agaaatgaac cattttttta tattttttac ttcatttatt aagtaaatag 3060
tagaggtgaa ttagagatga tctaagatat tttttttctt tcaaaaagag cttcgaaaac 3120
acttttccga cagaaacaag acacaaacct ttttactcgt agaccgacga tttttttaaa 3180
gatcaaagac ctaagaagat ttgtctccca tcttcttaaa acatatgtga gatagacact 3240
tctagcctct tctatgctaa aaaaaagagc tcgcctttag tttggttaat ttgagacaat 3300
ggtctccaca aaaacatagg tagttaggta ctcacgcgcc aagttactaa tctcaaatca 3360
aacataactg tatgatcgtc aacacatttt acaagttaac aaaagagcat tgctttagac 3420
ttaaaaattg ctttgagaaa aaacaaacac ctaagaattt ctaaaagcga tgatttcaac 3480
tctctttaaa atgtatatat atgttacatt ttggtcttta aacttttcaa gaaagtacaa 3540
ttcaactcct attttcaaaa tgttcttaca tgagcgatat gattttaccg tttaaaatgt 3600
aaaccatgat aactatttct aaattccaat ttttgtttcg ttgatcaatc tcattatcat 3660
tcaatgcata caaaacacaa tacaatctgt tttgtcatct tcttcaaggc cgaaagacaa 3720
ctaaacatat gaagactgaa gaggacaatc tagcaaactc aaacttcact ataaatttgc 3780
aattgctatt ggtagccatg aagtaacatt tttgaggagg ttaacaaaat tttaacagta 3840
aattcaataa tccatcacca cgatatgtaa tcatctacac aaacacagat gatgatagtc 3900
atatatgttc gtaatcacac aagcaagaaa tcgcaatgta ctttacaccg tcttctctga 3960
cttgaacacg ggaattggtt gtctaagaag tagattgttt cccacggatt taccaagtac 4020
atttaaatcc ttcacccttt gtatctctct tcctgttttt tgttttgcaa tcaacaaaaa 4080
aaaaagtaaa aatcccatct taaattcacg caaaaaaaca cattgaatca accatcacta 4140
tagtagtttc aagaaaaatc tgcacttcca taatttcttt ctattacacc attatactag 4200
gaaaacttca tagcaatatt atctaaatac aaagcaattt ttactagtaa tattcgtaga 4260
tttgtcaata tatagtgtcc taataaagaa aaaataacgg aactataatg ctctaatagg 4320
tagatttttt ttagtataat gtcctaataa gagaaaaaac aaatgtacaa ttatgtaata 4380
ataagaaaag aaagtaatat gcttaataga caaataaatg aaaccatgtt gctatttctt 4440
gcatctagtc cttatttgaa taatatgtag catattaact acttatgaat tttatatata 4500
aatgataaaa aattccgtga g 4521
<210> 10
<211> 19724
<212> DNA
<213> Taraxacum officinale
<400> 10
ctgacttggc caacattttt tgttcttccg atcccttcgt aacaatcagt ttaagcacaa 60
ttgaattata tggagataaa taggtgaaat ttggaagacg aggatgggag agtgcgaaga 120
gccaaagaag agaaatgtgg gatagcggcc ggccggttgt taatagaagt gcttagatct 180
tggagacctt ctaatgctta tggaggaacc agatgcttca atttgtaaat ctgcgctgcc 240
cacgtagaat attgaaaaag aaaatcaaat cgatcaataa tgcgaccata tactttagga 300
tttcccactt gtataattct cttattcatt ttcaaatctt tatctaaatt aaggatatcg 360
gcaaaaatat aatcctaatt gtttttcaaa atgataagga ttataaggta acttaattct 420
tgttttattc atatttaatt attattgttt tttatcaatg ttttaaaacc cgggttttga 480
gtcaacccgg tcttgtgaaa aatcccgggt cagccggtca gctgatctac cggttcaata 540
tatttaaata aaatataaat tttcatatag aatttgagtt ttaggctaag aaaatcgggt 600
tttgggctaa ggaaaatcgg gtttaagttt tgggctaatg gattttcggg tcaataacgt 660
ttttttccgt tttttagatc ggttcgaccg cgttttgtgt gaaacccggc cgggttgatc 720
cgagtcaata attggcaaca acccggtata tgttgacccg ctcttgtccc cgggtcccgg 780
ttcaaccggt tggatcggcc gggttgaccc tggttttaaa acactgtttt ttatacaata 840
tatttgtttt tgtttttagt tttgtttttg tttttgattt tgtagatata tttttaattt 900
tatttttatt ttgtataaat atagtcatta caaccgatta tttgtaagtt gagtcggtca 960
aaacgaactt tctgataatt cttatacatt tttcggcgaa acatgaatat tttgatcaac 1020
caatatgctt ttttctaggt tttttaaata aaccgcacgt tcaattgcat attcgcaaac 1080
aatagaactc gaaaacccta atcgagcttg ttttatagaa atctgggttg agtgcataca 1140
taataattaa taactgtgaa aaagtttgtt ttaacatgct aaacctatcg atagtcggtt 1200
ataataatta tatgtaaaca aaatcagaaa caataatgat atatgtcacc caaaaaaata 1260
gttactaaat atatacaaaa tcaaaaacaa cagtaatttc ttttacaaaa aaaagagaac 1320
aatagtgact aactttagaa agaaaaaaaa agaactaaat tactcttata aatcattatc 1380
ttttatataa attggtaaat tggtcatgta atctagaatg tgaattgcgg aatgctttag 1440
tcacattttg aacaaactgg taattattaa tttcgataaa agttcttcaa gaatagtttg 1500
gtcacatttt ggacgacaat ggtgtgtttt ccatagtaag caatacgtaa tgagttcgct 1560
taataggaaa atagatctaa agcttaatga aatcatatgt ataagtaaca tatatttttc 1620
acacgttaca ttgtttgtaa cgtcctcaat ttttttaata tatataacta ggtacactct 1680
aaggtcgtgc taagcacgac ccacgaatgg taatttaggt aatttttcat ccttgactaa 1740
aatacattat gctaataaca aagaattaag aatacaatgc tataatgcat aagtaaataa 1800
aagtacatga tatttctcac atttagtctt tatacataga aaacttacac tggccatttg 1860
caaaaaaaca ttaaatctcc ctaaaaagta gagtttacaa aatgaaagct tgtttttata 1920
gcaaacaata atcaatatgt gaagctatag tatagtaacc tactcatttc aacttttagg 1980
cagtgcagta attacttact catgttaatg gtgaaatgca ttaagataaa cttcattcaa 2040
cggattaaat ctgggttcat tataaatgta ctcttagtta ctcctccatg taactgcatt 2100
tagcgaacaa caaaagctct aataaataat atgaaacaca tgctaattta taaatgacat 2160
catgggtata gatgctgtaa catcctaaac ttttaaaata aataataaat catatttggg 2220
atttaaagta atattttaag ataattgata aataagagaa tgaaatacaa agaggcattt 2280
tatttttagc ctttgattta taaaaaagaa aaaaccttga aattggatgt attttgaaat 2340
gggtaagtat tttaaaagat gtgtaagtta agggggataa atggaaatta aggagataag 2400
catttgacca aagtcaaaat agaaggaaca ataagtcggt cgattgtttt cctgtgtgca 2460
tcttcggacg acagagagac agaaaagaac gagcgagaga cagagaggaa tcgagacaga 2520
gagattatcg agagagagac agcgaagtcg ggagagggag accgagaacg accgagacag 2580
gaggaaaacc gagagacaag gggaggacga ggcagcagca gcctaggctg ctgcgttttt 2640
ggcgacagaa aaccaccgcc agcggcggtg gtggtgagcg acggtggtgg tggagccgag 2700
aaggggttgt ggtggtgtta gaagtgatgg ttcatctcaa tttcttgata atttgccctt 2760
ttggaacaat aaattgaagg taactttcaa agctttagat gattatctct tgaaagtaga 2820
aagcaagggt aatttagtct tcaattatgt tatggagaag ggtaataaca cccaaatgct 2880
aacaaaatca tatagattaa tgtgatttga agttatatag ttcatgaatg tgaaggttga 2940
ctttctgcaa tggtcaaaca tggacatgga catgattata gcatattagc aatgtaatag 3000
gaatggaatc accaattcca ttgttgaaaa tagaaaattt gatgtgtgca gaattttgta 3060
aaatttccca aaacaccaac tttaaggctg cataagtcat gcatgaagaa tgcaaatcag 3120
tccattcttt cgcctaacat caagtccttg caacatagat tacacaggaa aaagaaacag 3180
ccaaatccga gttcgtatga ggattgtatg actgttcaac gtttgtcaaa agttgctgtc 3240
atgctgtcaa accagaattt ttctaagtct gggaaatatg cagaaaatgg gtttgaccag 3300
tttttggagc ttcataactt gatttataca tatccaaatc agttgattct tgagcctaaa 3360
ctgtagagaa agatgaggag aaggcatagg aaaaagaatc aacacatttg gatatcgtat 3420
acaacctgtg caaagggttg aagtaggctc aaaacccatt tttgacataa ttgtcaatta 3480
tatgaattgt gggtaacttt tgccgtaatg aaatgttttg acatataagt gtttatattg 3540
acttataaac atgttaagac tataaacttg ataaagtaac atgtcaaaac ccgaaaatgc 3600
ctatttaggc aaagtatgat gcttaattga gaaatcggtc aaatagcata aaaactaaaa 3660
gtgttctaaa tggtccaaga agactttata cataacttac acatcattag cacatgatgt 3720
gtagtacatg tgaggtttga acacttttat acttggaaaa ttgtcaagta gtcaaaaatg 3780
ggacaaaagg gtaaaattgt ccaaaatgag tatatggcta attaaagcaa gttgagctac 3840
tgaaatgaac ttagataagt attataagga ctataaaagt ataatacttg gttaactatg 3900
agttttgaag gtaatgtcaa tttaaagtaa gttaaccaaa agaaagtaag ttgctaattt 3960
tgggatatat gacccaaatg agttatgcat tggtttttag gttgtgtaat acctataatg 4020
agatatgaat tgattatgag acatgtattg atgataatac aaatgatgta atgaaatagg 4080
ttcgttgcct atcgtggagc aaggagcatg cggattagtg tagctagtct tacctagcta 4140
ctaaggtgag tacgtgtgga ttgttttccc attttcgggt acatggaaaa ataatatttt 4200
tataatgaag tgcctaatgt tttgaaagaa agaatgaatg aaaatacttg atgcttttga 4260
aagaatgttt taaaagaaag taatgttttg aaagaaaaag gtttgatgct ttacgtttga 4320
aaatgaatat gtcttgatat taatgaatgg aatgggtaaa gcatgaatga tataatatgt 4380
aataataaga tgctaaggat ggttatgttt atgatgttca cgtgaatata agaatgttgc 4440
tcgatctaag atgtcccggg tagggattca gaggagccta tcggggtggt acctcccctt 4500
cgcgagatag gttacctaat gtaaatgatg tcaatgtaat ctgatttgtt ctttttgcat 4560
tggtacagac ttggggtata tcagacccaa gtataatatg atatggccat atgataagat 4620
gattaaaaga gtatgtgaaa tgttaaaggt tatgtaaaat gttatatgaa attattcaaa 4680
gagatcttta tggttattat gtctatgaaa aggaagcata taatgttata gatattttat 4740
gtctaaaccc acgtagctca ccagactagt tgtctgacgt atttattttt atgccatgta 4800
tttcaggtta tacacgagga tagactgatg atcgatagaa gctagatgtt acgacggata 4860
gacggagtgg agctttcaag ttctattgta atgatcttac cgtaaattct tatttgcttt 4920
gctatggttg ctgtttgata tataattggt aacacccgag aattgtttta tatatattca 4980
aaaagttttt atttgggacg gtttttgtaa acatgaccaa gtgtcatgaa atatttttaa 5040
aaccatagcg tttttaaaac gataaaatga ggggtgttac agatgcgata atatatctta 5100
ggattatgtc aaatatttat gccaattata catgagagag caagtttata agagttttag 5160
ttattctatc attggatcaa tatagatacg tattaatagt agacagagat gcatgaatat 5220
tatagcagag aactttttgc aaaacctaac ctcactgcat gttgcattca tcaaccccac 5280
ttgtagttgt aacaccatga atatgccaat taagaaatat catgaggtat attgtactgg 5340
aaatgacaaa aagtactaat ttacaataga acgcagtcaa acttggttat tttgtaaatt 5400
ttaagaagca atttacaaaa aataaaacat aataaagaaa aacataacag taaatcacag 5460
acattgctca tggaagagtg actgatcaaa ctgaccgttt attttcttgt ttcttgtaca 5520
actaccaaac gttcctgtat aaccaccaaa tagtcccaga ctttagaaaa tagaacagaa 5580
aaccacagat atacatacat acagccatac attataattt ttaattgaaa aaaatgcata 5640
gaaaaccagt ctcaaataaa gaaccaaata aagaagatac aaatgaaacc tggttatcga 5700
ataaaagagt tagagataat gatttcagca tttgcactca tgtaaacgat atgccattgg 5760
gatccgttgg aaagggtatc gtgaagtgat taaggagaag cggggtgtta gggttttttt 5820
tgcagtttat tgaacaggtt gatcaaattt tgcgccggta gggttaattc cttttcgaac 5880
gggtttctat ctgggtcttt catcaaaatc actcatgttt gtgtctctaa cctttagttg 5940
cagatggata tcagatcaac ggtttcaggc taaatggggg aacaaataac aagaagaaag 6000
cggtgacatc tgtgttcgta ttcgtatggt ggaaggggaa gagtggcgta tgaattggtc 6060
aatgtaaaac atctggaaac aacttctccc aacatgtaaa aggatccgga aaatatgaaa 6120
atgacgatta gagatttcgt tcggatattg ggaatatggt cgcgtctgat tgccctacgg 6180
tgcccaccgt ttgggtttct tgatttgtcg tttagataga tgtcggaggt ctaaattcac 6240
aatcctgttc ttccgcggta attgaaattg ggtaaggcta attgtttaga tcaaatggca 6300
gaggacgatg tgaagttgcg ttgccctata attggctctc gtgaaattga attgcaaatt 6360
tcacaacgat gttagcaaca ataatcgtcg ctctcgcatc ccataccgtc gcaacgtatg 6420
atggtgatcg agattgagag atttagggct agatgtggcg ttggcggaca taggttgtgg 6480
ttgacggaat gaggagaaga cgtgagcgtc gattgaggta gcaacaggcg gagggttaac 6540
ggtgtcatca tggtgaaagg tcgcgcgtcg ttttatggtc gatagatcat ggacgttgtg 6600
agtgaatgcc ggcgcaaaca cggtggagga aagtctatgc tttagttgac ggggcggttt 6660
tctctcggag acggaaagag gacgtcgaaa gaaaggccgg ttggagaaaa tatattaaac 6720
gcgccgacac acgctatcag agaagaccgg ttttcttata taataatgac taggtacgtg 6780
caagggtcgt gctaagcacg acccatggag gcttcttgag aaaattgtaa acacatatca 6840
gataatagcg acgaacttta ctgttattga tatataaagt gattaagcat ggttggccct 6900
aagttaaaac tcaaactact gtaagtatgt aatggtaata atttatcctt ttcagctatc 6960
gatcttagat tgctctgtag tgttgtgtct tagtgctttt cacggttctt ttatatgcat 7020
atagtcacat aaaatcagac acacacatag aataacccac agacaatcac ataaaaatca 7080
gtctgatgag gtattaattt aagcaataag gattgatatt caagcaatta gaggagaata 7140
atatattaat ttcacgtact cctattgtag ttattgtgac aaaacccaac tgtttaattg 7200
tgccattgca aaaagtccac ctgtttaatt tctttatcaa catgtcgttg catcctttta 7260
catgcaaata tttcagaaca tcttcctata atgacccttg agatgaactt tttagaaata 7320
ttgttgctgg ttacattatc agaaaaaaca gagcttatga aaaaagacca aacatagtaa 7380
ctcgtacttc atgtctggta gttcttttga atatttccgt cttttgttcg aaacaatttg 7440
gttgaactgt agtagatctt tcaaactgta tacaacttca caatatgttt tgtaagttca 7500
ttacttctag atcctttcaa aagaagaggt caaactcaaa atttgcataa accagattta 7560
ttgaaggcta attagattag tgttgtaggg ctttttggat ataaataaaa atgaaacata 7620
ggtgctgcaa caggtgcgaa agaatttggt tggacagtag taggtctttc aaactgtata 7680
caactttaca atatgttttg taagttcatt atttctagat cctttcaaaa aaaaggaggt 7740
caaactaaaa aaatttctaa accagattta ttgaaggctg attagattaa cattgcaggg 7800
ctttttggga ataaatataa atgaaagata ggtccaacag aaacgaagga ggtgtgaatt 7860
atgcaacaaa tggaaacaca caattatcgt agtacacatg taattaacag ggatcaattt 7920
ccatttattg ttccatcaat tgccaaattt aaaagataac aaatgcatcc tttttgaatg 7980
gaaaagtatg atacataaaa ccagagagag gtatacattt agtccagaaa cggtggaaat 8040
tactttacct agagttgcgt gaatcaaatg gaaaatcaga ggaagagacc ctaaatcgca 8100
atccatcttc tattccctat agaatcaaat ggaaatttct tacttccgac ctttttcatt 8160
tccacaagtt tgtaatcgat aagatcataa aagaaaaccg atttacatta gcaaatcttt 8220
aaggcacttg tttgtagttc tcaagtatgc gttacgtatg aaattctaga cagaaaaggg 8280
acgacaggga aaataatggt ggaataaata aacaatcaag aatcaaaaga taataatcct 8340
taaaactaac aaaaattcta tcaataagcc ctacaaatga gaaatatgac ggtggagact 8400
cacctgattg cagtggcgga agctcttggg ggctttggta ggccatggcc ccctgttttt 8460
tggaaaattt tcaaaaaaaa aaaaattata tatattatat cattgaataa gtctagactc 8520
aggaaactat gaaagattag aaatagatca agttatctaa atcaaatctc gaaaaatatg 8580
gaaggaatca aaacacaata tttatctcat tgtgaaatca aaaaccctat aaaaaacaca 8640
aatctaacct acaatttaaa tcaaaaacac cataaaaatc aacctaccgt cggattcagc 8700
cgtcgtcgtc ttcttcaccg gaccaccatc caccgccatt gcttcaatcg tgctttctcg 8760
tcaatagctt agtggcttgt tcagctttct tgctctacca atgattttta tacactttcc 8820
agcaccaccg atttgttgaa cggtaatatt atgctccttt atatttttga aatctttgaa 8880
agttcatctg gttttctgtc tctgtaaact gtaaagaaac ttttatgttt tgttaagaaa 8940
atagagagat agagaagaaa gagtattgac gtgcttttcc catatgtctc gaatgccaca 9000
ttaggaaaag acaaaaagaa aacaattagt acattacgct agtgtgatag tactgtatga 9060
ctattagtat gatttacagc tttaataggg attcatagaa aagaacaaaa taaactactt 9120
ataaattaaa aatcgagctt tatttttaat tagtttaaat aaatatttag ctataacata 9180
atatattata tgttttgtat ttataatcaa atataattat ttgtattaca gattagtttg 9240
tataatcaaa tataatgatt catgtttcga aaagattgtt taaatatttt tatatgccat 9300
gttttttaac tgaattatat ttttttgtat gattttcttt acaatttagt ttttctttac 9360
aatttagttt tggcccccct tgtttttttg tttgtgttcc gcccctgcct gattgatgcg 9420
agaaaaggaa agccgccgac atttgtgctt cttcccgcgt taagaaaaat cgcagatgac 9480
attacgattc tttttctaca gaggaatagg ggggttgcga ctttgcgtga tttgttgtta 9540
atgagtgatg cgtcgtccgt tttgatcggt agcccgtgga gactgattta tttgacagat 9600
agatgtcgtt ctcgttgatg atgcaggtgt aattggcggc gttggtgaag cgaagatggc 9660
atagggaatg gctttgcaga ggagaaaagg agtttcacaa atatggatta ttgaatcgtc 9720
gtttcagagt cgcgatggtt agtaatcgat ggatttgggt ttgcacctgt tcaaggggtg 9780
gtgacgtgtc ttactgtaag aaagagtcgc gatggttagt aatcgacgat ggatttgggt 9840
ttgcaacatc gttgacggaa acgacgcggc gatggagaga ggcggtagag ggaatgaaac 9900
gggagattta ccttcaaccg caaacatgtc ttcgttcctc gaaaatcata tgcgcccttt 9960
atgaaaattc cttcacgcgc cgtacacgcg ctcagaaaaa acatagggtt ttcttatata 10020
ataatgacta ggaacgttta tgcgccgtga taatcacggc ccatgagtgg tacaaatgtt 10080
gtaaaactta gaaaatggga aagttgaatg tacaatgtta tgatttattt tattcttcat 10140
agcacaatac ttttgcttta gtgaaagcag ttaaaaagtg gatgtgtcgt tagcaactat 10200
aaacttttaa caaaatatta catacagaac atagaaataa gataaacact aaaaaaatac 10260
aaaatagccg tgttcaacac ggcccacaga atgcaatttg gatatttcta aggaggtgta 10320
aaaaatattg ctattatggg agctaattct aggtatattt tgttactcac atgacatgaa 10380
tattgagtaa ttttgtaaaa ttggtaattt agcttagatt ttcccacaaa gatgagtgtt 10440
aaaactatca aggaggatat atggtacttc ctcaacaaag atgattttga aatatctata 10500
ttttaaatgt aagaactact atcacatgag acaaatattg atattactgg ttaggattac 10560
aacattgata tgtaaaatat tttggtaatg taaattttct aaaaaagctt ggaagtagaa 10620
tgcaacaaca atatatgcta gtattacatg ttgggtgatt ttatgaatgt acttacgtgt 10680
tgatccttat ttaccgtact tgaataattt tatctgatca atgctttacc tatatggcta 10740
tatctagcaa tgtgcattat tcacaaatta tggagtgtaa attcatatag acgtatatga 10800
cagtggatga aaaggaaaac aagtaatttg attgaatcac tgagaaaaaa gcaaaagata 10860
catgcatata aaatgttaca tcaaaataca gaagataaat gaaagaaaga taataatgtg 10920
gagcattcaa aataagtaag aatgtaagtc cttgatagct cgaaattctt ttaagtcttc 10980
cgtgatagcc taatgtttat aatagaagag acattcaaaa tgaataagaa ttatatcacc 11040
taacagtatt taatcctact ctacttggcc attgagcata ttgctattgt taaaaattat 11100
gtccaaatcg catttaactg ttagatgcaa ttctcattgc cgattacact tatatgtatg 11160
tagtaaatta taattaactc tttgtcctgg tcatttgatg tgtcatggat gtttgtaagg 11220
tacaaataat agattacaat aacttaaata taaaattgag ttaatattcc agaattcaca 11280
aaatgtgtaa taacacttat ttataatttc cacgtaatta atgattaact acttagaatc 11340
ctacaagttt ttgtttatca cctttcatat gatcgtataa atgcaacaac ccttaatgca 11400
tttatagttg ttggtctgcc acgaacacct ttttctgttg attatttgtc attattatgt 11460
taaaaaatgt ttgaaaaatg ttaaatggga ttttgttatg gcaaagagat gaacttctcc 11520
aatattgtag ttgcataaat attgccagtt ccatcataca gaataatacc tcttatattg 11580
ggcaatagaa ttatagaaac aataagggtt aaccgactta catgtattga tctctgattc 11640
ttctttacac actggacaaa ttagtctatc atgtcttgca caaccctgtt aaagaaaaca 11700
gtgaaaattg accacgaagg tgtatcctct agtaccaaca ttacatctat cattttaaaa 11760
gggaaatgta tacttatcat atatatctaa tggacgttgc ctttcctcca attgtcactc 11820
ttacatctaa tggaaattat gatcacaatt tacttttaac agcatagata cattcatttg 11880
ttggtaagac acttttggcg gattcattgt attaatcttt catgtaaaaa ttctcattca 11940
agatattagg tttttgttag aacccttgtt atttgaacat gcaacctgaa ttctgattgt 12000
tcccaacacc aacattaata atacctcttc cactagacca tcattccacc ttcaggccct 12060
tgtgttcatt attataagca ctattcggtt tagttctttt atgagtccta tatttacatc 12120
cttaaccatt ttaacaagtc catcatattg ggaattttaa tataaatacc caatgttatt 12180
catttttgtc gcttcagtag atattgacca tactaaagat gagtatttaa tactcataca 12240
acatgaaaga aaaaaatgaa aaactaacag tcacttatgt agccccaatc tccatacaaa 12300
tagcgcttta agaataaacc aatttcaggt gaaattgtag aaaggacata aatctgtaca 12360
tgaaaaaaca ttaacagtta cacataaatt atttgcacag agataaaaag cacaatatgt 12420
gatgagaaga tttaaaagta ggaaagtgaa caaaaataac catcaaaatc caatgttagt 12480
aataaagaaa atgtacgagc gattcataac attcatccaa aacccatatg cgatgttgaa 12540
tgcatatctg gataaaagaa tttaataaac aataagcgcc tgtaaaatca ataaacaaaa 12600
tcaataaaaa tagacctaaa aatgcaaccg acttattgtt tctatacacc aataaatgat 12660
tttcacgaat tttatccaaa gaaagataaa aagtcataaa attgaacggg cttaccgatt 12720
tgaatcgtgg tctgtatctg ccacgcagat cagataacaa tcataatcta catcaaagat 12780
ttcagaaaaa tatgaaactt ccgccattac taatttgata tgaatttctc agagcctaaa 12840
acaaacctaa attactaaaa atcaaacaca ggtttttgac gtttaccttg atttgtgaaa 12900
ataggcattt gggttttttc gtaggatttt ctatgaaaga agccatcaag tttatgacat 12960
tgtaaattaa agcaaagtat gaatatatga aggataggaa aagagatcgg attgtgatga 13020
tccggagaga aaaatacaca aaccagagag aagcgatgtt gtgattgtgg tgtattaatc 13080
tgtttttaaa cctctaacca cttcttgtaa gtccgtaatc agacgaaatg cgcttgaata 13140
ataagtcttt cacgccagtg tcgaggatta atgccgtcaa gggtggtggg gaggtattta 13200
taggaagaaa tgcggtggag gtgaatggag gcgtcgatca aacccaagag gaaacggttt 13260
gtcgaaatag atgcgttggt cattcgccat aagtttgtga aacggtgagt gtatccttgg 13320
cgtcgtttga aagtttgtga aacggtggcg atgctccgtt aaaggaccgg caacggatcg 13380
agcgatatgt aaatgggagg gcagaaatat tgcatacgcg ccggacacgc gcttatggaa 13440
gtgatagtat ggaagtgata ggattttctt atataataat gatataactt aattttaaat 13500
aacatcgtac tatacgtttc aaaataaatt agagttttaa taaaattacg gaatgattaa 13560
accaattaca aacaaatata agtgtcggtg atataaaatt tgtaacaacg aaaacatttc 13620
aaaaaatctg aatgcggaaa tccataacat gagaatacga ttcgtttgca gtcacgccgg 13680
tttcttcacc ttctgagggt cctgaaaaag gttaataaac aatgggtaag ctaaagttta 13740
gtgatcatac acattacttg tctattatat gagttagata cattcacata tcacatacat 13800
acaagcatac acatattaca aaaaatcctc acacatattg ttggtaccaa ctactattta 13860
gtggaccagg ttattcttgg gggtcaattg tggttaacca taaatgtttg gagtttaggt 13920
tccccttggg ggccgaccat aaacacccat atcatatctc tgtctaggtt ctctttgggg 13980
actgactata gacaactttg ctcagattct ccttggagga taaccatcct cgacgagatt 14040
aacaacggac caccactgtt ttcagcttgt aacctgcaac atcaatagtt gcgatcttcg 14100
gcgacaatga tgaaccaaca tcaacacaac agtagtgccg gtatgttagt cgttggataa 14160
tagaggcatc atctgaccct tttagcggtg acttttgttg cctatgaagg tcttatcagt 14220
tatatatcga ttaggcttgg ttctaggtta taagaaaaaa tgattctcta tccggtatga 14280
catagagaca aaccggtcta cttttataag aaaatcatat ttgaaacaat gtcgtgttaa 14340
taattaatat gtgtatgttt aaatttagaa tatcctgaac ttatatttag ttcgcaaccc 14400
tatgtaagat cgaactaatt ttaaaccgta accagacgtg catgtttgat cagtaataaa 14460
aaggctatca tcgtcgaaaa tattaaaaca aaatataata tcttatttgg cgccatttca 14520
tgtcaacggt taaaagcaag ttatcaacgc ctccaaccga tcatttctcc ggtaaccacc 14580
aactgctact aataaccgcc accgcaaaaa cctatatata caacttccat cacaattctg 14640
tcccctactc ccatttcaat ccaaaaaagg ctacacagac atatacagcg atggcagata 14700
atggcaacac cggccgtcaa aaggatgacg acggtggcca tgatggggga cgcccaaatc 14760
cgaccacccc accctcccct tcccgcaccc cgcgaagacc caggcggacc acatcgccgc 14820
ctaaacattc tccgggggcg tcttcaagca ccatgccagc gccgcctact ccccctgcgc 14880
cgacgggaat caccggtgcg tctagttctt ctgtgggtac taatataatt tcatttactc 14940
cacccaaaac caaaagaacg aagtcggtga tttgtccgat ctgtaagaaa gatatgtgcc 15000
atgagaaggc gctgtgtggc cacatccggt ggcatactca ggaagaaaga ttggcggcca 15060
gcattgctat agcaagagcg ctatcttcta acgttgttgt ttctggcaat ggcgatgaag 15120
atgaaggtcc atctaaaaag tataaactcc cggacctgaa caagtcacca ccgccggagg 15180
aggaggacga ggacgctgcc tgattttctt gcgggagagg catgtatgtg tggccttttt 15240
gcaataatac tatgcatggg agatgcataa agtttatctt tattttgttt tagtttaata 15300
atgtgtggca aactttatat catttatgat ttcggccatg tactgctaca tcgttctagg 15360
atggttattc cctagaattt gcttttatat attttttttc ttcgttaatt cttctcttcc 15420
tttaacgtta tttcatgtga atttgcgata tcatgatatt gcaggaacgt aacttagaac 15480
tcaacgataa aaagtgtgtt gagatcgtgg aagttgatcg tttatcttga attcacaaga 15540
taagcaacat gagatagaat aattaattac tgcggagatt tctttttaga ttcatcttat 15600
tcgttgtaaa ttgcaatgca aatttttaag tagaataacg aaagcgtgtt gttatttacg 15660
gttaaatgca aaaaatcatt aacatatctc cataattgat ttgtttagta tgcattctca 15720
tgtgttctat tgcaaaattc tattttgaaa ttcaattaaa gcaatgcatt ttagatataa 15780
agcaattcca tcacttaatt atattgggta gatttttacc aaatcactgt cctaaaagaa 15840
aaataaaaaa tgaaagttca atgccatagt gatcccgtca attatgtgat caatttttac 15900
cagagcaaaa ccccaaaagt taaagagtat aattgcagaa cgacaacaat ctgaggatga 15960
tactaactcc ggtataaacc gaatgctttt gtggggattt cactaatcaa ctatttggct 16020
ctcatcacaa ggccgtgtta atggattact attagttata aggccatccc aagttgtttg 16080
gctatattat taccttttaa aaaccaaaat gtgtaaactg taaaattaca cttttggttc 16140
ttgtattttc taatttttag aattatgtat ttggttcttg tagttttttt atttgtatga 16200
atcatattag ttttggtcca cgataacttt tattttctat aattacactt ttggtcattg 16260
tagttttaat ttgcaagaaa aaaataatct atctttttag tccatatata tagtttgcaa 16320
tattctatat tttaggttca ggttatatat cttttacaaa aatactactt atgatttttt 16380
aatgaatata tcatatttcg taaattacat aaacatttta tataatttta tttagtcaga 16440
actataggat tcgcatgata actttgctga acttaattgg gcttcatttt taacaaagga 16500
taatgcatca tgcatgacat aaaaatttgt aatgtttcta atgtgcatgc actacaagaa 16560
cctgaccctt catatacatt aatgaatgat tctcttttct tattatatct tagcaaacgg 16620
tttggataag agtctgaaca atattaagaa ttgcactagc tagctagtcc atgcagcaag 16680
caaattaatt agaggacttt ttaagaggct tgatcacttc attgtatatc taatggcact 16740
gtggatatat gattggattg tgtgtatgta tggaatttaa tattactaaa aaatattaat 16800
gacaaacaat aacacactaa tttataactt acaaaagcgt gtgtcattaa agaaaatgtc 16860
atgtttctta aaatatggag aatttactac ttacataatt atgtgtcata aatttatgtc 16920
atcttgtgtg atatttatga cttacaaaaa tgtatgttat gtttatcgtc ataaaatctg 16980
taaaaaaaaa tagaaacatg gaggatactt tcaaggtgta gaaacttgac agcataaacg 17040
ggtttattac cttcatcaaa acttatctta cttcaatctc ttggagatgc aggttgattt 17100
taatgctaaa tgaacttttc aaatgtataa atatatatct tttgacggat ttgacattga 17160
tggagatgaa gatacaccag tgaattcacc tttcaatgat catactgaca taccaagtac 17220
tcttatcccc tctccacctc cacagaacga acctcaattt caaaaacgta actgccgctg 17280
ttctaaaaac agaaaatttt caaaaacgta actatcattt aaatatttaa tcatttttca 17340
attggattca tgctgtaata gaagttactg gactttaaac ttcttgtagc tgatgagatt 17400
catgaacaac agtccaagga gattttccaa atcaacaagt ttctgatgag aacaaggtaa 17460
aaaaaataag tttttcattt aaacatatga ttttggtttt caaaagataa ttaattatag 17520
gaactcttct gaaaagtccc aaagtttacc cgtaaaattg attttggttt ttttttaaat 17580
tgaataaaaa agtccataaa attggataaa ttattcgatt tagcccaatt tacctagtat 17640
atctggtaaa aattggttaa atcgaataat ttaggcagtt tgttgggctt ttttgcgcaa 17700
aaacattatt ttgggactta atcgttaatt ttccccaagt ttcagtttat ttacagtatt 17760
ggaataaaac cgaacctagt gcgctaattt tgtcttttgg tgtttagaat tatttgggtt 17820
tattggtctc ggtttctaaa cgagttcggt ttttggtttc ttgattcgat ttttggcttt 17880
tgggttcaac ccatggattt tcgatttggt tttggttttg ataatatttt ttgtgcaatc 17940
gttcaaaaaa tccgagttag attgggttta aatgttatca aaaccaaaac cgatggtaga 18000
accccaaaac tgaacccaat cgaaaatcca tgggttgaac ctcaaaaacg aacccaataa 18060
attctaaaaa ccaaaatcca aaattagcgg ataaaaattt taaaatacat atctactggt 18120
aaggtgtttt tgacaattta tgtaaattat agaaaaaaat gtattaagtg tttgctattt 18180
aagataaaaa tggcgttaaa aatagaattg gttagaaatg aaccattttt ttatattttt 18240
tacttcattt attaagtaaa tagtagaggt gaattagaga tgatctaaga tatttttttt 18300
ctttcaaaaa gagcttcgaa aacacttttc cgacagaaac aagacacaaa cctttttact 18360
cgtagaccga cgattttttt aaagatcaaa gacctaagaa gatttgtctc ccatcttctt 18420
aaaacatatg tgagatagac acttctagcc tcttctatgc taaaaaaaag agctcgcctt 18480
tagtttggtt aatttgagac aatggtctcc acaaaaacat aggtagttag gtactcacgc 18540
gccaagttac taatctcaaa tcaaacataa ctgtatgatc gtcaacacat tttacaagtt 18600
aacaaaagag cattgcttta gacttaaaaa ttgctttgag aaaaaacaaa cacctaagaa 18660
tttctaaaag cgatgatttc aactctcttt aaaatgtata tatatgttac attttggtct 18720
ttaaactttt caagaaagta caattcaact cctattttca aaatgttctt acatgagcga 18780
tatgatttta ccgtttaaaa tgtaaaccat gataactatt tctaaattcc aatttttgtt 18840
tcgttgatca atctcattat cattcaatgc atacaaaaca caatacaatc tgttttgtca 18900
tcttcttcaa ggccgaaaga caactaaaca tatgaagact gaagaggaca atctagcaaa 18960
ctcaaacttc actataaatt tgcaattgct attggtagcc atgaagtaac atttttgagg 19020
aggttaacaa aattttaaca gtaaattcaa taatccatca ccacgatatg taatcatcta 19080
cacaaacaca gatgatgata gtcatatatg ttcgtaatca cacaagcaag aaatcgcaat 19140
gtactttaca ccgtcttctc tgacttgaac acgggaattg gttgtctaag aagtagattg 19200
tttcccacgg atttaccaag tacatttaaa tccttcaccc tttgtatctc tcttcctgtt 19260
ttttgttttg caatcaacaa aaaaaaaagt aaaaatccca tcttaaattc acgcaaaaaa 19320
acacattgaa tcaaccatca ctatagtagt ttcaagaaaa atctgcactt ccataatttc 19380
tttctattac accattatac taggaaaact tcatagcaat attatctaaa tacaaagcaa 19440
tttttactag taatattcgt agatttgtca atatatagtg tcctaataaa gaaaaaataa 19500
cggaactata atgctctaat aggtagattt tttttagtat aatgtcctaa taagagaaaa 19560
aacaaatgta caattatgta ataataagaa aagaaagtaa tatgcttaat agacaaataa 19620
atgaaaccat gttgctattt cttgcatcta gtccttattt gaataatatg tagcatatta 19680
actacttatg aattttatat ataaatgata aaaaattccg tgag 19724
<210> 11
<211> 227
<212> PRT
<213> Taraxacum officinale
<400> 11
Met Ser Thr Val Lys Ser Lys Leu Ser Thr Pro Pro Thr Asp His Phe
1 5 10 15
Ser Gly Asn His Gln Leu Leu Leu Ile Thr Ala Thr Ala Lys Thr Tyr
20 25 30
Ile Tyr Asn Phe His His Asn Ser Val Pro Tyr Ser His Phe Asn Pro
35 40 45
Lys Lys Ala Thr Gln Thr Tyr Thr Ala Met Ala Asp Asn Gly Asn Thr
50 55 60
Gly Arg Gln Lys Asp Asp Asp Gly Gly His Asp Gly Gly Arg Pro Asn
65 70 75 80
Pro Thr Thr Pro Pro Ser Pro Ser Arg Thr Pro Arg Arg Pro Arg Arg
85 90 95
Thr Thr Ser Pro Pro Lys His Ser Pro Gly Ala Ser Ser Ser Thr Met
100 105 110
Pro Ala Pro Pro Thr Pro Pro Ala Pro Thr Gly Ile Thr Gly Ala Ser
115 120 125
Ser Ser Ser Leu Gly Thr Asn Ile Ile Ser Phe Thr Pro Pro Lys Thr
130 135 140
Lys Arg Thr Lys Ser Val Ile Cys Pro Ile Cys Lys Lys Asp Met Cys
145 150 155 160
His Glu Lys Ala Leu Cys Gly His Ile Arg Trp His Thr Gln Glu Glu
165 170 175
Arg Leu Ala Ala Ser Ile Ala Ile Ala Arg Ala Leu Ser Ser Asn Val
180 185 190
Val Val Ser Gly Asn Gly Asp Glu Asp Glu Gly Pro Ser Lys Lys Tyr
195 200 205
Lys Leu Pro Asp Leu Asn Lys Ser Pro Pro Pro Glu Glu Glu Asp Glu
210 215 220
Asp Ala Ala
225
<210> 12
<211> 3217
<212> DNA
<213> Taraxacum officinale
<400> 12
gttgaaagga aggatcggca gagaacaaga ttgagagagt tttatcgaag agaagagatg 60
gttgtgttga ttgacggcag agttcagcaa tggcagatat gcgtgtttaa agcgcagttt 120
gtggacagtt tgtccaaagg ccttcaagtg ggagattgtt gagatgaaga cccttttgac 180
caagtactta aatgtgattg gttgcatggg aaagagcttt acacttcatt ggttgaaaat 240
gaagcatgtt atttaatagt acgtctccac ttgttcttta tgaaggatga agacagccac 300
caagtcttta tgaatgtttc aaggagaaga caatgattag atgctgcctg ctcccttact 360
tcttcactat aaataggtgc ttaaggcacc tctcttctta caccaaacaa cacacaagtc 420
acagattaca aagattgaga gagttttcat tttctctcta gagtttgttt tgtcaaaagt 480
tttgtgtgca gattaattag ttgagagaca ctcctaatta atataaccac ttacacttgt 540
cattgattag cattctagtg tcagagagtt ctgagtgatt gtaacctttg tgtgatttat 600
atataaatct ctctcttgtt cgccagtgga cgtagctgat tatcctgatc agtgaaccac 660
ttaaaatatc gtgttgatat tatttatctg cagattattt taccagatag ttttattccg 720
caccgcaaag cataccgtcc attatttgtc agacgtacct actctcagct catcccagca 780
ggagttagac ctgcaggcag ccagccgtat ttcacaacag tgaattatgc aacaaatgga 840
aacacacaat tatcgtagta cacatgtaat taacagggat caatttccat ttattgttcc 900
atcaattgcc aaatttaaaa gataacaaat gcatcctttt tgaatggaaa agtatgatac 960
ataaaaccag agagaggtat acatttagtc cagaaacggt ggaaattact ttacctagag 1020
ttgcgtgaat caaatggaaa atcagaggaa gagaccctaa atcgcaatcc atcttctatt 1080
ccctatagaa tcaaatggaa atttcttact tccgaccttt ttcatttcca caagtttgta 1140
atcgataaga tcataaaaga aaaccgattt acattagcaa atctttaagg cagtttgtag 1200
ttctcaagta tgcgttacgt atgaaattct agacagaaaa gggacgacag ggaaaataat 1260
ggtggaataa ataaacaatc aagaatcaaa agataataat ccttaaaact aacaaaaatt 1320
ctatcaataa gccctacaaa tgagaaatat gacggtggag actcacctga ttgatgcgag 1380
aaaaggaaag ccgccgacat ttgtgcttct tcccgcgtta agaaaaatcg cagatgacat 1440
tacgattctt tttctacaga ggaatagggg ggttgcgact ttgcgtgatt tgttgttaat 1500
gagtgatgcg tcgtccgttt tgatcggtag cccatggaga ctgatttatt tgacagatag 1560
atgtcgttct cgttgatgat gcaggtgtaa ttggcggcgt tggtgaagcg aagatggcat 1620
agggaatgga tttgcagagg agaaaaggag tttcacaaat atggattatt gaattgtcgt 1680
ttcagagtcg cgatggttag taatcgatgg atttgggttt gcacctgttc aaggggtggt 1740
gacgtgtctt actgtaagaa agagtcgcga tggttagtaa tcgacgatgg atttgggttt 1800
gcaacatcgt tgacggaaac gacgcggcga tggagagagg cggtagaggg aatgaaacgg 1860
gagatttacc ttcaaccgca aacatgtctt cgttcctcga aaatcatatg cgccctttat 1920
gaaaattcct tcacgcgccg tacacgcgct cagaaaaagc atagggtttt cttatataat 1980
aatgatataa cttaatttta aataacatcg tactatacgt ttcaaaataa attagagttt 2040
taataaaatt acggaatgat taaacctatt acaaacaaat ataagtgtcg gtaatataaa 2100
atttgtaaca acgaaaacat ttcaaaaaat ctgaatgcgg aaatccataa catgagaata 2160
cgattcgttt gcagtcacgc cggtttcttc accttctgag ggtcctgaaa aaggttaata 2220
aacaatgggt aagctaaagt ttagggatca tacacattac ttgtctatta tatgagttag 2280
atacattcac atatcacata catacaagca tacacatatt acaaaaaatc ctaacacata 2340
tggttggtac caactactat ttagtggacc aggttattct tgggggtcaa ttgtggttaa 2400
ccataaatgt ttggagttta ggttctcttt gggggccgac cataaacacc catatcatat 2460
ctctgtctag gttctctttg gggactgact atagacaact ttgctcagat tctccttgga 2520
ggataaccat cctcgacgag attaacaacg gaccaccact gttttcagct tgtaacctgc 2580
aacatcaata gttgcgatct tcggcgacaa tgatgaacca acatcaacac aacagtagtg 2640
ccggtatgtt agtcgttgga taatagaggc atcatctgac ccttttagcg gtgacttttg 2700
ttgcctatga aggtcttatc agttatatat cgattaggct tggttctagg ttataagaaa 2760
aaatgattct ctatccggta tgacatagag acaaaccggt ctacttttat aagaaaatca 2820
tactcgtatt tgaaacgaaa atcatatttg aaacaatgtc gtgttaataa ttaatatgtg 2880
tatgtttaaa tttagaatat cctgaactta tatttagttc gcaaccctat gtaagatcga 2940
actaatttta aaccgtaacc agacatgcat gtttgatcag taataaaaag gctatcatcg 3000
tcgaaaatat taaaacaaaa tataatttct tatttggcgc catttcatgt caacggttaa 3060
aagcaagtta tcaacgcctc caaccgatca tttctccggt aaccaccaac tgctactaat 3120
aaccgccacc gcaaaaacct atatatacaa cttccatcac aattctgtcc cctactccca 3180
tttcaatcca aaaaaggcta cacagacata tacagcg 3217
<210> 13
<211> 684
<212> DNA
<213> Taraxacum officinale
<400> 13
atgtcaacgg ttaaaagcaa gttatcaacg cctccaaccg atcatttctc cggtaaccac 60
caactgctac taataaccgc caccgcaaaa acctatatat acaacttcca tcacaattct 120
gtcccctact cccatttcaa tccaaaaaag gctacacaga catatacagc gatggcagat 180
aatggcaaca ccggccgtca aaaggatgac gacggtggcc atgatggggg acgcccaaat 240
ccgaccaccc caccctcccc ttcccgcacc ccgcgaagac ccaggcggac cacatcgccg 300
cctaaacatt ctccgggggc gtcttcaagc accatgccag cgccgcctac tccccctgcg 360
ccgacgggaa tcaccggtgc gtctagttct tctctgggta ctaatataat ttcatttact 420
ccacccaaaa ccaaaagaac gaagtcggtg atttgtccga tctgtaagaa agatatgtgc 480
catgagaagg cgctgtgtgg ccacatccgg tggcatactc aggaagaaag attggcggcc 540
agcattgcta tagcaagagc gctatcttct aacgttgttg tttctggcaa tggcgatgaa 600
gatgaaggtc catctaaaaa gtataaactc ccggacctga acaagtcacc accgccggag 660
gaggaggacg aggacgctgc ctga 684
<210> 14
<211> 3925
<212> DNA
<213> Taraxacum officinale
<400> 14
ttttcttgcg ggagaggcat gtatgtgtgg cctttttgca ataatactat gcatgggaga 60
tgcataaagt ttatctttat tttgttttag tttaataatg tgtggcaaac tttatatcat 120
ttatgatttc ggccatgtac tgctacatcg ttctaggatg gttattccct agaatttgct 180
tttatatatt ttttttcttc gttaattctt ctcttccttt aacgttattt catgtgaatt 240
tgcgatatca tgatattgca ggaacgtaac ttagaactca acgataaaaa gtgtgttgag 300
atcgtggaag ttgatcgttt atcttgaatt cacaagataa gcaacatgag atagaataat 360
taattactgc ggagatttct ttttagattc atcttattcg ttgtaaattg caatgcaaat 420
ttttaagtag aataacgaaa gcgtgttgtt atttacggtt aaatgcaaaa aatcaataac 480
atatctccat aattgatttg tttagtatgc attctcatgt gttctattgc aaaattctat 540
tttgaaattc aattaaagca atgcatttta gatataaagc aattccatca cttaattata 600
ttgggtagat ttttaccaaa tcactgtcct aaaagaaaaa taaaaaatga aagttcaatg 660
ccatagtgat cccgtcaatt atgtgatcaa tttttaccag agcaaaaccc caaaagttaa 720
agagtataat tgcagaacga caacaatctg aggatgatac taactccggt ataaaccgaa 780
tgcttttgtg gggatttcac taatcaacta tttggctctc atcacaaggc cgtgttaatg 840
gattactatt agttataagg ccatcccaag ttgtttggct atattattac cttttaaaaa 900
ccaaaatgtg taaactgtaa aattacactt ttggttcttg tattttctaa tttttagaat 960
tatgtatttg gttcttgtag tttttttatt tgtatgaatc atattagttt tggtccacga 1020
taacttttat tttctataat tacacttttg gtcattgtag ttttaatttg caagaaaaaa 1080
ataatctatc tttttagtcc atatatatag tttgcaatat tctatatttt aggttcaggt 1140
tatatatctt ttacaaaaat actacttatg attttttaat gaatatatca tatttcgtaa 1200
attacataaa cattttatat aattttattt agtcagaact ataggattcg catgataact 1260
ttgctgaact taattgggct tcatttttaa caaaggataa tgcatcatgc atgacataaa 1320
aatttgtaat gtttctaatg tgcatgcact acaagaacct gacccttcat atacattaat 1380
gaatgattct cttttcttat tatatcttag caaacggttt ggataagagt ctgaacaata 1440
ttaagaattg cactagctag ctaggggagt ccatgcagca agcaaattaa ttagaggact 1500
ttttaagagg cttgatcact tcattgtata tctaatggca ctgtggatat atgattggat 1560
tgtgtgtatg tatggaattt aatattacta aaaaatatac atttaatgac aaacaataac 1620
acactaattt ataacttaca aaagcgtgta tcattaaaga aaatttcatg tttcttaaaa 1680
tatggagaat ttactactta cataattatg tgtcataaat ttatgtcatc ttgtgtgata 1740
tttatgactt acaaaaatgt atgtgatatt tatgacttac aaaaatgtat gttatgttta 1800
tcgtcataaa atctgtaaaa aaaaatagaa acatggagga tactttcaat gtgtagaaac 1860
ttgacagcat aaacaggttt attaccttca tcaaaactta tcttacttca atctcttgga 1920
gatgcaggtt gattttaatg ctaaatgaac ttttcaaatg tataaatata tatcttttga 1980
cggatttgac attgatggag atgaagatac accagtgaat tcacctttca atgatcatac 2040
tgacatacca agtactctta tcccctctcc acctccacag aacgaacctc aatttcaaaa 2100
acgtaactgc cgctgttcta aaaacagaaa attttcaaaa acgtaactat catttaaata 2160
tttaatcatt tttcaattgg attcatgctg taatagaagt tactggactt taaacttctt 2220
gtagctgatg agattcatga acaacagtcc aaggagattt tccaaatcaa caagtttctg 2280
atgagaacaa ggtaaaaaaa ataagttttt catttaaaca tatgattttg gttttcaaaa 2340
gataattaat tataggaact cttctgaaaa gtcccaaagt ttacccgtaa aattgatttt 2400
ggtttttttt ttttaaattg aataaaaaag tccataaaat tggataaatt attcgattta 2460
gcccaattta cctagtatat ctggtaaaaa tgggttaaat cgaataattt aggcagtttg 2520
ttgggctttt ttgcgcaaaa acattatttt gggacttaat cgttaatttt ccccaagttt 2580
cagtttattt acagtattgg aataaaaccg aacctagtgc gctaattttg tcttttggtg 2640
tttagaatta tttgggttta ttggtctcgg tttctaaacg agttcggttt ttggtttctt 2700
gattcgattt ttggcttttg ggttcaaccc atggattttc gatttggttt tggttttgat 2760
aatatttttt gtgcaatcgt tcaaaaaatc cgagttagat tgggtttaaa tgttatcaaa 2820
accaaaaccg atggtagaac cccaaaactg aacccaatcg aaaatccatg ggttgaacct 2880
caaaaacgaa cccaataaat tctaaaaacc aaaatccaaa attagcggat aaaaatttta 2940
aaatacatat ctactggtaa ggtgtttttg acaatttatg taaattatag aaaaaaatgt 3000
attaagtgtt tgctatttaa gataaaaatg gcgttaaaaa tacaattggt tagaaatgaa 3060
ccattttttt gttgtaaatg agtggtgcat caacgatggt ggatgccatc ttttccttcc 3120
accatataca tctttgtcaa acaccataca cacaaattct catatgtcaa agatattaat 3180
tatcatgtcc actgagtttg taatataaat agatgatcaa ttacaacgag aaatatacac 3240
tgaattctca tttctaaatt gaagaatctc tctctctctc tctcatctct cagttttcaa 3300
agttttataa gttactagtt tatagtgttt ctaattactt catatttata acacgttatc 3360
agcacgagag ctctaagcaa gatatgcaat tacttaataa agtttataaa aataaacaaa 3420
tcataataaa caacatagat ataaaattaa ttattaccat ggacatgatg gactactaac 3480
attttatttc ttatactaac atttatttat gttaactaac atttatttat gtttctaaca 3540
tttatttatg catactaaca tttatttatg ttaactaaca tttatttatg tttctaacat 3600
ttatttatgc atactaacat ttatttatgt tactaacttt tatttatgta tactaatgtt 3660
tatttatcaa atttatttaa catttactat tttttgatta tattttttaa ttagccgata 3720
gaatttattt atttaattat tctatttatt aaacttattt ttataaatat atatatatat 3780
ataaccgtta tatatataac ggctatatat ataacgtcta tatatatata acggctatat 3840
ttttacacta taaataaaca catcattctc catttttata ccacaacaaa taatttctct 3900
catcttccaa atcatcaaga gaaaa 3925
<210> 15
<211> 7826
<212> DNA
<213> Taraxacum officinale
<400> 15
gttgaaagga aggatcggca gagaacaaga ttgagagagt tttatcgaag agaagagatg 60
gttgtgttga ttgacggcag agttcagcaa tggcagatat gcgtgtttaa agcgcagttt 120
gtggacagtt tgtccaaagg ccttcaagtg ggagattgtt gagatgaaga cccttttgac 180
caagtactta aatgtgattg gttgcatggg aaagagcttt acacttcatt ggttgaaaat 240
gaagcatgtt atttaatagt acgtctccac ttgttcttta tgaaggatga agacagccac 300
caagtcttta tgaatgtttc aaggagaaga caatgattag atgctgcctg ctcccttact 360
tcttcactat aaataggtgc ttaaggcacc tctcttctta caccaaacaa cacacaagtc 420
acagattaca aagattgaga gagttttcat tttctctcta gagtttgttt tgtcaaaagt 480
tttgtgtgca gattaattag ttgagagaca ctcctaatta atataaccac ttacacttgt 540
cattgattag cattctagtg tcagagagtt ctgagtgatt gtaacctttg tgtgatttat 600
atataaatct ctctcttgtt cgccagtgga cgtagctgat tatcctgatc agtgaaccac 660
ttaaaatatc gtgttgatat tatttatctg cagattattt taccagatag ttttattccg 720
caccgcaaag cataccgtcc attatttgtc agacgtacct actctcagct catcccagca 780
ggagttagac ctgcaggcag ccagccgtat ttcacaacag tgaattatgc aacaaatgga 840
aacacacaat tatcgtagta cacatgtaat taacagggat caatttccat ttattgttcc 900
atcaattgcc aaatttaaaa gataacaaat gcatcctttt tgaatggaaa agtatgatac 960
ataaaaccag agagaggtat acatttagtc cagaaacggt ggaaattact ttacctagag 1020
ttgcgtgaat caaatggaaa atcagaggaa gagaccctaa atcgcaatcc atcttctatt 1080
ccctatagaa tcaaatggaa atttcttact tccgaccttt ttcatttcca caagtttgta 1140
atcgataaga tcataaaaga aaaccgattt acattagcaa atctttaagg cagtttgtag 1200
ttctcaagta tgcgttacgt atgaaattct agacagaaaa gggacgacag ggaaaataat 1260
ggtggaataa ataaacaatc aagaatcaaa agataataat ccttaaaact aacaaaaatt 1320
ctatcaataa gccctacaaa tgagaaatat gacggtggag actcacctga ttgatgcgag 1380
aaaaggaaag ccgccgacat ttgtgcttct tcccgcgtta agaaaaatcg cagatgacat 1440
tacgattctt tttctacaga ggaatagggg ggttgcgact ttgcgtgatt tgttgttaat 1500
gagtgatgcg tcgtccgttt tgatcggtag cccatggaga ctgatttatt tgacagatag 1560
atgtcgttct cgttgatgat gcaggtgtaa ttggcggcgt tggtgaagcg aagatggcat 1620
agggaatgga tttgcagagg agaaaaggag tttcacaaat atggattatt gaattgtcgt 1680
ttcagagtcg cgatggttag taatcgatgg atttgggttt gcacctgttc aaggggtggt 1740
gacgtgtctt actgtaagaa agagtcgcga tggttagtaa tcgacgatgg atttgggttt 1800
gcaacatcgt tgacggaaac gacgcggcga tggagagagg cggtagaggg aatgaaacgg 1860
gagatttacc ttcaaccgca aacatgtctt cgttcctcga aaatcatatg cgccctttat 1920
gaaaattcct tcacgcgccg tacacgcgct cagaaaaagc atagggtttt cttatataat 1980
aatgatataa cttaatttta aataacatcg tactatacgt ttcaaaataa attagagttt 2040
taataaaatt acggaatgat taaacctatt acaaacaaat ataagtgtcg gtaatataaa 2100
atttgtaaca acgaaaacat ttcaaaaaat ctgaatgcgg aaatccataa catgagaata 2160
cgattcgttt gcagtcacgc cggtttcttc accttctgag ggtcctgaaa aaggttaata 2220
aacaatgggt aagctaaagt ttagggatca tacacattac ttgtctatta tatgagttag 2280
atacattcac atatcacata catacaagca tacacatatt acaaaaaatc ctaacacata 2340
tggttggtac caactactat ttagtggacc aggttattct tgggggtcaa ttgtggttaa 2400
ccataaatgt ttggagttta ggttctcttt gggggccgac cataaacacc catatcatat 2460
ctctgtctag gttctctttg gggactgact atagacaact ttgctcagat tctccttgga 2520
ggataaccat cctcgacgag attaacaacg gaccaccact gttttcagct tgtaacctgc 2580
aacatcaata gttgcgatct tcggcgacaa tgatgaacca acatcaacac aacagtagtg 2640
ccggtatgtt agtcgttgga taatagaggc atcatctgac ccttttagcg gtgacttttg 2700
ttgcctatga aggtcttatc agttatatat cgattaggct tggttctagg ttataagaaa 2760
aaatgattct ctatccggta tgacatagag acaaaccggt ctacttttat aagaaaatca 2820
tactcgtatt tgaaacgaaa atcatatttg aaacaatgtc gtgttaataa ttaatatgtg 2880
tatgtttaaa tttagaatat cctgaactta tatttagttc gcaaccctat gtaagatcga 2940
actaatttta aaccgtaacc agacatgcat gtttgatcag taataaaaag gctatcatcg 3000
tcgaaaatat taaaacaaaa tataatttct tatttggcgc catttcatgt caacggttaa 3060
aagcaagtta tcaacgcctc caaccgatca tttctccggt aaccaccaac tgctactaat 3120
aaccgccacc gcaaaaacct atatatacaa cttccatcac aattctgtcc cctactccca 3180
tttcaatcca aaaaaggcta cacagacata tacagcgatg tcaacggtta aaagcaagtt 3240
atcaacgcct ccaaccgatc atttctccgg taaccaccaa ctgctactaa taaccgccac 3300
cgcaaaaacc tatatataca acttccatca caattctgtc ccctactccc atttcaatcc 3360
aaaaaaggct acacagacat atacagcgat ggcagataat ggcaacaccg gccgtcaaaa 3420
ggatgacgac ggtggccatg atgggggacg cccaaatccg accaccccac cctccccttc 3480
ccgcaccccg cgaagaccca ggcggaccac atcgccgcct aaacattctc cgggggcgtc 3540
ttcaagcacc atgccagcgc cgcctactcc ccctgcgccg acgggaatca ccggtgcgtc 3600
tagttcttct ctgggtacta atataatttc atttactcca cccaaaacca aaagaacgaa 3660
gtcggtgatt tgtccgatct gtaagaaaga tatgtgccat gagaaggcgc tgtgtggcca 3720
catccggtgg catactcagg aagaaagatt ggcggccagc attgctatag caagagcgct 3780
atcttctaac gttgttgttt ctggcaatgg cgatgaagat gaaggtccat ctaaaaagta 3840
taaactcccg gacctgaaca agtcaccacc gccggaggag gaggacgagg acgctgcctg 3900
attttcttgc gggagaggca tgtatgtgtg gcctttttgc aataatacta tgcatgggag 3960
atgcataaag tttatcttta ttttgtttta gtttaataat gtgtggcaaa ctttatatca 4020
tttatgattt cggccatgta ctgctacatc gttctaggat ggttattccc tagaatttgc 4080
ttttatatat tttttttctt cgttaattct tctcttcctt taacgttatt tcatgtgaat 4140
ttgcgatatc atgatattgc aggaacgtaa cttagaactc aacgataaaa agtgtgttga 4200
gatcgtggaa gttgatcgtt tatcttgaat tcacaagata agcaacatga gatagaataa 4260
ttaattactg cggagatttc tttttagatt catcttattc gttgtaaatt gcaatgcaaa 4320
tttttaagta gaataacgaa agcgtgttgt tatttacggt taaatgcaaa aaatcaataa 4380
catatctcca taattgattt gtttagtatg cattctcatg tgttctattg caaaattcta 4440
ttttgaaatt caattaaagc aatgcatttt agatataaag caattccatc acttaattat 4500
attgggtaga tttttaccaa atcactgtcc taaaagaaaa ataaaaaatg aaagttcaat 4560
gccatagtga tcccgtcaat tatgtgatca atttttacca gagcaaaacc ccaaaagtta 4620
aagagtataa ttgcagaacg acaacaatct gaggatgata ctaactccgg tataaaccga 4680
atgcttttgt ggggatttca ctaatcaact atttggctct catcacaagg ccgtgttaat 4740
ggattactat tagttataag gccatcccaa gttgtttggc tatattatta ccttttaaaa 4800
accaaaatgt gtaaactgta aaattacact tttggttctt gtattttcta atttttagaa 4860
ttatgtattt ggttcttgta gtttttttat ttgtatgaat catattagtt ttggtccacg 4920
ataactttta ttttctataa ttacactttt ggtcattgta gttttaattt gcaagaaaaa 4980
aataatctat ctttttagtc catatatata gtttgcaata ttctatattt taggttcagg 5040
ttatatatct tttacaaaaa tactacttat gattttttaa tgaatatatc atatttcgta 5100
aattacataa acattttata taattttatt tagtcagaac tataggattc gcatgataac 5160
tttgctgaac ttaattgggc ttcattttta acaaaggata atgcatcatg catgacataa 5220
aaatttgtaa tgtttctaat gtgcatgcac tacaagaacc tgacccttca tatacattaa 5280
tgaatgattc tcttttctta ttatatctta gcaaacggtt tggataagag tctgaacaat 5340
attaagaatt gcactagcta gctaggggag tccatgcagc aagcaaatta attagaggac 5400
tttttaagag gcttgatcac ttcattgtat atctaatggc actgtggata tatgattgga 5460
ttgtgtgtat gtatggaatt taatattact aaaaaatata catttaatga caaacaataa 5520
cacactaatt tataacttac aaaagcgtgt atcattaaag aaaatttcat gtttcttaaa 5580
atatggagaa tttactactt acataattat gtgtcataaa tttatgtcat cttgtgtgat 5640
atttatgact tacaaaaatg tatgtgatat ttatgactta caaaaatgta tgttatgttt 5700
atcgtcataa aatctgtaaa aaaaaataga aacatggagg atactttcaa tgtgtagaaa 5760
cttgacagca taaacaggtt tattaccttc atcaaaactt atcttacttc aatctcttgg 5820
agatgcaggt tgattttaat gctaaatgaa cttttcaaat gtataaatat atatcttttg 5880
acggatttga cattgatgga gatgaagata caccagtgaa ttcacctttc aatgatcata 5940
ctgacatacc aagtactctt atcccctctc cacctccaca gaacgaacct caatttcaaa 6000
aacgtaactg ccgctgttct aaaaacagaa aattttcaaa aacgtaacta tcatttaaat 6060
atttaatcat ttttcaattg gattcatgct gtaatagaag ttactggact ttaaacttct 6120
tgtagctgat gagattcatg aacaacagtc caaggagatt ttccaaatca acaagtttct 6180
gatgagaaca aggtaaaaaa aataagtttt tcatttaaac atatgatttt ggttttcaaa 6240
agataattaa ttataggaac tcttctgaaa agtcccaaag tttacccgta aaattgattt 6300
tggttttttt tttttaaatt gaataaaaaa gtccataaaa ttggataaat tattcgattt 6360
agcccaattt acctagtata tctggtaaaa atgggttaaa tcgaataatt taggcagttt 6420
gttgggcttt tttgcgcaaa aacattattt tgggacttaa tcgttaattt tccccaagtt 6480
tcagtttatt tacagtattg gaataaaacc gaacctagtg cgctaatttt gtcttttggt 6540
gtttagaatt atttgggttt attggtctcg gtttctaaac gagttcggtt tttggtttct 6600
tgattcgatt tttggctttt gggttcaacc catggatttt cgatttggtt ttggttttga 6660
taatattttt tgtgcaatcg ttcaaaaaat ccgagttaga ttgggtttaa atgttatcaa 6720
aaccaaaacc gatggtagaa ccccaaaact gaacccaatc gaaaatccat gggttgaacc 6780
tcaaaaacga acccaataaa ttctaaaaac caaaatccaa aattagcgga taaaaatttt 6840
aaaatacata tctactggta aggtgttttt gacaatttat gtaaattata gaaaaaaatg 6900
tattaagtgt ttgctattta agataaaaat ggcgttaaaa atacaattgg ttagaaatga 6960
accatttttt tgttgtaaat gagtggtgca tcaacgatgg tggatgccat cttttccttc 7020
caccatatac atctttgtca aacaccatac acacaaattc tcatatgtca aagatattaa 7080
ttatcatgtc cactgagttt gtaatataaa tagatgatca attacaacga gaaatataca 7140
ctgaattctc atttctaaat tgaagaatct ctctctctct ctctcatctc tcagttttca 7200
aagttttata agttactagt ttatagtgtt tctaattact tcatatttat aacacgttat 7260
cagcacgaga gctctaagca agatatgcaa ttacttaata aagtttataa aaataaacaa 7320
atcataataa acaacataga tataaaatta attattacca tggacatgat ggactactaa 7380
cattttattt cttatactaa catttattta tgttaactaa catttattta tgtttctaac 7440
atttatttat gcatactaac atttatttat gttaactaac atttatttat gtttctaaca 7500
tttatttatg catactaaca tttatttatg ttactaactt ttatttatgt atactaatgt 7560
ttatttatca aatttattta acatttacta ttttttgatt atatttttta attagccgat 7620
agaatttatt tatttaatta ttctatttat taaacttatt tttataaata tatatatata 7680
tataaccgtt atatatataa cggctatata tataacgtct atatatatat aacggctata 7740
tttttacact ataaataaac acatcattct ccatttttat accacaacaa ataatttctc 7800
tcatcttcca aatcatcaag agaaaa 7826
<210> 16
<211> 1547
<212> DNA
<213> Lactuca sativa
<400> 16
tcaatttcga tcttgactac catgaatgtc atatttatat gacatactta taagaaatta 60
taatacaaat ttgattttaa aataaaataa aaactatttt cataacggat attttgtttc 120
gtataaaaag aataccgtaa gattaaatta aaataaacaa tccgttaaac tgacataata 180
taatattgga aaataaaaaa atatatatgt tttcataaaa aaaaaaactt caagtttgga 240
tcagatttag gaaaagtaaa accttatatt tagttgatga ccgttttacc ataaacaatt 300
atcagtttgt gctgggttaa ttgttaataa aaataatatt aaaatttaat tgaatataac 360
atgaatatat aatttttttt tggaaaaact tcttttaaaa tgttacataa attacgatta 420
aatattttta ataccaaatt atatagtatc tggattaaag aggtcaaaaa gtaaacttta 480
aaaaataaaa aaaataaata atagattaat ataagttaga ggacttcaat tatttttcat 540
gtggaccctt ctaaaagaac ctatttttac aaatagattt aaaaccaatc tatttttgga 600
aatggtctcc taaatcaatc aaattttata aaaaaactcc aacactatca aatatataac 660
aattttattc gatcggttaa atagttagaa ttataacaaa ataaaaaaca agataatttt 720
ttcaaaataa tttgaaataa aaaataaggt gtcaaaaatg aacttttatg taaacttaac 780
atcatttgtc atttttgtta caaaacatga ttaatattat tactttgtaa gtgtccactt 840
ttcttcaaac tccttgctta gttaaaaaaa tctataatat atgaaattaa ttttagtttt 900
cttaaactac atatataatt attttttatc aaacttgaat taaaagccta tgacaataac 960
caaaatgaaa tagtatgact tatacatttg ccgttgacta ataaaccaaa aaatcgaatt 1020
gacatcagac caaaaccagc tctgtatata ttggttatgt tatgggttat atagagttgt 1080
ttaaaaggca gttatcgatt acgttctcag ttctagagtt ttcacaaaaa tcaattctcc 1140
tgtatcacat cgaaagcaaa ccggtctatt tataaaagag atacatattt gaaacaacat 1200
attttttaat tatatttatg tgttgtttat aaatctagaa acccgtaaat ttatatttag 1260
ttcagtatcc aatataggat ctgaaactac tttataaccg ttaccagaca aataccggtc 1320
aagtttatat tggtgtagtt ttcgattcct ttgattttat atctttttgg cgccatttca 1380
cgtcaacggt ttaaaaacaa gttatcgttt ctccggtaca gttaaccacc aaccgccaca 1440
aataaccgtc accggaatac ctataaatac aacttccatt tcaatcgtct ctctctgcac 1500
tcccattctt tgaatccaaa aaaggctaca cacacacaca gacaaca 1547
<210> 17
<211> 1532
<212> DNA
<213> Artificial Sequence
<220>
<223> Lactuca sativa LSAT_8X112340 promoter without 2 MYB binding sites
<400> 17
tcaatttcga tcttgactac catgaatgtc atatttatat gacatactta taagaaatta 60
taatacaaat ttgattttaa aataaaataa aaactatttt cataacggat attttgtttc 120
gtataaaaag aataccgtaa gattaaatta aaataaacaa tccgttaaac tgacataata 180
taatattgga aaataaaaaa atatatatgt tttcataaaa aaaaaaactt caagtttgga 240
tcagatttag gaaaagtaaa accttatatt tagttgatga ccgttttacc ataaacaatt 300
atcagtttgt gctgggttaa ttgttaataa aaataatatt aaaatttaat tgaatataac 360
atgaatatat aatttttttt tggaaaaact tcttttaaaa tgttacataa attacgatta 420
aatattttta ataccaaatt atatagtatc tggattaaag aggtcaaaaa gtaaacttta 480
aaaaataaaa aaaataaata atagattaat ataagttaga ggacttcaat tatttttcat 540
gtggaccctt ctaaaagaac ctatttttac aaatagattt aaaaccaatc tatttttgga 600
aatggtctcc taaatcaatc aaattttata aaaaaactcc aacactatca aatatataac 660
aattttattc gatcggttaa atagttagaa ttataacaaa ataaaaaaca agataatttt 720
ttcaaaataa tttgaaataa aaaataaggt gtcaaaaatg aacttttatg taaacttaac 780
atcatttgtc atttttgtta caaaacatga ttaatattat tactttgtaa gtgtccactt 840
ttcttcaaac tccttgctta gttaaaaaaa tctataatat atgaaattaa ttttagtttt 900
cttaaactac atatataatt attttttatc aaacttgaat taaaagccta tgacaataac 960
caaaatgaaa tagtatgact tatacatttg ccgttgacta ataaaccaaa aaatcgaatt 1020
gacatcagac caaaaccagc tctgtatata ttggttatgt tatgggttat atagagttgt 1080
ttaaaaggca gttatcgatt acgttctcag ttctagagtt ttcacaaaaa tcaattctcc 1140
tgtatcacat cgaaagcaaa ccggtctatt tataaaagag atacatattt gaaacaacat 1200
attttttaat tatatttatg tgttgtttat aaatctagaa acccgtaaat ttatatttag 1260
ttcagtatcc aatataggat ctgaaactac tttataaccg ttaccagaca aataccggtc 1320
aagtttatat tggtgtagtt ttcgattcct ttgattttat atctttttgg cgccatttca 1380
cgtcaacggt ttaaaaacaa gttatcgttt ctccggtaca gttaaccacc caaataccgg 1440
aatacctata aatacaactt ccatttcaat cgtctctctc tgcactccca ttctttgaat 1500
ccaaaaaagg ctacacacac acacagacaa ca 1532
<210> 18
<211> 2882
<212> DNA
<213> Artificial Sequence
<220>
<223> Lactuca sativa LSAT_8X112340 promoter with Taraxacum officinale
Par allele MITE insertion
<400> 18
tcaatttcga tcttgactac catgaatgtc atatttatat gacatactta taagaaatta 60
taatacaaat ttgattttaa aataaaataa aaactatttt cataacggat attttgtttc 120
gtataaaaag aataccgtaa gattaaatta aaataaacaa tccgttaaac tgacataata 180
taatattgga aaataaaaaa atatatatgt tttcataaaa aaaaaaactt caagtttgga 240
tcagatttag gaaaagtaaa accttatatt tagttgatga ccgttttacc ataaacaatt 300
atcagtttgt gctgggttaa ttgttaataa aaataatatt aaaatttaat tgaatataac 360
atgaatatat aatttttttt tggaaaaact tcttttaaaa tgttacataa attacgatta 420
aatattttta ataccaaatt atatagtatc tggattaaag aggtcaaaaa gtaaacttta 480
aaaaataaaa aaaataaata atagattaat ataagttaga ggacttcaat tatttttcat 540
gtggaccctt ctaaaagaac ctatttttac aaatagattt aaaaccaatc tatttttgga 600
aatggtctcc taaatcaatc aaattttata aaaaaactcc aacactatca aatatataac 660
aattttattc gatcggttaa atagttagaa ttataacaaa ataaaaaaca agataatttt 720
ttcaaaataa tttgaaataa aaaataaggt gtcaaaaatg aacttttatg taaacttaac 780
atcatttgtc atttttgtta caaaacatga ttaatattat tactttgtaa gtgtccactt 840
ttcttcaaac tccttgctta gttaaaaaaa tctataatat atgaaattaa ttttagtttt 900
cttaaactac atatataatt attttttatc aaacttgaat taaaagccta tgacaataac 960
caaaatgaaa tagtatgact tatacatttg ccgttgacta ataaaccaaa aaatcgaatt 1020
gacatcagac caaaaccagc tctgtatata ttggttatgt tatgggttat atagagttgt 1080
ttaaaaggca gttatcgatt acgttctcag ttctagagtt ttcacaaaaa tcaattctcc 1140
tgtatcacat cgaaagcaaa ccggtctatt tataaaagag atacatattt gaaacaacat 1200
attttttaat tatatttatg tgttgtttat aaatctagaa acccgtaaat ttatatttag 1260
ttcagtatcc aatataggat ctgaaactac tttataaccg ttaccagaca aataccggtc 1320
aagtttatat tggtgtagtt ttcgattcct ttgattttat atctttttgg cgccatttca 1380
cgtcaacggt ttaaaaacaa gttatcgttt ctccggtaca gttaaccacc actgctacca 1440
gggccggcca gaaggctgtg cggcttgggc tgtggcacag gggcagcaga tttagtccat 1500
ttattatggt ctgctattta tttgggtcca ataagatcag ggcactaaaa ctcaaataca 1560
tcaattcaag tcggcggcaa aagaataaaa agcgccaatt tttagaagac aaggagacag 1620
cacaataatc atgcttttcc aatggccaat taattttagc ctttgtgagg tataaatatg 1680
aatcactttt tctccaaata tcattattgt aaactagtaa agagcgtaaa ttgttttatc 1740
gctaatcttc ttctttttca aatataattg tttgattctt tgtagtaggt acgttaagtt 1800
ttatatcatt cgtcctggaa accttttctt atgccccttc aatttatgaa tttgtgtttt 1860
gtattgtctt gctattaatc caatgcaaac taattctgcc gcatcgatct cacagagttg 1920
gagcagctta aaaggagttt tggggcaact taaaatgagg gtagcttttt tgttgttgtt 1980
ggtctactat ttactttggt ccttatcgtt ttagttttgt gttcattgag gatttgaatg 2040
actttgaaca caagtttata aaactaagtt tttgtgattc taaatttttg atgtgtgcaa 2100
ccgactaaat gaatataaaa ttctgatttg tgtatttctg atttctgatt taccggttat 2160
tcattatgtt tttctggatc tcatatgaat ttagtatata aaaatctcag gttcttctta 2220
ctcagtctag tatattttgg cattggggat cagggttaaa atcatcattt ttctaagcac 2280
taacaagctt taaaaccatc aattaaaagt tagttctcca tacctggaat tgtttattgc 2340
tttagtattc atttcatagt gtcaatacct tacaactgtt tattgttttc aaatgtttac 2400
tgttttgcac tttagttgtt tttagcatgt ttcaactttc aaagttaatt gacgatagtg 2460
tcatatacga aatatcatca ctcatacaaa attaaactgg atagaatttt ttccgatgaa 2520
atctattttt aaatagttac gaatataata ggagacttaa tatgtttgtt tcaaaattac 2580
acaaaaacac catggaaatg ggcattagtt tgtataagca tccttttaaa tataaagctt 2640
tgttacattg atgccttcta aatatataat attgtaatga tttgtagtaa acaccatgga 2700
aatgggcatt attaagatgt ttcgcccagg gcatgaaaaa ctatcggacc ggccctgact 2760
gctacaaccg ccacaaataa ccgtcaccgg aatacctata aatacaactt ccatttcaat 2820
cgtctctctc tgcactccca ttctttgaat ccaaaaaagg ctacacacac acacagacaa 2880
ca 2882
<210> 19
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> target specific sequence of RNA-1
<400> 19
catccggtgg catacacagg 20
<210> 20
<211> 1148
<212> DNA
<213> Artificial Sequence
<220>
<223> Lactuca sativa LSAT_8X112340 promoter with deletion
<400> 20
tcaatttcga tcttgactac catgaatgtc atatttatat gacatactta taagaaatta 60
taatacaaat ttgattttaa aataaaataa aaactatttt cataacggat attttgtttc 120
gtataaaaag aataccgtaa gattaaatta aaataaacaa tccgttaaac tgacataata 180
taatattgga aaataaaaaa atatatatgt tttcataaaa aaaaaaactt caagtttgga 240
tcagatttag gaaaagtaaa accttatatt tagttgatga ccgttttacc ataaacaatt 300
atcagtttgt gctgggttaa ttgttaataa aaataatatt aaaatttaat tgaatataac 360
atgaatatat aatttttttt tggaaaaact tcttttaaaa tgttacataa attacgatta 420
aatattttta ataccaaatt atatagtatc tggattaaag aggtcaaaaa gtaaacttta 480
aaaaataaaa aaaataaata atagattaat ataagttaga ggacttcaat tatttttcat 540
gtggaccctt ctaaaagaac ctatttttac aaatagattt aaaaccaatc tatttttgga 600
aatggtctcc taaatcaatc aaattttata aaaaaactcc aacactatca aatatataac 660
aattttattc gatcggttaa atagttagaa ttataacaaa ataaaaaaca agataatttt 720
ttcaaaataa tttgaaataa aaaataaggt gtcaaaaatg aacttttatg taaacttaac 780
atcatttgtc atttttgtta caaaacatga ttaatattat tactttgtaa gtgtccactt 840
ttcttcaaac tccttgctta gttaaaaaaa tctataatat atgaaattaa ttttagtttt 900
cttaaactac atatataatt attttttatc aaacttgaat taaaagccta tgacaataac 960
caaaatgaaa tagtatgact tatacatttg ccgttgacta ataaaccaaa aaatcgaatt 1020
gacatcagac caaccgccac aaataaccgt caccggaata cctataaata caacttccat 1080
ttcaatcgtc tctctctgca ctcccattct ttgaatccaa aaaaggctac acacacacac 1140
agacaaca 1148
<210> 21
<211> 89
<212> PRT
<213> Helianthus annuus
<400> 21
Met Ser Ser Pro Ser Lys Asn Lys Ser Lys Ser Ser Ile Cys Pro Val
1 5 10 15
Cys Lys Arg Asp Leu Cys His Glu Lys Ala Leu Asn Gly His Ile Arg
20 25 30
Trp His Thr Gln Gln Glu Arg Glu Ala Ala Gly Ile Gly Asn Ala Lys
35 40 45
Ala Val Ala Ser Ala Ser Val Val Ile Arg Asp Ala Asn Val Arg Arg
50 55 60
Pro Glu Thr Ser Lys Pro Val Lys Leu Pro Asp Leu Asn Lys Ser Pro
65 70 75 80
Pro Arg Glu Glu Asp Lys Asp Ala Ala
85
<210> 22
<211> 157
<212> PRT
<213> Lactuca sativa
<400> 22
Met Ala Asp Asp Gly Asn Thr Ala Arg Gln Gln Ala Asp Ala Gly Gly
1 5 10 15
His Gly Asn Ala Arg Pro Asn Ser Ser Thr Pro Pro Ser Ser Pro Ser
20 25 30
Gln Pro Pro Arg Arg Pro Arg Arg Ala Gly Ala Thr Thr Pro Ser Lys
35 40 45
Leu Ser Gln Ala Ala Ser Ser Ser Thr Asn Leu Pro Pro Pro Pro Thr
50 55 60
Pro Thr Pro Thr Pro Pro Thr Pro Ser Ala Asp Gly Ile Leu Leu Gly
65 70 75 80
Thr Ala Arg Arg Pro Val Ile Cys Pro Ile Cys Lys Lys Asp Met Tyr
85 90 95
His Glu Lys Ala Leu Cys Gly His Ile Arg Trp His Thr Gln Glu Glu
100 105 110
Arg Leu Ala Ala Ser Arg Asp Ile Ala Arg Ala Leu Ser Ala Asn Val
115 120 125
Val Ser Gly Gln Arg Gly Asp Gly Glu Gln Gly Pro Ser Lys Arg Phe
130 135 140
Lys Leu Pro Asp Leu Asn Glu Pro Pro Pro Ser Glu Asp
145 150 155
<210> 23
<211> 36
<212> DNA
<213> Taraxacum officinale
<400> 23
tgtggccaca tccggtggca tacacaggag gaaaga 36
<210> 24
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> pKG10821-1
<400> 24
tgtggccaca tccggtggca tacaccagga ggaaaga 37
<210> 25
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> pKG10821-4
<400> 25
tgtggccaca tccggtggca tacacaagga ggaaaga 37
<210> 26
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> pKG10821-5
<400> 26
tgtggccaca tccggtggca tacaaggagg aaaga 35
<210> 27
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> pKG10821-6
<400> 27
tgtggccaca tccggtggca taaggaggaa aga 33
<210> 28
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> pKG10821-1
<400> 28
Cys Gly His Ile Arg Trp His Thr Pro Gly Gly Lys
1 5 10
<210> 29
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> pKG108121-4
<400> 29
Cys Gly His Ile Arg Trp His Thr Gln Gly Gly Lys
1 5 10
<210> 30
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> pKG10821-5
<400> 30
Cys Gly His Ile Arg Trp His Thr Arg Arg Lys
1 5 10
<210> 31
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> pKG10821-6
<400> 31
Cys Gly His Ile Arg Trp His Lys Glu Glu Arg
1 5 10
<210> 32
<211> 12
<212> PRT
<213> Taraxacum officinale
<400> 32
Cys Gly His Ile Arg Trp His Thr Gln Glu Glu Arg
1 5 10
<210> 33
<211> 474
<212> DNA
<213> Artificial Sequence
<220>
<223> Lactuca sativa LSAT_8X112340 coding sequence
<400> 33
atggcagatg atggcaacac cgcccgtcaa caggctgacg ccggtggcca tggaaacgca 60
cgtccaaact catccacccc cccttcgtca ccctcccaac ctccaagaag accacgccgt 120
gccggagcca ctacaccgtc aaagctttcc caggcggcat cttcgtcaac aaatcttcca 180
ccgccgccaa cgccaacacc aactccgccc accccttctg ccgacgggat attactaggt 240
actgcaagaa ggccggtaat atgcccgatt tgcaaaaagg atatgtatca tgaaaaggcg 300
ctgtgtggcc acatccggtg gcacacgcag gaggagagac tggcggcaag cagggatatt 360
gcccgggcgc tttctgccaa cgttgtttct gggcaaagag gcgatggaga acaagggccg 420
tctaaacggt tcaaactgcc ggatcttaac gagccaccac cgtcggagga ctga 474
<210> 34
<211> 3021
<212> DNA
<213> Artificial Sequence
<220>
<223> LsPromtoter_LsCoding sequence_To3'UTR
<400> 34
tcaatttcga tcttgactac catgaatgtc atatttatat gacatactta taagaaatta 60
taatacaaat ttgattttaa aataaaataa aaactatttt cataacggat attttgtttc 120
gtataaaaag aataccgtaa gattaaatta aaataaacaa tccgttaaac tgacataata 180
taatattgga aaataaaaaa atatatatgt tttcataaaa aaaaaaactt caagtttgga 240
tcagatttag gaaaagtaaa accttatatt tagttgatga ccgttttacc ataaacaatt 300
atcagtttgt gctgggttaa ttgttaataa aaataatatt aaaatttaat tgaatataac 360
atgaatatat aatttttttt tggaaaaact tcttttaaaa tgttacataa attacgatta 420
aatattttta ataccaaatt atatagtatc tggattaaag aggtcaaaaa gtaaacttta 480
aaaaataaaa aaaataaata atagattaat ataagttaga ggacttcaat tatttttcat 540
gtggaccctt ctaaaagaac ctatttttac aaatagattt aaaaccaatc tatttttgga 600
aatggtctcc taaatcaatc aaattttata aaaaaactcc aacactatca aatatataac 660
aattttattc gatcggttaa atagttagaa ttataacaaa ataaaaaaca agataatttt 720
ttcaaaataa tttgaaataa aaaataaggt gtcaaaaatg aacttttatg taaacttaac 780
atcatttgtc atttttgtta caaaacatga ttaatattat tactttgtaa gtgtccactt 840
ttcttcaaac tccttgctta gttaaaaaaa tctataatat atgaaattaa ttttagtttt 900
cttaaactac atatataatt attttttatc aaacttgaat taaaagccta tgacaataac 960
caaaatgaaa tagtatgact tatacatttg ccgttgacta ataaaccaaa aaatcgaatt 1020
gacatcagac caaaaccagc tctgtatata ttggttatgt tatgggttat atagagttgt 1080
ttaaaaggca gttatcgatt acgttctcag ttctagagtt ttcacaaaaa tcaattctcc 1140
tgtatcacat cgaaagcaaa ccggtctatt tataaaagag atacatattt gaaacaacat 1200
attttttaat tatatttatg tgttgtttat aaatctagaa acccgtaaat ttatatttag 1260
ttcagtatcc aatataggat ctgaaactac tttataaccg ttaccagaca aataccggtc 1320
aagtttatat tggtgtagtt ttcgattcct ttgattttat atctttttgg cgccatttca 1380
cgtcaacggt ttaaaaacaa gttatcgttt ctccggtaca gttaaccacc aaccgccaca 1440
aataaccgtc accggaatac ctataaatac aacttccatt tcaatcgtct ctctctgcac 1500
tcccattctt tgaatccaaa aaaggctaca cacacacaca gacaacaatg gcagatgatg 1560
gcaacaccgc ccgtcaacag gctgacgccg gtggccatgg aaacgcacgt ccaaactcat 1620
ccaccccccc ttcgtcaccc tcccaacctc caagaagacc acgccgtgcc ggagccacta 1680
caccgtcaaa gctttcccag gcggcatctt cgtcaacaaa tcttccaccg ccgccaacgc 1740
caacaccaac tccgcccacc ccttctgccg acgggatatt actaggtact gcaagaaggc 1800
cggtaatatg cccgatttgc aaaaaggata tgtatcatga aaaggcgctg tgtggccaca 1860
tccggtggca cacgcaggag gagagactgg cggcaagcag ggatattgcc cgggcgcttt 1920
ctgccaacgt tgtttctggg caaagaggcg atggagaaca agggccgtct aaacggttca 1980
aactgccgga tcttaacgag ccaccaccgt cggaggactg attttcttgc gggagaggca 2040
tgcatgtatg tgtggccttt ttgcaataat actatgcatg ggagatgcat aaagtttatc 2100
tttatttttt ttagtttaat aatgtgtggc aaactttata tcatttatga tttcggccat 2160
gtactgctac atcgttctag gatggttatt ccctagaatt tgctttatgt atttgttttc 2220
tttgttaatt cttctcttcc ttaaacgtta tttcatgtga attgcgatgt catgatattg 2280
caggaatgta acttagaact caacgataaa aagtgtgttg agatcgtgga agttgatcat 2340
ttatcttgaa ttcataagat aagcaacatg agataggata attaattact gtggggattt 2400
ctttttatat tcatattatt cgttgtaatg caaattttta agtagaataa cgaatgtgtc 2460
ttattattta cggttaaatg caaaagatca ttaacatatc tccattgatt tgtttactga 2520
tgtattctca tgtgttctgt tgctaaattc tattttgaaa agtatattca attaaagcaa 2580
tgcattttag atataaagca actccataac ttataattgt gtagattttt accaattcaa 2640
tgtcttaaaa gaaaaataaa aattgaaagt ttaattaatt gccatagtga tcccgttccc 2700
gtcaattatg tgatcaattt ttaccagagc aaaaccccac atttcttgta gtgaacaatc 2760
tgtggatgat aaccgatcga agacttttgt ggggatttca ctaaccaact atttggctct 2820
cattaattac tattagttat ataaggccat cccaagtatt ttggcaatat tcaaaacgag 2880
taaactataa aattacactt ttggttcttg tatttctaac ttttagaatt atgtatttgg 2940
ttcttatagt tttttatttg tatgaattac attacttttg gtccacaata ttttttattt 3000
tctataattc catttttagt c 3021
<210> 35
<211> 3006
<212> DNA
<213> Artificial Sequence
<220>
<223> LsPromoter-without-MYB-sites_LsCoding sequence_To3'UTR
<400> 35
tcaatttcga tcttgactac catgaatgtc atatttatat gacatactta taagaaatta 60
taatacaaat ttgattttaa aataaaataa aaactatttt cataacggat attttgtttc 120
gtataaaaag aataccgtaa gattaaatta aaataaacaa tccgttaaac tgacataata 180
taatattgga aaataaaaaa atatatatgt tttcataaaa aaaaaaactt caagtttgga 240
tcagatttag gaaaagtaaa accttatatt tagttgatga ccgttttacc ataaacaatt 300
atcagtttgt gctgggttaa ttgttaataa aaataatatt aaaatttaat tgaatataac 360
atgaatatat aatttttttt tggaaaaact tcttttaaaa tgttacataa attacgatta 420
aatattttta ataccaaatt atatagtatc tggattaaag aggtcaaaaa gtaaacttta 480
aaaaataaaa aaaataaata atagattaat ataagttaga ggacttcaat tatttttcat 540
gtggaccctt ctaaaagaac ctatttttac aaatagattt aaaaccaatc tatttttgga 600
aatggtctcc taaatcaatc aaattttata aaaaaactcc aacactatca aatatataac 660
aattttattc gatcggttaa atagttagaa ttataacaaa ataaaaaaca agataatttt 720
ttcaaaataa tttgaaataa aaaataaggt gtcaaaaatg aacttttatg taaacttaac 780
atcatttgtc atttttgtta caaaacatga ttaatattat tactttgtaa gtgtccactt 840
ttcttcaaac tccttgctta gttaaaaaaa tctataatat atgaaattaa ttttagtttt 900
cttaaactac atatataatt attttttatc aaacttgaat taaaagccta tgacaataac 960
caaaatgaaa tagtatgact tatacatttg ccgttgacta ataaaccaaa aaatcgaatt 1020
gacatcagac caaaaccagc tctgtatata ttggttatgt tatgggttat atagagttgt 1080
ttaaaaggca gttatcgatt acgttctcag ttctagagtt ttcacaaaaa tcaattctcc 1140
tgtatcacat cgaaagcaaa ccggtctatt tataaaagag atacatattt gaaacaacat 1200
attttttaat tatatttatg tgttgtttat aaatctagaa acccgtaaat ttatatttag 1260
ttcagtatcc aatataggat ctgaaactac tttataaccg ttaccagaca aataccggtc 1320
aagtttatat tggtgtagtt ttcgattcct ttgattttat atctttttgg cgccatttca 1380
cgtcaacggt ttaaaaacaa gttatcgttt ctccggtaca gttaaccacc caaataccgg 1440
aatacctata aatacaactt ccatttcaat cgtctctctc tgcactccca ttctttgaat 1500
ccaaaaaagg ctacacacac acacagacaa caatggcaga tgatggcaac accgcccgtc 1560
aacaggctga cgccggtggc catggaaacg cacgtccaaa ctcatccacc cccccttcgt 1620
caccctccca acctccaaga agaccacgcc gtgccggagc cactacaccg tcaaagcttt 1680
cccaggcggc atcttcgtca acaaatcttc caccgccgcc aacgccaaca ccaactccgc 1740
ccaccccttc tgccgacggg atattactag gtactgcaag aaggccggta atatgcccga 1800
tttgcaaaaa ggatatgtat catgaaaagg cgctgtgtgg ccacatccgg tggcacacgc 1860
aggaggagag actggcggca agcagggata ttgcccgggc gctttctgcc aacgttgttt 1920
ctgggcaaag aggcgatgga gaacaagggc cgtctaaacg gttcaaactg ccggatctta 1980
acgagccacc accgtcggag gactgatttt cttgcgggag aggcatgcat gtatgtgtgg 2040
cctttttgca ataatactat gcatgggaga tgcataaagt ttatctttat tttttttagt 2100
ttaataatgt gtggcaaact ttatatcatt tatgatttcg gccatgtact gctacatcgt 2160
tctaggatgg ttattcccta gaatttgctt tatgtatttg ttttctttgt taattcttct 2220
cttccttaaa cgttatttca tgtgaattgc gatgtcatga tattgcagga atgtaactta 2280
gaactcaacg ataaaaagtg tgttgagatc gtggaagttg atcatttatc ttgaattcat 2340
aagataagca acatgagata ggataattaa ttactgtggg gatttctttt tatattcata 2400
ttattcgttg taatgcaaat ttttaagtag aataacgaat gtgtcttatt atttacggtt 2460
aaatgcaaaa gatcattaac atatctccat tgatttgttt actgatgtat tctcatgtgt 2520
tctgttgcta aattctattt tgaaaagtat attcaattaa agcaatgcat tttagatata 2580
aagcaactcc ataacttata attgtgtaga tttttaccaa ttcaatgtct taaaagaaaa 2640
ataaaaattg aaagtttaat taattgccat agtgatcccg ttcccgtcaa ttatgtgatc 2700
aatttttacc agagcaaaac cccacatttc ttgtagtgaa caatctgtgg atgataaccg 2760
atcgaagact tttgtgggga tttcactaac caactatttg gctctcatta attactatta 2820
gttatataag gccatcccaa gtattttggc aatattcaaa acgagtaaac tataaaatta 2880
cacttttggt tcttgtattt ctaactttta gaattatgta tttggttctt atagtttttt 2940
atttgtatga attacattac ttttggtcca caatattttt tattttctat aattccattt 3000
ttagtc 3006
<210> 36
<211> 4356
<212> DNA
<213> Artificial Sequence
<220>
<223> LsPromoter-with-MITE-insert_LsCoding sequence_To3'UTR
<400> 36
tcaatttcga tcttgactac catgaatgtc atatttatat gacatactta taagaaatta 60
taatacaaat ttgattttaa aataaaataa aaactatttt cataacggat attttgtttc 120
gtataaaaag aataccgtaa gattaaatta aaataaacaa tccgttaaac tgacataata 180
taatattgga aaataaaaaa atatatatgt tttcataaaa aaaaaaactt caagtttgga 240
tcagatttag gaaaagtaaa accttatatt tagttgatga ccgttttacc ataaacaatt 300
atcagtttgt gctgggttaa ttgttaataa aaataatatt aaaatttaat tgaatataac 360
atgaatatat aatttttttt tggaaaaact tcttttaaaa tgttacataa attacgatta 420
aatattttta ataccaaatt atatagtatc tggattaaag aggtcaaaaa gtaaacttta 480
aaaaataaaa aaaataaata atagattaat ataagttaga ggacttcaat tatttttcat 540
gtggaccctt ctaaaagaac ctatttttac aaatagattt aaaaccaatc tatttttgga 600
aatggtctcc taaatcaatc aaattttata aaaaaactcc aacactatca aatatataac 660
aattttattc gatcggttaa atagttagaa ttataacaaa ataaaaaaca agataatttt 720
ttcaaaataa tttgaaataa aaaataaggt gtcaaaaatg aacttttatg taaacttaac 780
atcatttgtc atttttgtta caaaacatga ttaatattat tactttgtaa gtgtccactt 840
ttcttcaaac tccttgctta gttaaaaaaa tctataatat atgaaattaa ttttagtttt 900
cttaaactac atatataatt attttttatc aaacttgaat taaaagccta tgacaataac 960
caaaatgaaa tagtatgact tatacatttg ccgttgacta ataaaccaaa aaatcgaatt 1020
gacatcagac caaaaccagc tctgtatata ttggttatgt tatgggttat atagagttgt 1080
ttaaaaggca gttatcgatt acgttctcag ttctagagtt ttcacaaaaa tcaattctcc 1140
tgtatcacat cgaaagcaaa ccggtctatt tataaaagag atacatattt gaaacaacat 1200
attttttaat tatatttatg tgttgtttat aaatctagaa acccgtaaat ttatatttag 1260
ttcagtatcc aatataggat ctgaaactac tttataaccg ttaccagaca aataccggtc 1320
aagtttatat tggtgtagtt ttcgattcct ttgattttat atctttttgg cgccatttca 1380
cgtcaacggt ttaaaaacaa gttatcgttt ctccggtaca gttaaccacc actgctacca 1440
gggccggcca gaaggctgtg cggcttgggc tgtggcacag gggcagcaga tttagtccat 1500
ttattatggt ctgctattta tttgggtcca ataagatcag ggcactaaaa ctcaaataca 1560
tcaattcaag tcggcggcaa aagaataaaa agcgccaatt tttagaagac aaggagacag 1620
cacaataatc atgcttttcc aatggccaat taattttagc ctttgtgagg tataaatatg 1680
aatcactttt tctccaaata tcattattgt aaactagtaa agagcgtaaa ttgttttatc 1740
gctaatcttc ttctttttca aatataattg tttgattctt tgtagtaggt acgttaagtt 1800
ttatatcatt cgtcctggaa accttttctt atgccccttc aatttatgaa tttgtgtttt 1860
gtattgtctt gctattaatc caatgcaaac taattctgcc gcatcgatct cacagagttg 1920
gagcagctta aaaggagttt tggggcaact taaaatgagg gtagcttttt tgttgttgtt 1980
ggtctactat ttactttggt ccttatcgtt ttagttttgt gttcattgag gatttgaatg 2040
actttgaaca caagtttata aaactaagtt tttgtgattc taaatttttg atgtgtgcaa 2100
ccgactaaat gaatataaaa ttctgatttg tgtatttctg atttctgatt taccggttat 2160
tcattatgtt tttctggatc tcatatgaat ttagtatata aaaatctcag gttcttctta 2220
ctcagtctag tatattttgg cattggggat cagggttaaa atcatcattt ttctaagcac 2280
taacaagctt taaaaccatc aattaaaagt tagttctcca tacctggaat tgtttattgc 2340
tttagtattc atttcatagt gtcaatacct tacaactgtt tattgttttc aaatgtttac 2400
tgttttgcac tttagttgtt tttagcatgt ttcaactttc aaagttaatt gacgatagtg 2460
tcatatacga aatatcatca ctcatacaaa attaaactgg atagaatttt ttccgatgaa 2520
atctattttt aaatagttac gaatataata ggagacttaa tatgtttgtt tcaaaattac 2580
acaaaaacac catggaaatg ggcattagtt tgtataagca tccttttaaa tataaagctt 2640
tgttacattg atgccttcta aatatataat attgtaatga tttgtagtaa acaccatgga 2700
aatgggcatt attaagatgt ttcgcccagg gcatgaaaaa ctatcggacc ggccctgact 2760
gctacaaccg ccacaaataa ccgtcaccgg aatacctata aatacaactt ccatttcaat 2820
cgtctctctc tgcactccca ttctttgaat ccaaaaaagg ctacacacac acacagacaa 2880
caatggcaga tgatggcaac accgcccgtc aacaggctga cgccggtggc catggaaacg 2940
cacgtccaaa ctcatccacc cccccttcgt caccctccca acctccaaga agaccacgcc 3000
gtgccggagc cactacaccg tcaaagcttt cccaggcggc atcttcgtca acaaatcttc 3060
caccgccgcc aacgccaaca ccaactccgc ccaccccttc tgccgacggg atattactag 3120
gtactgcaag aaggccggta atatgcccga tttgcaaaaa ggatatgtat catgaaaagg 3180
cgctgtgtgg ccacatccgg tggcacacgc aggaggagag actggcggca agcagggata 3240
ttgcccgggc gctttctgcc aacgttgttt ctgggcaaag aggcgatgga gaacaagggc 3300
cgtctaaacg gttcaaactg ccggatctta acgagccacc accgtcggag gactgatttt 3360
cttgcgggag aggcatgcat gtatgtgtgg cctttttgca ataatactat gcatgggaga 3420
tgcataaagt ttatctttat tttttttagt ttaataatgt gtggcaaact ttatatcatt 3480
tatgatttcg gccatgtact gctacatcgt tctaggatgg ttattcccta gaatttgctt 3540
tatgtatttg ttttctttgt taattcttct cttccttaaa cgttatttca tgtgaattgc 3600
gatgtcatga tattgcagga atgtaactta gaactcaacg ataaaaagtg tgttgagatc 3660
gtggaagttg atcatttatc ttgaattcat aagataagca acatgagata ggataattaa 3720
ttactgtggg gatttctttt tatattcata ttattcgttg taatgcaaat ttttaagtag 3780
aataacgaat gtgtcttatt atttacggtt aaatgcaaaa gatcattaac atatctccat 3840
tgatttgttt actgatgtat tctcatgtgt tctgttgcta aattctattt tgaaaagtat 3900
attcaattaa agcaatgcat tttagatata aagcaactcc ataacttata attgtgtaga 3960
tttttaccaa ttcaatgtct taaaagaaaa ataaaaattg aaagtttaat taattgccat 4020
agtgatcccg ttcccgtcaa ttatgtgatc aatttttacc agagcaaaac cccacatttc 4080
ttgtagtgaa caatctgtgg atgataaccg atcgaagact tttgtgggga tttcactaac 4140
caactatttg gctctcatta attactatta gttatataag gccatcccaa gtattttggc 4200
aatattcaaa acgagtaaac tataaaatta cacttttggt tcttgtattt ctaactttta 4260
gaattatgta tttggttctt atagtttttt atttgtatga attacattac ttttggtcca 4320
caatattttt tattttctat aattccattt ttagtc 4356
<210> 37
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> K2-2 like zinc finger domain
<220>
<221> misc_feature
<222> (2)..(3)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (5)..(11)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (12)..(12)
<223> Xaa can be K or R
<220>
<221> misc_feature
<222> (14)..(15)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (18)..(18)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (19)..(19)
<223> Xaa can be R or N
<220>
<221> misc_feature
<222> (20)..(20)
<223> Xaa can be any naturally occurring amino acid
<400> 37
Cys Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ala Xaa Xaa Gly
1 5 10 15
His Xaa Xaa Xaa His
20
<210> 38
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> consensus zinc finger domain
<220>
<221> misc_feature
<222> (2)..(3)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (5)..(16)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (18)..(20)
<223> Xaa can be any naturally occurring amino acid
<400> 38
Cys Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
His Xaa Xaa Xaa His
20
<210> 39
<211> 163
<212> PRT
<213> cichorium endivia
<400> 39
Met Val Asp Asp Gly Thr Thr Ala Arg Gln Gln Val Asp Asp Gly Gly
1 5 10 15
His Gly Asn Pro Arg Pro Asn Pro Thr Thr Pro Pro Pro Ser Pro Ser
20 25 30
Arg Thr Pro Arg Arg Thr Arg Arg Ala Gly Ala Thr Thr Pro Ser Lys
35 40 45
Leu Ser Pro Ala Val Ser Ser Thr Thr Leu Pro Pro Pro Pro Thr Pro
50 55 60
Pro Thr Pro Pro Ala Asp Arg Leu Val Thr Gly Thr Ser Ser Ser Leu
65 70 75 80
Gly Thr Gln Arg Val Arg Arg Ser Lys Ser Val Ile Cys Pro Ile Cys
85 90 95
Lys Lys Asp Met Cys His Glu Lys Ala Leu Cys Gly His Ile Arg Trp
100 105 110
His Thr His Glu Glu Arg Gln Ala Ala Ser Ser Asp Ile Ala Arg Ala
115 120 125
Leu Ser Ser Asn Phe Ser Ser Gly His Gly Gly Glu Glu Gln Gly Pro
130 135 140
Ser Lys Arg Phe Lys Val Pro Asp Leu Asn Lys Pro Pro Pro Pro Glu
145 150 155 160
Glu Asp Asp
<210> 40
<211> 161
<212> PRT
<213> Hieracium aurantiacum
<400> 40
Met Val Asp Asp Gly Thr Ala Ala Arg Gln Gln Val Asp Asp Gly Gly
1 5 10 15
His Gly Glu Arg Arg Pro Thr Pro Thr Thr Pro Pro Pro Ser Pro Ser
20 25 30
Arg Thr Pro Arg Arg Ser His Arg Pro Gly Thr Thr Pro Pro Ser Lys
35 40 45
Leu Ser Pro Ala Ala Ser Ser Thr Ala Leu Pro Pro Pro Pro Thr Pro
50 55 60
Pro Thr Pro Thr Val Val Ala Gly Ser Ser Ser Ser Leu Thr Thr Pro
65 70 75 80
Arg Ile Lys Arg Ser Lys Ser Val Ile Cys Pro Ile Cys Lys Lys Asp
85 90 95
Met Cys His Glu Lys Ala Leu Cys Gly His Ile Arg Trp His Thr Gln
100 105 110
Glu Glu Arg Leu Ala Ala Ser Gly Asp Ile Ala Arg Ala Leu Ser Ala
115 120 125
Asn Phe Val Ser Gly Gly Asn Gly Asp Glu Glu Gln Gly Ser Ser Lys
130 135 140
Arg Phe Lys Val Pro Asp Leu Asn Lys Pro Pro Pro Pro Glu Glu Asp
145 150 155 160
Asp
<210> 41
<211> 166
<212> PRT
<213> Senecio cambrensis
<400> 41
Met Val Asn Ser Gly Asp Ala Ser Arg Ser Asp Asp Asn Pro Asn Thr
1 5 10 15
Pro Asn Arg Arg Ala Gly Lys Ala His Ala Ala Pro Ser Thr Ser Pro
20 25 30
Ser Ser Pro Pro Pro Pro Ile Gly Arg Leu Ser Ala Thr Thr Pro Leu
35 40 45
Ser Gly Ser Lys Arg Pro His Ser Pro Thr Lys Lys Ser Asn Phe Ile
50 55 60
Cys Pro Ile Cys Gly Lys Asp Leu Tyr His Ser Lys Ala Leu Asn Gly
65 70 75 80
His Ile Arg Trp His Ser Gln Met Glu Arg Glu Leu Lys Lys Lys Ala
85 90 95
Leu Arg Asp Ile Arg Glu Arg Asp Val Ala Val Val Ala Ala Ala Asp
100 105 110
Ala Val Gln Val Ala Pro Val Pro Ala Thr Val Pro Val Pro Val Pro
115 120 125
Thr Ile Val Arg Thr Arg Leu Phe His Glu Gln Pro Gln Pro Gln Pro
130 135 140
Gln Glu Glu Val Pro Tyr Asn Tyr Ala Tyr Leu Leu Pro Asp Leu Asn
145 150 155 160
Ala Ser Ala Asp Glu Glu
165
<210> 42
<211> 203
<212> PRT
<213> Hevea brasiliensis
<400> 42
Met Val Asn Ser Ser Pro Ser Ser Ser Ser Ser Ser Ser Ser Pro Thr
1 5 10 15
Pro Pro Pro Glu Val Gln Val Gly Pro Gly Gly Ser Ser Val Gly Gly
20 25 30
Glu Ser Glu Glu Gly Cys Ser Ser Arg Lys Lys Lys Ala Gly Ser Asn
35 40 45
Asp Gln Gln Gly Asp Glu Glu Gly Val Gln Lys Arg Leu Lys Arg Gly
50 55 60
Glu Met Asp Ser Pro Ile Ser Glu Pro Val Cys Cys Ile Cys Asn Lys
65 70 75 80
Lys Phe Gly Ser Trp Lys Gly Val Phe Gly His Met Arg Ala His Pro
85 90 95
Glu Arg Glu Trp Arg Gly Ala Phe Pro Pro Pro Lys Glu Lys Ala Gly
100 105 110
Ala Ile Asn Ile Asn His Gln Gln Ile Leu Gln Gln Gln Leu Ala Pro
115 120 125
Thr Leu Leu Ser Leu Gly Arg Glu Ala Leu Ala Arg Met Thr Asn His
130 135 140
His Gly Ser Gly Ala Ala Asn Ala Ala Ala Pro Ser Arg Arg Ala Gly
145 150 155 160
Asp Thr Glu Leu Asn Arg Glu Gln Gln Glu Leu Ala Gly Pro Ser Thr
165 170 175
Ile Ile His Pro Ser Leu Arg Gly Phe Asp Leu Asn Leu Pro Pro Pro
180 185 190
Pro Glu Glu Ala Asn Glu Asp Asp Arg Asn Asn
195 200
<210> 43
<211> 230
<212> PRT
<213> Cucurbita moschata
<400> 43
Met Glu Lys Asn Ala Asn Thr Asn Val Pro Ser Glu Thr Ser Ser Asp
1 5 10 15
Gln Arg His Gly Gly Glu Arg Ser Pro Thr Gly Pro Thr Ser Pro Pro
20 25 30
Pro Thr His Asn Arg Asp Asn Asn Pro Asn Pro Thr Thr Glu His Ser
35 40 45
Ser Tyr Ser Asp Thr Leu Arg Val Pro Pro Ala Ala Glu Thr Ser Arg
50 55 60
Arg Asp Ala Leu Leu Asp Val Gly Thr Ser Tyr Gln Asn Ile Val Gly
65 70 75 80
Ser Ser Glu Gly Glu Pro Gly Lys Lys Arg Gly Arg Gly Asp Gly Glu
85 90 95
Glu Glu Glu Glu Gln Gln Gln Pro Pro Gln Gln Gln Val Lys Ala Ala
100 105 110
Lys Lys Lys Gly Glu Leu Thr Glu Val Pro Lys Gly Glu Pro Arg Cys
115 120 125
Ala Thr Cys Asn Lys Val Phe Lys Ser Trp Lys Ala Leu Phe Gly His
130 135 140
Leu Arg Ser His Pro Glu Arg Thr Tyr Arg Gly Ala Leu Pro Pro Pro
145 150 155 160
Thr Ala Ala Glu Leu Asp Ile Arg Arg Cys Gln Gln Gln Leu Ala Ser
165 170 175
Thr Leu Leu Thr Val Ala Gln Glu Val Ala Ala Ser Arg Arg Gly Leu
180 185 190
Asp Ile Asp Leu Asn Gln Pro Ser Thr Ala Asp Asp Gly Asp Ser Pro
195 200 205
Glu Lys Thr Gly Gly Val Gly Phe Asp Leu Asn Ala Asp Pro Pro Pro
210 215 220
Glu Ser Asp Asp Glu Asp
225 230
<210> 44
<211> 242
<212> PRT
<213> Eutrema salsugineum
<400> 44
Met Val Thr Glu Glu Glu Ile Asn Glu Ile Ser Glu Asp Ser Gly Tyr
1 5 10 15
Leu Ser Ser Gly Glu Glu Gly Glu Ile Arg Glu Leu Val Cys Ala Leu
20 25 30
Pro Ala Leu Asn Val Thr Glu Arg Leu Asn Met Glu Glu Ala Gly Leu
35 40 45
His Asn Ala Val Val Ala Ala Glu Phe Val Met Val Ala Ser Glu Glu
50 55 60
Ala Pro Val Ser Lys Glu Asn Met Gln Thr Val Asp Ala Ile Asp Asp
65 70 75 80
Asp Ala Lys Asn Thr Ala Leu Gly Arg Arg Pro Arg Ile Asp Glu Leu
85 90 95
Asp Asp Ala Ala Gly Ala Ser Gly Ser Thr Ala Ile Gly Ser Gly Gly
100 105 110
Glu Asp Glu Pro Val Lys Lys Ala Lys Lys Lys Gly Ser Ser Gln Leu
115 120 125
His Ala Pro Pro Gln Gly Pro Pro Gln Cys Asn Ile Cys Gly Arg Asn
130 135 140
Phe Thr Ser Trp Lys Ala Val Phe Gly His Leu Arg Ala His Lys Asp
145 150 155 160
Arg Gly Tyr Gln Gly Phe Leu Pro Pro Pro Thr Phe Asn Ala Thr Glu
165 170 175
Glu Gly Phe Ser Ala Val Val Leu Ala Ser Asp Ser Ser Arg Gly Gly
180 185 190
Val Leu Gly Phe Gly Ser Ser Gly Ile Asp Leu Asn Leu Asp Pro Met
195 200 205
Glu Glu Glu Glu Glu Ala Val Ser Gly Phe Ile Pro Lys Phe Asp Leu
210 215 220
Asn Arg Ser Pro Pro Gln Glu Gly Gln Glu Glu Glu Glu Glu Asp Lys
225 230 235 240
Ala Lys
<210> 45
<211> 244
<212> PRT
<213> Arachis ipaensis
<400> 45
Met Glu Lys Asn His Ser Thr Ser Ala Ser Thr Thr Ser Leu Pro Ser
1 5 10 15
Leu Ser Leu Ser Thr Pro Val Thr Glu Pro Pro Ser Ser Pro Leu Val
20 25 30
Asp Gln Pro Asn Leu Ser Gly Glu Glu Glu Lys Leu Asn Ile Leu Lys
35 40 45
Thr Pro Glu Lys Ile Leu Thr Asp Leu Thr Thr Asn Asn Asp Ala Asn
50 55 60
Gly Gly Ser Ala Leu Pro Pro Ser Ser Pro Pro Pro Ser Pro Pro Gln
65 70 75 80
Met Met Val Ser Gly Ala Ile Ala Thr Ala Val Gly Gly Gly Ala Val
85 90 95
Val Leu Gly Gly Asn Asn Ile Ile Gly Pro Ile Lys Arg Arg Lys Ala
100 105 110
Ser Glu Ile Met Asp Pro Pro Ser Gly Thr Pro Thr Cys Pro Ile Cys
115 120 125
Ser Lys Thr Phe Ser Ser Trp Lys Gly Ala Phe Gly His Met Arg Lys
130 135 140
His Pro Asp Arg Gln Tyr Arg Gly Phe Phe Lys Pro Pro Thr Phe Ala
145 150 155 160
Pro Ser Ser Ser Lys Ala Ala Thr Asn Ala Ser Gly Asn Arg His Glu
165 170 175
Ala Ala Gly Glu Glu Gly Ser Ser Ala Ala Ser Gly Glu Val Gly Glu
180 185 190
Gly Gly Ala Ser Pro Ala Val Arg Asn Leu Leu Phe Asp Leu Asn His
195 200 205
Pro Val Glu Gly Val Lys Asp Glu Glu Glu Gly Lys Ile Ile Leu Gly
210 215 220
Phe Asp Leu Asn Glu Pro Ala Val Glu Glu Glu Glu Glu Glu Lys Glu
225 230 235 240
Asp Lys Pro Phe
<210> 46
<211> 202
<212> PRT
<213> Cajanus cajan
<400> 46
Met Gln Glu Gln Asn Pro Ser Glu Asn Ser Pro Ser Asn Asp Asp Ala
1 5 10 15
Pro Asn Pro Gln Gly Gly Glu Gly Glu Ile Met Lys Thr Pro Trp Gln
20 25 30
Val Leu Glu Glu Leu Cys Gly Gly Ser Ser Thr Pro Val Ala Val Ala
35 40 45
Pro Val Ser Glu Gly Val Leu Gln Pro Lys Lys Arg Lys Thr Ser Glu
50 55 60
Val Arg Asp Pro Pro Arg Gly Lys Pro Ile Cys Pro Val Cys Asn Lys
65 70 75 80
Glu Phe Thr Ser Trp Lys Ala Ala Phe Gly His Met Arg Ala His Pro
85 90 95
Asn Arg Asp Tyr Arg Gly Phe Tyr Lys Pro Pro Ala Phe Pro Ser Ser
100 105 110
Ser Ser Ser Lys Asp Gln Pro Pro Pro Ser Ala Asn Asn Asn Lys Gly
115 120 125
Gly Gly Ala Lys Lys Thr Asn Ala Ala Ser Asp Gly Thr Asp Glu Val
130 135 140
Asp Ser Gly Gly Gly Lys Glu Val Thr Pro Ser Pro Asn Gln Leu Phe
145 150 155 160
Gly Phe Asp Leu Asn Glu Pro Val Glu Gly Leu Gly Ser Ser His Ala
165 170 175
Val Glu Glu Gly Val Gln Glu Glu Lys Asp Leu Gly Phe Asp Leu Asn
180 185 190
Glu Met Pro Pro Ala Glu Asp His Glu Gly
195 200
<210> 47
<211> 265
<212> PRT
<213> Brassica rapa
<400> 47
Met Thr Asn Pro Glu Lys Met Lys Val Asp Gly Asp Thr Glu Lys Glu
1 5 10 15
Lys Glu Asp Ser Ser Asp Glu Gln Trp Ser Asp Glu Glu Ser Ala Met
20 25 30
Arg Glu Ile Val Leu Gly Leu Pro Ala Leu Ser Ile Ser Ser Ala Thr
35 40 45
Phe Gly Val Ser Ile Ala Val Asp Glu Glu Glu Glu Ala Arg Leu Asn
50 55 60
Glu Gln Ala Val Val Ala Ala Glu Leu Val Ile Ala Ala Ala Glu Glu
65 70 75 80
Ala Val Met Lys Glu Lys Ser Asp Gly Lys Lys Lys Lys Val Arg Arg
85 90 95
Gln Arg Lys Thr Met Lys Leu Asn Asn Asp Asp Glu Ala Gly Gly Ser
100 105 110
Ser Lys Gly Gly Glu Ala Ala Lys Lys Pro Arg Lys Lys Thr Ser Glu
115 120 125
Phe Thr Asn Leu Pro Arg Gly Pro Pro Val Cys Asn Val Cys Gly Arg
130 135 140
Ala Phe His Ser Trp Lys Ala Val Phe Gly His Leu Arg Ser His Lys
145 150 155 160
Asp Arg Ser Tyr Arg Gly Phe Leu Pro Pro Pro Arg Phe Ser Ala Pro
165 170 175
Ile Arg Gly Val Met Ile Pro Gly Pro Asn Ser Ala Phe Val Arg Val
180 185 190
Val Ala Arg Gly Gly Ser Ser Gly Val Val Val Ala Ser Gly Gly Gly
195 200 205
Gly Gly Gly Gly Ala Ser Gly Gly Glu Gly Gly Arg Gly Val Gly Ile
210 215 220
Val Met Asp Val Asp Arg Val Glu Lys Glu Lys Gln Glu Val Thr Glu
225 230 235 240
Ser Gly Thr Ala Ala Lys Phe Asp Leu Asn Lys Ser Pro Pro Lys Asp
245 250 255
Asp Asp Glu Glu Glu Asp Lys Thr Lys
260 265
<210> 48
<211> 237
<212> PRT
<213> Lagenaria siceraria
<400> 48
Met Glu Lys Asn Thr Asn Ala Asn Ala Asn Asp Asn Thr Val Ser Glu
1 5 10 15
Thr Ser Pro Asp Gln Arg His Gly Gly Glu Arg Ser Pro Met Ala Ser
20 25 30
Ser Pro Pro Pro Ser Ala Arg Asn Asp Asp Val Asn Asn Pro Thr Pro
35 40 45
Asn Val Val Ile Glu Leu Ser Ser Ser Val Val Val Ala Ala Pro Glu
50 55 60
Ser Thr Thr Thr Gly Asp Val Arg Arg Arg Gln Thr Val Asp Ala Thr
65 70 75 80
Leu Leu Asp Val Gly Thr Ser Ser His Asp His Val Gly Gly Ser Ser
85 90 95
Asp Ile Glu Gln Gly Lys Lys Arg Gly Arg Gly Asp Gly Gly Glu Gln
100 105 110
Gln Gln Gln Val Lys Ala Ala Lys Lys Lys Gly Glu Leu Thr Glu Val
115 120 125
Pro Lys Gly Glu Pro Arg Cys Ala Thr Cys Asn Lys Val Phe Lys Ser
130 135 140
Trp Lys Ala Leu Phe Gly His Leu Arg Ser His Pro Glu Arg Thr Tyr
145 150 155 160
Arg Gly Ala Leu Pro Pro Pro Thr Ala Ala Glu Leu Asp Ile Arg Arg
165 170 175
Cys Gln Gln Gln Leu Ala Ser Thr Leu Leu Thr Val Ala Gln Gln Val
180 185 190
Ala Thr Ser Arg Arg Gly Leu Asn Ile Asp Leu Asn Gln Pro Ser Ala
195 200 205
Ala Asp Asp Gly Asp Ser Pro Glu Lys Thr Gly Ser Val Gly Phe Asp
210 215 220
Leu Asn Val Glu Pro Pro Pro Glu Ser Asp Asp Glu Lys
225 230 235
<210> 49
<211> 243
<212> PRT
<213> Arachis ipaensis
<400> 49
Met Asp Lys Asn Ala Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser
1 5 10 15
Ser Ser Pro Ser Thr Ser Thr Thr Glu Gln Pro Pro Pro Pro Ser Pro
20 25 30
Gln Asp Val Pro Val Glu Glu Pro Pro Val Ile Leu Lys Thr Pro Glu
35 40 45
Glu Val Leu Ala Glu Leu Thr Glu Ser Gly Glu Ser Pro Pro Pro Pro
50 55 60
Pro Pro Ser Ala Ala Glu Glu Gly Gly Ile Gly Gly Ser Ala Met Ala
65 70 75 80
Ile Ala Val Gly Val Gly Gly Glu Gly Val Val Leu Gly Glu Ala Gly
85 90 95
Ser Gly Gly Ser Gly Ala Val Gly Ala Ser Arg Lys Arg Lys Ala Ser
100 105 110
Glu Val Lys Asp Pro Pro Thr Gly Thr Pro Thr Cys Pro Val Cys Asn
115 120 125
Lys Thr Phe Ala Ser Trp Lys Gly Ala Phe Gly His Met Arg Lys His
130 135 140
Pro Asp Arg Gln Tyr Arg Gly Phe Phe Lys Pro Pro Thr Phe Thr Ser
145 150 155 160
Ser Val Ala Ala Ala Ala Thr Ser Gly Ala Thr Thr Gln Gly Phe Val
165 170 175
Glu Gly Gly Ser Ser Ala Ala Ser Gly Glu Gly Gly Ser Val Gly Ala
180 185 190
Ala Gly Gln Val Gly Glu Gly Gly Ser Phe Asp Leu Asn Gln Pro Val
195 200 205
Met Glu Arg Gly Gly Ala Gly Asp Gly Asp Glu Gly Arg Asn Gly Asp
210 215 220
Glu Gly Lys Asp Leu Gly Phe Asp Leu Asn Lys Pro Ala Asp Glu Glu
225 230 235 240
Asp Lys Ala
<210> 50
<211> 271
<212> PRT
<213> Prunus persica
<400> 50
Met Ala Asn Gln Gln Asn Thr Thr Thr Asn Asn Thr Asn Arg Leu Ala
1 5 10 15
Ser Ser Ala Glu Gly Gln Gln Gln Pro Gly Asn Asp Asn Val Asn Val
20 25 30
Asn Val Thr Gly Val Ala Ala Thr Gly Thr Pro Ser Phe Pro Asn Pro
35 40 45
Pro Pro Pro Ser Thr Val Gln Leu Asn Val Ala Arg Gly Ser Ser Val
50 55 60
Ser Pro Pro Gly Leu Asn Arg Gly Pro Ser Gly Arg Gly Ser Ser Asn
65 70 75 80
Pro Arg Arg Val Ser Pro Ser Gly Arg Lys Ser Pro Pro Gly Gly Arg
85 90 95
Gly Ser Pro Ser Ser Gly Arg Gly Ser Ser Ser Phe Ala Ser Ser Pro
100 105 110
Gly Ala Gly Gln Ile Thr Gln Ile Gly Gly Arg Asn Phe Thr Pro Leu
115 120 125
Ser Val Glu Ile Thr Ile Gly Gly Gly Ser Gly Thr Ala Gly Gly Ser
130 135 140
Met Ile Pro Gly Ser Ser Ser Gly Ser Pro Pro Arg Ala Lys Arg Lys
145 150 155 160
Ala Glu Ile Thr Ala Pro Glu Gly Val Ser Pro Val Cys Ser Val Cys
165 170 175
Lys Arg Ser Asn Phe Ser Ser Trp Lys Ala Leu Phe Gly His Met Arg
180 185 190
Cys His Pro Glu Arg Gln Trp Arg Gly Cys Phe Pro Pro Pro Gly Phe
195 200 205
Glu Glu Ala Gln Arg Ala Leu Gln Gln Gly Glu Arg Leu Gly Ala Leu
210 215 220
Arg Gly Phe Asp Leu Asn Glu Ala Ser Asp Pro Glu Glu Glu Asn Glu
225 230 235 240
Gly Gly Gly Gly Gly Gly Phe Asp Leu Asn Met Leu Pro Pro Asp Glu
245 250 255
Asp Lys Asp Gly Gly Gly Ser Ser Gly Gly Ala Ala Lys Thr Gly
260 265 270
<210> 51
<211> 321
<212> PRT
<213> Glycine max
<400> 51
Met Gln Asn Gln Asn Pro Ser Glu Asp Asp Ser Thr Asn Lys Ala Pro
1 5 10 15
Ser Asp Asp Thr Pro His Pro Thr Asn Asn Asp Asn Asn Asn Pro Pro
20 25 30
Gly Glu Ser Leu Ile Met Lys Thr Val Arg Gln Val Leu Glu Glu Leu
35 40 45
Gly Gly Ser Arg Asp Asp Asn Asp Gly Gly Val Gly Asp Gly Thr Pro
50 55 60
Val Ala Val Ala Leu Glu Val Gly Gly Gly Gly Asp Gly Ser Gly Gly
65 70 75 80
Asp Gly Gly Gly Val Gly Gly Gly Pro Pro Val Ala Met Glu Ala Ser
85 90 95
Asp Gly Gly Asp Glu Asp Asn Asp Asn Glu His Ser Asp Ser Ile Gly
100 105 110
Asp Ser Val Pro Val Ala Val Ala Val Lys Val Gly Gly Arg Gly Gly
115 120 125
Asp Asn Ser Gly Gly Gly Ala Thr Val Thr Val Ser Val Ala Leu Ser
130 135 140
Asp Gly Asp Tyr Gly Gly Ser Asn Gly Ser Gly Gly Ser Pro Val Ala
145 150 155 160
Val Ala Val Ala Val Gly Gly Gly Ser Thr Val Met Glu Ser Val Val
165 170 175
Val Gly Thr Glu Gly Val Gln Gly Arg Lys Arg Lys Thr Pro Leu Val
180 185 190
Arg Asp Pro Pro Thr Gly Arg Pro Thr Cys Pro Leu Cys Gln Lys Glu
195 200 205
Phe Gln Thr Trp Lys Gly Ala Phe Gly His Met Arg Ala His Pro Asp
210 215 220
Arg Asp Tyr Arg Gly Phe Phe Lys Pro Pro Val Phe Gly Ser Pro Ser
225 230 235 240
Ser Thr Gln Asp Gln Pro Pro Ser Asp Gly Lys Gly Asp Asp Ser Ala
245 250 255
Lys Lys Ser Thr Gly Glu Asp Asn Thr Ala Glu Lys Gly Ser Ala Ser
260 265 270
Leu Pro Val Arg Val Pro Met Phe Asp Leu Asn Glu Leu Ile Glu Glu
275 280 285
Asp Gly Ser Ser His Ala Ala Glu Pro Ala Glu Asp Met Ser Thr Gly
290 295 300
Glu Gly Lys Gly Ser Gly Phe Asp Leu Asn Glu Met Pro Pro Ala Glu
305 310 315 320
Asp
<210> 52
<211> 355
<212> PRT
<213> Glycine max
<400> 52
Met Asn His His Lys Tyr Ser Ser His Arg His Asn Leu Phe Asn Ser
1 5 10 15
Phe Leu Thr Leu Ala Ile Phe Ile Ile Leu Gly Phe Ser Phe Ser Ala
20 25 30
Thr Gly Met Gln Asn Gln Asn Pro Ser Glu Asp Asp Ser Thr Asn Lys
35 40 45
Ala Pro Ser Asp Asp Thr Pro His Pro Thr Asn Asn Asp Asn Asn Asn
50 55 60
Pro Pro Gly Glu Ser Leu Ile Met Lys Thr Val Arg Gln Val Leu Glu
65 70 75 80
Glu Leu Gly Gly Ser Arg Asp Asp Asn Asp Gly Gly Val Gly Asp Gly
85 90 95
Thr Pro Val Ala Val Ala Leu Glu Val Gly Gly Gly Gly Asp Gly Ser
100 105 110
Gly Gly Asp Gly Gly Gly Val Gly Gly Gly Pro Pro Val Ala Met Glu
115 120 125
Ala Ser Asp Gly Gly Asp Glu Asp Asn Asp Asn Glu His Ser Asp Ser
130 135 140
Ile Gly Asp Ser Val Pro Val Ala Val Ala Val Lys Val Gly Gly Arg
145 150 155 160
Gly Gly Asp Asn Ser Gly Gly Gly Ala Thr Val Thr Val Ser Val Ala
165 170 175
Leu Ser Asp Gly Asp Tyr Gly Gly Ser Asn Gly Ser Gly Gly Ser Pro
180 185 190
Val Ala Val Ala Val Ala Val Gly Gly Gly Ser Thr Val Met Glu Ser
195 200 205
Val Val Val Gly Thr Glu Gly Val Gln Gly Arg Lys Arg Lys Thr Pro
210 215 220
Leu Val Arg Asp Pro Pro Thr Gly Arg Pro Thr Cys Pro Leu Cys Gln
225 230 235 240
Lys Glu Phe Gln Thr Trp Lys Gly Ala Phe Gly His Met Arg Ala His
245 250 255
Pro Asp Arg Asp Tyr Arg Gly Phe Phe Lys Pro Pro Val Phe Gly Ser
260 265 270
Pro Ser Ser Thr Gln Asp Gln Pro Pro Ser Asp Gly Lys Gly Asp Asp
275 280 285
Ser Ala Lys Lys Ser Thr Gly Glu Asp Asn Thr Ala Glu Lys Gly Ser
290 295 300
Ala Ser Leu Pro Val Arg Val Pro Met Phe Asp Leu Asn Glu Leu Ile
305 310 315 320
Glu Glu Asp Gly Ser Ser His Ala Ala Glu Pro Ala Glu Asp Met Ser
325 330 335
Thr Gly Glu Gly Lys Gly Ser Gly Phe Asp Leu Asn Glu Met Pro Pro
340 345 350
Ala Glu Asp
355
<210> 53
<211> 357
<212> PRT
<213> Glycine max
<400> 53
Met Asn His His Lys Tyr Ser Ser His Arg His Asn Leu Phe Asn Ser
1 5 10 15
Phe Leu Thr Leu Ala Ile Phe Ile Ile Leu Gly Phe Ser Phe Ser Ala
20 25 30
Thr Gly Met Gln Asn Gln Asn Pro Ser Glu Asp Asp Ser Thr Asn Lys
35 40 45
Ala Pro Ser Asp Asp Thr Pro His Pro Thr Asn Asn Asp Asn Asn Asn
50 55 60
Pro Pro Gly Glu Ser Leu Ile Met Lys Thr Val Arg Gln Val Leu Glu
65 70 75 80
Glu Leu Gly Gly Ser Arg Asp Asp Asn Asp Gly Gly Val Gly Asp Gly
85 90 95
Thr Pro Val Ala Val Ala Leu Glu Val Gly Gly Gly Gly Asp Gly Ser
100 105 110
Gly Gly Asp Gly Gly Gly Val Gly Gly Gly Pro Pro Val Ala Met Glu
115 120 125
Ala Ser Asp Gly Gly Asp Glu Asp Asn Asp Asn Glu His Ser Asp Ser
130 135 140
Ile Gly Asp Ser Val Pro Val Ala Val Ala Val Lys Val Gly Gly Arg
145 150 155 160
Gly Gly Asp Asn Ser Gly Gly Gly Ala Thr Val Thr Val Ser Val Ala
165 170 175
Leu Ser Asp Gly Asp Tyr Gly Gly Ser Asn Gly Ser Gly Gly Ser Pro
180 185 190
Val Ala Val Ala Val Ala Val Gly Gly Gly Ser Thr Val Met Glu Ser
195 200 205
Val Val Val Gly Thr Glu Gly Val Gln Gly Arg Lys Arg Lys Thr Pro
210 215 220
Leu Val Arg Asp Pro Pro Thr Gly Arg Pro Thr Cys Pro Leu Cys Gln
225 230 235 240
Lys Glu Phe Gln Thr Trp Lys Gly Ala Phe Gly His Met Arg Ala His
245 250 255
Pro Asp Arg Asp Tyr Arg Gly Phe Phe Lys Pro Pro Val Phe Gly Ser
260 265 270
Pro Ser Ser Thr Gln Asp Gln Pro Pro Ser Asp Gly Lys Val Ala Gly
275 280 285
Asp Asp Ser Ala Lys Lys Ser Thr Gly Glu Asp Asn Thr Ala Glu Lys
290 295 300
Gly Ser Ala Ser Leu Pro Val Arg Val Pro Met Phe Asp Leu Asn Glu
305 310 315 320
Leu Ile Glu Glu Asp Gly Ser Ser His Ala Ala Glu Pro Ala Glu Asp
325 330 335
Met Ser Thr Gly Glu Gly Lys Gly Ser Gly Phe Asp Leu Asn Glu Met
340 345 350
Pro Pro Ala Glu Asp
355
<210> 54
<211> 324
<212> PRT
<213> Glycine max
<400> 54
Met Gln Asn Gln Asn Pro Ser Glu Asp Asp Ser Thr Lys Lys Ser Pro
1 5 10 15
Ser Ser Pro Ser Asp Asp Thr Ser His Pro Thr Asn Asn Asn Asn Asn
20 25 30
Pro Gln Gly Glu Ser Leu Val Met Lys Thr Val Trp Gln Val Leu Glu
35 40 45
Glu Leu Gly Gly Ser Gly Asp Asp Ser Asp Gly Asp Ser Gly Phe Gly
50 55 60
Asp Gly Ala Pro Val Ala Val Ala Val Gly Gly Gly Gly Asp Asp Asn
65 70 75 80
Gly Asp Gly Asp Gly Ser Val Gly Gly Gly Ala Thr Val Ala Met Glu
85 90 95
Lys Ser Asp Asp Asp Ser Asp Asn Asn Gly Asp Asn Ser Gly Ser Asn
100 105 110
Leu Ala Val Ala Val Val Val Gly Gly Gly Asp Gly Ser Gly Ser Ser
115 120 125
Gly Val Gly Ala Thr Val Thr Val Ser Val Ala Val Ser Gly Gly Gly
130 135 140
Gly Asn His Gly Gly Gly Ser Ser Gly Gly Gly Gly Gly Gly Pro Val
145 150 155 160
Ala Val Ser Val Ala Val Gly Gly Gly Ser Thr Val Val Glu Ser Val
165 170 175
Val Val Ser Thr Glu Gly Val Gln Gly Arg Lys Arg Lys Thr Ser Ile
180 185 190
Val Arg Asp Pro Pro Thr Gly Arg Pro Thr Cys Pro Leu Cys Gln Lys
195 200 205
Glu Phe Pro Thr Trp Lys Gly Ala Phe Gly His Met Arg Ala His Pro
210 215 220
Asp Arg Asp Tyr Arg Gly Phe Phe Lys Pro Pro Val Phe Gly Ser Pro
225 230 235 240
Ser Ser Thr Gln Asp Gln Pro Pro Arg Asp Asp Lys Val Ala Gly Asp
245 250 255
Asp Ser Ala Lys Lys Ser Ser Gly Glu Val Asn Asn Gly Glu Lys Gly
260 265 270
Ser Ala Ser Ser His Val Arg Val Pro Met Phe Asp Leu Asn Glu Pro
275 280 285
Ile Glu Glu Glu Gly Ser Ser His Ala Ala Glu Pro Ala Glu Asp Met
290 295 300
Ser Ser Glu Glu Gly Lys Gly Phe Gly Phe Asp Leu Asn Glu Met Pro
305 310 315 320
Pro Ala Glu Asp
<210> 55
<211> 280
<212> PRT
<213> Cicer arietinum
<400> 55
Met Lys Arg Phe Cys His Ser Phe His Lys Thr Glu Lys His Asp Asp
1 5 10 15
Tyr Val Trp Pro Leu Leu Ala His Glu Met Lys Lys Asn Gly Ser Arg
20 25 30
Ile Phe Ile Cys Asp Leu Cys Asp Lys Ser Phe Ser Ser Gly Asn Ala
35 40 45
Leu Gly Gly His Lys Ala Ser His Asn Arg Ser Asp Leu Leu Gln Pro
50 55 60
Pro Ile Lys Lys His Lys Leu Thr Ile Asp Ser Cys Ser Leu Ser Ser
65 70 75 80
Pro Asn Asp His Asp Asp Val Lys His Lys His Ala Cys Val Leu Cys
85 90 95
His Lys Val Phe Pro Ser Asn Lys Ala Leu Tyr Gly His Met Arg Ser
100 105 110
His Ser Gln Lys Asp Ser Lys Ala Ile Gln Pro Pro Leu Ile Thr Thr
115 120 125
Thr Ser Arg Asp Ser Lys Ile Gln Ser Asn Asn Thr Asp Asp Gln Pro
130 135 140
Ile Leu Pro Ala Ile Asp Leu Glu Lys Tyr Phe Pro Pro Arg Ser His
145 150 155 160
Gln Thr Lys Lys Arg Cys Ser Lys Ser Thr Ile Asp Tyr Glu Leu Ile
165 170 175
Asn Val Ala Gln Ile Leu Cys Asp Met Ser Arg Ser Asp Pro Thr Lys
180 185 190
Phe Thr Thr Asn Ile Asp Asn Gln Arg Asn Lys Glu His Val Thr Ile
195 200 205
Val Lys Asn Asn Asn Asn Pro Lys Lys Leu Val Val Thr Phe Lys Ile
210 215 220
Pro Lys Asp Lys Thr Phe Lys Ile Pro Lys Asp Lys Glu Glu Lys Asn
225 230 235 240
Lys Glu Ala Glu Met Glu Lys Glu Ser Ser His Gln Leu Gly Ser Arg
245 250 255
Ala Val Ala Lys Asp Phe Asp Leu Asn Glu Ile Pro Val Asp Leu Asp
260 265 270
Leu Val Ala Asp Glu Gln Ala Pro
275 280
<210> 56
<211> 290
<212> PRT
<213> Cicer arietinum
<400> 56
Met Asp Val Asp Glu Leu Gln Ala Ala Glu Arg Glu Asp Arg Arg Ser
1 5 10 15
Ile Ile Ile Met Lys Arg Ser Cys Gln Ser Phe Asp Lys Pro Met Lys
20 25 30
Asn Asp Asp Phe Val Trp Pro Leu Leu Ala Asn Glu Met Lys Lys Asn
35 40 45
Gly Ser Arg Ile Phe Ile Cys Asp Leu Cys Gly Lys Ser Phe Ser Ser
50 55 60
Gly Asn Ala Leu Gly Gly His Lys Ala Ser His Asn Arg Ser Asn Leu
65 70 75 80
Leu Gln Pro Pro Ile Lys Lys His Lys Leu Thr Ile Asp Ser Cys Ser
85 90 95
Leu Ser Ser Pro His Asp His Asp Asp Val Lys His Lys His Ala Cys
100 105 110
Val Leu Cys His Lys Val Phe Pro Ser Asn Lys Val Leu Tyr Gly His
115 120 125
Met Arg Ser His Ser Gln Lys Asp Ser Lys Ala Ile Gln Pro Pro Pro
130 135 140
Ile Thr Thr Thr Ser Pro Asp Ser Lys Lys Gln Ser Asn Asn Thr His
145 150 155 160
Asp Gln Pro Ile Leu Pro Thr Ile Asp Leu Glu Lys Tyr Phe Pro Pro
165 170 175
Arg Ser His Gln Thr Lys Lys Arg Arg Ser Lys Ser Ile Ile Asp Tyr
180 185 190
Glu Leu Ile Asn Val Ala Gln Ile Leu Cys Asp Met Ser Arg Ser Asp
195 200 205
Pro Lys Arg Leu Lys Leu Ser Thr Asn Ile Asp Asn Gln Lys Asn Lys
210 215 220
Glu His Val Thr Ile Val Lys Asn Asn Asn Asn Glu Lys Lys Leu Val
225 230 235 240
Val Arg Phe Lys Ile Pro Lys Asp Lys Glu Val Lys Asn Asn Glu Gly
245 250 255
Glu Thr Lys Lys Glu Ser Ser His Gln Leu Gly Ser Arg Gly Val Val
260 265 270
Lys Asp Phe Asp Leu Asn Glu Ile Pro Val Asp Val Ala Asp Glu Gln
275 280 285
Ala Asn
290
<210> 57
<211> 246
<212> PRT
<213> Cicer arietinum
<400> 57
Met Lys Lys Asn Gly Ser Arg Ile Phe Ile Cys Asp Leu Cys Gly Lys
1 5 10 15
Ser Phe Ser Ser Gly Asn Ala Leu Gly Gly His Lys Ala Ser His Asn
20 25 30
Arg Ser Asn Leu Leu Gln Pro Pro Ile Lys Lys His Lys Leu Thr Ile
35 40 45
Asp Ser Cys Ser Leu Ser Ser Pro His Asp His Asp Asp Val Lys His
50 55 60
Lys His Ala Cys Val Leu Cys His Lys Val Phe Pro Ser Asn Lys Val
65 70 75 80
Leu Tyr Gly His Met Arg Ser His Ser Gln Lys Asp Ser Lys Ala Ile
85 90 95
Gln Pro Pro Pro Ile Thr Thr Thr Ser Pro Asp Ser Lys Lys Gln Ser
100 105 110
Asn Asn Thr Asp Asp Gln Pro Ile Leu Pro Thr Ile Asp Leu Glu Lys
115 120 125
Tyr Phe Pro Pro Arg Ser His Gln Thr Lys Lys Arg Arg Ser Lys Ser
130 135 140
Ile Ile Asp Tyr Glu Leu Ile Asn Val Ala Gln Ile Leu Cys Asp Met
145 150 155 160
Ser Arg Ser Asp Pro Lys Arg Leu Lys Leu Ser Thr Asn Ile Asp Asn
165 170 175
Gln Lys Asn Lys Glu His Val Thr Ile Val Lys Asn Asn Asn Asn Glu
180 185 190
Lys Lys Leu Val Val Arg Phe Lys Ile Pro Lys Asp Lys Glu Val Lys
195 200 205
Asn Asn Glu Gly Glu Thr Lys Lys Glu Ser Ser His Gln Leu Gly Ser
210 215 220
Arg Gly Val Val Lys Asp Phe Asp Leu Asn Glu Ile Pro Val Asp Val
225 230 235 240
Ala Asp Glu Gln Ala Asn
245
<210> 58
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> EAR motif
<220>
<221> misc_feature
<222> (4)..(5)
<223> Xaa can be any naturally occurring amino acid
<400> 58
Asp Leu Asn Xaa Xaa Pro
1 5
<210> 59
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> EAR motif
<220>
<221> misc_feature
<222> (4)..(4)
<223> Xaa can be any naturally occurring amino acid
<400> 59
Asp Leu Asn Xaa Pro
1 5
<210> 60
<211> 1335
<212> DNA
<213> Artificial Sequence
<220>
<223> Tar-MITE insert
<400> 60
actgctacca gggccggcca gaaggctgtg cggcttgggc tgtggcacag gggcagcaga 60
tttagtccat ttattatggt ctgctattta tttgggtcca ataagatcag ggcactaaaa 120
ctcaaataca tcaattcaag tcggcggcaa aagaataaaa agcgccaatt tttagaagac 180
aaggagacag cacaataatc atgcttttcc aatggccaat taattttagc ctttgtgagg 240
tataaatatg aatcactttt tctccaaata tcattattgt aaactagtaa agagcgtaaa 300
ttgttttatc gctaatcttc ttctttttca aatataattg tttgattctt tgtagtaggt 360
acgttaagtt ttatatcatt cgtcctggaa accttttctt atgccccttc aatttatgaa 420
tttgtgtttt gtattgtctt gctattaatc caatgcaaac taattctgcc gcatcgatct 480
cacagagttg gagcagctta aaaggagttt tggggcaact taaaatgagg gtagcttttt 540
tgttgttgtt ggtctactat ttactttggt ccttatcgtt ttagttttgt gttcattgag 600
gatttgaatg actttgaaca caagtttata aaactaagtt tttgtgattc taaatttttg 660
atgtgtgcaa ccgactaaat gaatataaaa ttctgatttg tgtatttctg atttctgatt 720
taccggttat tcattatgtt tttctggatc tcatatgaat ttagtatata aaaatctcag 780
gttcttctta ctcagtctag tatattttgg cattggggat cagggttaaa atcatcattt 840
ttctaagcac taacaagctt taaaaccatc aattaaaagt tagttctcca tacctggaat 900
tgtttattgc tttagtattc atttcatagt gtcaatacct tacaactgtt tattgttttc 960
aaatgtttac tgttttgcac tttagttgtt tttagcatgt ttcaactttc aaagttaatt 1020
gacgatagtg tcatatacga aatatcatca ctcatacaaa attaaactgg atagaatttt 1080
ttccgatgaa atctattttt aaatagttac gaatataata ggagacttaa tatgtttgtt 1140
tcaaaattac acaaaaacac catggaaatg ggcattagtt tgtataagca tccttttaaa 1200
tataaagctt tgttacattg atgccttcta aatatataat attgtaatga tttgtagtaa 1260
acaccatgga aatgggcatt attaagatgt ttcgcccagg gcatgaaaaa ctatcggacc 1320
ggccctgact gctac 1335
<210> 61
<211> 2622
<212> DNA
<213> Artificial Sequence
<220>
<223> LsPromoter-with-deletion_LsCoding sequence_To3'UTR
<400> 61
tcaatttcga tcttgactac catgaatgtc atatttatat gacatactta taagaaatta 60
taatacaaat ttgattttaa aataaaataa aaactatttt cataacggat attttgtttc 120
gtataaaaag aataccgtaa gattaaatta aaataaacaa tccgttaaac tgacataata 180
taatattgga aaataaaaaa atatatatgt tttcataaaa aaaaaaactt caagtttgga 240
tcagatttag gaaaagtaaa accttatatt tagttgatga ccgttttacc ataaacaatt 300
atcagtttgt gctgggttaa ttgttaataa aaataatatt aaaatttaat tgaatataac 360
atgaatatat aatttttttt tggaaaaact tcttttaaaa tgttacataa attacgatta 420
aatattttta ataccaaatt atatagtatc tggattaaag aggtcaaaaa gtaaacttta 480
aaaaataaaa aaaataaata atagattaat ataagttaga ggacttcaat tatttttcat 540
gtggaccctt ctaaaagaac ctatttttac aaatagattt aaaaccaatc tatttttgga 600
aatggtctcc taaatcaatc aaattttata aaaaaactcc aacactatca aatatataac 660
aattttattc gatcggttaa atagttagaa ttataacaaa ataaaaaaca agataatttt 720
ttcaaaataa tttgaaataa aaaataaggt gtcaaaaatg aacttttatg taaacttaac 780
atcatttgtc atttttgtta caaaacatga ttaatattat tactttgtaa gtgtccactt 840
ttcttcaaac tccttgctta gttaaaaaaa tctataatat atgaaattaa ttttagtttt 900
cttaaactac atatataatt attttttatc aaacttgaat taaaagccta tgacaataac 960
caaaatgaaa tagtatgact tatacatttg ccgttgacta ataaaccaaa aaatcgaatt 1020
gacatcagac caaccgccac aaataaccgt caccggaata cctataaata caacttccat 1080
ttcaatcgtc tctctctgca ctcccattct ttgaatccaa aaaaggctac acacacacac 1140
agacaacaat ggcagatgat ggcaacaccg cccgtcaaca ggctgacgcc ggtggccatg 1200
gaaacgcacg tccaaactca tccacccccc cttcgtcacc ctcccaacct ccaagaagac 1260
cacgccgtgc cggagccact acaccgtcaa agctttccca ggcggcatct tcgtcaacaa 1320
atcttccacc gccgccaacg ccaacaccaa ctccgcccac cccttctgcc gacgggatat 1380
tactaggtac tgcaagaagg ccggtaatat gcccgatttg caaaaaggat atgtatcatg 1440
aaaaggcgct gtgtggccac atccggtggc acacgcagga ggagagactg gcggcaagca 1500
gggatattgc ccgggcgctt tctgccaacg ttgtttctgg gcaaagaggc gatggagaac 1560
aagggccgtc taaacggttc aaactgccgg atcttaacga gccaccaccg tcggaggact 1620
gattttcttg cgggagaggc atgcatgtat gtgtggcctt tttgcaataa tactatgcat 1680
gggagatgca taaagtttat ctttattttt tttagtttaa taatgtgtgg caaactttat 1740
atcatttatg atttcggcca tgtactgcta catcgttcta ggatggttat tccctagaat 1800
ttgctttatg tatttgtttt ctttgttaat tcttctcttc cttaaacgtt atttcatgtg 1860
aattgcgatg tcatgatatt gcaggaatgt aacttagaac tcaacgataa aaagtgtgtt 1920
gagatcgtgg aagttgatca tttatcttga attcataaga taagcaacat gagataggat 1980
aattaattac tgtggggatt tctttttata ttcatattat tcgttgtaat gcaaattttt 2040
aagtagaata acgaatgtgt cttattattt acggttaaat gcaaaagatc attaacatat 2100
ctccattgat ttgtttactg atgtattctc atgtgttctg ttgctaaatt ctattttgaa 2160
aagtatattc aattaaagca atgcatttta gatataaagc aactccataa cttataattg 2220
tgtagatttt taccaattca atgtcttaaa agaaaaataa aaattgaaag tttaattaat 2280
tgccatagtg atcccgttcc cgtcaattat gtgatcaatt tttaccagag caaaacccca 2340
catttcttgt agtgaacaat ctgtggatga taaccgatcg aagacttttg tggggatttc 2400
actaaccaac tatttggctc tcattaatta ctattagtta tataaggcca tcccaagtat 2460
tttggcaata ttcaaaacga gtaaactata aaattacact tttggttctt gtatttctaa 2520
cttttagaat tatgtatttg gttcttatag ttttttattt gtatgaatta cattactttt 2580
ggtccacaat attttttatt ttctataatt ccatttttag tc 2622
<210> 62
<211> 300
<212> PRT
<213> Arabidopsis thaliana
<400> 62
Met Arg Lys Met Glu Ala Lys Lys Glu Glu Ile Lys Lys Gly Pro Trp
1 5 10 15
Lys Ala Glu Glu Asp Glu Val Leu Ile Asn His Val Lys Arg Tyr Gly
20 25 30
Pro Arg Asp Trp Ser Ser Ile Arg Ser Lys Gly Leu Leu Gln Arg Thr
35 40 45
Gly Lys Ser Cys Arg Leu Arg Trp Val Asn Lys Leu Arg Pro Asn Leu
50 55 60
Lys Asn Gly Cys Lys Phe Ser Ala Asp Glu Glu Arg Thr Val Ile Glu
65 70 75 80
Leu Gln Ser Glu Phe Gly Asn Lys Trp Ala Arg Ile Ala Thr Tyr Leu
85 90 95
Pro Gly Arg Thr Asp Asn Asp Val Lys Asn Phe Trp Ser Ser Arg Gln
100 105 110
Lys Arg Leu Ala Arg Ile Leu His Asn Ser Ser Asp Ala Ser Ser Ser
115 120 125
Ser Phe Asn Pro Lys Ser Ser Ser Ser His Arg Leu Lys Gly Lys Asn
130 135 140
Val Lys Pro Ile Arg Gln Ser Ser Gln Gly Phe Gly Leu Val Glu Glu
145 150 155 160
Glu Val Thr Val Ser Ser Ser Cys Ser Gln Met Val Pro Tyr Ser Ser
165 170 175
Asp Gln Val Gly Asp Glu Val Leu Arg Leu Pro Asp Leu Gly Val Lys
180 185 190
Leu Glu His Gln Pro Phe Ala Phe Gly Thr Asp Leu Val Leu Ala Glu
195 200 205
Tyr Ser Asp Ser Gln Asn Asp Ala Asn Gln Gln Ala Ile Ser Pro Phe
210 215 220
Ser Pro Glu Ser Arg Glu Leu Leu Ala Arg Leu Asp Asp Pro Phe Tyr
225 230 235 240
Tyr Asp Ile Leu Gly Pro Ala Asp Ser Ser Glu Pro Leu Phe Ala Leu
245 250 255
Pro Gln Pro Phe Phe Glu Pro Ser Pro Val Pro Arg Arg Cys Arg His
260 265 270
Val Ser Lys Asp Glu Glu Ala Asp Val Phe Leu Asp Asp Phe Pro Ala
275 280 285
Asp Met Phe Asp Gln Val Asp Pro Ile Pro Ser Pro
290 295 300
<210> 63
<211> 2338
<212> DNA
<213> artificial sequence
<220>
<223> LSpromoter - To coding sequence
<400> 63
tcaatttcga tcttgactac catgaatgtc atatttatat gacatactta taagaaatta 60
taatacaaat ttgattttaa aataaaataa aaactatttt cataacggat attttgtttc 120
gtataaaaag aataccgtaa gattaaatta aaataaacaa tccgttaaac tgacataata 180
taatattgga aaataaaaaa atatatatgt tttcataaaa aaaaaaactt caagtttgga 240
tcagatttag gaaaagtaaa accttatatt tagttgatga ccgttttacc ataaacaatt 300
atcagtttgt gctgggttaa ttgttaataa aaataatatt aaaatttaat tgaatataac 360
atgaatatat aatttttttt tggaaaaact tcttttaaaa tgttacataa attacgatta 420
aatattttta ataccaaatt atatagtatc tggattaaag aggtcaaaaa gtaaacttta 480
aaaaataaaa aaaataaata atagattaat ataagttaga ggacttcaat tatttttcat 540
gtggaccctt ctaaaagaac ctatttttac aaatagattt aaaaccaatc tatttttgga 600
aatggtctcc taaatcaatc aaattttata aaaaaactcc aacactatca aatatataac 660
aattttattc gatcggttaa atagttagaa ttataacaaa ataaaaaaca agataatttt 720
ttcaaaataa tttgaaataa aaaataaggt gtcaaaaatg aacttttatg taaacttaac 780
atcatttgtc atttttgtta caaaacatga ttaatattat tactttgtaa gtgtccactt 840
ttcttcaaac tccttgctta gttaaaaaaa tctataatat atgaaattaa ttttagtttt 900
cttaaactac atatataatt attttttatc aaacttgaat taaaagccta tgacaataac 960
caaaatgaaa tagtatgact tatacatttg ccgttgacta ataaaccaaa aaatcgaatt 1020
gacatcagac caaaaccagc tctgtatata ttggttatgt tatgggttat atagagttgt 1080
ttaaaaggca gttatcgatt acgttctcag ttctagagtt ttcacaaaaa tcaattctcc 1140
tgtatcacat cgaaagcaaa ccggtctatt tataaaagag atacatattt gaaacaacat 1200
attttttaat tatatttatg tgttgtttat aaatctagaa acccgtaaat ttatatttag 1260
ttcagtatcc aatataggat ctgaaactac tttataaccg ttaccagaca aataccggtc 1320
aagtttatat tggtgtagtt ttcgattcct ttgattttat atctttttgg cgccatttca 1380
cgtcaacggt ttaaaaacaa gttatcgttt ctccggtaca gttaaccacc aaccgccaca 1440
aataaccgtc accggaatac ctataaatac aacttccatt tcaatcgtct ctctctgcac 1500
tcccattctt tgaatccaaa aaaggctaca cacacacaca gacaacacca agtttgtaca 1560
aaaaagcagg ctatggcaga taatggcaac accggccgtc aaaaggatga cgacggtggc 1620
catgatggac cacgccaaaa cccaactact ccaccctccc cttcccgcac ccctcgaaga 1680
ccaaggcgga acacatcacc gcccaaacat tctccggggg cgtcttcaag caccatgcca 1740
gcgccgccta ctccccctgc gccgacggga atcaccggtg cttctagttc ttctgtgggt 1800
actaatataa tttcatttat tccacccaaa accaaaagaa cgaagtcggt gatctgcccg 1860
atctgcaaca aagatatgtg ccatgagaag gcgctgtgtg gccacatccg gtggcataca 1920
caggaggaaa gattggcggc cagcatcgct atagcaagag cgctatcttc taacgttgtt 1980
gtttctggca atggcgatga agatgaaggt ccatctaaaa agtataaact cccggacctg 2040
aacaaatctc caccgccgga ggaggaggac gaggacgctg cctgattttc ttgcgggaga 2100
ggcatgcatg tatgtgtggc ctttttgcaa taatactatg catgggagat gcataaagtt 2160
tatctttatt ttttttagtt taataatgtg tggcaaactt tatatcattt atgatttcgg 2220
ccatgtactg ctacatcgtt ctaggatggt tattccctag aatttgcttt atgtatttgt 2280
tttctttgtt aattcttctc ttccttaaac gttatttcat gtgaattgcg atgtcacc 2338
<210> 64
<211> 3673
<212> DNA
<213> artificial sequence
<220>
<223> LsPromoter-with-MITE_To Coding sequence
<400> 64
tcaatttcga tcttgactac catgaatgtc atatttatat gacatactta taagaaatta 60
taatacaaat ttgattttaa aataaaataa aaactatttt cataacggat attttgtttc 120
gtataaaaag aataccgtaa gattaaatta aaataaacaa tccgttaaac tgacataata 180
taatattgga aaataaaaaa atatatatgt tttcataaaa aaaaaaactt caagtttgga 240
tcagatttag gaaaagtaaa accttatatt tagttgatga ccgttttacc ataaacaatt 300
atcagtttgt gctgggttaa ttgttaataa aaataatatt aaaatttaat tgaatataac 360
atgaatatat aatttttttt tggaaaaact tcttttaaaa tgttacataa attacgatta 420
aatattttta ataccaaatt atatagtatc tggattaaag aggtcaaaaa gtaaacttta 480
aaaaataaaa aaaataaata atagattaat ataagttaga ggacttcaat tatttttcat 540
gtggaccctt ctaaaagaac ctatttttac aaatagattt aaaaccaatc tatttttgga 600
aatggtctcc taaatcaatc aaattttata aaaaaactcc aacactatca aatatataac 660
aattttattc gatcggttaa atagttagaa ttataacaaa ataaaaaaca agataatttt 720
ttcaaaataa tttgaaataa aaaataaggt gtcaaaaatg aacttttatg taaacttaac 780
atcatttgtc atttttgtta caaaacatga ttaatattat tactttgtaa gtgtccactt 840
ttcttcaaac tccttgctta gttaaaaaaa tctataatat atgaaattaa ttttagtttt 900
cttaaactac atatataatt attttttatc aaacttgaat taaaagccta tgacaataac 960
caaaatgaaa tagtatgact tatacatttg ccgttgacta ataaaccaaa aaatcgaatt 1020
gacatcagac caaaaccagc tctgtatata ttggttatgt tatgggttat atagagttgt 1080
ttaaaaggca gttatcgatt acgttctcag ttctagagtt ttcacaaaaa tcaattctcc 1140
tgtatcacat cgaaagcaaa ccggtctatt tataaaagag atacatattt gaaacaacat 1200
attttttaat tatatttatg tgttgtttat aaatctagaa acccgtaaat ttatatttag 1260
ttcagtatcc aatataggat ctgaaactac tttataaccg ttaccagaca aataccggtc 1320
aagtttatat tggtgtagtt ttcgattcct ttgattttat atctttttgg cgccatttca 1380
cgtcaacggt ttaaaaacaa gttatcgttt ctccggtaca gttaaccacc actgctacca 1440
gggccggcca gaaggctgtg cggcttgggc tgtggcacag gggcagcaga tttagtccat 1500
ttattatggt ctgctattta tttgggtcca ataagatcag ggcactaaaa ctcaaataca 1560
tcaattcaag tcggcggcaa aagaataaaa agcgccaatt tttagaagac aaggagacag 1620
cacaataatc atgcttttcc aatggccaat taattttagc ctttgtgagg tataaatatg 1680
aatcactttt tctccaaata tcattattgt aaactagtaa agagcgtaaa ttgttttatc 1740
gctaatcttc ttctttttca aatataattg tttgattctt tgtagtaggt acgttaagtt 1800
ttatatcatt cgtcctggaa accttttctt atgccccttc aatttatgaa tttgtgtttt 1860
gtattgtctt gctattaatc caatgcaaac taattctgcc gcatcgatct cacagagttg 1920
gagcagctta aaaggagttt tggggcaact taaaatgagg gtagcttttt tgttgttgtt 1980
ggtctactat ttactttggt ccttatcgtt ttagttttgt gttcattgag gatttgaatg 2040
actttgaaca caagtttata aaactaagtt tttgtgattc taaatttttg atgtgtgcaa 2100
ccgactaaat gaatataaaa ttctgatttg tgtatttctg atttctgatt taccggttat 2160
tcattatgtt tttctggatc tcatatgaat ttagtatata aaaatctcag gttcttctta 2220
ctcagtctag tatattttgg cattggggat cagggttaaa atcatcattt ttctaagcac 2280
taacaagctt taaaaccatc aattaaaagt tagttctcca tacctggaat tgtttattgc 2340
tttagtattc atttcatagt gtcaatacct tacaactgtt tattgttttc aaatgtttac 2400
tgttttgcac tttagttgtt tttagcatgt ttcaactttc aaagttaatt gacgatagtg 2460
tcatatacga aatatcatca ctcatacaaa attaaactgg atagaatttt ttccgatgaa 2520
atctattttt aaatagttac gaatataata ggagacttaa tatgtttgtt tcaaaattac 2580
acaaaaacac catggaaatg ggcattagtt tgtataagca tccttttaaa tataaagctt 2640
tgttacattg atgccttcta aatatataat attgtaatga tttgtagtaa acaccatgga 2700
aatgggcatt attaagatgt ttcgcccagg gcatgaaaaa ctatcggacc ggccctgact 2760
gctacaaccg ccacaaataa ccgtcaccgg aatacctata aatacaactt ccatttcaat 2820
cgtctctctc tgcactccca ttctttgaat ccaaaaaagg ctacacacac acacagacaa 2880
caccaagttt gtacaaaaaa gcaggctatg gcagataatg gcaacaccgg ccgtcaaaag 2940
gatgacgacg gtggccatga tggaccacgc caaaacccaa ctactccacc ctccccttcc 3000
cgcacccctc gaagaccaag gcggaacaca tcaccgccca aacattctcc gggggcgtct 3060
tcaagcacca tgccagcgcc gcctactccc cctgcgccga cgggaatcac cggtgcttct 3120
agttcttctg tgggtactaa tataatttca tttattccac ccaaaaccaa aagaacgaag 3180
tcggtgatct gcccgatctg caacaaagat atgtgccatg agaaggcgct gtgtggccac 3240
atccggtggc atacacagga ggaaagattg gcggccagca tcgctatagc aagagcgcta 3300
tcttctaacg ttgttgtttc tggcaatggc gatgaagatg aaggtccatc taaaaagtat 3360
aaactcccgg acctgaacaa atctccaccg ccggaggagg aggacgagga cgctgcctga 3420
ttttcttgcg ggagaggcat gcatgtatgt gtggcctttt tgcaataata ctatgcatgg 3480
gagatgcata aagtttatct ttattttttt tagtttaata atgtgtggca aactttatat 3540
catttatgat ttcggccatg tactgctaca tcgttctagg atggttattc cctagaattt 3600
gctttatgta tttgttttct ttgttaattc ttctcttcct taaacgttat ttcatgtgaa 3660
ttgcgatgtc acc 3673
<210> 65
<211> 3405
<212> DNA
<213> artificial sequence
<220>
<223> ToPromoter_LsCoding sequence
<400> 65
taaggccata acaaggttat ttgaacattc gcctaaaccc taaaccaact atatctattc 60
ggatttgtta cgagttttag agtttctaga aaatcagtta tatatcgatt aggcttggtt 120
ctaggttata agaaaaaatg attctctatc cggtatgaca tagagacaaa ccggtctact 180
tttataagaa aatcatattt gaaacaatgt ctagttaata attaattaat atgtgcatgt 240
ttaaatttag aatatcctga atttatattt agtgcgcaac cctatgtaag atcgaactaa 300
ttttaaaccg taaccagaca tgcatgtttg atcagtaata aaaaggctat tatcgtcgaa 360
aatattaaaa caaaatataa tatcttattt ggcgccattt catgtcaacg gttgaaagca 420
agttaccaac gcctccaacc gatcatttct ccggtaacaa ccaactgcta ccagggccgg 480
ccagaaggct gtgcggcttg ggctgtggca caggggcagc agatttagtc catttattat 540
ggtctgctat ttatttgggt ccaataagat cagggcacta aaactcaaat acatcaattc 600
aagtcggcgg caaaagaata aaaagcgcca atttttagaa gacaaggaga cagcacaata 660
atcatgcttt tccaatggcc aattaatttt agcctttgtg aggtataaat atgaatcact 720
ttttctccaa atatcattat tgtaaactag taaagagcgt aaattgtttt atcgctaatc 780
ttcttctttt tcaaatataa ttgtttgatt ctttgtagta ggtacgttaa gttttatatc 840
attcgtcctg gaaacctttt cttatgcccc ttcaatttat gaatttgtgt tttgtattgt 900
cttgctatta atccaatgca aactaattct gccgcatcga tctcacagag ttggagcagc 960
ttaaaaggag ttttggggca acttaaaatg agggtagctt ttttgttgtt gttggtctac 1020
tatttacttt ggtccttatc gttttagttt tgtgttcatt gaggatttga atgactttga 1080
acacaagttt ataaaactaa gtttttgtga ttctaaattt ttgatgtgtg caaccgacta 1140
aatgaatata aaattctgat ttgtgtattt ctgatttctg atttaccggt tattcattat 1200
gtttttctgg atctcatatg aatttagtat ataaaaatct caggttcttc ttactcagtc 1260
tagtatattt tggcattggg gatcagggtt aaaatcatca tttttctaag cactaacaag 1320
ctttaaaacc atcaattaaa agttagttct ccatacctgg aattgtttat tgctttagta 1380
ttcatttcat agtgtcaata ccttacaact gtttattgtt ttcaaatgtt tactgttttg 1440
cactttagtt gtttttagca tgtttcaact ttcaaagtta attgacgata gtgtcatata 1500
cgaaatatca tcactcatac aaaattaaac tggatagaat tttttccgat gaaatctatt 1560
tttaaatagt tacgaatata ataggagact taatatgttt gtttcaaaat tacacaaaaa 1620
caccatggaa atgggcatta gtttgtataa gcatcctttt aaatataaag ctttgttaca 1680
ttgatgcctt ctaaatatat aatattgtaa tgatttgtag taaacaccat ggaaatgggc 1740
attattaaga tgtttcgccc agggcatgaa aaactatcgg accggccctg actgctacta 1800
ataaccgcca ccgcaaaaac ctataaatac aacttccatc acaattctgt cccctactcc 1860
catttcaatc caaaaaaagg ctacacagac atatacagcg ccaagtttgt acaaaaaagc 1920
aggcttcatg gcagatgatg gcaacaccgc ccgtcaacag gctgacgccg gtggccatgg 1980
aaacgcacgt ccaaactcat ccaccccccc ttcgtcaccc tcccaacctc caagaagacc 2040
acgccgtgcc ggagccacta caccgtcaaa gctttcccag gcggcatctt cgtcaacaaa 2100
tcttccaccg ccgccaacgc caacaccaac tccgcccacc ccttctgccg acgggatatt 2160
actaggtact gcaagaaggc cggtaatatg cccgatttgc aaaaaggata tgtatcatga 2220
aaaggcgctg tgtggccata tacgttggca cacgcaagag gagagactgg cggcaagcag 2280
ggatattgcc cgggcgcttt ctgccaacgt tgtttctggg caaagaggcg atggagaaca 2340
agggccgtct aaacggttca aactgccgga tcttaacgag ccaccaccgt cggaggactg 2400
attttcttgc gggagaggca tgcatgtatg tgtggccttt ttgcaataat actatgcatg 2460
ggagatgcat aaagtttatc tttatttttt ttagtttaat aatgtgtggc aaactttata 2520
tcatttatga tttcggccat gtactgctac atcgttctag gatggttatt ccctagaatt 2580
tgctttatgt atttgttttc tttgttaatt cttctcttcc ttaaacgtta tttcatgtga 2640
attgcgatgt catgatattg caggaatgta acttagaact caacgataaa aagtgtgttg 2700
agatcgtgga agttgatcat ttatcttgaa ttcataagat aagcaacatg agataggata 2760
attaattact gtggggattt ctttttatat tcatattatt cgttgtaatg caaattttta 2820
agtagaataa cgaatgtgtc ttattattta cggttaaatg caaaagatca ttaacatatc 2880
tccattgatt tgtttactga tgtattctca tgtgttctgt tgctaaattc tattttgaaa 2940
agtatattca attaaagcaa tgcattttag atataaagca actccataac ttataattgt 3000
gtagattttt accaattcaa tgtcttaaaa gaaaaataaa aattgaaagt ttaattaatt 3060
gccatagtga tcccgttccc gtcaattatg tgatcaattt ttaccagagc aaaaccccac 3120
atttcttgta gtgaacaatc tgtggatgat aaccgatcga agacttttgt ggggatttca 3180
ctaaccaact atttggctct cattaattac tattagttat ataaggccat cccaagtatt 3240
ttggcaatat tcaaaacgag taaactataa aattacactt ttggttcttg tatttctaac 3300
ttttagaatt atgtatttgg ttcttatagt tttttatttg tatgaattac attacttttg 3360
gtccacaata ttttttattt tctataattc catttttagt cgacc 3405
Claims (15)
- 하기 단계를 포함하는 단위생식 표현형을 유도할 수 있는 돌연변이 유전자의 제조 방법:
(a) 하나 이상의 전사 인자 MYB 결합 부위를 포함하는 프로모터에 작동 가능하게 연결된 SEQ ID NO: 1, 6 또는 11의 PAR 단백질 또는 이의 어느 오르토로그(orthologue)를 인코딩하는 서열을 포함하는 유전자를 제공하는 단계; 및
(b) 상기 하나 이상의 MYB 결합 부위의 업스트림의 서열을 변형함으로써 상기 프로모터를 변형시켜 인코딩된 PAR 단백질의 전사를 증가시키는 단계.
- 제1항에 있어서,
상기 프로모터는 상기 하나 이상의 MYB 결합 부위의 바로 업스트림에 있는 상기 프로모터에 삽입 또는 결실을 도입함으로써 변형되는, 방법.
- 제1항 또는 제2항에 있어서,
상기 프로모터가 무작위 또는 표적 돌연변이유발에 의해 변형되는, 방법.
- 제1항 내지 제3항 중 어느 한 항에 있어서,
단계 (a)에서 제공되는 유전자는 식물 세포, 바람직하게는 식물 원형질체 내에 포함되고, 여기서 바람직하게 돌연변이 유전자는 식물 세포에서 단위생식을 유도하거나 증가시키는, 방법.
- 제4항에 있어서,
단계 (a)에서 제공되는 유전자는 내인성 유전자인, 방법.
- 제4항에 있어서,
단계 (a)에서 제공되는 유전자는 선택적으로 네이티브 또는 키메라 유전자인 트랜스진인, 방법.
- SEQ ID NO: 1, 6 또는 11의 PAR 단백질 또는 이의 어느 오르토로그를 인코딩하는 서열을 포함하는 단위생식 표현형을 유도할 수 있는 돌연변이 유전자로서, 상기 돌연변이 유전자가 제1항 내지 제6항 중 어느 한 항에 정의된 변형을 포함하는, 돌연변이 유전자.
- 제7항의 돌연변이 유전자를 포함하는 핵산 분자, 구조물 또는 벡터.
- 제7항의 돌연변이 유전자 및/또는 제8항의 핵산 분자, 구조물 또는 벡터를 포함하는, 식물 세포, 바람직하게는 식물 세포 원형질체.
- 제7항의 돌연변이 유전자 및/또는 제8항의 핵산 분자, 구조물 또는 벡터를 포함하는 식물로서, 상기 식물은 단위생식 식물이고, 상기 식물은 바람직하게는 제1항 내지 제6항 중 어느 한 항에 정의된 돌연변이 유전자를 생산함으로써 얻을 수 있는 식물.
- 제10항에 있어서,
상기 식물이 추가로 아포메이오시스(apomeiosis)를 할 수 있고, 바람직하게는 상기 식물이 아포믹틱(apomictic)인 식물.
- 하기의 단계를 포함하는 단위생식 식물의 생산 방법:
(a) 제9항의 식물 세포로부터 식물 조직 또는 식물을 재생 및/또는 성장시키는 단계; 및
(b) 선택적으로, 단계 (A)에서 얻은 식물 조직 또는 식물을 스크리닝 및/또는 유전자형 분석하는 단계.
- 제12항의 단계들을 포함하며, 여기서 단계 a)의 유전자는 아포메이오시스가 가능한 식물 세포, 바람직하게는 식물 원형질체에 포함되는 아포믹틱 식물의 생산 방법.
- 하기 단계를 포함하는 아포믹틱 F1 잡종 종자의 생산 방법:
(I) 유성 번식 제1 식물을 제2 식물의 꽃가루와 교배 수정시켜 F1 잡종 종자를 생산하는 단계로서, 여기서 상기 제2 식물은 제7항의 돌연변이 유전자 및/또는 제8항의 핵산 분자, 구조물 또는 벡터를 포함하며, 그리고 여기서 상기 제1 식물 및/또는 제2 식물은 아포메이오시스가 가능한, 단계; 및
(II) 선택적으로 상기 F1 잡종 종자로부터, 아포믹틱 표현형을 포함하는 종자를 선택하는, 바람직하게는 유전자형 분석에 의해, 아포믹틱 표현형을 포함하는 종자를 선택하는, 단계.
- 원형질체, 식물 세포 또는 식물에 단위생식 표현형을 유도하기 위한 제8항의 돌연변이 유전자, 핵산, 구조물 또는 벡터의 용도.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20201578.0 | 2020-10-13 | ||
EP20201578 | 2020-10-13 | ||
PCT/EP2021/078281 WO2022079087A1 (en) | 2020-10-13 | 2021-10-13 | Modified promoter of a parthenogenesis gene |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230088741A true KR20230088741A (ko) | 2023-06-20 |
Family
ID=72852495
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237015218A KR20230088741A (ko) | 2020-10-13 | 2021-10-13 | 단위생식 유전자의 변형된 프로모터 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20230383308A1 (ko) |
EP (1) | EP4228398A1 (ko) |
JP (1) | JP2023544753A (ko) |
KR (1) | KR20230088741A (ko) |
CN (1) | CN116568131A (ko) |
AU (1) | AU2021363100A1 (ko) |
CA (1) | CA3195190A1 (ko) |
IL (1) | IL301700A (ko) |
WO (1) | WO2022079087A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116589550B (zh) * | 2023-06-27 | 2023-10-03 | 中农集团种业控股有限公司 | 固定水稻杂种优势的方法 |
CN117660525B (zh) * | 2024-01-30 | 2024-04-26 | 三亚中国农业科学院国家南繁研究院 | 一种水稻单倍体诱导方法 |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4407956A (en) | 1981-03-13 | 1983-10-04 | The Regents Of The University Of California | Cloned cauliflower mosaic virus DNA as a plant vehicle |
CA1192510A (en) | 1981-05-27 | 1985-08-27 | Lawrence E. Pelcher | Rna plant virus vector or portion thereof, a method of construction thereof, and a method of producing a gene derived product therefrom |
NL8200523A (nl) | 1982-02-11 | 1983-09-01 | Univ Leiden | Werkwijze voor het in vitro transformeren van planteprotoplasten met plasmide-dna. |
US4536475A (en) | 1982-10-05 | 1985-08-20 | Phytogen | Plant vector |
EP0320500B1 (en) | 1983-01-13 | 2004-11-17 | Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. | Non-oncogenic ti plasmid vector system and recombinant DNA molecules for the introduction of expressible genes into plant cell genomes |
JPH0714349B2 (ja) | 1983-01-17 | 1995-02-22 | モンサント カンパニ− | 植物細胞での発現に適したキメラ遺伝子 |
DE3464841D1 (en) | 1983-01-27 | 1987-08-27 | Gen Foods Corp | Water-agglomeration method for depeptide sweetened products |
NL8300699A (nl) | 1983-02-24 | 1984-09-17 | Univ Leiden | Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; werkwijze voor het produceren van agrobacterium tumefaciens bacterien; stabiele cointegraat plasmiden; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten. |
EP0160692A1 (en) | 1983-11-03 | 1985-11-13 | DE WET, Johannes Martenis Jacob | Method for the transfer of exogenous genes in plants using pollen as a vector |
US5254799A (en) | 1985-01-18 | 1993-10-19 | Plant Genetic Systems N.V. | Transformation vectors allowing expression of Bacillus thuringiensis endotoxins in plants |
FI864720A (fi) | 1985-11-22 | 1987-05-23 | Ciba Geigy Ag | Direkt gentransmission i plasticider och mitokondrier. |
ES2018274T5 (es) | 1986-03-11 | 1996-12-16 | Plant Genetic Systems Nv | Celulas vegetales resistentes a los inhibidores de glutamina sintetasa, preparadas por ingenieria genetica. |
EP0265556A1 (en) | 1986-10-31 | 1988-05-04 | Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. | Stable binary agrobacterium vectors and their use |
IL84459A (en) | 1986-12-05 | 1993-07-08 | Agracetus | Apparatus and method for the injection of carrier particles carrying genetic material into living cells |
CA2071943C (en) | 1989-12-22 | 2007-04-24 | Joan Tellefsen Odell | Site-specific recombination of dna in plant cells |
FR2673642B1 (fr) | 1991-03-05 | 1994-08-12 | Rhone Poulenc Agrochimie | Gene chimere comprenant un promoteur capable de conferer a une plante une tolerance accrue au glyphosate. |
FR2673643B1 (fr) | 1991-03-05 | 1993-05-21 | Rhone Poulenc Agrochimie | Peptide de transit pour l'insertion d'un gene etranger dans un gene vegetal et plantes transformees en utilisant ce peptide. |
ATE191510T1 (de) | 1991-09-24 | 2000-04-15 | Keygene Nv | Selektive restriktionsfragmentenamplifikation: generelles verfahren für dns-fingerprinting |
WO1994000977A1 (en) | 1992-07-07 | 1994-01-20 | Japan Tobacco Inc. | Method of transforming monocotyledon |
US5527695A (en) | 1993-01-29 | 1996-06-18 | Purdue Research Foundation | Controlled modification of eukaryotic genomes |
EP0632054A1 (en) | 1993-06-28 | 1995-01-04 | European Molecular Biology Laboratory | Regulation of site-specific recombination by site-specific recombinase/nuclear receptor fusion proteins |
EP0672752B1 (en) | 1993-09-03 | 2004-05-26 | Japan Tobacco Inc. | Method of transforming monocotyledon by using scutellum of immature embryo |
US5811636A (en) | 1995-09-22 | 1998-09-22 | The United States Of America As Represented By The Secretary Of Agriculture | Apomixis for producing true-breeding plant progenies |
AUPN903196A0 (en) | 1996-03-29 | 1996-04-26 | Australian National University, The | Single-step excision means |
US20050155111A1 (en) | 2003-10-22 | 2005-07-14 | Carman John G. | Methods for increasing the frequency of apomixis expression in angiosperms |
US6750376B1 (en) | 1997-02-05 | 2004-06-15 | Utah State University | Methods for producing apomictic plants |
US20040148667A1 (en) | 1997-02-17 | 2004-07-29 | Institut De Recherche Pour Le Developpement (Ird) | Means for identifying nucleotide sequences involved in apomixis |
US6369298B1 (en) | 1997-04-30 | 2002-04-09 | Pioneer Hi-Bred International, Inc. | Agrobacterium mediated transformation of sorghum |
US6506963B1 (en) | 1999-12-08 | 2003-01-14 | Plant Genetic Systems, N.V. | Hybrid winter oilseed rape and methods for producing same |
CA2454609C (en) | 2001-08-23 | 2016-06-28 | Rijk Zwaan Zaadteelt En Zaadhandel B.V. | Reverse breeding |
US8878002B2 (en) | 2005-12-09 | 2014-11-04 | Council Of Scientific And Industrial Research | Nucleic acids and methods for producing seeds with a full diploid complement of the maternal genome in the embryo |
CA2996806A1 (en) | 2015-09-04 | 2017-03-09 | Keygene N.V. | Diplospory gene |
CN113874388A (zh) * | 2019-05-29 | 2021-12-31 | 主基因有限公司 | 孤雌生殖基因 |
-
2021
- 2021-10-13 AU AU2021363100A patent/AU2021363100A1/en active Pending
- 2021-10-13 IL IL301700A patent/IL301700A/en unknown
- 2021-10-13 WO PCT/EP2021/078281 patent/WO2022079087A1/en active Application Filing
- 2021-10-13 JP JP2023520327A patent/JP2023544753A/ja active Pending
- 2021-10-13 KR KR1020237015218A patent/KR20230088741A/ko unknown
- 2021-10-13 CA CA3195190A patent/CA3195190A1/en active Pending
- 2021-10-13 EP EP21786516.1A patent/EP4228398A1/en active Pending
- 2021-10-13 CN CN202180083089.0A patent/CN116568131A/zh active Pending
-
2023
- 2023-04-11 US US18/133,392 patent/US20230383308A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2022079087A1 (en) | 2022-04-21 |
JP2023544753A (ja) | 2023-10-25 |
AU2021363100A1 (en) | 2023-05-25 |
CN116568131A (zh) | 2023-08-08 |
CA3195190A1 (en) | 2022-04-21 |
IL301700A (en) | 2023-05-01 |
US20230383308A1 (en) | 2023-11-30 |
EP4228398A1 (en) | 2023-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106998665B (zh) | 单倍体植物的产生 | |
JP5770086B2 (ja) | 突然変異株INDEHISCENTアレルを有するアブラナ属(Brassica)植物 | |
US20220186238A1 (en) | Diplospory gene | |
CN113874388A (zh) | 孤雌生殖基因 | |
JP2012514467A (ja) | 2n配偶子またはアポマイオシス性配偶子を産生する植物 | |
CN113121664A (zh) | 鉴定、选择和产生疾病抗性作物的方法 | |
AU2016369320A1 (en) | Brassicaceae plants resistant to plasmodiophora brassicae (clubroot) | |
US20230383308A1 (en) | Modified promoter of a parthenogenesis gene | |
KR20080075908A (ko) | 배아에 모계 게놈의 완전한 이배체 상보체를 갖는 종자를생산하기 위한 핵산 및 방법 | |
CA2445700C (en) | Protein involved in restoration of cytoplasmic male sterility to fertility and gene encoding the protein and gene | |
US10087461B2 (en) | Glycine max resistance gene(s) and use thereof to engineer plants with broad-spectrum resistance to fungal pathogens and pests | |
CN114072512A (zh) | 不育基因及其相关构建体和应用 | |
KR101760931B1 (ko) | 양파의 임성회복 관련 분자 마커 및 웅성-가임 또는 웅성-불임의 선별방법 | |
CN110959043A (zh) | 利用bcs1l基因和向导rna/cas核酸内切酶系统改良植物农艺性状的方法 | |
CN114540366B (zh) | 一种水稻育性调控基因gms3及其突变体与应用 | |
US20040117868A1 (en) | Protein participating in restoration from cytoplasmic male sterility to fertility and gene encoding the same | |
KR102448347B1 (ko) | 무 웅성불임 판별하는 방법 및 무 웅성불임 식물체 | |
CN115315178A (zh) | 黄瓜植物中的甜瓜球腔菌果实内部腐烂抗性 | |
KR20220166292A (ko) | 개선된 선충 저항성을 갖는 식물 | |
CN115697043A (zh) | 通过靶向诱变获得突变植物的方法 | |
AU2022358470A1 (en) | Plants with improved properties | |
EA040147B1 (ru) | Растение-восстановитель фертильности |