CN113365494B - 能够发生种子败育型的果实形成的茄子科植物 - Google Patents
能够发生种子败育型的果实形成的茄子科植物 Download PDFInfo
- Publication number
- CN113365494B CN113365494B CN201980090949.6A CN201980090949A CN113365494B CN 113365494 B CN113365494 B CN 113365494B CN 201980090949 A CN201980090949 A CN 201980090949A CN 113365494 B CN113365494 B CN 113365494B
- Authority
- CN
- China
- Prior art keywords
- plant
- ser
- gly
- ssper
- leu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 235000013399 edible fruits Nutrition 0.000 title claims abstract description 186
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 67
- 206010000210 abortion Diseases 0.000 title claims description 11
- 231100000176 abortion Toxicity 0.000 title claims description 10
- 244000061458 Solanum melongena Species 0.000 title description 59
- 241000196324 Embryophyta Species 0.000 claims abstract description 488
- 108700028369 Alleles Proteins 0.000 claims abstract description 248
- 238000000034 method Methods 0.000 claims abstract description 83
- 239000000463 material Substances 0.000 claims abstract description 15
- 235000013305 food Nutrition 0.000 claims abstract description 14
- 108090000623 proteins and genes Proteins 0.000 claims description 338
- 102000004169 proteins and genes Human genes 0.000 claims description 173
- 230000035772 mutation Effects 0.000 claims description 54
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 53
- 231100000350 mutagenesis Toxicity 0.000 claims description 26
- 238000003306 harvesting Methods 0.000 claims description 10
- 230000006698 induction Effects 0.000 claims description 6
- 241000722363 Piper Species 0.000 claims 13
- 150000007523 nucleic acids Chemical class 0.000 abstract description 44
- 241000208292 Solanaceae Species 0.000 abstract description 39
- 102000039446 nucleic acids Human genes 0.000 abstract description 21
- 108020004707 nucleic acids Proteins 0.000 abstract description 21
- 238000004519 manufacturing process Methods 0.000 abstract description 14
- 235000018102 proteins Nutrition 0.000 description 156
- 108020004414 DNA Proteins 0.000 description 56
- 240000003768 Solanum lycopersicum Species 0.000 description 48
- 235000002566 Capsicum Nutrition 0.000 description 47
- 210000004027 cell Anatomy 0.000 description 46
- 229940024606 amino acid Drugs 0.000 description 44
- 150000001413 amino acids Chemical class 0.000 description 44
- 239000002773 nucleotide Substances 0.000 description 41
- 125000003729 nucleotide group Chemical group 0.000 description 41
- 240000008574 Capsicum frutescens Species 0.000 description 40
- 239000001390 capsicum minimum Substances 0.000 description 38
- 230000002068 genetic effect Effects 0.000 description 35
- 235000002597 Solanum melongena Nutrition 0.000 description 34
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 30
- 230000002829 reductive effect Effects 0.000 description 29
- 108091028043 Nucleic acid sequence Proteins 0.000 description 27
- 244000302909 Piper aduncum Species 0.000 description 26
- 239000012634 fragment Substances 0.000 description 25
- 241000894007 species Species 0.000 description 25
- 210000001519 tissue Anatomy 0.000 description 25
- 108020004999 messenger RNA Proteins 0.000 description 22
- 230000014509 gene expression Effects 0.000 description 20
- 240000004160 Capsicum annuum Species 0.000 description 19
- 210000000349 chromosome Anatomy 0.000 description 19
- 238000002703 mutagenesis Methods 0.000 description 19
- 238000009395 breeding Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 16
- 230000010152 pollination Effects 0.000 description 16
- 230000001488 breeding effect Effects 0.000 description 15
- 230000000694 effects Effects 0.000 description 15
- 108091026890 Coding region Proteins 0.000 description 14
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 14
- 238000000338 in vitro Methods 0.000 description 14
- 239000000126 substance Substances 0.000 description 14
- 238000006467 substitution reaction Methods 0.000 description 14
- 238000003556 assay Methods 0.000 description 13
- 238000012217 deletion Methods 0.000 description 13
- 230000037430 deletion Effects 0.000 description 13
- 238000003205 genotyping method Methods 0.000 description 12
- 108010050848 glycylleucine Proteins 0.000 description 12
- 239000000047 product Substances 0.000 description 12
- 230000000644 propagated effect Effects 0.000 description 12
- 239000002299 complementary DNA Substances 0.000 description 11
- 238000009396 hybridization Methods 0.000 description 11
- 230000004853 protein function Effects 0.000 description 11
- 108020004485 Nonsense Codon Proteins 0.000 description 10
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 10
- 125000000539 amino acid group Chemical group 0.000 description 10
- 238000003780 insertion Methods 0.000 description 10
- 230000037431 insertion Effects 0.000 description 10
- 238000012225 targeting induced local lesions in genomes Methods 0.000 description 10
- 241000208293 Capsicum Species 0.000 description 9
- 241000880493 Leptailurus serval Species 0.000 description 9
- 235000016761 Piper aduncum Nutrition 0.000 description 9
- 108010068380 arginylarginine Proteins 0.000 description 9
- 108010037850 glycylvaline Proteins 0.000 description 9
- 108020004705 Codon Proteins 0.000 description 8
- 239000006002 Pepper Substances 0.000 description 8
- 235000017804 Piper guineense Nutrition 0.000 description 8
- 235000008184 Piper nigrum Nutrition 0.000 description 8
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 8
- 108010038633 aspartylglutamate Proteins 0.000 description 8
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 8
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 8
- 230000037434 nonsense mutation Effects 0.000 description 8
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 8
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 7
- 235000008534 Capsicum annuum var annuum Nutrition 0.000 description 7
- 241000219109 Citrullus Species 0.000 description 7
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 7
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 7
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 7
- FIZZULTXMVEIAA-IHRRRGAJSA-N Met-Ser-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FIZZULTXMVEIAA-IHRRRGAJSA-N 0.000 description 7
- 244000089698 Zanthoxylum simulans Species 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 108010047857 aspartylglycine Proteins 0.000 description 7
- 238000011161 development Methods 0.000 description 7
- 230000005855 radiation Effects 0.000 description 7
- 230000001105 regulatory effect Effects 0.000 description 7
- 108010026333 seryl-proline Proteins 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 6
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 6
- 235000002567 Capsicum annuum Nutrition 0.000 description 6
- PLUBXMRUUVWRLT-UHFFFAOYSA-N Ethyl methanesulfonate Chemical compound CCOS(C)(=O)=O PLUBXMRUUVWRLT-UHFFFAOYSA-N 0.000 description 6
- HUWSBFYAGXCXKC-CIUDSAMLSA-N Glu-Ala-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O HUWSBFYAGXCXKC-CIUDSAMLSA-N 0.000 description 6
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 6
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 6
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 6
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 238000005520 cutting process Methods 0.000 description 6
- 230000005094 fruit set Effects 0.000 description 6
- 108010057821 leucylproline Proteins 0.000 description 6
- 108010056582 methionylglutamic acid Proteins 0.000 description 6
- 238000003752 polymerase chain reaction Methods 0.000 description 6
- 108090000765 processed proteins & peptides Proteins 0.000 description 6
- 108010061238 threonyl-glycine Proteins 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 5
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 5
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 5
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 5
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 5
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 5
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 5
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 5
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 5
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 5
- PUQRDHNIOONJJN-AVGNSLFASA-N Pro-Lys-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O PUQRDHNIOONJJN-AVGNSLFASA-N 0.000 description 5
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 5
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 5
- 108700019146 Transgenes Proteins 0.000 description 5
- 208000026487 Triploidy Diseases 0.000 description 5
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 5
- 235000009932 Zanthoxylum simulans Nutrition 0.000 description 5
- 108010005233 alanylglutamic acid Proteins 0.000 description 5
- 108010044940 alanylglutamine Proteins 0.000 description 5
- 108010070944 alanylhistidine Proteins 0.000 description 5
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 5
- 239000001511 capsicum annuum Substances 0.000 description 5
- 230000010154 cross-pollination Effects 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 210000002257 embryonic structure Anatomy 0.000 description 5
- 231100000221 frame shift mutation induction Toxicity 0.000 description 5
- 230000037433 frameshift Effects 0.000 description 5
- 230000005078 fruit development Effects 0.000 description 5
- 108010077515 glycylproline Proteins 0.000 description 5
- 230000012010 growth Effects 0.000 description 5
- 230000001939 inductive effect Effects 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 108010015796 prolylisoleucine Proteins 0.000 description 5
- 210000001938 protoplast Anatomy 0.000 description 5
- 239000003642 reactive oxygen metabolite Substances 0.000 description 5
- 230000008929 regeneration Effects 0.000 description 5
- 238000011069 regeneration method Methods 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 4
- CWEAKSWWKHGTRJ-BQBZGAKWSA-N Ala-Gly-Met Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O CWEAKSWWKHGTRJ-BQBZGAKWSA-N 0.000 description 4
- 108010068139 Ala-Leu-Pro-Met Proteins 0.000 description 4
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 4
- BGDILZXXDJCKPF-CIUDSAMLSA-N Arg-Gln-Cys Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(O)=O BGDILZXXDJCKPF-CIUDSAMLSA-N 0.000 description 4
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 4
- ADPACBMPYWJJCE-FXQIFTODSA-N Arg-Ser-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O ADPACBMPYWJJCE-FXQIFTODSA-N 0.000 description 4
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 4
- 229930192334 Auxin Natural products 0.000 description 4
- 235000007862 Capsicum baccatum Nutrition 0.000 description 4
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 description 4
- 240000008067 Cucumis sativus Species 0.000 description 4
- ZMWOJVAXTOUHAP-ZKWXMUAHSA-N Cys-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N ZMWOJVAXTOUHAP-ZKWXMUAHSA-N 0.000 description 4
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 4
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 4
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- SLFSYFJKSIVSON-SRVKXCTJSA-N His-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N SLFSYFJKSIVSON-SRVKXCTJSA-N 0.000 description 4
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 4
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 4
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 4
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 4
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 4
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 4
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 4
- DJBCKVNHEIJLQA-GMOBBJLQSA-N Met-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCSC)N DJBCKVNHEIJLQA-GMOBBJLQSA-N 0.000 description 4
- 108091005461 Nucleic proteins Proteins 0.000 description 4
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 4
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 4
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 4
- SRBFGSGDNNQABI-FHWLQOOXSA-N Pro-Leu-Trp Chemical compound N([C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C(=O)[C@@H]1CCCN1 SRBFGSGDNNQABI-FHWLQOOXSA-N 0.000 description 4
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 4
- SVWQEIRZHHNBIO-WHFBIAKZSA-N Ser-Gly-Cys Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CS)C(O)=O SVWQEIRZHHNBIO-WHFBIAKZSA-N 0.000 description 4
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 4
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 4
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 4
- XNXRTQZTFVMJIJ-DCAQKATOSA-N Ser-Met-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNXRTQZTFVMJIJ-DCAQKATOSA-N 0.000 description 4
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 4
- 235000002560 Solanum lycopersicum Nutrition 0.000 description 4
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 4
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 4
- UXUFNBVCPAWACG-SIUGBPQLSA-N Tyr-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N UXUFNBVCPAWACG-SIUGBPQLSA-N 0.000 description 4
- 108010008355 arginyl-glutamine Proteins 0.000 description 4
- 108010062796 arginyllysine Proteins 0.000 description 4
- 108010060035 arginylproline Proteins 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 239000002363 auxin Substances 0.000 description 4
- 238000004113 cell culture Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000001066 destructive effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 4
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 4
- 108010081551 glycylphenylalanine Proteins 0.000 description 4
- 108010085325 histidylproline Proteins 0.000 description 4
- 238000001727 in vivo Methods 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 238000002844 melting Methods 0.000 description 4
- 230000008018 melting Effects 0.000 description 4
- 108010022588 methionyl-lysyl-proline Proteins 0.000 description 4
- 239000003471 mutagenic agent Substances 0.000 description 4
- 231100000707 mutagenic chemical Toxicity 0.000 description 4
- 230000003505 mutagenic effect Effects 0.000 description 4
- 108010047079 phenylalanyl-leucyl-arginyl-phenylalanine Proteins 0.000 description 4
- 108091033319 polynucleotide Proteins 0.000 description 4
- 102000040430 polynucleotide Human genes 0.000 description 4
- 239000002157 polynucleotide Substances 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000010153 self-pollination Effects 0.000 description 4
- 230000037436 splice-site mutation Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000009261 transgenic effect Effects 0.000 description 4
- 108010080629 tryptophan-leucine Proteins 0.000 description 4
- 108010073969 valyllysine Proteins 0.000 description 4
- 239000011534 wash buffer Substances 0.000 description 4
- 108010044087 AS-I toxin Proteins 0.000 description 3
- IYCZBJXFSZSHPN-DLOVCJGASA-N Ala-Cys-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IYCZBJXFSZSHPN-DLOVCJGASA-N 0.000 description 3
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 3
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 3
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 3
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 3
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 3
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 3
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 3
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 3
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 3
- CVKOQHYVDVYJSI-QTKMDUPCSA-N Arg-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N)O CVKOQHYVDVYJSI-QTKMDUPCSA-N 0.000 description 3
- BSGSDLYGGHGMND-IHRRRGAJSA-N Arg-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N BSGSDLYGGHGMND-IHRRRGAJSA-N 0.000 description 3
- LYJXHXGPWDTLKW-HJGDQZAQSA-N Arg-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O LYJXHXGPWDTLKW-HJGDQZAQSA-N 0.000 description 3
- POZKLUIXMHIULG-FDARSICLSA-N Arg-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCN=C(N)N)N POZKLUIXMHIULG-FDARSICLSA-N 0.000 description 3
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 3
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 3
- ZNYKKCADEQAZKA-FXQIFTODSA-N Asn-Ser-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O ZNYKKCADEQAZKA-FXQIFTODSA-N 0.000 description 3
- LRCIOEVFVGXZKB-BZSNNMDCSA-N Asn-Tyr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LRCIOEVFVGXZKB-BZSNNMDCSA-N 0.000 description 3
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 3
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 3
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 3
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 3
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 3
- 240000001844 Capsicum baccatum Species 0.000 description 3
- 235000018306 Capsicum chinense Nutrition 0.000 description 3
- 244000185501 Capsicum chinense Species 0.000 description 3
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 3
- 108010090461 DFG peptide Proteins 0.000 description 3
- LKUWAWGNJYJODH-KBIXCLLPSA-N Gln-Ala-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKUWAWGNJYJODH-KBIXCLLPSA-N 0.000 description 3
- OETQLUYCMBARHJ-CIUDSAMLSA-N Gln-Asn-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OETQLUYCMBARHJ-CIUDSAMLSA-N 0.000 description 3
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 3
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 3
- ZXGLLNZQSBLQLT-SRVKXCTJSA-N Gln-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZXGLLNZQSBLQLT-SRVKXCTJSA-N 0.000 description 3
- RQNYYRHRKSVKAB-GUBZILKMSA-N Glu-Cys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O RQNYYRHRKSVKAB-GUBZILKMSA-N 0.000 description 3
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 3
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 3
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 3
- FQFWFZWOHOEVMZ-IHRRRGAJSA-N Glu-Phe-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FQFWFZWOHOEVMZ-IHRRRGAJSA-N 0.000 description 3
- WIKMTDVSCUJIPJ-CIUDSAMLSA-N Glu-Ser-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WIKMTDVSCUJIPJ-CIUDSAMLSA-N 0.000 description 3
- GZUKEVBTYNNUQF-WDSKDSINSA-N Gly-Ala-Gln Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GZUKEVBTYNNUQF-WDSKDSINSA-N 0.000 description 3
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 3
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 3
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 3
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 3
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 3
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 3
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 3
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 3
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 3
- TVRMJKNELJKNRS-GUBZILKMSA-N His-Glu-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N TVRMJKNELJKNRS-GUBZILKMSA-N 0.000 description 3
- UPJODPVSKKWGDQ-KLHWPWHYSA-N His-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O UPJODPVSKKWGDQ-KLHWPWHYSA-N 0.000 description 3
- CGAMSLMBYJHMDY-ONGXEEELSA-N His-Val-Gly Chemical compound CC(C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N CGAMSLMBYJHMDY-ONGXEEELSA-N 0.000 description 3
- 102000001420 Homeobox domains Human genes 0.000 description 3
- 108050009606 Homeobox domains Proteins 0.000 description 3
- WUEIUSDAECDLQO-NAKRPEOUSA-N Ile-Ala-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)O)N WUEIUSDAECDLQO-NAKRPEOUSA-N 0.000 description 3
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 3
- ZDNORQNHCJUVOV-KBIXCLLPSA-N Ile-Gln-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O ZDNORQNHCJUVOV-KBIXCLLPSA-N 0.000 description 3
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 3
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 3
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 3
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 3
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 3
- KEVYYIMVELOXCT-KBPBESRZSA-N Leu-Gly-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KEVYYIMVELOXCT-KBPBESRZSA-N 0.000 description 3
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 3
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 3
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 3
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 3
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 3
- LXNPMPIQDNSMTA-AVGNSLFASA-N Lys-Gln-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 LXNPMPIQDNSMTA-AVGNSLFASA-N 0.000 description 3
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 3
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 3
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 3
- PSVAVKGDUAKZKU-BZSNNMDCSA-N Lys-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCCN)N)O PSVAVKGDUAKZKU-BZSNNMDCSA-N 0.000 description 3
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 3
- ACYHZNZHIZWLQF-BQBZGAKWSA-N Met-Asn-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ACYHZNZHIZWLQF-BQBZGAKWSA-N 0.000 description 3
- OHMKUHXCDSCOMT-QXEWZRGKSA-N Met-Asn-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHMKUHXCDSCOMT-QXEWZRGKSA-N 0.000 description 3
- UYAKZHGIPRCGPF-CIUDSAMLSA-N Met-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N UYAKZHGIPRCGPF-CIUDSAMLSA-N 0.000 description 3
- STTRPDDKDVKIDF-KKUMJFAQSA-N Met-Glu-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 STTRPDDKDVKIDF-KKUMJFAQSA-N 0.000 description 3
- FYRUJIJAUPHUNB-IUCAKERBSA-N Met-Gly-Arg Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N FYRUJIJAUPHUNB-IUCAKERBSA-N 0.000 description 3
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 3
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 3
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 3
- UMKYAYXCMYYNHI-AVGNSLFASA-N Phe-Gln-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N UMKYAYXCMYYNHI-AVGNSLFASA-N 0.000 description 3
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 3
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 3
- NWVMQNAELALJFW-RNXOBYDBSA-N Phe-Trp-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NWVMQNAELALJFW-RNXOBYDBSA-N 0.000 description 3
- YTWNSIDWAFSEEI-RWMBFGLXSA-N Pro-His-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N3CCC[C@@H]3C(=O)O YTWNSIDWAFSEEI-RWMBFGLXSA-N 0.000 description 3
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 3
- 108091030071 RNAI Proteins 0.000 description 3
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 3
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 3
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 3
- DBIDZNUXSLXVRG-FXQIFTODSA-N Ser-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N DBIDZNUXSLXVRG-FXQIFTODSA-N 0.000 description 3
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 3
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 3
- LWMQRHDTXHQQOV-MXAVVETBSA-N Ser-Ile-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LWMQRHDTXHQQOV-MXAVVETBSA-N 0.000 description 3
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 3
- XGQKSRGHEZNWIS-IHRRRGAJSA-N Ser-Pro-Tyr Chemical compound N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O XGQKSRGHEZNWIS-IHRRRGAJSA-N 0.000 description 3
- VFWQQZMRKFOGLE-ZLUOBGJFSA-N Ser-Ser-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O VFWQQZMRKFOGLE-ZLUOBGJFSA-N 0.000 description 3
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 3
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 3
- PCMZJFMUYWIERL-ZKWXMUAHSA-N Ser-Val-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMZJFMUYWIERL-ZKWXMUAHSA-N 0.000 description 3
- SYCFMSYTIFXWAJ-DCAQKATOSA-N Ser-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N SYCFMSYTIFXWAJ-DCAQKATOSA-N 0.000 description 3
- 241001136583 Solanum pennellii Species 0.000 description 3
- 235000011564 Solanum pennellii Nutrition 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 3
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 3
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 3
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 3
- RERIQEJUYCLJQI-QRTARXTBSA-N Trp-Asp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RERIQEJUYCLJQI-QRTARXTBSA-N 0.000 description 3
- YTCNLMSUXPCFBW-SXNHZJKMSA-N Trp-Ile-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O YTCNLMSUXPCFBW-SXNHZJKMSA-N 0.000 description 3
- GWBWCGITOYODER-YTQUADARSA-N Trp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GWBWCGITOYODER-YTQUADARSA-N 0.000 description 3
- ADECJAKCRKPSOR-ULQDDVLXSA-N Tyr-His-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O ADECJAKCRKPSOR-ULQDDVLXSA-N 0.000 description 3
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 3
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 3
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 3
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 3
- YDVDTCJGBBJGRT-GUBZILKMSA-N Val-Met-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N YDVDTCJGBBJGRT-GUBZILKMSA-N 0.000 description 3
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 3
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 3
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- 230000008827 biological function Effects 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 230000002939 deleterious effect Effects 0.000 description 3
- 230000004720 fertilization Effects 0.000 description 3
- 238000003197 gene knockdown Methods 0.000 description 3
- 230000009368 gene silencing by RNA Effects 0.000 description 3
- 210000004602 germ cell Anatomy 0.000 description 3
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 3
- 108010036413 histidylglycine Proteins 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 230000001771 impaired effect Effects 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 238000012606 in vitro cell culture Methods 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 3
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 3
- 210000001161 mammalian embryo Anatomy 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 229930195732 phytohormone Natural products 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 108010079317 prolyl-tyrosine Proteins 0.000 description 3
- 108010053725 prolylvaline Proteins 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 3
- 108010003137 tyrosyltyrosine Proteins 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- IAKHMKGGTNLKSZ-INIZCTEOSA-N (S)-colchicine Chemical compound C1([C@@H](NC(C)=O)CC2)=CC(=O)C(OC)=CC=C1C1=C2C=C(OC)C(OC)=C1OC IAKHMKGGTNLKSZ-INIZCTEOSA-N 0.000 description 2
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 2
- SDMAQFGBPOJFOM-GUBZILKMSA-N Ala-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SDMAQFGBPOJFOM-GUBZILKMSA-N 0.000 description 2
- VIGKUFXFTPWYER-BIIVOSGPSA-N Ala-Cys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N VIGKUFXFTPWYER-BIIVOSGPSA-N 0.000 description 2
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 2
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 2
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 2
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 2
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 2
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 2
- NLOMBWNGESDVJU-GUBZILKMSA-N Ala-Met-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLOMBWNGESDVJU-GUBZILKMSA-N 0.000 description 2
- XSTZMVAYYCJTNR-DCAQKATOSA-N Ala-Met-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XSTZMVAYYCJTNR-DCAQKATOSA-N 0.000 description 2
- GKAZXNDATBWNBI-DCAQKATOSA-N Ala-Met-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N GKAZXNDATBWNBI-DCAQKATOSA-N 0.000 description 2
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 2
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 2
- ISCYZXFOCXWUJU-KZVJFYERSA-N Ala-Thr-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O ISCYZXFOCXWUJU-KZVJFYERSA-N 0.000 description 2
- 241000219194 Arabidopsis Species 0.000 description 2
- SBVJJNJLFWSJOV-UBHSHLNASA-N Arg-Ala-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SBVJJNJLFWSJOV-UBHSHLNASA-N 0.000 description 2
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 2
- HCIUUZGFTDTEGM-NAKRPEOUSA-N Arg-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HCIUUZGFTDTEGM-NAKRPEOUSA-N 0.000 description 2
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 2
- URAUIUGLHBRPMF-NAKRPEOUSA-N Arg-Ser-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O URAUIUGLHBRPMF-NAKRPEOUSA-N 0.000 description 2
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 2
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 2
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 2
- PFOYSEIHFVKHNF-FXQIFTODSA-N Asn-Ala-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PFOYSEIHFVKHNF-FXQIFTODSA-N 0.000 description 2
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 2
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 2
- QISZHYWZHJRDAO-CIUDSAMLSA-N Asn-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N QISZHYWZHJRDAO-CIUDSAMLSA-N 0.000 description 2
- WQSCVMQDZYTFQU-FXQIFTODSA-N Asn-Cys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WQSCVMQDZYTFQU-FXQIFTODSA-N 0.000 description 2
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 2
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 2
- OWUCNXMFJRFOFI-BQBZGAKWSA-N Asn-Gly-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O OWUCNXMFJRFOFI-BQBZGAKWSA-N 0.000 description 2
- JQSWHKKUZMTOIH-QWRGUYRKSA-N Asn-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N JQSWHKKUZMTOIH-QWRGUYRKSA-N 0.000 description 2
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 2
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 2
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 2
- QDXQWFBLUVTOFL-FXQIFTODSA-N Asn-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(=O)N)N QDXQWFBLUVTOFL-FXQIFTODSA-N 0.000 description 2
- UYRPHDGXHKBZHJ-CIUDSAMLSA-N Asn-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N UYRPHDGXHKBZHJ-CIUDSAMLSA-N 0.000 description 2
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 2
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 2
- GFGUPLIETCNQGF-DCAQKATOSA-N Asn-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O GFGUPLIETCNQGF-DCAQKATOSA-N 0.000 description 2
- VCJCPARXDBEGNE-GUBZILKMSA-N Asn-Pro-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 VCJCPARXDBEGNE-GUBZILKMSA-N 0.000 description 2
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 2
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 2
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 2
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 2
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 2
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 2
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 2
- LXKLDWVHXNZQGB-SRVKXCTJSA-N Asp-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N)O LXKLDWVHXNZQGB-SRVKXCTJSA-N 0.000 description 2
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 2
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 2
- FIAKNCXQFFKSSI-ZLUOBGJFSA-N Asp-Ser-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O FIAKNCXQFFKSSI-ZLUOBGJFSA-N 0.000 description 2
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 2
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 235000011331 Brassica Nutrition 0.000 description 2
- 241000219198 Brassica Species 0.000 description 2
- 108091033409 CRISPR Proteins 0.000 description 2
- 101100189378 Caenorhabditis elegans pat-3 gene Proteins 0.000 description 2
- 101100232929 Caenorhabditis elegans pat-4 gene Proteins 0.000 description 2
- SFUUYRSAJPWTGO-SRVKXCTJSA-N Cys-Asn-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SFUUYRSAJPWTGO-SRVKXCTJSA-N 0.000 description 2
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 2
- VTJLJQGUMBWHBP-GUBZILKMSA-N Cys-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N VTJLJQGUMBWHBP-GUBZILKMSA-N 0.000 description 2
- PDRMRVHPAQKTLT-NAKRPEOUSA-N Cys-Ile-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O PDRMRVHPAQKTLT-NAKRPEOUSA-N 0.000 description 2
- HEPLXMBVMCXTBP-QWRGUYRKSA-N Cys-Phe-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O HEPLXMBVMCXTBP-QWRGUYRKSA-N 0.000 description 2
- ZLFRUAFDAIFNHN-LKXGYXEUSA-N Cys-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N)O ZLFRUAFDAIFNHN-LKXGYXEUSA-N 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 229930191978 Gibberellin Natural products 0.000 description 2
- SSWAFVQFQWOJIJ-XIRDDKMYSA-N Gln-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N SSWAFVQFQWOJIJ-XIRDDKMYSA-N 0.000 description 2
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 2
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 2
- GQZDDFRXSDGUNG-YVNDNENWSA-N Gln-Ile-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O GQZDDFRXSDGUNG-YVNDNENWSA-N 0.000 description 2
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 2
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 2
- XUMFMAVDHQDATI-DCAQKATOSA-N Gln-Pro-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XUMFMAVDHQDATI-DCAQKATOSA-N 0.000 description 2
- LGWNISYVKDNJRP-FXQIFTODSA-N Gln-Ser-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGWNISYVKDNJRP-FXQIFTODSA-N 0.000 description 2
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 2
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 2
- UTKICHUQEQBDGC-ACZMJKKPSA-N Glu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UTKICHUQEQBDGC-ACZMJKKPSA-N 0.000 description 2
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 2
- PBEQPAZRHDVJQI-SRVKXCTJSA-N Glu-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N PBEQPAZRHDVJQI-SRVKXCTJSA-N 0.000 description 2
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 2
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 2
- APHGWLWMOXGZRL-DCAQKATOSA-N Glu-Glu-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O APHGWLWMOXGZRL-DCAQKATOSA-N 0.000 description 2
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 2
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 2
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 2
- UCZXXMREFIETQW-AVGNSLFASA-N Glu-Tyr-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O UCZXXMREFIETQW-AVGNSLFASA-N 0.000 description 2
- PHONXOACARQMPM-BQBZGAKWSA-N Gly-Ala-Met Chemical compound [H]NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O PHONXOACARQMPM-BQBZGAKWSA-N 0.000 description 2
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 2
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 2
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 2
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 2
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 2
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 2
- ZRZILYKEJBMFHY-BQBZGAKWSA-N Gly-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN ZRZILYKEJBMFHY-BQBZGAKWSA-N 0.000 description 2
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 2
- LEGMTEAZGRRIMY-ZKWXMUAHSA-N Gly-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN LEGMTEAZGRRIMY-ZKWXMUAHSA-N 0.000 description 2
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 2
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 2
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 2
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 2
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 2
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 2
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 2
- HHRODZSXDXMUHS-LURJTMIESA-N Gly-Met-Gly Chemical compound CSCC[C@H](NC(=O)C[NH3+])C(=O)NCC([O-])=O HHRODZSXDXMUHS-LURJTMIESA-N 0.000 description 2
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 2
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 2
- OCPPBNKYGYSLOE-IUCAKERBSA-N Gly-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN OCPPBNKYGYSLOE-IUCAKERBSA-N 0.000 description 2
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 2
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 2
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 2
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 2
- DKJWUIYLMLUBDX-XPUUQOCRSA-N Gly-Val-Cys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O DKJWUIYLMLUBDX-XPUUQOCRSA-N 0.000 description 2
- COZMNNJEGNPDED-HOCLYGCPSA-N Gly-Val-Trp Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O COZMNNJEGNPDED-HOCLYGCPSA-N 0.000 description 2
- 241000132456 Haplocarpha Species 0.000 description 2
- AFPFGFUGETYOSY-HGNGGELXSA-N His-Ala-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AFPFGFUGETYOSY-HGNGGELXSA-N 0.000 description 2
- OHOXVDFVRDGFND-YUMQZZPRSA-N His-Cys-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CS)C(=O)NCC(O)=O OHOXVDFVRDGFND-YUMQZZPRSA-N 0.000 description 2
- PMWSGVRIMIFXQH-KKUMJFAQSA-N His-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 PMWSGVRIMIFXQH-KKUMJFAQSA-N 0.000 description 2
- FSOXZQBMPBQKGJ-QSFUFRPTSA-N His-Ile-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 FSOXZQBMPBQKGJ-QSFUFRPTSA-N 0.000 description 2
- NDKSHNQINMRKHT-PEXQALLHSA-N His-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N NDKSHNQINMRKHT-PEXQALLHSA-N 0.000 description 2
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 2
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 2
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 2
- BEWFWZRGBDVXRP-PEFMBERDSA-N Ile-Glu-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BEWFWZRGBDVXRP-PEFMBERDSA-N 0.000 description 2
- IXEFKXAGHRQFAF-HVTMNAMFSA-N Ile-Glu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N IXEFKXAGHRQFAF-HVTMNAMFSA-N 0.000 description 2
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 2
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 2
- LWWILHPVAKKLQS-QXEWZRGKSA-N Ile-Gly-Met Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCSC)C(=O)O)N LWWILHPVAKKLQS-QXEWZRGKSA-N 0.000 description 2
- KOPIAUWNLKKELG-SIGLWIIPSA-N Ile-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N KOPIAUWNLKKELG-SIGLWIIPSA-N 0.000 description 2
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 2
- UFRXVQGGPNSJRY-CYDGBPFRSA-N Ile-Met-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N UFRXVQGGPNSJRY-CYDGBPFRSA-N 0.000 description 2
- NPAYJTAXWXJKLO-NAKRPEOUSA-N Ile-Met-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N NPAYJTAXWXJKLO-NAKRPEOUSA-N 0.000 description 2
- FGBRXCZYVRFNKQ-MXAVVETBSA-N Ile-Phe-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N FGBRXCZYVRFNKQ-MXAVVETBSA-N 0.000 description 2
- XHBYEMIUENPZLY-GMOBBJLQSA-N Ile-Pro-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O XHBYEMIUENPZLY-GMOBBJLQSA-N 0.000 description 2
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 2
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 2
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 2
- JCGMFFQQHJQASB-PYJNHQTQSA-N Ile-Val-His Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O JCGMFFQQHJQASB-PYJNHQTQSA-N 0.000 description 2
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 2
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 2
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 2
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 2
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 2
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 2
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 2
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- FZMNAYBEFGZEIF-AVGNSLFASA-N Leu-Met-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)O)N FZMNAYBEFGZEIF-AVGNSLFASA-N 0.000 description 2
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 2
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 2
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 2
- KTOIECMYZZGVSI-BZSNNMDCSA-N Leu-Phe-His Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 KTOIECMYZZGVSI-BZSNNMDCSA-N 0.000 description 2
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 2
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 2
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 2
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 2
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 2
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 2
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 2
- URHJPNHRQMQGOZ-RHYQMDGZSA-N Leu-Thr-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O URHJPNHRQMQGOZ-RHYQMDGZSA-N 0.000 description 2
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 2
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 2
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 2
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 2
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 2
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 2
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 2
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 2
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 2
- LMKSBGIUPVRHEH-FXQIFTODSA-N Met-Ala-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(N)=O LMKSBGIUPVRHEH-FXQIFTODSA-N 0.000 description 2
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 2
- YORIKIDJCPKBON-YUMQZZPRSA-N Met-Glu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YORIKIDJCPKBON-YUMQZZPRSA-N 0.000 description 2
- HLQWFLJOJRFXHO-CIUDSAMLSA-N Met-Glu-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O HLQWFLJOJRFXHO-CIUDSAMLSA-N 0.000 description 2
- RKIIYGUHIQJCBW-SRVKXCTJSA-N Met-His-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RKIIYGUHIQJCBW-SRVKXCTJSA-N 0.000 description 2
- DBXMFHGGHMXYHY-DCAQKATOSA-N Met-Leu-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O DBXMFHGGHMXYHY-DCAQKATOSA-N 0.000 description 2
- WPTHAGXMYDRPFD-SRVKXCTJSA-N Met-Lys-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O WPTHAGXMYDRPFD-SRVKXCTJSA-N 0.000 description 2
- IRVONVRHHJXWTK-RWMBFGLXSA-N Met-Lys-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N IRVONVRHHJXWTK-RWMBFGLXSA-N 0.000 description 2
- CNAGWYQWQDMUGC-IHRRRGAJSA-N Met-Phe-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CNAGWYQWQDMUGC-IHRRRGAJSA-N 0.000 description 2
- VQILILSLEFDECU-GUBZILKMSA-N Met-Pro-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O VQILILSLEFDECU-GUBZILKMSA-N 0.000 description 2
- LUYURUYVNYGKGM-RCWTZXSCSA-N Met-Pro-Thr Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUYURUYVNYGKGM-RCWTZXSCSA-N 0.000 description 2
- CIIJWIAORKTXAH-FJXKBIBVSA-N Met-Thr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O CIIJWIAORKTXAH-FJXKBIBVSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- 108091092724 Noncoding DNA Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 108010033276 Peptide Fragments Proteins 0.000 description 2
- 102000007079 Peptide Fragments Human genes 0.000 description 2
- DFEVBOYEUQJGER-JURCDPSOSA-N Phe-Ala-Ile Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O DFEVBOYEUQJGER-JURCDPSOSA-N 0.000 description 2
- JEGFCFLCRSJCMA-IHRRRGAJSA-N Phe-Arg-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N JEGFCFLCRSJCMA-IHRRRGAJSA-N 0.000 description 2
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 2
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 2
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 2
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 2
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 2
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 2
- VJLJGKQAOQJXJG-CIUDSAMLSA-N Pro-Asp-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJLJGKQAOQJXJG-CIUDSAMLSA-N 0.000 description 2
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 2
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 2
- BVRBCQBUNGAWFP-KKUMJFAQSA-N Pro-Tyr-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O BVRBCQBUNGAWFP-KKUMJFAQSA-N 0.000 description 2
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 2
- 102000009147 START domains Human genes 0.000 description 2
- 108050000027 START domains Proteins 0.000 description 2
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 2
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 2
- QWZIOCFPXMAXET-CIUDSAMLSA-N Ser-Arg-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QWZIOCFPXMAXET-CIUDSAMLSA-N 0.000 description 2
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 2
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 2
- SWIQQMYVHIXPEK-FXQIFTODSA-N Ser-Cys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O SWIQQMYVHIXPEK-FXQIFTODSA-N 0.000 description 2
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 2
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 2
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 2
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 2
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 2
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 2
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 2
- AMRRYKHCILPAKD-FXQIFTODSA-N Ser-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N AMRRYKHCILPAKD-FXQIFTODSA-N 0.000 description 2
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 2
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 2
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 2
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 2
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 2
- 241000207763 Solanum Species 0.000 description 2
- 244000061456 Solanum tuberosum Species 0.000 description 2
- 208000035199 Tetraploidy Diseases 0.000 description 2
- MQUZMZBFKCHVOB-HJGDQZAQSA-N Thr-Gln-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O MQUZMZBFKCHVOB-HJGDQZAQSA-N 0.000 description 2
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 2
- CYVQBKQYQGEELV-NKIYYHGXSA-N Thr-His-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O CYVQBKQYQGEELV-NKIYYHGXSA-N 0.000 description 2
- JRAUIKJSEAKTGD-TUBUOCAGSA-N Thr-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N JRAUIKJSEAKTGD-TUBUOCAGSA-N 0.000 description 2
- UYTYTDMCDBPDSC-URLPEUOOSA-N Thr-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N UYTYTDMCDBPDSC-URLPEUOOSA-N 0.000 description 2
- XUGYQLFEJYZOKQ-NGTWOADLSA-N Thr-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XUGYQLFEJYZOKQ-NGTWOADLSA-N 0.000 description 2
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 2
- DOBIBIXIHJKVJF-XKBZYTNZSA-N Thr-Ser-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DOBIBIXIHJKVJF-XKBZYTNZSA-N 0.000 description 2
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 2
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 2
- SBYQHZCMVSPQCS-RCWTZXSCSA-N Thr-Val-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O SBYQHZCMVSPQCS-RCWTZXSCSA-N 0.000 description 2
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 2
- KDWZQYUTMJSYRJ-BHYGNILZSA-N Trp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O KDWZQYUTMJSYRJ-BHYGNILZSA-N 0.000 description 2
- NESIQDDPEFTWAH-BPUTZDHNSA-N Trp-Met-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O NESIQDDPEFTWAH-BPUTZDHNSA-N 0.000 description 2
- RKISDJMICOREEL-QRTARXTBSA-N Trp-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RKISDJMICOREEL-QRTARXTBSA-N 0.000 description 2
- SGFIXFAHVWJKTD-KJEVXHAQSA-N Tyr-Arg-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SGFIXFAHVWJKTD-KJEVXHAQSA-N 0.000 description 2
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 2
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 2
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 2
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 2
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 2
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 2
- FPCIBLUVDNXPJO-XPUUQOCRSA-N Val-Cys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FPCIBLUVDNXPJO-XPUUQOCRSA-N 0.000 description 2
- YCMXFKWYJFZFKS-LAEOZQHASA-N Val-Gln-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCMXFKWYJFZFKS-LAEOZQHASA-N 0.000 description 2
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 2
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 2
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 2
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 2
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 2
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 2
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 2
- TVGWMCTYUFBXAP-QTKMDUPCSA-N Val-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N)O TVGWMCTYUFBXAP-QTKMDUPCSA-N 0.000 description 2
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 2
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 2
- IRAUYEAFPFPVND-UVBJJODRSA-N Val-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 IRAUYEAFPFPVND-UVBJJODRSA-N 0.000 description 2
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 2
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 2
- 230000009418 agronomic effect Effects 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000027455 binding Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 108010069495 cysteinyltyrosine Proteins 0.000 description 2
- 230000001627 detrimental effect Effects 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 239000003448 gibberellin Substances 0.000 description 2
- IXORZMNAPKEEDV-OBDJNFEBSA-N gibberellin A3 Chemical class C([C@@]1(O)C(=C)C[C@@]2(C1)[C@H]1C(O)=O)C[C@H]2[C@]2(C=C[C@@H]3O)[C@H]1[C@]3(C)C(=O)O2 IXORZMNAPKEEDV-OBDJNFEBSA-N 0.000 description 2
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 2
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 2
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 2
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 2
- 238000013537 high throughput screening Methods 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 108010028295 histidylhistidine Proteins 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 2
- 238000010884 ion-beam technique Methods 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 230000004576 lipid-binding Effects 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 230000013011 mating Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 235000016709 nutrition Nutrition 0.000 description 2
- 210000001672 ovary Anatomy 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 2
- 230000032361 posttranscriptional gene silencing Effects 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 230000004952 protein activity Effects 0.000 description 2
- 150000003230 pyrimidines Chemical class 0.000 description 2
- 238000002708 random mutagenesis Methods 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000003757 reverse transcription PCR Methods 0.000 description 2
- -1 seed coatings Chemical class 0.000 description 2
- 230000008117 seed development Effects 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 108010007375 seryl-seryl-seryl-arginine Proteins 0.000 description 2
- 230000014639 sexual reproduction Effects 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 210000001082 somatic cell Anatomy 0.000 description 2
- 230000000392 somatic effect Effects 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- ZEIYPKQQLSUPOT-QORCZRPOSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-phenylpropanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 ZEIYPKQQLSUPOT-QORCZRPOSA-N 0.000 description 1
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 1
- SCAKQYSGEIHPLV-IUCAKERBSA-N (4S)-4-[(2-aminoacetyl)amino]-5-[(2S)-2-(carboxymethylcarbamoyl)pyrrolidin-1-yl]-5-oxopentanoic acid Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SCAKQYSGEIHPLV-IUCAKERBSA-N 0.000 description 1
- HCAJQHYUCKICQH-VPENINKCSA-N 8-Oxo-7,8-dihydro-2'-deoxyguanosine Chemical compound C1=2NC(N)=NC(=O)C=2NC(=O)N1[C@H]1C[C@H](O)[C@@H](CO)O1 HCAJQHYUCKICQH-VPENINKCSA-N 0.000 description 1
- 101150027500 AGL6 gene Proteins 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- SHYYAQLDNVHPFT-DLOVCJGASA-N Ala-Asn-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SHYYAQLDNVHPFT-DLOVCJGASA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 1
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 1
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- FAJIYNONGXEXAI-CQDKDKBSSA-N Ala-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 FAJIYNONGXEXAI-CQDKDKBSSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- DEWWPUNXRNGMQN-LPEHRKFASA-N Ala-Met-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N DEWWPUNXRNGMQN-LPEHRKFASA-N 0.000 description 1
- DRARURMRLANNLS-GUBZILKMSA-N Ala-Met-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O DRARURMRLANNLS-GUBZILKMSA-N 0.000 description 1
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 1
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 1
- BHTBAVZSZCQZPT-GUBZILKMSA-N Ala-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N BHTBAVZSZCQZPT-GUBZILKMSA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 1
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 1
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 1
- 101100490647 Arabidopsis thaliana AGL6 gene Proteins 0.000 description 1
- 101100065298 Arabidopsis thaliana ENDO1 gene Proteins 0.000 description 1
- WOPFJPHVBWKZJH-SRVKXCTJSA-N Arg-Arg-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O WOPFJPHVBWKZJH-SRVKXCTJSA-N 0.000 description 1
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 1
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 1
- NAARDJBSSPUGCF-FXQIFTODSA-N Arg-Cys-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N NAARDJBSSPUGCF-FXQIFTODSA-N 0.000 description 1
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 1
- YNSGXDWWPCGGQS-YUMQZZPRSA-N Arg-Gly-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O YNSGXDWWPCGGQS-YUMQZZPRSA-N 0.000 description 1
- JTZUZBADHGISJD-SRVKXCTJSA-N Arg-His-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JTZUZBADHGISJD-SRVKXCTJSA-N 0.000 description 1
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 1
- LLUGJARLJCGLAR-CYDGBPFRSA-N Arg-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LLUGJARLJCGLAR-CYDGBPFRSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- IIAXFBUTKIDDIP-ULQDDVLXSA-N Arg-Leu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IIAXFBUTKIDDIP-ULQDDVLXSA-N 0.000 description 1
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 1
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- YNSUUAOAFCVINY-OSUNSFLBSA-N Arg-Thr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YNSUUAOAFCVINY-OSUNSFLBSA-N 0.000 description 1
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 1
- ZPWMEWYQBWSGAO-ZJDVBMNYSA-N Arg-Thr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZPWMEWYQBWSGAO-ZJDVBMNYSA-N 0.000 description 1
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 1
- BXLDDWZOTGGNOJ-SZMVWBNQSA-N Arg-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCN=C(N)N)N BXLDDWZOTGGNOJ-SZMVWBNQSA-N 0.000 description 1
- BFDDUDQCPJWQRQ-IHRRRGAJSA-N Arg-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O BFDDUDQCPJWQRQ-IHRRRGAJSA-N 0.000 description 1
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 1
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 1
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 1
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 1
- PLVAAIPKSGUXDV-WHFBIAKZSA-N Asn-Gly-Cys Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)C(=O)N PLVAAIPKSGUXDV-WHFBIAKZSA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 1
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 1
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 1
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 1
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 1
- VITDJIPIJZAVGC-VEVYYDQMSA-N Asn-Met-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VITDJIPIJZAVGC-VEVYYDQMSA-N 0.000 description 1
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 1
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 1
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 1
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 1
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 1
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 1
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 1
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 1
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 1
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 1
- WEDGJJRCJNHYSF-SRVKXCTJSA-N Asp-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N WEDGJJRCJNHYSF-SRVKXCTJSA-N 0.000 description 1
- PSLSTUMPZILTAH-BYULHYEWSA-N Asp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PSLSTUMPZILTAH-BYULHYEWSA-N 0.000 description 1
- PYXXJFRXIYAESU-PCBIJLKTSA-N Asp-Ile-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PYXXJFRXIYAESU-PCBIJLKTSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- JXGJJQJHXHXJQF-CIUDSAMLSA-N Asp-Met-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O JXGJJQJHXHXJQF-CIUDSAMLSA-N 0.000 description 1
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 1
- HICVMZCGVFKTPM-BQBZGAKWSA-N Asp-Pro-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HICVMZCGVFKTPM-BQBZGAKWSA-N 0.000 description 1
- QTIZKMMLNUMHHU-DCAQKATOSA-N Asp-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QTIZKMMLNUMHHU-DCAQKATOSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- HRVQDZOWMLFAOD-BIIVOSGPSA-N Asp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N)C(=O)O HRVQDZOWMLFAOD-BIIVOSGPSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- GXHDGYOXPNQCKM-XVSYOHENSA-N Asp-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GXHDGYOXPNQCKM-XVSYOHENSA-N 0.000 description 1
- 235000000832 Ayote Nutrition 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 238000010443 CRISPR/Cpf1 gene editing Methods 0.000 description 1
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 description 1
- 235000008733 Citrus aurantifolia Nutrition 0.000 description 1
- 235000005979 Citrus limon Nutrition 0.000 description 1
- 244000131522 Citrus pyriformis Species 0.000 description 1
- 241000219112 Cucumis Species 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- 235000009849 Cucumis sativus Nutrition 0.000 description 1
- 241000219122 Cucurbita Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- AEJSNWMRPXAKCW-WHFBIAKZSA-N Cys-Ala-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AEJSNWMRPXAKCW-WHFBIAKZSA-N 0.000 description 1
- YFXFOZPXVFPBDH-VZFHVOOUSA-N Cys-Ala-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)CS)C(O)=O YFXFOZPXVFPBDH-VZFHVOOUSA-N 0.000 description 1
- UKVGHFORADMBEN-GUBZILKMSA-N Cys-Arg-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UKVGHFORADMBEN-GUBZILKMSA-N 0.000 description 1
- QLCPDGRAEJSYQM-LPEHRKFASA-N Cys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N)C(=O)O QLCPDGRAEJSYQM-LPEHRKFASA-N 0.000 description 1
- AYKQJQVWUYEZNU-IMJSIDKUSA-N Cys-Asn Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O AYKQJQVWUYEZNU-IMJSIDKUSA-N 0.000 description 1
- OXOQBEVULIBOSH-ZDLURKLDSA-N Cys-Gly-Thr Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O OXOQBEVULIBOSH-ZDLURKLDSA-N 0.000 description 1
- WVLZTXGTNGHPBO-SRVKXCTJSA-N Cys-Leu-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O WVLZTXGTNGHPBO-SRVKXCTJSA-N 0.000 description 1
- GDNWBSFSHJVXKL-GUBZILKMSA-N Cys-Lys-Gln Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O GDNWBSFSHJVXKL-GUBZILKMSA-N 0.000 description 1
- WZJLBUPPZRZNTO-CIUDSAMLSA-N Cys-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N WZJLBUPPZRZNTO-CIUDSAMLSA-N 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 231100001074 DNA strand break Toxicity 0.000 description 1
- 208000035240 Disease Resistance Diseases 0.000 description 1
- 108700003861 Dominant Genes Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- WOACHWLUOFZLGJ-GUBZILKMSA-N Gln-Arg-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O WOACHWLUOFZLGJ-GUBZILKMSA-N 0.000 description 1
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- WMOMPXKOKASNBK-PEFMBERDSA-N Gln-Asn-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WMOMPXKOKASNBK-PEFMBERDSA-N 0.000 description 1
- RMOCFPBLHAOTDU-ACZMJKKPSA-N Gln-Asn-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RMOCFPBLHAOTDU-ACZMJKKPSA-N 0.000 description 1
- JFSNBQJNDMXMQF-XHNCKOQMSA-N Gln-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JFSNBQJNDMXMQF-XHNCKOQMSA-N 0.000 description 1
- OIIIRRTWYLCQNW-ACZMJKKPSA-N Gln-Cys-Asn Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O OIIIRRTWYLCQNW-ACZMJKKPSA-N 0.000 description 1
- IPHGBVYWRKCGKG-FXQIFTODSA-N Gln-Cys-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O IPHGBVYWRKCGKG-FXQIFTODSA-N 0.000 description 1
- LWDGZZGWDMHBOF-FXQIFTODSA-N Gln-Glu-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LWDGZZGWDMHBOF-FXQIFTODSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- BVELAHPZLYLZDJ-HGNGGELXSA-N Gln-His-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O BVELAHPZLYLZDJ-HGNGGELXSA-N 0.000 description 1
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 1
- LUGUNEGJNDEBLU-DCAQKATOSA-N Gln-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LUGUNEGJNDEBLU-DCAQKATOSA-N 0.000 description 1
- MSHXWFKYXJTLEZ-CIUDSAMLSA-N Gln-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MSHXWFKYXJTLEZ-CIUDSAMLSA-N 0.000 description 1
- SXFPZRRVWSUYII-KBIXCLLPSA-N Gln-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N SXFPZRRVWSUYII-KBIXCLLPSA-N 0.000 description 1
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 1
- OEIDWQHTRYEYGG-QEJZJMRPSA-N Gln-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N OEIDWQHTRYEYGG-QEJZJMRPSA-N 0.000 description 1
- NVHJGTGTUGEWCG-ZVZYQTTQSA-N Gln-Trp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O NVHJGTGTUGEWCG-ZVZYQTTQSA-N 0.000 description 1
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 1
- VYOILACOFPPNQH-UMNHJUIQSA-N Gln-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N VYOILACOFPPNQH-UMNHJUIQSA-N 0.000 description 1
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 1
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 1
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 1
- VFZIDQZAEBORGY-GLLZPBPUSA-N Glu-Gln-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VFZIDQZAEBORGY-GLLZPBPUSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 1
- WDTAKCUOIKHCTB-NKIYYHGXSA-N Glu-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N)O WDTAKCUOIKHCTB-NKIYYHGXSA-N 0.000 description 1
- BKRQSECBKKCCKW-HVTMNAMFSA-N Glu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N BKRQSECBKKCCKW-HVTMNAMFSA-N 0.000 description 1
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 1
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 1
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 1
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 1
- JYXKPJVDCAWMDG-ZPFDUUQYSA-N Glu-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N JYXKPJVDCAWMDG-ZPFDUUQYSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 1
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 1
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 1
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 1
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 1
- HHSKZJZWQFPSKN-AVGNSLFASA-N Glu-Tyr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O HHSKZJZWQFPSKN-AVGNSLFASA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 1
- DJTXYXZNNDDEOU-WHFBIAKZSA-N Gly-Asn-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)C(=O)N DJTXYXZNNDDEOU-WHFBIAKZSA-N 0.000 description 1
- WJZLEENECIOOSA-WDSKDSINSA-N Gly-Asn-Gln Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)O WJZLEENECIOOSA-WDSKDSINSA-N 0.000 description 1
- JVACNFOPSUPDTK-QWRGUYRKSA-N Gly-Asn-Phe Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JVACNFOPSUPDTK-QWRGUYRKSA-N 0.000 description 1
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 1
- JMQFHZWESBGPFC-WDSKDSINSA-N Gly-Gln-Asp Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JMQFHZWESBGPFC-WDSKDSINSA-N 0.000 description 1
- LJXWZPHEMJSNRC-KBPBESRZSA-N Gly-Gln-Trp Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O LJXWZPHEMJSNRC-KBPBESRZSA-N 0.000 description 1
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 1
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 1
- PCPOYRCAHPJXII-UWVGGRQHSA-N Gly-Lys-Met Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O PCPOYRCAHPJXII-UWVGGRQHSA-N 0.000 description 1
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 1
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 1
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 1
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- NWOSHVVPKDQKKT-RYUDHWBXSA-N Gly-Tyr-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O NWOSHVVPKDQKKT-RYUDHWBXSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- 108091027305 Heteroduplex Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- HTZKFIYQMHJWSQ-INTQDDNPSA-N His-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HTZKFIYQMHJWSQ-INTQDDNPSA-N 0.000 description 1
- JBJNKUOMNZGQIM-PYJNHQTQSA-N His-Arg-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JBJNKUOMNZGQIM-PYJNHQTQSA-N 0.000 description 1
- VOKCBYNCZVSILJ-KKUMJFAQSA-N His-Asn-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)O VOKCBYNCZVSILJ-KKUMJFAQSA-N 0.000 description 1
- LIEIYPBMQJLASB-SRVKXCTJSA-N His-Gln-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CN=CN1 LIEIYPBMQJLASB-SRVKXCTJSA-N 0.000 description 1
- NJZGEXYLSFGPHG-GUBZILKMSA-N His-Gln-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N NJZGEXYLSFGPHG-GUBZILKMSA-N 0.000 description 1
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 1
- QPSCMXDWVKWVOW-BZSNNMDCSA-N His-His-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QPSCMXDWVKWVOW-BZSNNMDCSA-N 0.000 description 1
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 1
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 1
- WPUAVVXYEJAWIV-KKUMJFAQSA-N His-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N WPUAVVXYEJAWIV-KKUMJFAQSA-N 0.000 description 1
- JSQIXEHORHLQEE-MEYUZBJRSA-N His-Phe-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JSQIXEHORHLQEE-MEYUZBJRSA-N 0.000 description 1
- BZAQOPHNBFOOJS-DCAQKATOSA-N His-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O BZAQOPHNBFOOJS-DCAQKATOSA-N 0.000 description 1
- CHIAUHSHDARFBD-ULQDDVLXSA-N His-Pro-Tyr Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 CHIAUHSHDARFBD-ULQDDVLXSA-N 0.000 description 1
- BFOGZWSSGMLYKV-DCAQKATOSA-N His-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CN=CN1)N BFOGZWSSGMLYKV-DCAQKATOSA-N 0.000 description 1
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 1
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 1
- LVQDUPQUJZWKSU-PYJNHQTQSA-N Ile-Arg-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LVQDUPQUJZWKSU-PYJNHQTQSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 1
- PPSQSIDMOVPKPI-BJDJZHNGSA-N Ile-Cys-Leu Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O PPSQSIDMOVPKPI-BJDJZHNGSA-N 0.000 description 1
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 1
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 1
- VUEXLJFLDONGKQ-PYJNHQTQSA-N Ile-His-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N VUEXLJFLDONGKQ-PYJNHQTQSA-N 0.000 description 1
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 1
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 1
- GMUYXHHJAGQHGB-TUBUOCAGSA-N Ile-Thr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMUYXHHJAGQHGB-TUBUOCAGSA-N 0.000 description 1
- XVUAQNRNFMVWBR-BLMTYFJBSA-N Ile-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N XVUAQNRNFMVWBR-BLMTYFJBSA-N 0.000 description 1
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 1
- 240000003589 Impatiens walleriana Species 0.000 description 1
- 206010021929 Infertility male Diseases 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 1
- CPONGMJGVIAWEH-DCAQKATOSA-N Leu-Met-Ala Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O CPONGMJGVIAWEH-DCAQKATOSA-N 0.000 description 1
- WXZOHBVPVKABQN-DCAQKATOSA-N Leu-Met-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WXZOHBVPVKABQN-DCAQKATOSA-N 0.000 description 1
- RRVCZCNFXIFGRA-DCAQKATOSA-N Leu-Pro-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RRVCZCNFXIFGRA-DCAQKATOSA-N 0.000 description 1
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- QONKWXNJRRNTBV-AVGNSLFASA-N Leu-Pro-Met Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N QONKWXNJRRNTBV-AVGNSLFASA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- FPFOYSCDUWTZBF-IHPCNDPISA-N Leu-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]([NH3+])CC(C)C)C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 FPFOYSCDUWTZBF-IHPCNDPISA-N 0.000 description 1
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 241000227653 Lycopersicon Species 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 1
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 1
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- ORVFEGYUJITPGI-IHRRRGAJSA-N Lys-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN ORVFEGYUJITPGI-IHRRRGAJSA-N 0.000 description 1
- NQSFIPWBPXNJII-PMVMPFDFSA-N Lys-Phe-Trp Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 NQSFIPWBPXNJII-PMVMPFDFSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- XGZDDOKIHSYHTO-SZMVWBNQSA-N Lys-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 XGZDDOKIHSYHTO-SZMVWBNQSA-N 0.000 description 1
- 208000007466 Male Infertility Diseases 0.000 description 1
- 241001608711 Melo Species 0.000 description 1
- BLIPQDLSCFGUFA-GUBZILKMSA-N Met-Arg-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O BLIPQDLSCFGUFA-GUBZILKMSA-N 0.000 description 1
- OLWAOWXIADGIJG-AVGNSLFASA-N Met-Arg-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(O)=O OLWAOWXIADGIJG-AVGNSLFASA-N 0.000 description 1
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 1
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 1
- HGAJNEWOUHDUMZ-SRVKXCTJSA-N Met-Leu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O HGAJNEWOUHDUMZ-SRVKXCTJSA-N 0.000 description 1
- OSZTUONKUMCWEP-XUXIUFHCSA-N Met-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC OSZTUONKUMCWEP-XUXIUFHCSA-N 0.000 description 1
- KMSMNUFBNCHMII-IHRRRGAJSA-N Met-Leu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN KMSMNUFBNCHMII-IHRRRGAJSA-N 0.000 description 1
- HOZNVKDCKZPRER-XUXIUFHCSA-N Met-Lys-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HOZNVKDCKZPRER-XUXIUFHCSA-N 0.000 description 1
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 1
- OVTOTTGZBWXLFU-QXEWZRGKSA-N Met-Val-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O OVTOTTGZBWXLFU-QXEWZRGKSA-N 0.000 description 1
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- WFHCXHNINSITPJ-VPENINKCSA-N NC(N=C(C1=[N+]2[O-])N([C@@H](C3)O[C@H](CO)[C@H]3O)C2=O)=NC1=O Chemical compound NC(N=C(C1=[N+]2[O-])N([C@@H](C3)O[C@H](CO)[C@H]3O)C2=O)=NC1=O WFHCXHNINSITPJ-VPENINKCSA-N 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 108010037490 Peptidyl-Prolyl Cis-Trans Isomerase NIMA-Interacting 4 Proteins 0.000 description 1
- 241000288936 Perodicticus potto Species 0.000 description 1
- ALHULIGNEXGFRM-QWRGUYRKSA-N Phe-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=CC=C1 ALHULIGNEXGFRM-QWRGUYRKSA-N 0.000 description 1
- CPTJPDZTFNKFOU-MXAVVETBSA-N Phe-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N CPTJPDZTFNKFOU-MXAVVETBSA-N 0.000 description 1
- FGXIJNMDRCZVDE-KKUMJFAQSA-N Phe-Cys-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N FGXIJNMDRCZVDE-KKUMJFAQSA-N 0.000 description 1
- WFDAEEUZPZSMOG-SRVKXCTJSA-N Phe-Cys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O WFDAEEUZPZSMOG-SRVKXCTJSA-N 0.000 description 1
- ZFVWWUILVLLVFA-AVGNSLFASA-N Phe-Gln-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N ZFVWWUILVLLVFA-AVGNSLFASA-N 0.000 description 1
- RJYBHZVWJPUSLB-QEWYBTABSA-N Phe-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N RJYBHZVWJPUSLB-QEWYBTABSA-N 0.000 description 1
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 1
- GHNVJQZQYKNTDX-HJWJTTGWSA-N Phe-Ile-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O GHNVJQZQYKNTDX-HJWJTTGWSA-N 0.000 description 1
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 1
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 1
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 1
- 235000001982 Physalis edulis Nutrition 0.000 description 1
- 240000004001 Physalis peruviana Species 0.000 description 1
- 241000758706 Piperaceae Species 0.000 description 1
- 108020005120 Plant DNA Proteins 0.000 description 1
- 108700001094 Plant Genes Proteins 0.000 description 1
- ALJGSKMBIUEJOB-FXQIFTODSA-N Pro-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 ALJGSKMBIUEJOB-FXQIFTODSA-N 0.000 description 1
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 1
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 1
- KQCCDMFIALWGTL-GUBZILKMSA-N Pro-Asn-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 KQCCDMFIALWGTL-GUBZILKMSA-N 0.000 description 1
- NGNNPLJHUFCOMZ-FXQIFTODSA-N Pro-Asp-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 NGNNPLJHUFCOMZ-FXQIFTODSA-N 0.000 description 1
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 1
- DTQIXTOJHKVEOH-DCAQKATOSA-N Pro-His-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CS)C(=O)O DTQIXTOJHKVEOH-DCAQKATOSA-N 0.000 description 1
- BWCZJGJKOFUUCN-ZPFDUUQYSA-N Pro-Ile-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O BWCZJGJKOFUUCN-ZPFDUUQYSA-N 0.000 description 1
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 1
- KLSOMAFWRISSNI-OSUNSFLBSA-N Pro-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 KLSOMAFWRISSNI-OSUNSFLBSA-N 0.000 description 1
- AUQGUYPHJSMAKI-CYDGBPFRSA-N Pro-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 AUQGUYPHJSMAKI-CYDGBPFRSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- WIPAMEKBSHNFQE-IUCAKERBSA-N Pro-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@@H]1CCCN1 WIPAMEKBSHNFQE-IUCAKERBSA-N 0.000 description 1
- ANESFYPBAJPYNJ-SDDRHHMPSA-N Pro-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ANESFYPBAJPYNJ-SDDRHHMPSA-N 0.000 description 1
- HOTVCUAVDQHUDB-UFYCRDLUSA-N Pro-Phe-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 HOTVCUAVDQHUDB-UFYCRDLUSA-N 0.000 description 1
- HWLKHNDRXWTFTN-GUBZILKMSA-N Pro-Pro-Cys Chemical compound C1C[C@H](NC1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CS)C(=O)O HWLKHNDRXWTFTN-GUBZILKMSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- BXHRXLMCYSZSIY-STECZYCISA-N Pro-Tyr-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O BXHRXLMCYSZSIY-STECZYCISA-N 0.000 description 1
- 241000508269 Psidium Species 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 108700005079 Recessive Genes Proteins 0.000 description 1
- 102000052708 Recessive Genes Human genes 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 1
- SFZKGGOGCNQPJY-CIUDSAMLSA-N Ser-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N SFZKGGOGCNQPJY-CIUDSAMLSA-N 0.000 description 1
- BLPYXIXXCFVIIF-FXQIFTODSA-N Ser-Cys-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N)CN=C(N)N BLPYXIXXCFVIIF-FXQIFTODSA-N 0.000 description 1
- MPPHJZYXDVDGOF-BWBBJGPYSA-N Ser-Cys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CO MPPHJZYXDVDGOF-BWBBJGPYSA-N 0.000 description 1
- XWCYBVBLJRWOFR-WDSKDSINSA-N Ser-Gln-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O XWCYBVBLJRWOFR-WDSKDSINSA-N 0.000 description 1
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 1
- DGPGKMKUNGKHPK-QEJZJMRPSA-N Ser-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N DGPGKMKUNGKHPK-QEJZJMRPSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- QGAHMVHBORDHDC-YUMQZZPRSA-N Ser-His-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 QGAHMVHBORDHDC-YUMQZZPRSA-N 0.000 description 1
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 1
- CJINPXGSKSZQNE-KBIXCLLPSA-N Ser-Ile-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O CJINPXGSKSZQNE-KBIXCLLPSA-N 0.000 description 1
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 1
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- WGDYNRCOQRERLZ-KKUMJFAQSA-N Ser-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N WGDYNRCOQRERLZ-KKUMJFAQSA-N 0.000 description 1
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- QPPYAWVLAVXISR-DCAQKATOSA-N Ser-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QPPYAWVLAVXISR-DCAQKATOSA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 1
- 241000220263 Sisymbrium Species 0.000 description 1
- 235000002634 Solanum Nutrition 0.000 description 1
- 241000208123 Solanum chilense Species 0.000 description 1
- 235000002540 Solanum chilense Nutrition 0.000 description 1
- 241000896544 Solanum chmielewskii Species 0.000 description 1
- 241000896499 Solanum habrochaites Species 0.000 description 1
- 244000194806 Solanum sisymbriifolium Species 0.000 description 1
- 235000018724 Solanum sisymbriifolium Nutrition 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 241000123055 Stereum hirsutum Species 0.000 description 1
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 1
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 1
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 1
- ODSAPYVQSLDRSR-LKXGYXEUSA-N Thr-Cys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O ODSAPYVQSLDRSR-LKXGYXEUSA-N 0.000 description 1
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 1
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 1
- YJVJPJPHHFOVMG-VEVYYDQMSA-N Thr-Met-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YJVJPJPHHFOVMG-VEVYYDQMSA-N 0.000 description 1
- MCDVZTRGHNXTGK-HJGDQZAQSA-N Thr-Met-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O MCDVZTRGHNXTGK-HJGDQZAQSA-N 0.000 description 1
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 1
- MEBDIIKMUUNBSB-RPTUDFQQSA-N Thr-Phe-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MEBDIIKMUUNBSB-RPTUDFQQSA-N 0.000 description 1
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 1
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 1
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 1
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 1
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 1
- CURFABYITJVKEW-QTKMDUPCSA-N Thr-Val-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O CURFABYITJVKEW-QTKMDUPCSA-N 0.000 description 1
- 235000011941 Tilia x europaea Nutrition 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- YYXIWHBHTARPOG-HJXMPXNTSA-N Trp-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N YYXIWHBHTARPOG-HJXMPXNTSA-N 0.000 description 1
- AIISTODACBDQLW-WDSOQIARSA-N Trp-Leu-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 AIISTODACBDQLW-WDSOQIARSA-N 0.000 description 1
- SLOYNOMYOAOUCX-BVSLBCMMSA-N Trp-Phe-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SLOYNOMYOAOUCX-BVSLBCMMSA-N 0.000 description 1
- MXKUGFHWYYKVDV-SZMVWBNQSA-N Trp-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(C)C)C(O)=O MXKUGFHWYYKVDV-SZMVWBNQSA-N 0.000 description 1
- 102000005506 Tryptophan Hydroxylase Human genes 0.000 description 1
- 108010031944 Tryptophan Hydroxylase Proteins 0.000 description 1
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 1
- IUQDEKCCHWRHRW-IHPCNDPISA-N Tyr-Asn-Trp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IUQDEKCCHWRHRW-IHPCNDPISA-N 0.000 description 1
- YGKVNUAKYPGORG-AVGNSLFASA-N Tyr-Asp-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YGKVNUAKYPGORG-AVGNSLFASA-N 0.000 description 1
- KEHKBBUYZWAMHL-DZKIICNBSA-N Tyr-Gln-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O KEHKBBUYZWAMHL-DZKIICNBSA-N 0.000 description 1
- LOOCQRRBKZTPKO-AVGNSLFASA-N Tyr-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LOOCQRRBKZTPKO-AVGNSLFASA-N 0.000 description 1
- ZRPLVTZTKPPSBT-AVGNSLFASA-N Tyr-Glu-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZRPLVTZTKPPSBT-AVGNSLFASA-N 0.000 description 1
- PJWCWGXAVIVXQC-STECZYCISA-N Tyr-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PJWCWGXAVIVXQC-STECZYCISA-N 0.000 description 1
- VUVVMFSDLYKHPA-PMVMPFDFSA-N Tyr-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC3=CC=C(C=C3)O)N VUVVMFSDLYKHPA-PMVMPFDFSA-N 0.000 description 1
- OKDNSNWJEXAMSU-IRXDYDNUSA-N Tyr-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 OKDNSNWJEXAMSU-IRXDYDNUSA-N 0.000 description 1
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- AFWXOGHZEKARFH-ACRUOGEOSA-N Tyr-Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=C(O)C=C1 AFWXOGHZEKARFH-ACRUOGEOSA-N 0.000 description 1
- QVYFTFIBKCDHIE-ACRUOGEOSA-N Tyr-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O QVYFTFIBKCDHIE-ACRUOGEOSA-N 0.000 description 1
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- QGFPYRPIUXBYGR-YDHLFZDLSA-N Val-Asn-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N QGFPYRPIUXBYGR-YDHLFZDLSA-N 0.000 description 1
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- OUUBKKIJQIAPRI-LAEOZQHASA-N Val-Gln-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OUUBKKIJQIAPRI-LAEOZQHASA-N 0.000 description 1
- QHFQQRKNGCXTHL-AUTRQRHGSA-N Val-Gln-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QHFQQRKNGCXTHL-AUTRQRHGSA-N 0.000 description 1
- OACSGBOREVRSME-NHCYSSNCSA-N Val-His-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CC(N)=O)C(O)=O OACSGBOREVRSME-NHCYSSNCSA-N 0.000 description 1
- DLMNFMXSNGTSNJ-PYJNHQTQSA-N Val-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N DLMNFMXSNGTSNJ-PYJNHQTQSA-N 0.000 description 1
- MYLNLEIZWHVENT-VKOGCVSHSA-N Val-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](C(C)C)N MYLNLEIZWHVENT-VKOGCVSHSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- MGVYZTPLGXPVQB-CYDGBPFRSA-N Val-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MGVYZTPLGXPVQB-CYDGBPFRSA-N 0.000 description 1
- RQOMPQGUGBILAG-AVGNSLFASA-N Val-Met-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RQOMPQGUGBILAG-AVGNSLFASA-N 0.000 description 1
- MJFSRZZJQWZHFQ-SRVKXCTJSA-N Val-Met-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N MJFSRZZJQWZHFQ-SRVKXCTJSA-N 0.000 description 1
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- DLLRRUDLMSJTMB-GUBZILKMSA-N Val-Ser-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N DLLRRUDLMSJTMB-GUBZILKMSA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- KJFBXCFOPAKPTM-BZSNNMDCSA-N Val-Trp-Val Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 KJFBXCFOPAKPTM-BZSNNMDCSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000219094 Vitaceae Species 0.000 description 1
- 235000009754 Vitis X bourquina Nutrition 0.000 description 1
- 235000012333 Vitis X labruscana Nutrition 0.000 description 1
- 240000006365 Vitis vinifera Species 0.000 description 1
- 235000014787 Vitis vinifera Nutrition 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 238000010170 biological method Methods 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000001728 capsicum frutescens Substances 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 229960001338 colchicine Drugs 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000009260 cross reactivity Effects 0.000 description 1
- 239000012297 crystallization seed Substances 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 210000001840 diploid cell Anatomy 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 235000020774 essential nutrients Nutrition 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000003925 fat Substances 0.000 description 1
- 235000019197 fats Nutrition 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 235000015203 fruit juice Nutrition 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 230000000855 fungicidal effect Effects 0.000 description 1
- 239000000417 fungicide Substances 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 230000035784 germination Effects 0.000 description 1
- 239000012869 germination medium Substances 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 235000021021 grapes Nutrition 0.000 description 1
- 238000000227 grinding Methods 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000002363 herbicidal effect Effects 0.000 description 1
- 239000004009 herbicide Substances 0.000 description 1
- 235000008216 herbs Nutrition 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 101150063121 iaaM gene Proteins 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009399 inbreeding Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 239000002917 insecticide Substances 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 230000005865 ionizing radiation Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 235000008960 ketchup Nutrition 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 239000004571 lime Substances 0.000 description 1
- 230000004777 loss-of-function mutation Effects 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000011880 melting curve analysis Methods 0.000 description 1
- 230000000442 meristematic effect Effects 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 235000010755 mineral Nutrition 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 230000008789 oxidative DNA damage Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 101150101567 pat-2 gene Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 210000002826 placenta Anatomy 0.000 description 1
- 238000003976 plant breeding Methods 0.000 description 1
- 230000008121 plant development Effects 0.000 description 1
- 239000000419 plant extract Substances 0.000 description 1
- 239000003375 plant hormone Substances 0.000 description 1
- 230000037039 plant physiology Effects 0.000 description 1
- 210000002706 plastid Anatomy 0.000 description 1
- 235000021018 plums Nutrition 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
- 125000000561 purinyl group Chemical group N1=C(N=C2N=CNC2=C1)* 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 239000012882 rooting medium Substances 0.000 description 1
- 235000012045 salad Nutrition 0.000 description 1
- 235000011890 sandwich Nutrition 0.000 description 1
- 235000015067 sauces Nutrition 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 230000007226 seed germination Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000030118 somatic embryogenesis Effects 0.000 description 1
- 229910001220 stainless steel Inorganic materials 0.000 description 1
- 239000010935 stainless steel Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000008961 swelling Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 229910021642 ultra pure water Inorganic materials 0.000 description 1
- 239000012498 ultrapure water Substances 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H6/00—Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
- A01H6/82—Solanaceae, e.g. pepper, tobacco, potato, tomato or eggplant
- A01H6/825—Solanum lycopersicum [tomato]
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H6/00—Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
- A01H6/82—Solanaceae, e.g. pepper, tobacco, potato, tomato or eggplant
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H5/00—Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
- A01H5/08—Fruits
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H1/00—Processes for modifying genotypes ; Plants characterised by associated natural traits
- A01H1/04—Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H1/00—Processes for modifying genotypes ; Plants characterised by associated natural traits
- A01H1/10—Processes for modifying non-agronomic quality output traits, e.g. for industrial processing; Value added, non-agronomic traits
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H5/00—Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
- A01H5/10—Seeds
Abstract
本发明涉及一种在基因组中包含突变等位基因的至少一个拷贝的茄科植物,所述突变等位基因当以纯合形式存在时,引起种子败育型的果实形成。本发明还涉及由本发明的植物产生的花粉和种子、可生长出本发明的植物的种子以及来自根据本发明的植物的部分。本发明还涉及一种鉴别和/或选择根据本发明的植物的方法和一种产生根据本发明的植物的方法。本发明还涉及本发明的植物作为食用作物或作为繁殖材料来源的用途。本发明还涉及核酸用于鉴别本发明的植物或用于培育本发明的植物的用途。
Description
技术领域
本发明涉及植物育种领域。特别是在基因组中包含突变等位基因的至少一个拷贝的茄科(Solanaceae)植物,所述突变等位基因当以纯合形式存在时,引起种子败育型的果实形成。本发明还涉及由本发明的植物产生的花粉和种子、可生长出本发明的植物的种子以及来自本发明的植物的部分。本发明还涉及一种鉴别和/或选择本发明的植物的方法和一种产生本发明的植物的方法。本发明还涉及本发明的植物作为食用作物或作为繁殖材料来源的用途。本发明还涉及核酸用于鉴别本发明的植物或用于培育本发明的植物的用途。
背景技术
大多数商业生产无籽果实的植物都是在下述植物物种中开发的,所述植物物种的果实通常含有大量分布在整个果实果肉中的相对较大的硬种子。无籽果实为例如以西瓜、黄瓜、葡萄、香蕉、柑橘类水果如橙、柠檬和酸橙闻名,也有来自茄科植物的,如番茄、茄子和辣椒。由于食用无籽果实通常更容易和更方便,因此它们被认为是高价值的。
当花的胚珠室中的一个或多个卵细胞被来自花粉的精子核受精时,果实发育通常开始。
无籽果实可以由两种不同的现象产生。在一些情况下,果实是在没有通过花粉使胚珠受精的情况下发育的,这种现象被称为单性结实(parthenocarpy)。在其他情况下,无籽果实是在授粉后,当种子(胚和/或胚乳)的生长受到抑制或种子过早死亡而果实的其余部分继续生长时发育的(种子败育(stenospermocarpy))。与单性结实相反,种子败育需要授粉来启动果实生长。
无籽黄瓜、无籽南瓜和无籽茄子是无需授粉即可产生无籽果实的作物的实例(单性结实),例如在授粉受损的条件下(例如低温)。然而,在这些条件下可以产生商业品质的果实。但所有这些作物都可以在授粉后产生带种子的果实。因此,这些作物是兼性单性结实的。作物的繁殖可以通过自花授粉或异花授粉、离体繁殖和嫁接来完成。
由番茄突变体,还已知它们可以在正常授粉受损/受精受损的条件下(例如在低温环境下)产生无籽果实。因此,这些突变体也是兼性单性结实的。已知显示这种表型的突变体为pat、pat-2和pat-3/pat-4系统(WO1999021411 A1)。这些突变背后的基因尚不清楚,pat-3/pat-4系统似乎依赖于多个基因座。
单性结实也已经通过遗传修饰引入到几个植物物种中。在胚珠和胎座特异性DefH9启动子的控制下表达赋予生长素合成的细菌色氨酸单加氧酶(iaaM)确实诱导黄瓜(Yin et al.,2006,Cellular&molecular Biotech.Letters 11,279-290)、茄子(Acciarriet al.,2002,BMC Biotech.2(4))、番茄(Rotino et al.,2005,BMC Biotech.5(32))和烟草的单性结实。
这些转基因植物证明了植物激素在种子和果实发育中的重要性。除了其他因素之外,种子和果实的发育还受到几种植物激素的强烈控制,这在本领域是众所周知的。单性结实,包括果实无籽的逻辑结果,也可以被诱导,例如通过外源施用植物激素,特别是生长素或赤霉素(Ruan et al.,Trends in Plant Sci.17(11),1360-1385)。
WO2008/152134 A1记载了一种雄性不育杂种辣椒植物,其在整株植物中生长出外观正常的可食用无籽果实,其中所述无籽果实被表征为至少95%无籽。WO2008/152134 A1的“无籽”性状由可从根据《布达佩斯条约》保藏的各种辣椒植物获得的遗传决定子控制,该遗传决定子未进一步具体描述。WO2008/152134 A1还记载了其中公开的单性结实性状不依赖于授粉和受精过程,不依赖于用单性结实诱导植物激素(包括生长素、赤霉素和细胞因子、生长素运输抑制剂或其他)和/或其它单性结实诱导外源因子和/或外源施用的单性结实诱导剂(例如天然或合成的生长调节物质)或植物提取物(例如死花粉提取物)处理,并且也不依赖于外部气候条件。
WO2009/098983 A1记载了产生无籽果实的辣椒植物,其中所述植物通过特定的杂交方法获得。在第一方法步骤中,杂交方法包括从通过雄性不育系的植物和单性结实系的植物之间杂交产生的第一子代植物群中选择能够产生无籽果实以及具有遗传决定的雄性不育性状和遗传决定的单性结实性状的第一子代植物。在第二方法步骤中,然后将如此选择的第一子代植物与“Mi 74系”作为花粉亲本杂交,从而产生具有遗传决定的单性结实性状和遗传决定的雄性不育性状的子代植物,所述“Mi74系”是能够维持植物的遗传决定的单性结实性状和遗传决定的雄性不育性状的特异性固定的单性结实系。在最后的方法步骤中,将如此产生的子代植物再次与在第二方法步骤中用作花粉亲本的固定的单性结实系的植物作为花粉亲本回交,从而产生具有遗传决定的单性结实性状和遗传决定的雄性不育性状的子代植物,其中第三方法步骤重复至少一次。
WO2012/087140 A2记载了包含突变的遗传决定子的辣椒植物,当所述突变的遗传决定子以纯合存在时,导致单性结实果实的形成,其中所述遗传决定子可通过由根据《布达佩斯条约》保藏的种子生长出的特定植物的基因渗入获得。
WO2013/078319 A1记载了生长单性结实无籽辣椒果实的辣椒植物。WO2013/078319 A1的辣椒植物可通过一种方法获得,所述方法包括将包含细胞质雄性不育(CMS)性状的第一辣椒植物作为母本与单性结实的第二植物杂交以产生单性结实无籽辣椒植物的种子。WO2013/078319 A1的CMS性状来源于风铃辣椒(Capsicum baccatum)植物。
WO2016/120438 A1记载了在蛋白结构的细胞内环中包含氨基酸改变的一种修饰的PIN4蛋白当存在于植物中时,能够诱导单性结实坐果,其中所述植物优选为甜瓜(Cucumis melo)、黄瓜(Cucumis sativus)、西瓜(Citrillus lanatus)、番茄(Solanumlycopersicum)、茄子(Solanum melongena)或辣椒(Capsicum annuum)植物。
WO2017/125931 A1记载了茄子科植物,其选自番茄、辣椒和茄子,表现出兼性单性结实,并且在AGL6基因中包含功能丧失突变。WO2017/125931 A1的茄子科植物优选为番茄植物。
无籽西瓜是种子败育作物的一个实例。正常西瓜植物为二倍体(2n)。产生无籽果实的西瓜是通过雄性二倍体(2n)西瓜植物与雌性四倍体(4n)西瓜植物杂交产生的杂种。得到的F1杂种种子是三倍体(3n)。在F1杂种植物中诱导坐果需要授粉。由于三倍体(3n)F1杂种植物不产生可育花粉,二倍体(2n)传粉者(pollinator(或polliniser))植物必须种植在同一块地中。二倍体(2n)传粉者和雌性三倍体(3n)杂种植物的花之间的异花授粉诱导坐果并导致在三倍体杂种植物上产生无籽三倍体果实。通常,必须在给定的方案中种植传粉者与杂种植物的比值约为1比3,以提供足够的花粉为所有F1杂种植物授粉。F1杂种的二倍体(2n)和四倍体(4n)亲本各自产生带种子的果实,并且都可以通过自花授粉彼此独立地繁殖。
无籽葡萄可以由单性结实或种子败育的植物产生。Black Corinth品种是单性结实,而Sultanina品种是种子败育。藤本植物通常通过插条和连续嫁接到另一个砧木上来繁殖。
从以上讨论可以明显看出,决定植物是否产生无籽果实的因素在本质上是多方面的,并且可以存在于几个因素中,例如形态学、生理和/或遗传原因。
根据现有技术能够产生无籽果实的茄子科植物都是单性结实,即它们能够在没有授粉的情况下坐果。由单性结实产生无籽果实的植物的育种和栽培存在一些缺点。最重要的是,许多作物中的单性结实植物产生的果实形状异常和/或尺寸缩小。此外,利用单性结实植物进行育种以将单性结实性状引入同一植物物种的不同果实类型和品种中可能非常复杂,因为这需要雄性不育背景作为先决条件。此外,单性结实植物的F1杂种种子的生产通常是不可能的,或者可能是非常困难和低效率的。因此,迫切需要开发能够产生具有正常形状和大小的无籽果实的改良茄子科植物,其中无籽性状可以容易地转移到同一植物物种的不同果实类型和品种中,并且可以有效地产生种子。
出乎意料地,可以在茄科植物中鉴别出突变等位基因,所述突变等位基因当以纯合形式存在时,引起种子败育型的果实形成。野生型基因在本文中被命名为SSPER-1,即种子败育-1。还出乎意料地发现,由对于该突变等位基因是纯合的植物所产生的无籽果实具有正常的形状和大小。还出乎意料地发现,能够诱导种子败育型的果实形成的突变等位基因可以容易地转移到同一植物物种的不同果实类型和品种中。还出人意料地发现,可以有效地产生包含突变等位基因的种子,其中可以由所述种子生长能够发生种子败育型的果实形成的植物。
发明内容
本发明涉及在基因组中包含野生型SSPER-1基因的突变等位基因的至少一个拷贝的茄科植物,其中所述突变等位基因当以纯合形式存在时,引起种子败育型的果实形成,其中野生型SSPER-1基因编码包含与SEQ ID NO:1的至少70%氨基酸序列同一性的蛋白。
本发明还涉及可生长出本发明的植物的种子、由所述种子生长出的植物、由本发明的植物产生的果实、根据本发明的植物的部分以及从根据本发明的植物部分繁殖的营养繁殖植物。
此外,本发明涉及一种产生种子败育型果实的方法,所述方法包括使根据本发明的植物生长并收获由所述植物产生的果实。本发明还涉及一种鉴别和/或选择包含SSPER-1基因的突变等位基因的茄科植物或植物部分的方法,所述方法包括确定所述植物或植物部分是否包含SSPER-1基因的突变等位基因,其中所述突变等位基因导致SSPER-1基因的表达降低或不表达,或者其中所述突变等位基因编码与野生型蛋白相比功能降低或功能丧失的蛋白,以及任选地选择包含SSPER-1基因的突变等位基因的至少一个拷贝的植物或植物部分,其中所述突变等位基因当以纯合形式存在时,引起种子败育型的果实形成,其中野生型SSPER-1基因编码包含与SEQ ID NO:1的至少70%氨基酸序列同一性的蛋白。本发明还涉及一种产生在基因组中包含如本文定义的SSPER-1基因的突变等位基因的至少一个拷贝的茄科植物的方法,其中所述突变等位基因当以纯合形式存在时,引起种子败育型的果实形成。本发明还涉及一种产生在基因组中包含如本文所定义的SSPER-1基因的突变等位基因的至少一个拷贝的茄科植物的方法,其中所述突变等位基因当以纯合形式存在时,引起种子败育型的果实形成,所述方法包括以下步骤:(i)使第一茄科植物和第二茄科植物杂交,其中所述第一茄科植物是根据本发明的植物;(ii)任选地从(i)的杂交中收获种子,并选择在基因组中包含如本文所述的SSPER-1基因的突变等位基因的至少一个拷贝的种子。
此外,本发明涉及根据本发明的植物作为食用作物的用途,所述植物优选包含纯合形式的突变SSPER-1等位基因。本发明还涉及根据本发明的植物作为繁殖材料来源的用途。此外,本发明涉及编码SSPER-1蛋白的核酸用于鉴别能够发生种子败育型的果实形成的茄科植物的用途,其中所述SSPER-1蛋白包含与SEQ ID NO:1的至少70%氨基酸序列同一性。本发明还涉及编码SSPER-1蛋白的核酸用于培育能够发生种子败育型的果实形成的茄科植物的用途,其中所述SSPER-1蛋白包含与SEQ ID NO:1的至少70%氨基酸序列同一性。
序列表的简要描述
SEQ ID NO:1显示了野生型辣椒SSPER-1蛋白的氨基酸序列。
SEQ ID NO:2显示了编码野生型辣椒SSPER-1蛋白的核苷酸序列(编码DNA或cDNA)。
SEQ ID NO:3显示了突变辣椒ssper-1蛋白的氨基酸序列。
SEQ ID NO:4显示了编码突变辣椒ssper-1蛋白的核苷酸序列(编码DNA或cDNA)。
SEQ ID NO:5显示了野生型中华辣椒(Capsicum chinense)SSPER-1蛋白的氨基酸序列。
SEQ ID NO:6显示了编码野生型中华辣椒SSPER-1蛋白的核苷酸序列(编码DNA或cDNA)。
SEQ ID NO:7显示了野生型风铃辣椒SSPER-1蛋白的氨基酸序列。
SEQ ID NO:8显示了编码野生型风铃辣椒SSPER-1蛋白的核苷酸序列(编码DNA或cDNA)。
SEQ ID NO:9显示了野生型茄子SSPER-1蛋白的氨基酸序列。
SEQ ID NO:10显示了编码野生型茄子SSPER-1蛋白的核苷酸序列(编码DNA或cDNA)。
SEQ ID NO:11显示了野生型潘那利番茄(Solanum pennellii)SSPER-1蛋白的氨基酸序列。
SEQ ID NO:12显示了编码野生型潘那利番茄SSPER-1蛋白的核苷酸序列(编码DNA或cDNA)。
SEQ ID NO:13显示了野生型番茄SSPER-1蛋白的氨基酸序列。
SEQ ID NO:14显示了编码野生型番茄SSPER-1蛋白的核苷酸序列(编码DNA或cDNA)。
附图说明
图1:显示与野生型植物(见图3)具有相同遗传背景的甜椒植物果实的灰度照片,不同的是图1的植物根据本发明对于SSPER-1基因的突变等位基因是纯合的。果实显示未形成正常种子,而果实的胎座和隔膜组织发育正常,导致形成正常的果实形状。
图2:显示与野生型植物(见图3)具有相同遗传背景的甜椒植物果实的灰度照片,不同的是图2的植物根据本发明对于SSPER-1基因的突变等位基因是杂合的。与野生型植物的果实相比,该果实显示出果实胎座组织中的种子形成减少。
图3:显示野生型甜椒植物果实的灰度照片,即植物对于SSPER-1基因的野生型等位基因是纯合的。该果实显示出果实胎座组织中种子形成正常。
具体实施方式
一般定义
术语“基因组”涉及生物体的遗传物质。它由DNA组成。基因组包括基因和DNA的非编码序列。
术语“遗传决定子”涉及植物基因组中引起植物特定性状的遗传信息。因此,遗传决定子包含赋予某一性状的遗传信息(基因或基因座或基因渗入)。通常,遗传决定子可以包含单个基因(或一个数量性状基因座(QTL))或多于一个基因。在本发明中,遗传决定子包含单个基因。
等位性检验是本领域已知的可用于鉴别赋予相同性状的两个基因是否位于同一基因座的检验。
本申请上下文中的“性状”一词是指植物的表型。当植物显示本发明的性状时,其基因组包含引起本发明性状的突变等位基因,特别是在本发明中当突变等位基因是纯合形式时。因此,该植物具有本发明的遗传决定子。应当理解,当提及包含本发明植物的性状的植物时,是指包含种子败育型果实形成的性状的茄子科植物。
遗传决定子可以以隐性方式、中间方式或显性方式遗传。当涉及中间遗传或显性遗传时,表型性状的选择更容易,因为较大部分的杂交子代揭示了该性状。遗传决定子也可以包含隐性的和/或中间的和/或显性的基因或QTL的组合。在本发明中,遗传决定子包含单隐性基因。
可以根据表型(可以观察到的性状)选择遗传决定子(例如突变的SSPER-1等位基因)。也可以通过使用分子基因分型方法进行选择,例如一个或多个与突变等位基因遗传连锁的分子标记,或者优选使用基因或等位基因序列本身,例如通过能够区分存在突变等位基因和野生型等位基因或其产物(例如由等位基因编码的mRNA或蛋白)的分子方法。在育种中使用分子基因分型方法(如使用遗传连锁标记时的“标记辅助选择”,或其他基因分型方法,如SNP基因分型)需要较小的群体进行筛选(与表型选择相比),并且可以在非常早的阶段进行。分子基因分型方法的另一个优点是可以容易地区分不具有SSPER-1基因野生型拷贝(对于突变ssper-1等位基因是纯合的)的纯合植物或种子、杂合植物或种子和不具有本发明的突变SSPER-1基因拷贝的纯合植物或种子,这甚至可以在种子发芽之前或在植物发育早期进行,例如在成熟果实发育之前。
“植物系”或“育种系”是指植物及其子代。如本文所用,术语“近交系”是指已经重复自交并且每个特征几乎是纯合的植物系。因此,“近交系”或“亲本系”是指经历了几代(例如至少5、6、7或更多)近交,从而产生具有高一致性的植物系的植物。
术语“等位基因”是指特定基因座上基因的一种或多种替代形式中的任何一种,所有这些等位基因都与特定基因座上的一种性状或特征相关。在生物体的二倍体细胞中,给定基因的等位基因位于染色体上的特定位置或基因座(多个基因座)。一个等位基因存在于该对同源染色体的每条染色体上。二倍体植物物种可在特定基因座包含大量不同的等位基因。这些可以是基因的相同等位基因(纯合的)或两个不同的等位基因(杂合的)。
术语“基因座”是指染色体上的一个或多个特定位置或位点,在此处例如发现了基因或遗传标记。因此,无籽基因座是茄子科植物基因组中发现SSPER-1基因的位置。
术语“基因”是指(基因组)DNA序列,其包含在细胞中被转录成信使RNA分子(mRNA)的区域(转录区)和可操作地连接的调节区(例如启动子)。因此,基因可以包含几个可操作地连接的序列,例如启动子、5’前导序列(包含例如参与翻译起始的序列)、(蛋白)编码区(cDNA或基因组DNA)和3’非翻译序列(包含例如转录终止位点)。因此,基因的不同等位基因是基因的不同替代形式,其可以是例如差异在于基因组DNA序列(例如启动子序列、外显子序列、内含子序列等)的一个或多个核苷酸、mRNA和/或所编码的蛋白的氨基酸序列的形式。基因可以是内源基因(在起源物种中)或嵌合基因(例如转基因或同源转基因(cis-gene))。基因序列的“启动子”被定义为启动特定基因转录的DNA区域。启动子位于它们转录的基因附近,在同一条链上,在DNA的上游。启动子可以是大约100-1000个碱基对长。在一个方面,启动子被定义为约1000个或更多个例如约1500或2000个碱基对的区域,在基因编码的蛋白的起始密码子(即ATG)的上游。
“转基因”或“嵌合基因”是指包含DNA序列(如重组基因)的遗传基因座,其已通过转化(如农杆菌属(Agrobacterium)介导的转化)导入植物基因组中。包含稳定整合到基因组中的转基因的植物称为“转基因植物”。
“基因的表达”是指这样的过程,其中可操作地连接到合适的调节区,特别是启动子的DNA区域被转录成具有生物活性的RNA,即其能够被翻译成生物活性蛋白或肽(或活性肽片段)或其本身是活性的(例如在转录后基因沉默或RNAi中)。编码序列可以是有义定向的,并编码所需的生物活性蛋白或肽,或活性肽片段。
“数量性状基因座”或“QTL”是一种染色体基因座,其编码一个或多个影响连续分布(数量)的表型的表达度的等位基因。
同一染色体上基因座之间(例如分子标记之间和/或表型标记之间)的“物理距离”是以碱基或碱基对(bp)、千碱基或千碱基对(kb)或兆碱基或兆碱基对(Mb)表示的实际物理距离。
同一染色体上基因座之间(例如分子标记之间和/或表型标记之间)的“遗传距离”是通过交叉频率或重组频率(RF)来测量的,并以厘摩(cM)表示。一个cM对应于1%的重组频率。如果不能发现重组体,则RF为零,并且基因座要么在物理上非常紧密地在一起、要么完全相同。两个基因座相距越远,RF越高。
“野生型等位基因”(WT)在本文中是指编码全功能蛋白(野生型蛋白)的基因形式。因此,术语“野生型SSPER-1等位基因”或“SSPER-1等位基因”或“SSPER-1基因的野生型等位基因”是指SSPER-1基因的全功能等位基因,其允许果实中成熟和/或有活力的种子的正常形成。例如,物种辣椒中的这种野生型SSPER-1等位基因是编码SEQ ID NO:2所示的野生型SSPER-1cDNA(mRNA)序列的野生型基因组DNA。该野生型辣椒SSPER-1cDNA编码的蛋白序列有815个氨基酸,如SEQ ID NO:1所示,其对应于NCBI参考序列XP_016564676.1。例如,物种中华辣椒中的野生型SSPER-1等位基因是编码SEQ ID NO:6所示的野生型SSPER-1cDNA(mRNA)序列的野生型基因组DNA。该野生型中华辣椒SSPER-1cDNA编码的蛋白序列具有818个氨基酸,如SEQ ID NO:5所示,其对应于NCBI参考序列PHU23006.1。例如,物种风铃辣椒中的野生型SSPER-1等位基因是编码SEQ ID NO:8所示的野生型SSPER-1 cDNA(mRNA)序列的野生型基因组DNA。该野生型风铃辣椒SSPER-1 cDNA编码的蛋白序列有819个氨基酸,如SEQID NO:7所示,其对应于NCBI参考序列PHT53105.1。例如,物种茄子中的野生型SSPER-1等位基因是编码SEQ ID NO:10所示的野生型SSPER-1cDNA(mRNA)序列的野生型基因组DNA。该野生型茄子SSPER-1cDNA编码的蛋白序列有749个氨基酸,如SEQ ID NO:9所示,其对应于GenBank登记号GBGZ01086676.1。例如,物种潘那利番茄中的野生型SSPER-1等位基因是编码SEQ ID NO:12所示的野生型SSPER-1cDNA(mRNA)序列的野生型基因组DNA。该野生型潘那利番茄SSPER-1cDNA编码的蛋白序列有807个氨基酸,如SEQ ID NO:11所示,其对应于NCBI参考序列XP_015070591.1。例如,物种番茄中的野生型SSPER-1等位基因是编码SEQ ID NO:14所示的野生型SSPER-1cDNA(mRNA)序列的野生型基因组DNA。该野生型番茄SSPER-1cDNA编码的蛋白序列有824个氨基酸,如SEQ ID NO:13所示,其对应于NCBI参考序列XP_004234441.1。在茄科的其他植物物种中,可以使用本领域已知的方法鉴别本文具体描述的野生型SSPER-1等位基因的一个或多个直系同源物。野生型SSPER-1等位基因还包含编码本文所述的野生型SSPER-1cDNA和氨基酸序列的野生型基因组DNA的功能性变体。本文具体描述的野生型SSPER-1等位基因的某一变体是否代表功能性变体可通过使用常规方法来确定,所述常规方法包括,但不限于,对果实中成熟和/或有活力的种子的正常形成的表型测试和影响蛋白功能的氨基酸变化的计算机模拟预测。例如,基于网络的计算机程序SIFT(从耐受至不耐受排序(Sorting Intolerant From Tolerant))是预测氨基酸取代是否影响蛋白功能的程序;参见万维网sift.bii.a-star.edu.sg/。功能上重要的氨基酸在蛋白家族中是保守的,因此保守良好的位置上的变化倾向于被预测为不耐受或有害的;另参见Ng andHenikoff(2003)Nucleic Acids Res 31(13):3812–3814。例如,如果蛋白家族比对中的某个位置仅包含氨基酸异亮氨酸,则推定选择了对任何其他氨基酸的取代,并且异亮氨酸是蛋白功能所必需的。因此,任何其他氨基酸的变化都将被预测为对蛋白功能有害。如果比对中的某个位置包含疏水性氨基酸异亮氨酸、缬氨酸和亮氨酸,那么SIFT实际上假定该位置只能包含具有疏水性特征的氨基酸。在该位置,通常预测其他疏水性氨基酸的变化是可耐受的,但预测其他残基(如带电的或极性的)的变化会影响蛋白功能。另一个可用于预测蛋白功能的工具是Provean;参见万维网provean.jcvi.org/index.php。
“突变等位基因”在本文中是指与野生型等位基因相比,在编码序列(mRNA、cDNA或基因组序列)中包含一个或多个突变的等位基因。这种突变(例如一个或多个核苷酸的插入、倒位、缺失和/或替换)可导致编码的蛋白具有降低的体外和/或体内功能性(功能降低)或没有体外和/或体内功能性(功能丧失),例如由于蛋白,例如被截短或具有其中缺失、插入或替换一个或多个氨基酸的氨基酸序列。这种变化可导致蛋白具有不同的3D构象、靶向不同的亚细胞区室、具有修饰的催化结构域、对核酸或蛋白具有改进的结合活性等。根据本发明的突变等位基因可以通过诱变方法产生,例如化学诱变(例如使用EMS或MNU诱变或通过产生活性氧物质的诱变)或其他辐射诱变(例如使用UV辐射或离子束辐射)。因此,“突变ssper-1等位基因”或“ssper-1等位基因”或“SSPER-1基因的突变等位基因”是指与野生型等位基因相比在编码序列中包含一个或多个突变的SSPER-1基因的等位基因,所述一个或多个突变导致编码基因产物的功能降低或功能丧失,并且当突变等位基因是纯合形式时,其阻止果实中成熟和/或有活力的种子的正常形成。例如,物种辣椒中的这种突变型ssper-1等位基因是SEQ ID NO:4所示的突变ssper-1cDNA(mRNA)序列。该突变辣椒ssper-1cDNA编码的蛋白序列有181个氨基酸,如SEQ ID NO:3所示。优选地,本文所用的术语突变ssper-1等位基因在本文中是指野生型SSPER-1基因的任何等位基因或ssper-1等位基因,其在天然群体或育种群体的植物中没有发现,但是其通过人类干预如诱变或靶向基因修饰(也称为靶向基因编辑)产生,如通过例如CRISPR/Cas9、CRISPR/Cpf1或类似方法产生。术语突变ssper-1等位基因还包括敲除ssper-1等位基因和敲低(knock-down)ssper-1等位基因,以及编码功能降低或无功能的SSPER-1蛋白的ssper-1等位基因。如本文所用,术语“敲除等位基因”是指其中相应(野生型)基因的表达不再可检测的等位基因。与野生型等位基因相比,“敲低”ssper-1等位基因的相应(野生型)基因表达降低。
“野生型植物”在本文中是指包含野生型SSPER-1等位基因的两个拷贝的茄科植物,其显示了果实中成熟和/或有活力的种子的正常形成。例如,这种植物是表型论文中的合适对照。
在茄科植物中,野生型SSPER-1基因编码包含与SEQ ID NO:1的至少70%(71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%)氨基酸序列同一性的蛋白。氨基酸序列SEQ ID NO:1描述的蛋白代表辣椒中的野生型SSPER-1蛋白,对应于NCBI参考序列XP_016564676.1。在茄科的其他植物中,野生型SSPER-1蛋白相应地由辣椒中野生型SSPER-1基因的直系同源物编码。优选地,茄科其他植物中的辣椒SSPER-1基因的直系同源物编码具有与SEQ ID NO:1的至少65%(例如至少65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%)氨基酸序列同一性的蛋白。
术语“直系同源基因”或“直系同源物”定义为不同物种中通过物种形成事件进化的基因。一般认为,在不同物种中,直系同源物具有相同的生物学功能。因此,特别优选的是,在茄科的其他植物中由野生型辣椒SSPER-1基因的直系同源物编码的蛋白具有与野生型辣椒SSPER-1蛋白相同的生物学功能。直系同源物的鉴别方法在本领域中是众所周知的,因为它实现了两个目标:描绘基因谱系以研究进化过程的力量和机制,以及创建具有相同生物学功能的基因组(Fang G,et al(2010)Getting Started in Gene Orthology andFunctional Analysis.PLoS Comput Biol 6(3):e1000703.doi:10.1371/journal.pcbi.1000703)。例如,可以使用目的蛋白的基因序列与其他物种的基因序列的序列比对或序列同一性来鉴别特定基因或蛋白的直系同源物。基因比对或基因序列同一性测定可以根据本领域已知的方法进行,例如通过鉴别现有核酸或蛋白数据库(例如GENBANK、SWISSPROT、TrEMBL)中的核酸或蛋白序列,并使用标准序列分析软件,如序列相似性检索工具(BLASTN、BLASTP、BLASTX、TBLAST、FASTA等)。在本发明的一个方面,茄科的其他植物中的辣椒SSPER-1蛋白的直系同源物具有与SEQ ID NO:1的至少65%(例如至少65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%)氨基酸序列同一性。
野生型SSPER-1蛋白包含几个不同的保守结构域,包括,但不限于,DNA结合同源框结构域和脂质结合START结构域。在辣椒的野生型SSPER-1蛋白中,DNA结合同源框结构域包含SEQ ID NO:1的下述氨基酸残基,其起始于并包括氨基酸118,结束于并包括氨基酸171(本文中表示为氨基酸118-171)。在辣椒的野生型SSPER-1蛋白中的脂质结合START结构域包含SEQ ID NO:1的氨基酸残基320-548。这些保守结构域被认为对蛋白的体内活性很重要。
“基因渗入片段”或“基因渗入区段”或“基因渗入区”指已通过杂交或传统育种技术如回交引入相同或相关物种的另一植物的染色体片段(或染色体部分或区域),即基因渗入片段是由动词“基因渗入”(如回交)所指的育种方法的结果。应理解,术语“基因渗入片段”从来不包括整条染色体,而只包括染色体的一部分。基因渗入片段可以很大,例如甚至是染色体的四分之三或一半,但优选较小,例如约15Mb或更小,例如约10Mb或更小,约9Mb或更小,约8Mb或更小,约7Mb或更小,约6Mb或更小,约5Mb或更小,约4Mb或更小,约3Mb或更小,约2.5Mb或2Mb或更小,约1Mb(等于1,000,000个碱基对)或更小,或约0.5Mb(等于500,000个碱基对)或更小,例如约200,000bp(等于200千碱基对)或更小,约100,000bp(100kb)或更小,约50,000bp(50kb)或更小,约25,000bp(25kb)或更小。
术语“等基因植物”是指除了本发明的突变等位基因之外在遗传上相同的两种植物。为了研究种子败育型果实形成性状的影响,可以将目的植物系(或品种)与包含引起种子败育型果实形成性状的突变等位基因的植物杂交,并选择表达所需性状的子代。任选地,可能必须自交子代一次或多次,以能够确定植物表型中种子败育性状的遗传决定子。然后可以将所述子代与目的植物系(或品种)回交(至少2次,例如3、4或优选5或6次),同时选择与目的植物系(或品种)具有相同表型并表达种子败育性状的遗传决定子的子代。然后,可以在目的植物系(品种)与其不包含种子败育型果实形成性状的遗传决定子的等基因系之间进行比较引起种子败育型果实形成性状的突变等位基因的影响。
术语“核酸序列”或“核酸分子”或多核苷酸可互换使用,是指单链或双链形式的DNA或RNA分子,特别是编码根据本发明的蛋白或蛋白片段的DNA。“分离的核酸序列”是指不再处于分离它的天然环境中的核酸序列,例如细菌宿主细胞或植物细胞核或质体基因组中的核酸序列。
术语“蛋白”、“肽序列”、“氨基酸序列”或“多肽”可互换使用,是指由氨基酸链组成的分子,而不涉及特定的作用模式、大小、三维结构或起源。因此,蛋白的“片段”或“部分”仍然可以称为“蛋白”。“分离的蛋白”用于指不再处于其天然环境中的蛋白,例如在体外或在重组细菌或植物宿主细胞中。
“活性蛋白”或“功能性蛋白”是指这样的蛋白,其蛋白活性是可体外测量的,例如通过体外活性测定,和/或可体内测量,例如由蛋白赋予的表型测量。“野生型”蛋白是一种全功能蛋白,存在于野生型植物中。“突变蛋白”在本文中是在编码该蛋白的核酸序列中包含一个或多个突变的蛋白,由该突变导致(突变核酸分子编码的)蛋白具有改变的活性。
如本文所述的蛋白的“功能性衍生物”是蛋白的片段、变体、类似物或化学衍生物,其保留与突变蛋白特异性抗体的至少一部分活性或免疫交叉反应性。
突变蛋白的片段是指分子的任何子集。
变体肽可以通过直接化学合成,例如使用本领域众所周知的方法来制备。
突变蛋白的类似物是指与整个蛋白或其片段基本相似的非天然蛋白。
核酸分子中的“突变”是与野生型序列相比一个或多个核苷酸的变化,例如通过替换、缺失或插入一个或多个核苷酸。
构成蛋白的氨基酸分子中的“突变”是与野生型序列相比一个或多个氨基酸的变化,例如通过替换、缺失或插入一个或多个氨基酸。于是,这种蛋白也称为“突变蛋白”。
“点突变”是指单个核苷酸的替换,或单个核苷酸的插入或缺失。
“无义突变”是编码蛋白的核酸序列中的(点)突变,由此核酸分子中的密码子被改变为终止密码子。这导致mRNA中存在提前终止密码子,并导致截短蛋白的翻译。截短蛋白可能功能下降或功能丧失。
“错义或非同义突变”是编码蛋白的核酸序列中的(点)突变,由此密码子被改变以编码不同的氨基酸。产生的蛋白可能功能下降或功能丧失。
“剪接位点突变”是编码蛋白的核酸序列中的突变,由此前mRNA的RNA剪接被改变,导致具有与野生型不同的核苷酸序列的mRNA和具有与野生型不同的氨基酸序列的蛋白。产生的蛋白可能功能下降或功能丧失。
“移码突变”是这样一种编码蛋白的核酸序列中的突变,通过该突变改变mRNA的阅读框,产生不同的氨基酸序列。产生的蛋白可能功能下降或功能丧失。
本发明上下文中的“缺失”是指在给定核酸序列的任何地方,与相应野生型序列的核酸序列相比,至少一个核苷酸缺失,或者在给定氨基酸序列的任何地方,与相应(野生型)序列的氨基酸序列相比,至少一个氨基酸缺失。
“截短”应理解为意指与相应野生型序列的核酸序列相比,核苷酸序列的3’端或5’端的至少一个核苷酸缺失,或与相应野生型蛋白的氨基酸序列相比,蛋白的N-端或C-端的至少一个氨基酸缺失,由此在3’-端或C-端截短中,至少5’-端的第一个核苷酸或N-端的第一个氨基酸分别仍然存在,并且在5’-端或N-端截短中,至少3’-端的最后一个核苷酸或C-端的最后一个氨基酸分别仍然存在。5’-端由相应野生型核酸序列翻译中用作起始密码子的ATG密码子决定。
“替换”应意指核酸序列中的至少一个核苷酸或蛋白序列中的至少一个氨基酸分别与相应的野生型核酸序列或相应的野生型氨基酸序列相比,由于相应蛋白的编码序列中的核苷酸的交换而不同。
“插入”应意指分别与相应的野生型核酸序列或相应的野生型氨基酸序列相比,核酸序列或蛋白的氨基酸序列包含至少一个额外的核苷酸或氨基酸。
本发明上下文中的“提前终止密码子”意指终止密码子存在于编码序列(cds)中,与相应野生型编码序列的终止密码子相比,其更接近5’端的起始密码子。
“调节序列中的突变”,例如在基因的启动子或增强子中,是与野生型序列相比一个或多个核苷酸的变化,例如通过替换、缺失或插入一个或多个核苷酸,从而导致例如所制备基因的mRNA转录物减少或没有。
如本文所用,术语“可操作地连接”是指多核苷酸元件以功能关系连接。当核酸与另一个核酸序列处于功能关系时,它是“可操作地连接的”。例如,如果启动子或更确切地说转录调节序列影响编码序列的转录,则它与编码序列可操作地连接。可操作地连接意指被连接的核酸序列通常是邻接的。
“序列同一性”和“序列相似性”可以通过使用全局或局部比对算法对两个肽或两个核苷酸序列进行比对来确定。当序列通过例如程序GAP或BESTFIT或Emboss程序“Needle”(使用默认参数,见下文)进行最佳比对,共有至少某个最小百分比的序列同一性(如下文进一步定义)时,它们可称为“基本相同”。这些程序使用Needleman和Wunsch全局比对算法在整个长度上比对两个序列,从而使匹配数量最大化并使空隙数量最小化。通常,使用默认参数,其中空隙产生罚分=10,空隙延伸罚分=0.5(对于核苷酸和蛋白比对均如此)。对于核苷酸,使用的默认打分矩阵是DNAFULL,对于蛋白,默认打分矩阵是Blosum62(Henikoff&Henikoff,1992,PNAS 89,10915-10919)。序列同一性百分比的序列比对和得分可以例如使用计算机程序来确定,例如EMBOSS,(可在互联网上通过ebi.ac.uk在http://www.ebi.ac.uk under/Tools/psa/emboss_needle/找到)。或者,可通过检索数据库(如FASTA、BLAST等)来确定序列相似性或同一性,但是应该检索命中(hit)并成对比对以比较序列同一性。如果序列同一性百分比为至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%(通过Emboss“needle”使用默认参数确定,即空隙产生罚分=10,空隙延伸罚分=0.5,对于核酸使用打分矩阵DNAFULL,对于蛋白使用Blosum62),则两个蛋白或两个蛋白结构域或两个核酸序列具有“基本序列同一性”。这种序列在本文中也称为“变体”,例如除了本文所公开的特定核酸和氨基酸序列之外,还可以鉴别出引起种子败育型果实形成性状的等位基因的其他变体和蛋白,它们对种子败育型果实形成的作用与本发明的植物相同。
本文所用的术语“杂交”通常用于表示核酸在适当的严格条件(严格的杂交条件)下的杂交,这对于本领域技术人员来说是显而易见的,取决于探针序列和靶序列的性质。杂交和洗涤条件是本领域众所周知的,并且通过改变孵育时间、温度和/或溶液的离子强度根据所需的严格性调节条件是容易实现的。例如,参见Sambrook,J.et al.,MolecularCloning:A Laboratory Manual,2nd edition,Cold Spring Harbor Press,Cold SpringHarbor,New York,1989。条件的选择取决于被杂交序列的长度,特别是探针序列的长度、核酸的相对G-C含量和允许的错配量。当需要互补程度较低的链之间的部分杂交时,优选低严格条件。当需要完美或接近完美的互补性时,优选高严格条件。对于典型的高严格条件,杂交溶液含有6X S.S.C.、0.01M EDTA、1X Denhardt溶液和0.5%SOS。对于克隆的DNA片段,杂交在约68℃下进行约3至4小时,对于总真核DNA进行约12至约16小时。对于较低的严格性,杂交温度降低到双链体解链温度(TM)以下约42℃。已知TM是G-C含量和双链体长度以及溶液离子强度的函数。
如本文所用,短语“杂交”到DNA或RNA分子意指使例如寡核苷酸、多核苷酸或任何核苷酸序列杂交(以有义或反义方向)的分子识别并杂交到另一个核酸分子中的序列,所述另一个核酸分子具有近似相同的大小并具有足够的序列相似性以在适当的条件下实现杂交。例如,来自基因的3’编码区或非编码区的100个核苷酸长的分子将识别并杂交到该基因或任何其他植物基因的3’编码区或非编码区内的核苷酸序列的约100个核苷酸部分,只要这两个序列之间具有约70%或更多的序列相似性。应当理解,相应部分的大小将允许杂交中的一些错配,使得相应部分可以小于或大于与其杂交的分子,例如大或小20-30%,优选大或小不超过约12-15%。
如本文所用,短语“包含至少70%序列同一性的序列”或“包含至少70%氨基酸序列同一性的序列”或“包含至少70%核苷酸序列同一性的序列”意指与所示参考序列相比具有至少70%,例如至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%的序列同一性。序列同一性可根据本文所述方法确定。
根据以上提供的定义,遗传决定子的直系同源物或直系同源序列——其在本发明的上下文中是野生型SSPER-1基因的突变等位基因,是指与辣椒不同的茄科物种中的赋予种子败育型果实形成的等位基因,例如茄科另一物种中辣椒SSPER-1基因的直系同源物的突变等位基因,该突变等位基因在该物种中处于纯合形式(即本发明的突变等位基因的直系同源物)时引起种子败育型果实形成,并且其中由所述基因编码的直系同源基因组序列包含与SEQ ID NO:4所述的核酸的基本序列同一性,即至少65%(例如至少65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%)序列同一性或更多和/或由所述基因编码的直系同源氨基酸序列包含与SEQ ID NO:3的氨基酸序列的基本序列同一性,即至少65%(例如至少65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%)序列同一性或更多。
基因或DNA序列的“片段”是指分子的任何子集,例如较短的多核苷酸或寡核苷酸。在一方面,片段包含本发明定义的突变。
基因或DNA的“变体”是指与整个基因或其片段基本相似的分子,例如具有一个或多个取代核苷酸的核苷酸取代变体,但其保持与特定基因杂交或编码与天然DNA杂交的mRNA转录物的能力。优选地,变体包含本发明定义的突变等位基因。
如本文所用,术语“植物”包括整株植物或其任何部分或其衍生物,例如植物器官(例如收获或未收获的花、叶等)、植物细胞、植物原生质体、可再生出整株植物的植物细胞或组织培养物、可再生或不可再生的植物细胞、植物愈伤组织、植物细胞团(clump)以及在植物或植物部分(例如胚、花粉、胚珠、子房(例如收获的组织或器官)、花、叶、种子、块茎、克隆繁殖的植物、根、茎、子叶、下胚轴、根尖等)中完整的植物细胞。也包括任何发育阶段,如幼苗、不成熟的和成熟的等。优选地,植物部分或衍生物包含本发明定义的基因或基因座。
“植物系”或“育种系”是指植物及其子代。
“植物品种”是已知最低等级的同一植物分类群内的一组植物,其(无论认可植物育种者权利的条件是否满足)可以基于由某一基因型或基因型组合产生的特征的表达来定义,可以通过表达那些特征中的至少一个来区别于任何其他植物群组,并且可以被视为实体,因为它可以在没有任何变化的情况下繁殖。因此,术语“植物品种”不能用于表示这样的一组植物,即使它们是同一种类的,即,如果它们都以存在1个基因座或基因(或由于该单个基因座或基因的一系列表型特征)为特征,但就其他基因座或基因而言彼此极为不同。“F1、F2等”指两个亲本植物或亲本系间杂交后的连续相关世代。由两个植物或系杂交产生的种子生长出的植株称为F1代。F1植物的自交产生F2代等。“F1杂种”植物(或F1种子,或杂种)是通过杂交两个近交亲本系获得的一代。因此,“自交”是指植物的自花授粉,即来自同一植物的配子的结合。
“回交”是指这样一种育种方法,通过该方法可以将(单个)性状,例如种子败育型果实形成的能力,从一个遗传背景(也称为“供体”,通常但不一定,这是较差的遗传背景)转移到另一个遗传背景(也称为“轮回亲本”;通常但不一定,这是优越的遗传背景)。杂交后代(例如通过将包含本发明突变等位基因的某一植物物种的第一植物与相同植物物种的或可与所述第一植物物种杂交的不同植物物种的第二植物杂交获得的F1植物,其中所述第二植物物种不包含本发明的突变等位基因;或通过自交F1获得的F2植物或F3植物等)与所述第二植物物种的亲本植物“回交”。重复回交后,供体遗传背景的性状例如赋予种子败育型果实形成性状的突变等位基因将被整合到轮回遗传背景中。上下文中的术语“基因转化的”或“转化植物”或“单基因座转化”是指通过回交发育的植物,其中除了从供体亲本转移的一个或多个基因之外,还恢复了轮回亲本的基本所有所需的形态学和/或生理学特征。由F1植物与第二亲本植物系回交产生的种子生长出的植物称为“BC1代”。来自BC1群体的植物可以自交产生BC1F2代,或者与栽培的亲本植物系再次回交以提供BC2代。“M1群体”是某一植物系的多个诱变种子/植物。“M2、M3、M4等”是指第一个诱变种子/植物(M1)自交后获得的连续世代。
“茄子科植物”或“茄科植物”是植物学茄科的植物,即茄科的任何植物,包括野生茄子科植物和栽培茄子科植物。植物学茄科由大约98个属组成,其中茄属和辣椒属在商业上最相关,因为它们包括许多被广泛种植并用作具有高经济重要性的粮食作物的驯化物种。
辣椒属由20至27个物种组成,其中5种是驯化的:辣椒、风铃辣椒、中华辣椒、观赏辣椒(C.frutescens)和绒毛辣椒(C.pubescens)。已使用生物地理学、形态学、化学系统学、杂交和遗传数据研究了物种之间的系统发育关系。辣椒的果实,通常被命名为“辣椒”或“辣椒果实”,在物种之间和物种之内在颜色、形状和大小上可能有巨大的差异。化学系统学研究有助于区分品种和物种之间的差异。
辣椒(Capsicum annuum L.)植物是在本发明上下文中特别相关的茄科草本植物。辣椒植物达到约0.5-1.5米(约20-60英寸)。单朵白花结辣椒果实,其未成熟时为绿色,大体转变为红色,尽管有些品种可能成熟为棕色或紫色。虽然该物种可以耐受大多数气候,但它们在温暖和干燥的气候中尤其高产。辣椒种的栽培植物包括不同类型的辣椒,如甜椒、番椒、红辣椒和墨西哥胡椒。“辣椒3号染色体”是指本领域已知的辣椒3号染色体(参见辣椒cvCM334基因组染色体(版本1.55)和辣椒UCD10X基因组染色体(v1.0)和辣椒zunla基因组染色体(v2.0)“直系同源3号染色体”是指辣椒近缘种的对应染色体。
茄属由约1330个物种组成,包括非常重要的粮食作物番茄(S.lycopersicum,tomato)、茄子(S.melongena,eggplant)和马铃薯(S.tuberosum,potato)。
番茄植物或“番茄植物”是在本发明上下文中特别相关的茄科的其他草本植物。番茄植物在其原生栖息地是多年生植物,但作为一年生植物进行了栽培。栽培番茄植物通常长到1-3米(3-10英尺)高。番茄果实在植物学上是浆果类水果,它们被认为是烹饪蔬菜。果实大小因品种而异,宽度范围约为1-10cm(约0.5-4英寸)。番茄又被称为Lycopersiconlycopersicum(L.)H.Karst.或Lycopersicon esculentum Mill。术语“栽培番茄植物”或“栽培番茄”是指由人类栽培并具有良好的农艺特性的番茄植物,例如番茄物种的品种、育种系或栽培品种。“番茄的野生近缘种”包括S.arcanum、克梅留斯基番茄(S.chmielewskii)、小花番(S.neorickii)(=L.parviflorum)、契斯曼尼番茄(S.cheesmaniae)、多腺番茄(S.galapagense)、醋栗番茄(S.pimpinellifolium)、智利番茄(S.chilense)、S.corneliomulleri、多毛番茄(S.habrochaites(=L.hirsutum))、S.huaylasense、拟刺茄(S.sisymbriifolium)、秘鲁番茄(S.peruvianum)、S.hirsutum或潘那利番茄。番茄和番茄的野生近缘种是二倍体,有12对同源染色体,编号为1到12。
茄子植物或“茄子”或“茄子植物”是在本发明上下文中特别相关的茄科的其他草本植物。蛋形、有光泽、深紫色至白色的果实有白色果肉,质地多肉。茄子植物长到约40-150cm(约1.3-5英尺)高,有大约10-20cm(约3-8英寸)长和约5-10cm(约2-4英寸)宽的大的粗裂叶。
术语“栽培植物”或“栽培品种”是指给定物种的植物,例如由人类栽培并具有良好农艺特性的所述物种的品种、育种系或栽培品种。所谓原生种(heirloom)品种或栽培品种,即通常在人类历史的较早时期生长并经常适应特定地理区域的自由授粉品种或栽培品种,在本发明的一个方面作为栽培植物涵盖在本文中。术语“栽培植物”不涵盖野生植物。“野生植物”包括例如野生种质(accession)。
术语“食物”是为身体提供营养支持而被消耗的任何物质。它通常来源于植物或动物,并含有必需的营养物,如碳水化合物、脂肪、蛋白、维生素或矿物质。该物质被生物体摄取,并被生物体的细胞同化,以产生能量、维持生命或刺激生长。术语食物包括为人体和动物体提供营养支持而被消耗的物质。
“营养繁殖”或“克隆繁殖”是指从营养组织繁殖植物,例如由插条繁殖植物或通过体外繁殖。体外繁殖包括体外细胞或组织培养和从体外培养再生整株植物。因此可以通过体外培养产生原始植物的克隆(即遗传上相同的营养繁殖体)。“细胞培养”或“组织培养”指植物细胞或组织的体外培养。“再生”是指植物由细胞培养或组织培养或营养繁殖发育。“非繁殖细胞”指不能再生为整株植物的细胞。
“平均值”在本文中指算术平均值。
应当理解,不同植物系之间的比较包括在与一个或多个对照植物系的植物(优选野生型植物)相同的条件下生长一个系(或品种)的许多植物(例如至少5种植物,优选每系至少10种植物),并测定在相同环境条件下生长的植物系之间的统计学显著差异。优选地,植物是同一系或同一品种。
术语“种子败育”或“种子败育型果实形成”在本领域中通常理解为,并且也结合本发明理解为,意指诱导坐果和发育需要授粉但果实不产生成熟或有活力的种子。由于种子发育停滞或胚珠和/或胚和/或胚乳退化,或胚珠和/或胚和/或胚乳在达到成熟之前败育,在种子败育植物中不能发育成熟或有活力的种子。术语“单性结实”或“单性结实果实形成”在本领域中通常理解为,并且也结合本发明理解为,描述没有雌性胚珠受精的果实发育。产生果实不需要授粉过程,因为缺乏授粉,这些果实是无籽的。本文所用的术语“能够发生种子败育型果实形成的植物”或“具有种子败育性状的植物”相应地描述了一种发育果实的植物,其中诱导坐果和发育需要授粉,但果实不产生成熟或有活力的种子。本领域、特别是育种中通常使用的“无籽果实”,尽管与“果实”的植物学含义有些矛盾,但在本发明的上下文中应理解为基本上没有成熟或有活力的种子的果实。成熟或有活力的种子可以在适合于相应植物的条件下在土壤中发芽并生长成植物。这个测试可以用来确定植物是否产生无籽果实。无籽果实将基本上不产生将在适合于相应植物的条件下发芽并生长成植物的种子。在本发明的上下文中,术语“无籽果实”或“基本上不含种子的果实”优选理解为描述包含平均不超过正常果实的有活力种子的5%的果实,例如不超过正常果实的有活力种子的4%、3%、2.5%、2%、1.5%、1%或0.5%。
在本文及其权利要求中,动词“包括”及其变化形式以其非限制性的意义使用,以表示包括该词之后的对象,但不排除没有具体提及的对象。此外,通过不定冠词“一个/种(a)”或“一个/种(an)”提及要素并不排除存在多于一个要素的可能性,除非上下文明确要求存在一个并且只有一个要素。因此,不定冠词“一个/种(a)”或“一个/种(an)”通常表示“至少一个/种”。还应理解,当在本文中提及“序列”时,通常是指具有一定亚基序列(例如氨基酸或核酸)的实体分子。
本发明的植物和方法
本发明提供了一种在基因组中包含野生型SSPER-1基因的突变等位基因的至少一个拷贝的茄科植物,其中所述突变等位基因当以纯合形式存在时,引起种子败育型的果实形成,其中野生型SSPER-1基因编码包含与SEQ ID NO:1的至少70%序列同一性的蛋白。
本发明人惊奇地发现,茄科植物中野生型SSPER-1蛋白的正常蛋白功能对于授粉后成熟和/或有活力的种子的发育是必需的。还出人意料地发现,野生型SSPER-1基因的突变等位基因以纯合形式存在时,引起种子败育型果实形成。根据本发明的突变等位基因优选代表本文指定为SSPER-1(其代表种子败育辣椒1)的野生型基因的变体。还出人意料地发现,可以由根据本发明的植物产生的无籽果实具有正常的形状和大小。特别地,就果实数量、果实大小和果皮厚度而言,在产生无籽果实的本发明植物中没有观察到负面作用。这提供了对现有技术的显著改进。例如,目前可获得的无籽辣椒——其全部基于单性结实——的特征在于当与它们的等基因非单性结实对应物相比和/或当在兼性单性结实性状的情况下与正常受精的非无籽对应物相比时,果实大小和/或果实形状改变。
因此,本发明提供了一种在基因组中包含野生型SSPER-1基因的突变等位基因的至少一个拷贝的茄科植物,其中所述突变等位基因当以纯合形式存在时,引起种子败育型果实形成。野生型SSPER-1基因编码包含与SEQ ID NO:1的至少70%氨基酸序列同一性的蛋白,例如与SEQ ID NO:1的71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%、或99.3%或更优选99.7%序列同一性(使用本文别处公开的方法测定)。
在一个实施方案中,野生型SSPER-1基因的突变等位基因导致SSPER-1基因编码的蛋白的正常(野生型)蛋白功能被破坏。因此,本文所述的突变等位基因可能导致野生型SSPER-1基因表达降低或不表达。本文所述的突变等位基因也可编码与野生型蛋白相比功能降低或功能丧失的蛋白。因此,以纯合形式存在时引起种子败育型果实形成的突变等位基因可能与其他功能性SSPER-1基因产物的表达降低或甚至表达丧失有关。在一个非限制性实例中,这种表达降低或表达丧失可为SSPER-1基因的调节区中的一个或多个突变的结果,例如在SSPER-1基因的启动子序列中。在另一个非限制性实例中,这种表达降低或表达丧失可为SSPER-1基因产物(例如野生型SSPER-1蛋白的功能性变体)正常(野生型)表达所需的转录因子中的一个或多个突变的结果。在另一个非限制性实例中,这种表达降低或表达丧失可为转录后基因沉默或RNAi的结果。测定给定基因的表达水平的手段和方法是本领域众所周知的,包括但不限于用于检测和定量特定mRNA的定量逆转录聚合酶链式反应(定量RT-PCR)和用于检测和定量特定蛋白的酶联免疫吸附测定(ELISA)。以纯合形式存在时引起种子败育型果实形成的突变等位基因可能与与野生型蛋白(例如野生型SSPER-1蛋白的非功能性变体)相比功能降低或功能丧失的蛋白的表达有关。在一个非限制性实例中,这种功能降低或功能丧失可为SSPER-1基因编码区突变的结果,导致例如与野生型蛋白相比一个或多个氨基酸被替换(例如通过移码突变或由于错义突变)、插入或缺失。测定蛋白功能的手段和方法是本领域众所周知的,包括但不限于正常蛋白功能的表型测试试验(例如检测果实中成熟和/或有活力的种子的正常形成)、能够量化酶活性的生物测定和影响蛋白功能的氨基酸变化的计算机模拟预测,如上文进一步所述。
因此,在本发明的一个实施方案中,涉及包含SSPER-1蛋白编码基因的突变等位基因的茄科尤其是辣椒属或茄属物种的植物细胞或植物,其特征在于突变ssper-1等位基因包含或引起一种或多种选自以下的突变:
(a)基因组序列中的缺失、截短、插入、点突变、无义突变、错义或非同义突变、剪接位点突变、移码突变;
(b)一个或多个调节序列中的突变;
(c)编码序列中的缺失、截短、插入、点突变、无义突变、错义或非同义突变、剪接位点突变、移码突变;
(d)前mRNA或mRNA中的缺失、截短、插入、点突变、无义突变、错义或非同义突变、剪接位点突变、移码突变;和/或
(e)SSPER-1蛋白中一个或多个氨基酸的缺失、截短、插入或替换。
与相应物种中的野生型SSPER-1蛋白相比,上述突变等位基因导致突变SSPER-1蛋白的活性降低。活性降低是由于SSPER-1基因表达的敲除、该基因表达的敲低、编码的突变SSPER-1蛋白的功能丧失或突变SSPER-1蛋白的功能降低。
在一个实施方案中,本发明提供了包含野生型SSPER-1基因的突变等位基因的植物,其中本文所述的突变等位基因编码与野生型蛋白相比被截短的蛋白。在一个实施方案中,截短的ssper-1蛋白最多包含SEQ ID NO:1的氨基酸残基1-500或其片段,这在本发明的上下文中意指截短的蛋白最多包含SEQ ID NO:1的氨基酸残基1-500(即从SEQ ID NO:1的氨基酸1开始并包括氨基酸1,到最多氨基酸500终止并包括氨基酸500的氨基酸残基)或SEQID NO:1的所述氨基酸残基1-500之间的任何片段。例如,本发明的截短蛋白最多包含SEQID NO:1的氨基酸残基1-400或其片段,最多包含SEQ ID NO:1的氨基酸残基1-300或其片段,或最多包含SEQ ID NO:1的氨基酸残基1-200或其片段。在一个实施方案中,本发明的截短的ssper-1蛋白包含同源框结构域。在另一个实施方案中,本发明的截短的ssper-1蛋白包含SEQ ID NO:1的氨基酸残基118-175(即从SEQ ID NO:1的氨基酸118开始并包括氨基酸118,到氨基酸171终止并包括氨基酸171的氨基酸残基)。在一个实施方案中,物种辣椒中的突变ssper-1等位基因是SEQ ID NO:4所示的突变ssper-1cDNA(mRNA)序列。在一个实施方案中,物种辣椒中的突变ssper-1等位基因编码SEQ ID NO:3所示的突变ssper-1蛋白。
本发明的植物是茄科植物。在一个实施方案中,本发明提供了一种辣椒属植物,其在基因组中包含野生型SSPER-1基因的突变等位基因的至少一个拷贝,其中所述突变等位基因当以纯合形式存在时,引起种子败育型果实形成,其中野生型SSPER-1基因编码包含与SEQ ID NO:1的至少70%氨基酸序列同一性的蛋白。在所述辣椒属植物中,野生型SSPER-1基因编码包含与SEQ ID NO:1的至少70%氨基酸序列同一性的蛋白,例如与SEQ ID NO:1的71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%的序列同一性(使用本文别处公开的方法测定)。在一个实施方案中,本发明提供了一种植物,其为辣椒植物、中华辣椒植物、风铃辣椒植物、茄子植物、潘那利番茄植物或番茄植物。在所述辣椒植物中,野生型SSPER-1基因编码包含与SEQ ID NO:1的至少70%氨基酸序列同一性的蛋白,例如与SEQ ID NO:1的71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%的序列同一性。在所述中华辣椒植物中,野生型SSPER-1基因编码包含与SEQ ID NO:5的至少70%氨基酸序列同一性的蛋白,例如与SEQ ID NO:5的71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%的序列同一性。在所述风铃辣椒植物中,野生型SSPER-1基因编码包含与SEQ ID NO:7的至少70%氨基酸序列同一性的蛋白,例如与SEQ ID NO:7的71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%的序列同一性。在所述茄子植物中,野生型SSPER-1基因编码包含与SEQ ID NO:9的至少70%氨基酸序列同一性的蛋白,例如与SEQ ID NO:9的71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%的序列同一性。在所述番茄植物中,野生型SSPER-1基因编码包含与SEQ ID NO:13的至少70%氨基酸序列同一性的蛋白,例如与SEQ ID NO:13的71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%的序列同一性。
根据本发明的植物包含本文提供的突变等位基因的至少一个拷贝。因此,这种植物对于本发明的突变等位基因而言可为杂合的。这种杂合植物包含野生型等位基因的(至少)一个拷贝和本发明突变等位基因的(至少)一个拷贝。这种杂合植物可以表现出这样的表型,其中产生的果实部分包含成熟的和/或有活力的种子(即与纯合野生型植物的可比果实相比,成熟和/或有活力的种子的数量减少)。因此,本发明还涉及包含杂合形式的本发明的突变ssper-1等位基因的植物。这种杂合植物也可有利地用于育种以产生对于突变ssper-1等位基因是纯合的后代,如下文进一步所述。在一个实施方案中,本发明提供了对于本发明的突变等位基因是纯合的植物。这种植物的特征尤其在于其能够发生种子败育型果实形成,如下文进一步所述。
本发明的植物可以是本文所述的茄科的任何植物,其在基因组中包含野生型SSPER-1基因的突变等位基因的至少一个拷贝。在一个实施方案中,本发明提供本文所述的植物,其进一步是近交植物、二单倍体植物或杂种植物。因此,在一个方面,本发明提供本发明的植物是近交植物。例如,通过重复自交杂交步骤,这种近交植物是高度纯合的。这种近交植物作为亲本植物对于产生F1杂种种子可能非常有用。在一个方面,本公开内容提供了本文涵盖的本发明植物的单倍体植物和/或二单倍体(双单倍体)植物,其包含本文所述的突变ssper-1等位基因。单倍体和二单倍体植物可以例如通过花药或小孢子培养并再生为整株植物来产生。对于二单倍体生产,可以使用已知的方法例如秋水仙碱处理等诱导染色体加倍。因此,在一个方面,提供了茄子科植物,其包含如所述的种子败育型果实形成表型,其中所述植物是双单倍体植物。本发明还提供了杂种植物,其可具有例如提高的均匀性、活力和/或耐病性的优点。
本发明提供的植物可用于生产果实。因此,本发明提供了本文提供的茄科植物作为食用作物的用途。特别地,由本发明的植物产生的果实可以有利地用作食用作物,因为这些果实包含显著更少的或甚至基本上不包含有活力的和/或成熟的种子。
本发明提供的植物可用于生产繁殖材料。这种繁殖材料包括适合于有性繁殖和/或由有性繁殖产生的繁殖材料,如花粉和种子。这种繁殖材料包括适合于无性繁殖或营养繁殖和/或由无性繁殖或营养繁殖产生的繁殖材料,包括但不限于插条、移植物、块茎、细胞培养物和组织培养物。因此,本发明还提供了本文提供的茄科植物作为繁殖材料来源的用途。
种子
本发明提供了可生长出根据本发明的任何植物的种子。此外,本发明提供了多个这样的种子。由于存在本文所述的野生型SSPER-1基因的突变等位基因,本发明的种子可以与其它种子区分开来,在表型上(基于具有种子败育型果实形成表型的植物)和/或使用分子方法检测细胞或组织中的突变等位基因,例如使用分子基因分型方法检测本发明的突变等位基因或测序。种子包括例如在本发明的植物上产生的种子,其在自花授粉后对于突变等位基因是杂合的,并任选地选择包含突变等位基因的一个或两个拷贝的那些种子(例如通过非破坏性种子取样方法和分析ssper-1等位基因的存在),或异花授粉后产生的种子,例如用来自另一种茄子科植物的花粉对本发明的植物授粉或用本发明的植物的花粉对另一种茄子科植物授粉。
特别地,本发明提供了由根据本发明的植物产生的花粉或种子,或可生长出本发明的植物的种子,其中所述植物是茄科植物,其在基因组中包含野生型SSPER-1基因的突变等位基因的至少一个拷贝,其中所述突变等位基因当以纯合形式存在时引起种子败育型果实形成,其中野生型SSPER-1基因编码包含与SEQ ID NO:1的至少70%序列同一性的蛋白,例如与SEQ ID NO:1的71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%的序列同一性。
特别地,本发明提供了由根据本发明的植物产生的花粉或种子,或可生长出本发明的植物的种子,其中所述花粉或种子包含如本文所定义的野生型SSPER-1基因的突变等位基因,所述突变等位基因当以纯合形式存在时,能够引起种子败育型果实形成。特别地,本发明提供了可生长出本发明植物的种子。
在一个方面,通过使对于突变ssper-1等位基因是杂合的第一茄科植物与对于野生型SSPER-1等位基因是纯合的第二茄科植物杂交来生产种子,由此从所述杂交收获的种子中约50%的种子对于突变ssper-1等位基因是纯合的,并且收获的种子中约50%的种子对于突变ssper-1等位基因是杂合的。在该方法中,任选地选择对于突变ssper-1等位基因是纯合的种子,使用例如非破坏性种子DNA取样,或选择对于突变SSPER-1等位基因是纯合的幼苗,使用例如子叶或叶样品的DNA分析。因此,在一个方面,本文提供了一种选择对于突变ssper-1等位基因是纯合的种子或幼苗的方法。该方法包括提供多个分离突变ssper-1等位基因的种子,以及a)使用非破坏性种子取样并分析种子中突变ssper-1等位基因的存在与否,以选择包含突变ssper-1等位基因的两个拷贝的那些种子,和/或b)使种子发芽并分析幼苗的子叶或叶样品中突变ssper-1等位基因的存在与否,并选择包含突变ssper-1等位基因的两个拷贝的那些幼苗。由所选种子或所选幼苗生长出的植物将产生无籽果实。因此,可将它们出售给客户。多个选择的种子或幼苗——均为对于突变ssper-1等位基因是纯合的——是本发明的一个实施方案。
本发明还提供了由本文所述的生产植物的方法获得的种子。
在一个方面,将多个种子包装到容器(例如袋子、纸箱、罐等)。容器可以是任何大小。种子可以在包装前造粒(形成小丸(pill)或丸粒)和/或用各种化合物处理,包括种子包衣。
植物部分和营养繁殖体
在另一方面,本文提供了从(可从)本发明的植物获得的植物部分,以及包含所述植物部分的容器或包装。
特别地,本发明提供了来自本发明植物的部分,其中所述部分在其基因组中包含本文所述的突变ssper-1等位基因的至少一个拷贝,优选其中所述部分选自果实、叶、花药、雌蕊、茎、叶柄、根、胚珠、花粉、原生质体、组织、种子、花、子叶、下胚轴、胚和细胞。因此,本发明提供了根据本发明的植物的部分,其中所述植物部分是叶、花药、雌蕊、茎、叶柄、根、胚珠、花粉、原生质体、组织、种子、花、子叶、下胚轴、胚或细胞,并且其中所述部分在其基因组中包含本文所述的突变ssper-1等位基因的至少一个拷贝。在基因组中包含突变ssper-1等位基因的至少一个拷贝的根据本发明的植物的部分对于本文所述的突变ssper-1等位基因优选是纯合的。本发明包括上述植物部分的各个发育阶段。
特别地,提供了由本发明的植物产生的果实。根据本发明的植物对于SSPER-1基因的突变等位基因可以是杂合的。由这种杂合植物产生的果实可能已经显示出一种表型,该表型可以与由SSPER-1基因的野生型等位基因是纯合的可比植物产生的果实区分开。例如,与纯合野生型植物的可比果实相比,杂合植物可产生包含数量降低的成熟和/或有活力的种子的果实。优选地,果实对于SSPER-1基因的突变等位基因是纯合的,并且是无籽的。因此,本发明在植物是包含纯合形式的本发明的突变ssper-1等位基因的辣椒植物、中华辣椒植物或风铃辣椒植物的情况下,特别提供了无籽辣椒果实,在植物是包含纯合形式的本发明的突变ssper-1等位基因的茄子植物的情况下,特别提供了无籽茄子果实,在植物是包含纯合形式的本发明的突变ssper-1等位基因的番茄植物的情况下,特别提供了无籽番茄果实。本发明还提供了一种(加工的)食品,其包含由本文所述的植物产生的果实。优选地,包含在所述(加工的)食品中的果实由对于SSPER-1基因的突变等位基因是纯合的植物产生,因此是无籽的。
优选地,与包含SSPER-1基因的野生型等位基因的两个拷贝的遗传相同的植物的果实相比,SSPER-1基因的突变等位基因是纯合的果实具有相同的形状和/或大小。在本发明的上下文中出人意料地发现,可以由根据本发明的植物产生的无籽果实具有正常的形状和大小。因此,本发明首次提供了由茄科植物产生的无籽果实,与遗传相同的野生型植物(即包含SSPER-1基因的野生型等位基因的两个拷贝的植物)的果实相比,其具有相同的形状和/或大小。
本发明还提供了根据本发明的植物的部分,其中所述植物部分可以是叶、花药、雌蕊、茎、叶柄、根、胚珠、花粉、原生质体、组织、种子、花、子叶、下胚轴、胚或细胞。
在另一方面,植物部分是植物细胞。在又一方面,植物部分是不可再生细胞或可再生细胞。在另一方面,植物细胞是体细胞。
不可再生细胞是不能通过体外培养再生为整株植物的细胞。不可再生细胞可以在本发明的植物或植物部分(例如叶)中。不可再生细胞可以是种子中的细胞,或所述种子的种皮中的细胞。成熟的植物器官,包括成熟的叶、成熟的茎或成熟的根,含有至少一个不可再生细胞。
在另一方面,植物细胞是生殖细胞,如胚珠或作为花粉一部分的细胞。在一个方面,花粉细胞是营养(非生殖)细胞,或精子细胞(Tiezzi,Electron Microsc.Review,1991)。这种生殖细胞是单倍体。当它再生为整株植物时,它包含起始植物的单倍体基因组。如果发生染色体加倍(例如通过化学处理),则可以再生双单倍体植株。在一个方面,包含突变ssper-1等位基因的本发明植物是单倍体或双单倍体茄子科植物。
此外,提供了本发明茄子科植物的体外细胞培养物或组织培养物,其中所述细胞培养物或组织培养物源自上述植物部分,例如但不限于叶、花粉、胚、子叶、下胚轴、愈伤组织、根、根尖、花药、花、种子或茎,或它们中任一种的一部分,或分生组织细胞、体细胞或生殖细胞。
本发明还提供了一种营养繁殖的植物,其中所述植物由根据本发明的植物部分繁殖。
此外,提供了在每个细胞中包含本发明的突变ssper-1等位基因的至少一个拷贝的分离的细胞、体外细胞培养物和组织培养物、原生质体培养物、植物部分、收获的材料(例如收获的辣椒果实)、花粉、子房、花、种子、雄蕊、花部分等。因此,当所述细胞或组织再生或生长成整株茄子科植物时,所述植物包含当以纯合形式存在时能够引起种子败育型果实形成的突变等位基因。
因此,还提供了本发明植物的细胞或组织的体外细胞培养物和/或组织培养物。细胞或组织培养物可以用生芽和/或生根培养基处理以再生茄子科植物。
本文还涵盖根据本发明的植物的营养繁殖或克隆繁殖。存在许多不同的营养繁殖技术。插条(节、茎尖、茎等)可以例如用于如上所述的体外培养。还存在其他的营养繁殖技术并可以使用,如嫁接或空中压条。在空中压条中,使一根茎在它仍然附着于亲本植物的同时发育根,并且一旦发育了足够的根,就将克隆植物与亲本分离。
因此,在一个方面,提供了一种方法,包括:
(a)获得本发明植物的一部分(例如细胞或组织,例如插条),
(b)营养繁殖所述植物部分以从所述植物部分产生相同的植物。
因此,将本发明植物的营养植物部分用于克隆/营养繁殖也是本发明的一个实施方案。在一个方面,提供了一种用于营养繁殖包含突变ssper-1等位基因的两个拷贝的本发明的茄子科植物(优选辣椒)的方法。还提供了包含突变的ssper-1等位基因的两个拷贝的营养生产的植物。
在另一方面,通过体细胞胚胎发生技术繁殖本发明的植物,所述植物包含根据本发明的突变ssper-1等位基因的两个拷贝。
还提供了从任何上述植物部分再生或从上述细胞或组织培养物再生的茄子科植物,所述再生植物在其基因组中包含野生型SSPER-1基因的突变等位基因的至少一个拷贝,其中所述突变等位基因当以纯合形式存在时,引起种子败育型果实形成,其中野生型SSPER-1基因编码包含与SEQ ID NO:1的至少70%氨基酸序列同一性的蛋白,例如与SEQ IDNO:1的71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%的序列同一性。这种植物也可以称为本发明植物的营养繁殖体。优选地,再生植物对于本发明的突变ssper-1等位基因是纯合的,因此能够发生种子败育型果实形成。
本发明还涉及包含本文所述植物部分或由本文所述植物部分组成的食品或饲料产品。食品或饲料产品可以是新鲜的或加工的,例如罐装、蒸、煮、油炸、烫和/或冷冻等。实例是三明治、沙拉、果汁、酱汁、水果泥、番茄酱或包含本发明植物的果实或果实的一部分的其他食品。
本发明还提供了编码SSPER-1蛋白的核酸用于鉴别能够发生种子败育型果实形成的茄科植物的用途,其中所述SSPER-1蛋白包含与SEQ ID NO:1的至少70%氨基酸序列同一性,例如与SEQ ID NO:1的71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%的序列同一性。本发明还提供了编码SSPER-1蛋白的核酸序列用于鉴别能够发生种子败育型果实形成的茄科植物的用途,其中所述SSPER-1蛋白包含与SEQ ID NO:1的至少70%氨基酸序列同一性,例如与SEQID NO:1的71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%的序列同一性。例如,编码本发明的SSPER-1蛋白的核酸序列可用于设计用于鉴别和/或选择能够发生种子败育型果实形成的茄科植物的遗传标记,其中所述SSPER-1蛋白包含与SEQ ID NO:1的至少70%氨基酸序列同一性,例如与SEQ ID NO:1的71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%的序列同一性。
本发明还提供了编码SSPER-1蛋白的核酸序列用于培育能够发生种子败育型果实形成的茄科植物的用途,其中所述SSPER-1蛋白包含与SEQ ID NO:1的至少70%氨基酸序列同一性,例如与SEQ ID NO:1的71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%的序列同一性。例如,编码本发明的SSPER-1蛋白的核酸序列可用于确定植物是否适合作为育种中的亲本植物,例如以产生可以生长出能够发生种子败育型果实形成的茄科植物的种子。
植物和子代
在另一个实施方案中,提供了本发明的茄子科植物的植物和部分,以及本发明的茄子科植物的子代,例如由种子生长、通过有性繁殖或营养繁殖产生、从上述植物部分再生或从细胞或组织培养物再生,其中再生的(种子繁殖的或营养繁殖的)植物包含本发明的突变ssper-1等位基因的至少一个拷贝。
本发明还提供了由本文所述的种子生长的茄科植物。因此,本发明提供了由本文所述的产生茄子科植物的方法获得的种子生长的茄子科植物。
此外,本发明提供了包含或保留种子败育型果实形成表型(由突变ssper-1等位基因赋予)的子代,例如通过例如将本发明的植物自交一次或多次和/或与相同植物物种(或可与本发明的茄子科植物杂交的植物物种)的不同品种或育种系的另一茄子科植物异花授粉而获得的子代,或与本发明的茄子科植物异花授粉一次或多次获得的子代。特别地,本发明提供了对于能够形成无籽果实的突变ssper-1等位基因是纯合的子代。在一个方面,本发明涉及包含突变ssper-1等位基因的子代植物,例如通过选自以下的一种或多种方法由包含突变ssper-1等位基因的茄子科植物产生的子代植物:自交、杂交、突变、双单倍体生产或转化。优选的突变是人诱导的突变或体细胞克隆突变。在一个实施方案中,也可以使本发明的植物或种子突变(通过例如辐射、化学诱变、热处理、TILLING等)和/或可以选择突变的种子或植物(例如体细胞克隆变体等),以便改变植物的一个或多个特性。类似地,可以转化和再生本发明的植物,由此将一个或多个嵌合基因导入植物。可以使用标准方法进行转化,例如根癌农杆菌(Agrobacterium tumefaciens)介导的转化或基因枪法,随后选择转化的细胞并再生为植物。通过用赋予所需性状的转基因转化本发明的植物或其子代,可以将所需性状(例如赋予抗虫性或抗病性、除草剂耐受性、杀真菌剂耐受性或杀昆虫剂耐受性等的基因)引入植物或其子代,其中转化的植物保留突变ssper-1等位基因,并且当突变ssper-1等位基因以纯合形式包含时,保留由其赋予的种子败育型果实形成表型并包含所需性状。
在另一个实施方案中,本发明涉及一种生产种子的方法,包括将本发明的植物与其自身或不同的植物杂交并收获所得种子。在另一个实施方案中,本发明涉及根据该方法产生的种子和/或通过生长这种种子产生的植物。因此,本发明的植物可在种子生产中用作父本和/或母本,由此由所述种子生长的植物包含本文提供的突变ssper-1等位基因。因此,本发明还提供了一种由本发明的种子生长的植物。
因此,在一个方面,提供了本发明的茄子科植物的子代,其中所述子代植物通过自交、杂交、突变、双单倍体生产或转化产生,并且优选其中所述子代保留突变ssper-1等位基因。
本发明还提供了一种生产种子败育果实的方法,所述方法包括使根据本发明的植物生长并收获由所述植物产生的果实。优选地,根据本发明的方法产生种子败育果实的植物对于本文所述的突变ssper-1等位基因是纯合的,因此是无籽的。
本发明还提供了一种鉴别和/或选择包含SSPER-1基因的突变等位基因的茄科植物或植物部分的方法,包括确定所述植物或植物部分是否包含SSPER-1基因的突变等位基因,其中所述突变等位基因导致SSPER-1基因的表达降低或不表达,或者其中所述突变等位基因编码与野生型蛋白相比功能降低或功能丧失的蛋白,以及任选地选择包含SSPER-1基因的突变等位基因的至少一个拷贝的植物或植物部分,其中所述突变等位基因当以纯合形式存在时,引起种子败育型果实形成,其中野生型SSPER-1基因编码包含与SEQ ID NO:1的至少70%氨基酸序列同一性的蛋白,例如与SEQ ID NO:1的71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%的序列同一性。
该方法包括使用已知方法在DNA、RNA(或cDNA)或蛋白水平进行筛选,以检测根据本发明的突变等位基因的存在。有许多方法可以检测基因的突变等位基因的存在。
例如,如果野生型和突变等位基因之间存在单核苷酸差异(单核苷酸多态性,SNP),则SNP基因分型测定可用于检测植物或植物部分或细胞在其基因组中是否包含野生型核苷酸或突变核苷酸。例如,使用KASP测定(参见万维网kpbioscience.co.uk)或其他SNP基因分型测定可以很容易地检测出SNP。为了开发KASP测定,可以选择例如SNP上游的70个碱基对和下游的70个碱基对,并且可以设计两个等位基因特异性正向引物和一个等位基因特异性反向引物。参见例如Allen et al.2011,Plant Biotechnology J.9,1086-1099,特别是p097-1098的KASP测定法。
同样可以使用其他基因分型测定。例如,同样可以使用TaqMan SNP基因分型测定、高分辨率熔解曲线(HRM)测定、SNP基因分型阵列(例如Fluidigm、Illumina等)或者DNA测序。
分子标记也可用于帮助鉴别含有突变ssper-1等位基因的植物(或植物部分或由其获得的核酸)。例如,可以开发一种或多种合适的分子标记,其与突变ssper-1等位基因在遗传上(以及优选在物理上)紧密连接。这可以通过将根据本发明的茄子科植物(优选能够发生种子败育型果实形成)与野生型植物杂交并从该杂交形成分离群体(例如F2或回交群体)来实现。然后可以对分离群体进行种子败育型果实形成的表型化,并使用例如分子标记如SNP(单核苷酸多态性)、AFLP(扩增片段长度多态性;参见例如EP 534 858)或其他进行基因分型,并且通过软件分析,可以鉴别与分离群体中的种子败育型果实形成性状共分离的分子标记,并且可以鉴别它们与SSPER-1基因(或基因座)的顺序和遗传距离(厘摩距离,cM)。与SSPER-1基因座紧密连锁的分子标记,例如位于5cM距离或更小的标记,然后可以用于检测和/或选择包含或保留包含突变ssper-1等位基因的基因渗入片段的植物(例如本发明的植物或本发明的植物的子代)或植物部分。这种紧密连锁的分子标记可以在育种程序中,即在标记辅助选择(MAS)中替代表型选择(或在表型选择之外额外再使用)。优选地,在MAS中使用连锁标记。更优选地,在MAS中使用侧翼标记,即突变ssper-1等位基因的基因座两侧各有一个标记。
优选地,在确定植物或植物部分是否包含SSPER-1基因的突变等位基因之前,对植物或植物部分进行突变诱导步骤。所述突变诱导步骤可以包括使所述植物或植物部分与诱变剂接触。所述突变诱导步骤还可涵盖靶向诱变技术,如CRISPR-Cas。优选地,与诱变剂接触的植物包含纯合形式的野生型SSPER-1等位基因。突变诱导步骤随后在野生型SSPER-1等位基因中引起突变,以提供能够引起种子败育型果实形成的突变ssper-1等位基因。也可以使用本领域已知的植物转化和再生技术,使用本发明的突变ssper-1核苷酸序列制备转基因植物。可以选择“良种株系(elite event)”,其是将嵌合基因(包含与编码功能丧失的ssper-1蛋白或功能降低的ssper-1蛋白的核苷酸序列可操作地连接的启动子)插入基因组中特定位置的转化株系,这导致所需表型的良好表达。也可以制备包含降低或消除内源(野生型)ssper-1基因表达的构建体如RNAi构建体的转基因植物。
因此,本发明提供了一种生产本发明的茄子科植物的方法,包括以下步骤:
(a)从茄科植物中获得植物材料;
(b)用诱变剂处理所述植物材料以产生诱变的植物材料;
(c)分析所述诱变的植物材料以鉴别在SSPER-1基因中具有至少一个突变的植物,其中野生型SSPER-1基因编码包含与SEQ ID NO:1的至少70%氨基酸序列同一性的蛋白,例如与SEQ ID NO:1的71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%的序列同一性。
TILLING(定向诱导基因组局部突变)是一种通用的反向遗传学技术,它使用传统的化学诱变方法来创建诱变个体库,然后对库进行高通量筛选以发现突变。TILLING将化学诱变与对混合的PCR产物的突变筛选相结合,从而分离出靶基因的错义和无义突变等位基因。因此,TILLING使用传统的化学诱变(例如EMS或MNU诱变或通过产生活性氧的诱变)或其他诱变方法(例如通过使用例如UV辐射或离子束辐射的辐射诱变),然后高通量筛选特定靶基因(例如根据本发明的SSPER-1基因)中的突变。S1核酸酶,例如CEL1或ENDO1,用于切割突变靶DNA和野生型靶DNA的异源双链体,并使用例如电泳,如LI-COR凝胶分析仪系统检测切割产物,参见,例如Henikoff et al.Plant Physiology 2004,135:630-636。TILLING已应用于许多植物物种,包括茄子科植物如番茄(参见http://tilling.ucdavis.edu/index.php/Tomato_Tilling)、稻(Till et al.2007,BMC Plant Biol 7:19)、拟南芥属(Arabidopsis)(Till et al.2006,Methods Mol Biol 323:127-35)、芸苔属(Brassica)、玉米(Till et al.2004,BMC Plant Biol 4:12)等。EcoTILLING也已被广泛使用,通过它检测天然群体中的突变体,参见Till et al.2006(Nat Protoc 1:2465-77)和Comai etal.2004(Plant J 37:778-86)。
在本发明的一个实施方案中,编码这种突变SSPER-1蛋白的(cDNA或基因组)核酸序列包含一个或多个无义和/或错义突变,例如转换(将嘌呤替换为另一种嘌呤或将嘧啶替换为另一种嘧啶/>)或颠换(用嘧啶替换嘌呤,反之亦然/>)。在一个实施方案中,无义和/或错义突变在编码任何SSPER-1外显子的核苷酸序列中,或在变体SSPER-1蛋白的基本相似的结构域中,即在包含与SEQ ID NO:1的至少70%氨基酸序列同一性的结构域中,例如与SEQ ID NO:1的71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%的序列同一性。
在一个实施方案中,提供了在外显子编码序列之一中包含一个或多个无义和/或错义突变的SSPER-1核苷酸序列,以及包含这种突变等位基因的植物,所述突变等位基因当以纯合形式存在时,导致能够发生种子败育型果实形成。
因此,在一个方面,植物或植物部分是从通过使植物或植物部分经受诱变剂而获得的TILLING群体中鉴别和/或选择的。因此,在一个方面,提供了一种生产方法,包括以下步骤:
(a)提供茄科植物物种的TILLING群体,
(b)筛选所述TILLING群体中SSPER-1基因的突变体,其中野生型SSPER-1基因编码包含与SEQ ID NO:1的至少70%氨基酸序列同一性的蛋白,例如与SEQ ID NO:1的71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、98.3%、98.7%、99.0%或99.3%或更优选99.7%的序列同一性,以及
(c)从(b)的突变植物中选择那些能够发生种子败育型果实形成的植物(或那些植物的子代)。
突变植物(M1)优选自交一次或多次以产生例如M2群体或优选M3或M4群体用于表型分析。在M2群体中,突变等位基因以1(突变等位基因为纯合的):2(突变等位基因为杂合的):1(野生型等位基因为纯合的)的比例存在。
本发明还提供了一种生产茄科植物的方法,所述茄科植物在其基因组中包含本文所定义的SSPER-1基因的突变等位基因的至少一个拷贝,其中所述突变等位基因当以纯合形式存在时,引起种子败育型的果实形成,所述方法包括以下步骤:
(i)使第一茄科植物和第二茄科植物杂交,其中第一茄科植物是根据本发明的植物;
(ii)任选地从(i)的杂交收获种子,并选择在基因组中包含本文所述的SSPER-1基因的突变等位基因的至少一个拷贝的种子。所述用于产生在基因组中包含SSPER-1基因的突变等位基因的至少一个拷贝的茄科植物的方法还可包括这样的方法步骤,其包括确定该植物是否包含本文所述的SSPER-1基因的突变等位基因。
在一个方面,第一茄科植物对于突变SSPER-1等位基因是杂合的,第二茄科植物对于野生型SSPER-1等位基因是纯合的,由此从所述杂交收获的一部分种子对于突变SSPER-1等位基因是纯合的,而剩余的种子对于突变SSPER-1等位基因是杂合的。在该方法中,随后任选地使用例如非破坏性种子DNA取样来选择对于突变SSPER-1等位基因是纯合的种子,或使用例如子叶或叶样品的DNA分析来选择对于突变SSPER-1等位基因是纯合的幼苗。
优选地,本文提供的生产茄子科植物的方法的步骤(i)中的第一茄科植物和第二茄科植物都是根据本发明的植物。
本发明还提供了一种由通过鉴别和/或选择包含本文所述的SSPER-1基因的突变等位基因的茄科植物或植物部分的方法获得的种子生长的植物。本发明还提供了一种由通过生产茄科植物的方法获得的种子生长的植物,所述茄科植物在其基因组中包含本文定义的SSPER-1基因的突变等位基因的至少一个拷贝。
本发明还提供了一种通过使根据本发明的种子生长来生产能够发生种子败育型果实形成的茄科植物的方法,其中所述植物对于突变等位基因是纯合的。
在一个方面,种子败育型果实形成性状是由ssper-1等位基因或直系同源等位基因或同源等位基因中的突变引起的。因此,在一个方面,提供了一种特异性突变ssper-1等位基因。可以使用诱变技术如化学或UV诱变,或者可以使用靶向诱变技术如CRISPR-Cas来诱导野生型SSPER-1基因的突变,所述突变赋予本发明的种子败育型果实形成性状。在一个方面,根据本发明的植物、植物部分和细胞不排他地通过如Rule28(2)EPC所定义的实质生物学方法获得。
实施例
实施例1
随机诱变,然后进行表型评估。
突变可通过电离辐射诱导,电离辐射通过产生活性氧(ROS)产生DNA链断裂和氧化性DNA损伤。ROS诱导的氧化产物之一是8-氧代-7-羟基脱氧鸟苷(8-oxo-7-hydrodeoxyguanosine)(8-氧代-dG),其可诱导DNA中的G/C-至-T/A颠换。通过收获花蕾并在室温下用各种剂量的(例如100Gy)来自60Co源的γ射线辐射,可以在花粉中产生突变(Akbudak et al.(2009)New Zealand Journal of Crop and Horticultural Science37:361–367)。含有从单碱基取代或缺失到跨越数兆碱基的大缺失的突变的辐射花粉可用于与未处理的植物杂交(Ryouhei Morita,et al.(2009)Genes Genet Syst.84:361-70)。来自杂交(F1)的种子可以再次播种,有活力的种子将生长出来,产生具有各自特定突变集的植物。可以从每株植物中采集F1的种子并再让其生长以进行表型化。突变在F2家族中分离,并可以评估它们的表型效应。
实施例2
随机诱变,然后从TILLING突变群体反向筛选。
商业辣椒育种中使用的高纯合近交系可用于采用以下方案的诱变处理。将种子在潮湿的纸上吸胀24小时后,将20,000粒种子(分为8批,每批2500粒)浸泡在锥形瓶中的100ml超纯水和浓度为1%的甲磺酸乙酯(EMS)中。将烧瓶在室温下轻轻摇晃16小时。最后,将EMS在流水下冲洗干净。EMS处理后,将种子直接播种在温室中。从发芽的种子中,将足够数量的小植株移植到田间。从这些小植株中,从存活和结果的植物中收获至少一个果实。例如,从每个剩余的M1突变植物中收获一个果实并分离其种子。从获得的群体,即M2群体,特定的家族可能由于低的结实率(seed set)被排除在群体之外。
从每个M2种子批的一个10粒种子的池中提取DNA。对于每个突变系,将10粒种子汇集在96深孔板的深孔管中;(http://www.micronic.com),在每个管中添加2个不锈钢球。将管和种子在液氮中冷冻1分钟,然后立即在Deepwell振动器(Vaskon 96研磨机,Belgium;http://www.vaskon.com)中以16.8Hz(最大速度的80%)持续2分钟将种子研磨成细粉。将来自/>植物DNA分离试剂盒(http://www.agowa.de)的300μl/>裂解缓冲液P加入样品板,并通过在Deepwell振动器中以16.8Hz振荡1分钟,使粉末悬浮在溶液中。以4000rpm离心板10分钟。使用Janus/>(Perkin Elmer,USA;http://www.perkinelmer.com)平台(96头)将75μl上清液移出至96Kingfisher板。使用PerkinElmer/>液体处理机器人和96/>(Thermo labsystems,Finland;http://www.thermo.com)进行以下步骤。用结合缓冲液(150μl)和磁珠(20μl)稀释含有DNA的上清液。一旦DNA与磁珠结合,就进行两个连续的洗涤步骤(洗涤缓冲液1:Agowa洗涤缓冲液1 1/3,乙醇1/3,异丙醇1/3;洗涤缓冲液2:70%乙醇,30%Agowa洗涤缓冲液2),最后在洗脱缓冲液(100μl MQ、0.025μl Tween)中洗脱。
研磨4粒辣椒种子通常产生足以使磁珠饱和的DNA,因此获得了所有样品的高度同质和可比的DNA浓度。与λDNA参考值相比,估计每个样品的浓度为30ng/μl。将2倍稀释的DNA直接4倍汇聚。将2μl混合DNA用于多重PCR中进行突变检测分析。
高分辨率熔解曲线分析(HRM)已被证明是人类和植物遗传学中灵敏且高通量的方法。HRM是一种非酶筛选技术。在PCR扩增过程中,染料(LCGreen+染料,Idaho TechnologyInc.,UT,USA)分子插入双链DNA分子的每个退火碱基对之间。当在分子中捕获时,染料在470nm激发后在510nm发射荧光。荧光检测器(LightScanner,Idaho Technology Inc.,UT,USA)中的照相机记录DNA样品逐步加热时的荧光强度。在取决于DNA螺旋的序列特异性稳定性的温度下,双链PCR产物开始熔解,释放出染料。染料的释放会导致荧光减弱,荧光检测器将其记录为熔解曲线。含有突变的混合体在PCR后片段混合物中形成异源双链体。这些被鉴别为与同源双链体相比具有差异的熔解温度曲线。
使用计算机程序(Primer3,http://primer3.sourceforge.net/)设计用于扩增用于HRM的基因片段的引物。扩增产物的长度限制在200至400个碱基对之间。通过应产生单一产物的测试PCR反应确定引物的质量。
用于扩增基因片段的聚合酶链反应(PCR)可以如下进行。将10ng基因组DNA与4μl反应缓冲液(5x反应缓冲液)、2μl 10xLC染料((LCGreen+染料,Idaho Technology Inc.,UT,USA)、各5pmole的正向和反向引物、4nmole dNTP(Life Technologies,NY,USA)和1单位DNA聚合酶(Hot Start II DNA聚合酶)混合,总体积为10μl。反应条件为:30s 98℃,然后40个循环的10s 98℃,15s 60℃,25s 72℃,最后在72℃下60s。
通过对来自所鉴别的相应DNA池的单个M2种子批的DNA重复HRM分析,确认单个植物中特定突变的存在。当根据HRM图在四份单个M2家族DNA样品中的一份中确认存在突变时,对PCR片段进行测序以鉴别基因中的突变。
一旦知道了突变,就可以预测这种突变的作用,例如通过使用计算机程序CODDLe(用于选择密码子以优化有害损伤的发现(for Choosing codons to Optimize Discoveryof Deleterious Lesions),http://www.proweb.org/coddle/),其识别用户选择的基因及其编码序列的区域,其中预期的点突变最可能导致对基因功能的有害影响。
播种含有对蛋白活性具有预测作用的突变的M2家族的种子,用于植物的表型分析。在自交和随后的选择之后选择或获得纯合突变体。随后确定突变对植物的相应蛋白和表型的作用,例如通过使用下文所述的方法。
实施例3
表征根据本发明的无籽辣椒植物。
在相同条件下播种从分离世代(F3和F4)中选择的各种待测类型(块状、甜尖和Lamuyo)的辣椒植物和具有相同遗传背景、除了野生型SSPER-1等位基因是纯合的相应对照植物,并使其生长直到它们有规律地产生成熟果实。所选植物采用营养繁殖的嫁接方法进行繁殖,并在西班牙阿尔梅里亚在秋冬季周期建立4株植物的2次平行测定的试验。生长条件为:温室,充足的水源,温度:约26℃/18℃日/夜,光照时间约14小时,光强度:约120μmol*sec-1*m-2μ[PAR],生长介质:土壤(半草皮半坑)。随后,每株植物收获至少三个成熟果实,并在收获后直接对以下特征进行表征:平均果实长度(cm)、平均果实宽度(cm)和平均果实重量(g)。下表提供了该表征的结果。
因此,可以得出结论:可以由根据本发明的植物产生的无籽果实具有正常的形状和大小。
实施例4
本发明的无籽辣椒植物的繁殖。
将产生无籽果实的辣椒植物(无籽果实由于所述植物的根据本发明的SSPER-1基因的突变等位基因是纯合的(ssper-1/ssper-1)而引起),通过嫁接和/或其他常规的营养繁殖方法如插条来繁殖。
或者,通过将产生无籽果实且突变SSPER-1等位基因是纯合(ssper-1/ssper-1)的植物与同一家族或世系的突变SSPER-1等位基因是杂合(SSPER-1/ssper-1)的植物杂交,使用同胞交配繁殖产生无籽果实的辣椒植物。通过这种同胞交配产生的种子代表了一个群体,该群体针对由突变SSPER-1等位基因控制的无籽性状进行了分离。相应产生的突变SSPER-1等位基因是纯合(ssper-1/ssper-1)的种子,或由此类种子生长的植物,可以通过使用如本文所述的分子基因分型方法,与同样产生的突变SSPER-1等位基因是杂合(SSPER-1/ssper-1)的后代区分开来和/或分离。
序列表
<110> Nunhems B.V.
<120> 能够发生种子败育型的果实形成的茄子科植物
<130> 182088WO01
<150> EP18212422.2
<151> 13 December 2018
<160> 14
<170> PatentIn version 3.5
<210> 1
<211> 815
<212> PRT
<213> 辣椒(Capsicum annuum)
<400> 1
Met Ser Phe Gly Gly Phe Ile Gly Ser Ser Ser Gly Gly Gly Gly Gly
1 5 10 15
Ser Gly Val Ser Arg Leu Val Gly Asp Ser Pro Tyr Glu Ala Met Pro
20 25 30
Thr Ala Thr Val Ala Gln Ser Gln Leu Ile Thr Ser Ser Leu Pro Gln
35 40 45
Ser Ile Phe Asn Ser Ser Pro Leu Ser Leu Ala Leu Lys Pro Lys Met
50 55 60
Glu Gly Ala Ser Asp Met Ser Leu Leu Ala Glu Asn Phe Gly Ala Val
65 70 75 80
Ala Met Gly Arg Ser Asp Glu Asn Asp Ser Arg Ser Pro Ser Asp His
85 90 95
Leu Asp Gly Gly Gly Ser Gly Asp Asp Met Glu Ala His Val Gly Ser
100 105 110
Ser Ser Arg Lys Lys Lys Tyr His Arg His Thr Pro Tyr Gln Ile Gln
115 120 125
Glu Leu Glu Ala Cys Phe Lys Glu Asn Pro His Pro Asp Glu Lys Ala
130 135 140
Arg Leu Glu Leu Gly Lys Arg Leu Ser Leu Glu Thr Arg Gln Val Lys
145 150 155 160
Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Thr Gln Leu Glu Arg
165 170 175
His Glu Asn Ser Met Leu Lys Gln Glu Asn Asp Lys Leu Arg Leu Glu
180 185 190
Asn Met Ala Met Lys Glu Ala Met Arg Gly Pro Thr Cys His Gln Cys
195 200 205
Gly Gly Gln Ala Ile Leu Gly Glu Ile His Met Glu Glu His His Leu
210 215 220
Lys Ile Glu Asn Ala Arg Leu Arg Asp Glu Tyr Asn Arg Ile Cys Leu
225 230 235 240
Met Ala Asn Lys Val Leu Gly Arg Pro Leu Ser Ser Phe Pro Ser Pro
245 250 255
Met Pro Ala Gly Met Gly Asn Phe Gly Leu Glu Leu Ala Val Gly Arg
260 265 270
Asn Gly Phe Gly Ala Met Asn Ser Val Asp Ala Ala Leu Pro Met Gly
275 280 285
Leu Asp Phe Gly Asn Gly Ile Ser Ser Ala Thr Ile Pro Val Ile Ser
290 295 300
Pro Arg Pro Ile Pro Asn Met Thr Gly Ile Asp Val Ser Phe Asp Lys
305 310 315 320
Thr Val Leu Met Glu Leu Ala Phe Ala Ala Met Asn Glu Leu Val Lys
325 330 335
Leu Ala Glu Ile Ser Gly Pro Leu Trp Phe Arg Ser Leu Asp Gly Asn
340 345 350
Gly Glu Glu Leu Asn Leu Glu Glu Tyr Ala Arg Ser Phe Pro Pro Cys
355 360 365
Ile Gly Met Lys Pro Ala Asn Phe Thr Ala Glu Ala Thr Lys Ala Thr
370 375 380
Gly Thr Val Met Ile Asn Ser Leu Ala Leu Val Glu Thr Leu Met Asp
385 390 395 400
Thr Ser Gln Trp Val Asp Thr Phe Ser Ser Ile Val Gly Arg Thr Ser
405 410 415
Ser Met Asn Leu Ile Ser Ser Ser Ser Gly Gly Gly Arg Asn Gly Asn
420 425 430
Leu Gln Leu Ile Gln Ala Glu Phe Gln Val Val Ser Ala Leu Val Pro
435 440 445
Val Arg Gln Val Lys Phe Leu Arg Phe Cys Lys Gln His Ala Glu Gly
450 455 460
Val Trp Ala Val Val Asp Val Ser Val Asp Ala Ile Gln Glu Gly Ser
465 470 475 480
Gln Pro Arg Glu Ala Gly Asn Cys Arg Arg Leu Pro Ser Gly Cys Ile
485 490 495
Val Gln Asp Leu Ser Asn Gly Tyr Ser Lys Val Ile Trp Ile Glu His
500 505 510
Met Glu Tyr Asp Glu Ser Thr Ile His Asn Tyr Tyr Arg Ala Phe Ile
515 520 525
Lys Ser Gly Leu Gly Phe Gly Ala Gln Arg Trp Ile Ala Ala Leu Gln
530 535 540
Arg Gln Cys Glu Cys Leu Ala Ile Ile Met Ser Ser Thr Val Ser Ser
545 550 555 560
Gly Asp Asn Ala Val Val Gly Pro Ser Gly Arg Arg Ser Ile Ala Met
565 570 575
Leu Ala Arg Arg Val Thr Cys Asn Phe Cys Ala Gly Val Cys Gly Thr
580 585 590
Phe Tyr Lys Trp Glu Pro Ile Gln Ser Gly Ser Gly Glu Glu Thr Lys
595 600 605
Leu Met Met Arg Lys Ser Val Gly Glu Leu Gly Glu Pro Ser Gly Val
610 615 620
Met Leu Ser Ala Thr Arg Thr Ile Trp Leu Pro Ile Thr His Gln Arg
625 630 635 640
Leu Phe Asp Phe Leu Arg Asn Ala Gln Thr Arg Arg Gln Trp Asp Val
645 650 655
Leu Phe His Gly Asp Ala Met His Glu Ile Val His Ile Ala Lys Gly
660 665 670
Gln Asp Leu Gly Asn Ser Ile Ser Leu Tyr Arg Thr Asn Val Thr Gly
675 680 685
Ser Asp Gly Asn Gln Ser Ser Met Leu Tyr Leu Gln Asp Ser Cys Thr
690 695 700
Asp Val Ser Gly Ser Ile Val Ser Tyr Ala Ala Val Asp Thr Ala Gln
705 710 715 720
Met Asn Val Val Met Ser Gly Gly Asp Ser Ser Cys Val Thr Phe Leu
725 730 735
Pro Ser Gly Phe Ala Ile Val Pro Asp Cys Phe Gly Asn Ser Asn Gly
740 745 750
Val Thr Ser Asn Gly Met Leu Glu Lys Glu Asp Asn Gly Gly Arg Asn
755 760 765
Asn Gly Ser Phe Leu Thr Val Gly Tyr Gln Ile Leu Val Asn Asn Leu
770 775 780
Pro Gly Gly Asn Leu Thr Met Glu Ser Val Asn Thr Ile Asn Ser Phe
785 790 795 800
Val Ser Arg Thr Leu Gly Gly Ile Lys Thr Ile Phe Gln Cys Asn
805 810 815
<210> 2
<211> 2448
<212> DNA
<213> 辣椒(Capsicum annuum)
<400> 2
atgagttttg gaggcttcat tggtagtagt agtggtggtg gtggtggttc tggggtttcg 60
agattggtgg gtgatagtcc atacgaagcc atgcctactg ctactgttgc tcagtcacaa 120
cttatcacat catctttacc tcagtctata tttaactctt ctccactatc tcttgctctt 180
aaaccgaaga tggaaggtgc aagtgacatg agtttgttag cggaaaattt tggtgctgtt 240
gcaatgggaa ggtcggatga gaacgatagc aggtccccta gtgaccactt agatggtggt 300
ggatcgggcg atgatatgga agctcacgtt ggtagctcat cgaggaagaa gaaataccat 360
aggcacactc cataccaaat tcaagaactt gaagcttgtt ttaaggagaa tccacaccct 420
gatgaaaaag ctagacttga acttggtaag aggttgtcgt tggaaaccag gcaggtgaag 480
ttttggtttc aaaataggag aactcagatg aagacccaat tggagcgcca tgaaaattca 540
atgttaaagc aagaaaatga caaactgcgc ctggagaaca tggcaatgaa ggaagctatg 600
agagggccaa cttgccacca atgtggtggc caagcaattc ttggagaaat acacatggaa 660
gagcatcatt tgaagattga gaatgctagg ctgagagatg aatacaatag gatctgtctt 720
atggcgaaca aggttttggg caggcctttg tcatctttcc ctagtccaat gccagctgga 780
atgggcaact ttggtttgga acttgctgtt ggaagaaacg gctttggtgc tatgaactct 840
gttgacgctg cattgccaat gggacttgat tttggtaatg gtatctcaag tgctactata 900
ccagtgattt cacctaggcc catccccaac atgactggta tagatgtatc ctttgataag 960
actgtgttaa tggagcttgc ttttgctgcc atgaatgagc tggttaagct ggctgagatc 1020
agtggtcctc tgtggtttag aagcttggat ggaaatgggg aagagttgaa ccttgaggag 1080
tatgctaggt cttttcctcc gtgtattggc atgaagcctg ccaacttcac agcagaagca 1140
acaaaggcaa ctggtacggt gatgatcaac agtctggcct tggtggagac tttaatggac 1200
acaagtcaat gggtggatac attctcaagc attgttggca gaacctcttc aatgaatttg 1260
atctccagca gctcgggtgg aggcaggaat ggcaatttgc aattgatcca agctgagttc 1320
caagttgtat ctgctttagt tcctgtccgt caagtaaaat ttctacgctt ctgcaagcaa 1380
catgctgaag gtgtctgggc agtggtggat gtgtctgttg atgcaatcca agagggttca 1440
caaccgcgtg aagctggaaa ctgcaggagg ctcccctcgg gatgtattgt gcaagacttg 1500
tccaatggat actcaaaggt tatttggatt gaacatatgg aatatgatga gagtaccatc 1560
cacaattact accgcgcttt catcaagtct ggcctgggct ttggtgccca acggtggatt 1620
gccgccctac aaaggcaatg tgagtgcttg gcaatcatca tgtcttctac tgtgtccagt 1680
ggggataacg cagttgttgg tcccagtggt cggagaagta ttgcaatgct ggctcgacgc 1740
gtgacttgca acttttgtgc tggggtttgt ggaacctttt acaagtggga accaatccaa 1800
tcagggagtg gagaggagac taagttgatg atgaggaaga gcgttggtga acttggtgag 1860
ccttctggtg tgatgttgag tgccaccagg accatctggc tgccgataac acatcaacgt 1920
ttgtttgact tcctgagaaa tgcacaaaca agaaggcaat gggatgtctt gttccatggt 1980
gatgccatgc acgaaatagt ccacattgcc aagggtcagg atcttggcaa tagcatctct 2040
ctctatcgta ctaatgtgac tggtagcgat ggtaatcaaa gtagtatgtt gtacttgcag 2100
gactcctgca ctgatgtgtc gggttcaatt gtatcatatg cagctgttga tactgcacaa 2160
atgaatgttg tgatgagtgg tggagattcc tcctgcgtga ctttcctgcc atctgggttt 2220
gccatagttc cagattgttt tgggaattcc aacggggtta ctagcaatgg aatgcttgaa 2280
aaagaggata atgggggtag gaacaatggg tctttcttga ctgtgggata tcaaatattg 2340
gtgaataact tgcctggagg aaatctcact atggaatcgg tcaacaccat taactctttc 2400
gtctcccgta ctctgggtgg tatcaaaact attttccagt gcaattaa 2448
<210> 3
<211> 181
<212> PRT
<213> 辣椒(Capsicum annuum)
<400> 3
Met Ser Phe Gly Gly Phe Ile Gly Ser Ser Ser Gly Gly Gly Gly Gly
1 5 10 15
Ser Gly Val Ser Arg Leu Val Gly Asp Ser Pro Tyr Glu Ala Met Pro
20 25 30
Thr Ala Thr Val Ala Gln Ser Gln Leu Ile Thr Ser Ser Leu Pro Gln
35 40 45
Ser Ile Phe Asn Ser Ser Pro Leu Ser Leu Ala Leu Lys Pro Lys Met
50 55 60
Glu Gly Ala Ser Asp Met Ser Leu Leu Ala Glu Asn Phe Gly Ala Val
65 70 75 80
Ala Met Gly Arg Ser Asp Glu Asn Asp Ser Arg Ser Pro Ser Asp His
85 90 95
Leu Asp Gly Gly Gly Ser Gly Asp Asp Met Glu Ala His Val Gly Ser
100 105 110
Ser Ser Arg Lys Lys Lys Tyr His Arg His Thr Pro Tyr Gln Ile Gln
115 120 125
Glu Leu Glu Ala Cys Phe Lys Glu Asn Pro His Pro Asp Glu Lys Ala
130 135 140
Arg Leu Glu Leu Gly Lys Arg Leu Ser Leu Glu Thr Arg Gln Val Lys
145 150 155 160
Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Thr Gln Leu Glu Arg
165 170 175
Met Lys Ile Gln Phe
180
<210> 4
<211> 546
<212> DNA
<213> 辣椒(Capsicum annuum)
<400> 4
atgagttttg gaggcttcat tggtagtagt agtggtggtg gtggtggttc tggggtttcg 60
agattggtgg gtgatagtcc atacgaagcc atgcctactg ctactgttgc tcagtcacaa 120
cttatcacat catctttacc tcagtctata tttaactctt ctccactatc tcttgctctt 180
aaaccgaaga tggaaggtgc aagtgacatg agtttgttag cggaaaattt tggtgctgtt 240
gcaatgggaa ggtcggatga gaacgatagc aggtccccta gtgaccactt agatggtggt 300
ggatcgggcg atgatatgga agctcacgtt ggtagctcat cgaggaagaa gaaataccat 360
aggcacactc cataccaaat tcaagaactt gaagcttgtt ttaaggagaa tccacaccct 420
gatgaaaaag ctagacttga acttggtaag aggttgtcgt tggaaaccag gcaggtgaag 480
ttttggtttc aaaataggag aactcagatg aagacccaat tggagcgcat gaaaattcaa 540
ttttaa 546
<210> 5
<211> 818
<212> PRT
<213> 中华辣椒(Capsicum chinense)
<400> 5
Met Ser Phe Gly Gly Phe Ile Gly Ser Ser Ser Gly Gly Asp Gly Gly
1 5 10 15
Gly Gly Gly Ser Gly Val Ser Arg Leu Val Gly Asp Ser Pro Tyr Glu
20 25 30
Ala Met Pro Thr Ala Thr Val Ala Gln Ser Gln Leu Ile Thr Ser Ser
35 40 45
Leu Pro Gln Ser Ile Phe Asn Ser Ser Pro Leu Ser Leu Ala Leu Lys
50 55 60
Pro Lys Met Glu Gly Ala Ser Asp Met Ser Leu Leu Ala Glu Asn Phe
65 70 75 80
Gly Ala Val Ala Met Gly Arg Ser Asp Glu Asn Asp Ser Arg Ser Pro
85 90 95
Ser Asp His Leu Asp Gly Gly Gly Ser Gly Asp Asp Met Glu Ala His
100 105 110
Val Gly Ser Ser Ser Arg Lys Lys Lys Tyr His Arg His Thr Pro Tyr
115 120 125
Gln Ile Gln Glu Leu Glu Ala Cys Phe Lys Glu Asn Pro His Pro Asp
130 135 140
Glu Lys Ala Arg Leu Glu Leu Gly Lys Arg Leu Ser Leu Glu Thr Arg
145 150 155 160
Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Thr Gln
165 170 175
Leu Glu Arg His Glu Asn Ser Met Leu Lys Gln Glu Asn Asp Lys Leu
180 185 190
Arg Leu Glu Asn Met Ala Met Lys Glu Ala Met Arg Gly Pro Thr Cys
195 200 205
His Gln Cys Gly Gly Gln Ala Ile Leu Gly Glu Ile His Met Glu Glu
210 215 220
His His Leu Lys Ile Glu Asn Ala Arg Leu Arg Asp Glu Tyr Asn Arg
225 230 235 240
Ile Cys Leu Met Ala Asn Lys Val Leu Gly Arg Pro Leu Ser Ser Phe
245 250 255
Pro Ser Pro Met Pro Ala Gly Met Gly Asn Phe Gly Leu Glu Leu Ala
260 265 270
Val Gly Arg Asn Gly Phe Gly Ala Met Asn Ser Val Asp Ala Ala Leu
275 280 285
Pro Met Gly Leu Asp Phe Gly Asn Gly Ile Ser Ser Ala Thr Ile Pro
290 295 300
Val Ile Ser Pro Arg Pro Ile Pro Asn Met Thr Gly Ile Asp Val Ser
305 310 315 320
Phe Asp Lys Thr Val Leu Met Glu Leu Ala Phe Ala Ala Met Asn Glu
325 330 335
Leu Val Lys Leu Ala Glu Ile Ser Gly Pro Leu Trp Phe Arg Ser Leu
340 345 350
Asp Gly Asn Gly Glu Glu Leu Asn Leu Glu Glu Tyr Ala Arg Ser Phe
355 360 365
Pro Pro Cys Ile Gly Met Lys Pro Ala Asn Leu Thr Ser Glu Ala Thr
370 375 380
Lys Ala Thr Gly Thr Val Met Ile Asn Ser Leu Ala Leu Val Glu Thr
385 390 395 400
Leu Met Asp Thr Ser Gln Trp Val Asp Thr Phe Ser Ser Ile Val Gly
405 410 415
Arg Thr Ser Ser Met Asn Leu Ile Ser Ser Ser Ser Gly Gly Ser Arg
420 425 430
Asn Gly Asn Leu Gln Leu Ile Gln Ala Glu Phe Gln Val Val Ala Thr
435 440 445
Leu Val Pro Val Arg Gln Val Lys Phe Leu Arg Phe Cys Lys Gln His
450 455 460
Ala Glu Gly Val Trp Ala Val Val Asp Val Ser Val Asp Ala Ile Gln
465 470 475 480
Glu Gly Ser Gln Pro Arg Glu Ala Gly Asn Cys Arg Arg Leu Pro Ser
485 490 495
Gly Cys Ile Val Gln Asp Leu Ser Asn Gly Tyr Ser Lys Val Ile Trp
500 505 510
Ile Glu His Met Glu Tyr Asp Glu Ser Thr Ile His Asn Tyr Tyr Arg
515 520 525
Ala Phe Ile Lys Ser Gly Leu Gly Phe Gly Ala Gln Arg Trp Ile Ala
530 535 540
Ala Leu Gln Arg Gln Cys Glu Cys Leu Ala Ile Ile Met Ser Ser Thr
545 550 555 560
Val Ser Ser Gly Asp Asn Ala Val Val Gly Pro Ser Gly Arg Arg Ser
565 570 575
Ile Ala Met Leu Ala Arg Arg Val Thr Cys Asn Phe Cys Gly Gly Val
580 585 590
Cys Gly Thr Phe Tyr Lys Trp Glu Pro Ile Gln Ser Gly Ser Gly Glu
595 600 605
Glu Thr Lys Leu Met Met Arg Lys Ser Val Gly Glu Leu Gly Glu Pro
610 615 620
Ser Gly Val Met Leu Ser Ala Thr Arg Thr Ile Trp Leu Pro Ile Thr
625 630 635 640
His Gln Arg Leu Phe Asp Phe Leu Arg Asn Ala Gln Thr Arg Arg Gln
645 650 655
Trp Asp Val Leu Phe His Gly Asp Ala Met His Glu Ile Val His Ile
660 665 670
Ala Lys Gly Gln Asp Leu Gly Asn Ser Ile Ser Leu Tyr Arg Thr Asn
675 680 685
Val Thr Gly Ser Asp Gly Asn Gln Ser Ser Met Leu Tyr Leu Gln Asp
690 695 700
Ser Cys Thr Asp Val Ser Gly Ser Ile Val Ser Tyr Ala Ala Val Asp
705 710 715 720
Thr Ala Gln Met Asn Val Val Met Ser Gly Gly Asp Ser Ser Cys Val
725 730 735
Thr Phe Leu Pro Ser Gly Phe Ala Ile Val Pro Asp Cys Phe Gly Asn
740 745 750
Ser Asn Gly Val Thr Ser Asn Gly Met Leu Glu Lys Glu Asp Asn Gly
755 760 765
Gly Arg Asn Lys Gly Ser Phe Leu Thr Val Gly Tyr Gln Ile Leu Val
770 775 780
Asn Asn Leu Pro Gly Gly Asn Leu Thr Met Glu Ser Val Asn Thr Ile
785 790 795 800
Asn Ser Phe Val Ser Arg Thr Leu Asp Gly Ile Lys Thr Ile Phe Arg
805 810 815
Cys Asn
<210> 6
<211> 2457
<212> DNA
<213> 中华辣椒(Capsicum chinense)
<400> 6
atgagttttg gaggcttcat tggtagtagt agtggtggtg acggtggtgg tggtggttct 60
ggggtttcga gattggtggg tgatagtcca tacgaagcca tgcctactgc tactgttgct 120
cagtcacaac ttatcacatc atctttacct cagtctatat ttaactcttc tccactatct 180
cttgctctta aaccgaagat ggaaggtgca agtgacatga gtttgttagc ggaaaatttt 240
ggtgctgttg caatgggaag gtcggatgag aacgatagca ggtcccctag tgaccactta 300
gatggtggtg gatcgggcga tgatatggaa gctcacgttg gtagctcatc gaggaagaag 360
aaataccata ggcacactcc ataccaaatt caagaacttg aagcttgttt taaggagaat 420
ccacaccctg atgaaaaagc tagacttgaa cttggtaaga ggttgtcgtt ggaaaccagg 480
caggtgaagt tttggtttca aaataggaga actcagatga agacccaatt ggagcgccat 540
gaaaattcaa tgttaaagca agaaaatgac aaactgcgcc tagagaacat ggcaatgaag 600
gaagctatga gagggccaac ttgccaccaa tgtggtggcc aagcaattct tggagaaata 660
cacatggaag agcatcattt gaagattgag aatgctaggc tgagagatga atacaatagg 720
atctgtctta tggcgaacaa ggttttgggc aggcctttgt catctttccc tagtccaatg 780
ccagctggaa tgggcaactt tggtttggaa cttgctgttg gaagaaacgg ctttggtgct 840
atgaactctg ttgacgctgc attgccaatg ggacttgatt ttggtaatgg tatctcaagt 900
gctactatac cagtgatttc acctaggccc atccccaaca tgactggtat agatgtatcc 960
tttgataaga ctgtgttaat ggagcttgct tttgctgcca tgaatgagct ggttaagctg 1020
gctgagatca gtggtcctct gtggtttaga agcttggatg gaaatgggga agagttgaac 1080
cttgaggagt atgctaggtc ttttcctccg tgtattggca tgaagcctgc caacttgaca 1140
tcagaagcaa caaaggcaac tggtacagtg atgatcaaca gtctggcctt ggtggagact 1200
ttaatggaca caagtcaatg ggtggataca ttctcaagca ttgttggcag aacctcttca 1260
atgaatttga tctccagcag ctcgggtgga agcaggaatg gcaatttgca attgatccaa 1320
gctgagttcc aagttgtagc tactttagtt cctgtccgtc aagtaaaatt tctacgcttc 1380
tgcaagcaac atgctgaagg tgtctgggca gtggtggatg tgtctgttga tgcaatccaa 1440
gagggttcac aaccgcgtga agctggaaac tgcaggaggc tcccctcggg atgtattgtg 1500
caagacttgt ccaatggata ctcaaaggtt atttggattg agcatatgga atatgatgag 1560
agtaccatcc acaattacta ccgcgctttc atcaagtctg gcctgggctt tggtgcccaa 1620
cggtggattg ccgccctaca aaggcaatgc gagtgcttgg caatcatcat gtcttctact 1680
gtgtccagtg gggataacgc agttgttggt cccagtggtc ggagaagtat tgcaatgctg 1740
gctcgacgcg tgacttgcaa cttttgtggt ggggtttgtg gaacctttta caagtgggaa 1800
ccaatccaat cagggagtgg agaggagact aagttgatga tgaggaagag cgttggtgaa 1860
cttggtgagc cttctggtgt gatgttgagt gccaccagga ccatctggct gccgataaca 1920
catcaacgtt tgtttgactt cctgagaaat gcacaaacaa gaaggcaatg ggatgtcttg 1980
ttccatggtg atgccatgca cgaaatagtc cacattgcca agggtcagga tcttggcaat 2040
agcatctctc tctatcgtac taatgtgact ggtagcgatg gtaatcaaag tagtatgttg 2100
tacttgcagg actcctgcac tgatgtgtcg ggttcaattg tatcatatgc agctgttgat 2160
actgcacaaa tgaatgttgt gatgagtggt ggagattcct cctgcgtgac tttcctgcca 2220
tctgggtttg ccatagttcc agattgtttt gggaattcca acggggttac tagcaatgga 2280
atgcttgaaa aagaggataa tgggggtagg aacaaggggt ctttcttgac tgtgggatat 2340
caaatattgg tgaataactt gcctggagga aatctcacta tggagtcggt caacaccatt 2400
aactctttcg tctcccgtac tctggatggt atcaaaacta ttttccggtg caattaa 2457
<210> 7
<211> 819
<212> PRT
<213> 风铃辣椒(Capsicum baccatum)
<400> 7
Met Ser Phe Gly Gly Phe Ile Gly Ser Ser Ser Gly Gly Asp Gly Gly
1 5 10 15
Gly Gly Gly Gly Ser Gly Val Ser Arg Leu Val Gly Asp Ser Pro Tyr
20 25 30
Glu Ala Met Pro Thr Ala Thr Val Ala Gln Ser Gln Leu Ile Thr Ser
35 40 45
Ser Leu Pro Gln Ser Ile Phe Asn Ser Ser Pro Leu Ser Leu Ala Leu
50 55 60
Lys Pro Lys Met Glu Gly Ala Ser Asp Met Ser Leu Leu Ala Glu Asn
65 70 75 80
Phe Gly Ala Val Ala Met Gly Arg Ser Asp Glu Asn Asp Ser Arg Ser
85 90 95
Pro Ser Asp His Leu Asp Gly Gly Gly Ser Gly Asp Asp Met Glu Ala
100 105 110
His Val Gly Ser Ser Ser Arg Lys Lys Lys Tyr His Arg His Thr Pro
115 120 125
Tyr Gln Ile Gln Glu Leu Glu Ala Cys Phe Lys Glu Asn Pro His Pro
130 135 140
Asp Glu Lys Ala Arg Leu Glu Leu Gly Lys Arg Leu Ser Leu Glu Thr
145 150 155 160
Arg Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Thr
165 170 175
Gln Leu Glu Arg His Glu Asn Ser Met Leu Lys Gln Glu Asn Asp Lys
180 185 190
Leu Arg Leu Glu Asn Leu Ala Met Lys Glu Ala Met Arg Gly Pro Thr
195 200 205
Cys His Gln Cys Gly Gly Gln Ala Ile Leu Gly Glu Ile His Met Glu
210 215 220
Glu His His Leu Lys Ile Glu Asn Ala Arg Leu Arg Asp Glu Tyr Asn
225 230 235 240
Arg Ile Cys Leu Met Ala Asn Lys Val Leu Gly Arg Pro Leu Ser Ser
245 250 255
Phe Pro Ser Pro Met Pro Ala Gly Met Gly Asn Phe Gly Leu Glu Leu
260 265 270
Ala Val Gly Arg Asn Gly Phe Gly Ala Met Asn Ser Val Asp Ala Ala
275 280 285
Leu Pro Met Gly Leu Asp Phe Gly Asn Gly Ile Ser Ser Ala Thr Ile
290 295 300
Pro Val Ile Ser Pro Arg Pro Ile Pro Asn Met Thr Gly Ile Asp Val
305 310 315 320
Ser Phe Asp Lys Thr Val Leu Met Glu Leu Ala Phe Ala Ala Met Asn
325 330 335
Glu Leu Val Lys Leu Ala Glu Ile Ser Gly Pro Leu Trp Phe Arg Ser
340 345 350
Leu Asp Gly Asn Gly Glu Glu Leu Asn Leu Glu Glu Tyr Ala Arg Ser
355 360 365
Phe Pro Pro Cys Ile Gly Met Lys Pro Ala Asn Phe Thr Ala Glu Ala
370 375 380
Thr Lys Ala Thr Gly Thr Val Met Ile Asn Ser Leu Ala Leu Val Glu
385 390 395 400
Thr Leu Met Asp Thr Ser Gln Trp Val Asp Thr Phe Ser Ser Ile Val
405 410 415
Gly Arg Thr Ser Ser Met Asn Leu Ile Ser Ser Ser Ser Gly Gly Ser
420 425 430
Arg Asn Gly Asn Leu Gln Leu Ile Gln Ala Glu Phe Gln Val Val Ser
435 440 445
Ala Leu Val Pro Val Arg Gln Val Lys Phe Leu Arg Phe Cys Lys Gln
450 455 460
His Ala Glu Gly Val Trp Ala Val Val Asp Val Ser Val Asp Ala Ile
465 470 475 480
Gln Glu Gly Ser Gln Pro Arg Glu Ala Gly Asn Cys Arg Arg Leu Pro
485 490 495
Ser Gly Cys Ile Val Gln Asp Leu Ser Asn Gly Tyr Ser Lys Val Ile
500 505 510
Trp Ile Glu His Met Glu Tyr Asp Glu Ser Thr Ile His His Tyr Tyr
515 520 525
Arg Ala Phe Ile Lys Ser Gly Leu Gly Phe Gly Ala Gln Arg Trp Ile
530 535 540
Ala Ala Leu Gln Arg Gln Cys Glu Cys Leu Ala Ile Ile Met Ser Ser
545 550 555 560
Thr Val Ser Ser Gly Asp Asn Ala Val Val Ala Pro Ser Gly Arg Arg
565 570 575
Ser Ile Ala Met Leu Ala Arg Arg Val Thr Cys Asn Phe Cys Gly Gly
580 585 590
Val Cys Gly Thr Phe Tyr Lys Trp Glu Pro Ile Gln Ser Gly Ser Gly
595 600 605
Glu Glu Thr Lys Leu Met Met Arg Lys Ser Val Gly Glu Leu Gly Glu
610 615 620
Pro Ser Gly Val Met Leu Ser Ala Thr Arg Thr Ile Trp Leu Pro Ile
625 630 635 640
Thr His Gln Arg Leu Phe Asp Phe Leu Arg Asn Ala Gln Thr Arg Arg
645 650 655
Gln Trp Asp Val Leu Phe His Gly Asp Ala Met His Glu Ile Val His
660 665 670
Ile Ala Lys Gly Gln Asp Leu Gly Asn Ser Ile Ser Leu Tyr Arg Thr
675 680 685
Asn Val Thr Gly Ser Asp Gly Asn Gln Ser Ser Met Leu Tyr Leu Gln
690 695 700
Asp Ser Cys Thr Asp Val Ser Gly Ser Ile Val Ser Tyr Ala Ala Val
705 710 715 720
Asp Thr Ala Gln Met Asn Val Val Met Ser Gly Gly Asp Ser Ser Cys
725 730 735
Val Thr Phe Leu Pro Ser Gly Phe Ala Ile Val Pro Asp Cys Phe Gly
740 745 750
Asn Ser Asp Gly Val Thr Asn Asn Gly Met Leu Glu Lys Glu Asp Asn
755 760 765
Gly Gly Arg Asn Asn Gly Ser Phe Leu Thr Val Gly Tyr Gln Ile Leu
770 775 780
Val Asn Asn Leu Pro Gly Gly Asn Leu Thr Met Glu Ser Val Asn Thr
785 790 795 800
Ile Asn Ser Phe Val Ser Arg Thr Leu Asp Gly Ile Lys Thr Ile Phe
805 810 815
Arg Cys Asn
<210> 8
<211> 2460
<212> DNA
<213> 风铃辣椒(Capsicum baccatum)
<400> 8
atgagttttg gaggcttcat tggtagtagt agtggtggtg acggtggtgg tggtggtggt 60
tctggggttt cgagattggt gggtgatagt ccatacgaag ccatgcctac tgctactgtt 120
gctcagtcac aacttatcac atcatcttta cctcagtcta tatttaactc ttctccacta 180
tctcttgctc ttaaaccgaa gatggaaggt gcaagtgaca tgagtttgtt agcggaaaat 240
tttggtgctg ttgcaatggg aaggtcggat gagaacgata gcaggtcccc tagtgaccac 300
ttagatggtg gtggatcggg cgatgatatg gaagctcacg ttggtagctc atcgaggaag 360
aagaaatacc ataggcacac tccataccaa attcaagaac ttgaagcttg ttttaaggag 420
aatccacacc ctgatgaaaa agctagactt gaacttggta agaggttgtc gttggaaacc 480
aggcaggtga agttttggtt tcaaaatagg agaactcaga tgaagaccca attggagcgc 540
catgaaaatt caatgttaaa gcaagaaaat gacaaactgc gcctagagaa cctggcaatg 600
aaggaagcta tgagagggcc aacttgccac caatgtggtg gccaagcaat tcttggagaa 660
atacacatgg aagagcatca tttgaagatt gagaatgcta ggctgagaga tgaatacaat 720
aggatctgtc ttatggcgaa caaggttttg ggcaggcctt tgtcatcttt ccctagtcca 780
atgccagctg gaatgggcaa ctttggtttg gaacttgctg ttggaagaaa cggctttggt 840
gctatgaact ctgttgacgc tgcattgcca atgggacttg attttggtaa tggtatctca 900
agtgctacta taccagtgat ttcgcctagg cccatcccca acatgactgg tatagatgta 960
tcctttgata agactgtgtt aatggagctt gcttttgctg ccatgaatga gctggttaag 1020
ctggctgaga tcagtggtcc tctgtggttt agaagcttgg atggaaatgg ggaagagttg 1080
aatcttgagg agtatgctag gtcttttcct ccgtgtattg gcatgaagcc tgccaacttc 1140
acagcagaag caacaaaggc aactggtaca gtgatgatca acagtctggc cttggtggag 1200
actttaatgg acacaagtca atgggtggat acattctcaa gcattgttgg cagaacctct 1260
tcaatgaatt tgatctccag cagctcgggt ggaagcagga atggcaattt gcaattgatc 1320
caagctgagt tccaagttgt atctgcttta gttcctgtcc gtcaagtaaa atttctacgc 1380
ttctgcaagc aacatgctga aggtgtctgg gcagtggtgg atgtgtctgt tgatgcaatc 1440
caagagggtt cacaaccgcg tgaagctgga aactgcagga ggctcccctc gggatgtatt 1500
gtgcaagact tgtccaatgg atactcaaag gttatttgga ttgagcatat ggaatatgat 1560
gagagtacca tccaccatta ctaccgcgct ttcatcaagt ctggcctggg atttggtgcc 1620
caacggtgga ttgccgccct acaaaggcaa tgcgagtgct tggcaatcat catgtcttct 1680
actgtgtcca gtggggataa cgcagttgtt gctcccagtg gtcggagaag tattgcaatg 1740
ctggctcgac gcgtgacttg caacttttgt ggtggggttt gtggaacctt ttacaagtgg 1800
gaaccaatcc aatcagggag tggagaagag actaagttga tgatgcggaa gagcgttggt 1860
gaacttggtg agccttctgg tgtgatgttg agtgccacca ggaccatctg gctgccgata 1920
acacatcagc gtttgtttga cttcctgaga aatgcacaaa caagaaggca atgggatgtc 1980
ttgttccatg gtgatgccat gcacgaaata gtccacattg ccaagggtca ggatcttggc 2040
aatagcatct ctctctatcg tactaatgtg actggtagcg atggtaatca aagtagtatg 2100
ttgtacttgc aggactcctg cactgatgtg tcaggttcaa ttgtatcata tgcagctgtt 2160
gatactgcac aaatgaatgt tgtgatgagt ggtggagatt cctcctgcgt gactttcctg 2220
ccatctggtt ttgccatagt tccagattgt tttgggaatt ccgacggggt tactaacaat 2280
ggaatgcttg aaaaagagga taatgggggt aggaacaatg ggtctttctt gactgtggga 2340
tatcaaatat tggtgaataa cttgcctgga ggaaatctca ctatggagtc ggtcaacacc 2400
attaactctt tcgtctcccg tactctggat ggtatcaaaa ctattttccg gtgcaattaa 2460
<210> 9
<211> 749
<212> PRT
<213> 茄子(Solanum melongena)
<400> 9
Met Ser Phe Gly Gly Phe Ile Gly Ser Ser Ser Gly Gly Lys Gly Ser
1 5 10 15
Asp Gly Gly Ser Ser Gly Val Ser Arg Leu Val Ala Asp Ser Ser Tyr
20 25 30
Glu Ala Met Pro Thr Ala Thr Ile Ala Gln Ser Gln Leu Ile Thr Ser
35 40 45
Ser Leu Pro His Ser Met Phe Asn Ser Ser Pro Leu Ser Leu Ala Leu
50 55 60
Lys Pro Lys Met Glu Gly Ala Gly Asp Val Asn Phe Asp Ala Val Ala
65 70 75 80
Met Gly Arg Thr Ser Arg Asp Asp Asp Tyr Glu Ser Ser Ser Phe Lys
85 90 95
Glu Asn Pro His Pro Asp Glu Lys Ala Arg Leu Glu Leu Gly Lys Arg
100 105 110
Leu Ser Leu Glu Ser Arg Gln Thr Gln Met Glu Arg His Glu Asn Ser
115 120 125
Met Leu Lys Gln Glu Asn Asp Lys Leu Arg Ile Glu Asn Ile Ala Met
130 135 140
Lys Glu Ala Met Arg Asn Pro Ala Cys Pro His Cys Gly Gly Pro Ala
145 150 155 160
Ile Leu Gly Glu Ile His Ile Glu Glu His His Leu Lys Ile Glu Asn
165 170 175
Ala Arg Leu Arg Asp Glu Tyr Asn Arg Ile Cys Ala Val Ala Asn Lys
180 185 190
Phe Leu Gly Arg Pro Leu Glu Thr Phe His Ala Pro Ala Pro Met Pro
195 200 205
Ala Gly Met Ala Asn Ser Ala Leu Glu Leu Ala Val Gly Arg Asn Gly
210 215 220
Phe Gly Ala Met Ser Ser Val Asp Thr Ala Leu Pro Met Gly Leu Asn
225 230 235 240
Phe Gly Asn Gly Ile Ser Ile Ser Pro Arg Pro Thr Pro Asn Met Ala
245 250 255
Gly Val Asp Val Ser Tyr Asp Lys Asn Met Leu Ile Glu Leu Ala Phe
260 265 270
Val Ser Met Ala Glu Leu Ile Lys Leu Ala Asp Ile Gly Gly Pro Leu
275 280 285
Trp Leu Arg Asn Phe Asp Gly Ser Ala Glu Glu Leu Asn Leu Glu Glu
290 295 300
Tyr Ala Arg Ser Phe Pro Pro Cys Ile Gly Met Lys Pro Ala His Phe
305 310 315 320
Thr Ala Glu Ala Thr Lys Ala Ala Gly Thr Val Met Ile Asn Ser Leu
325 330 335
Ala Leu Val Glu Ser Leu Met Asp Thr Ser Arg Trp Met Asp Ile Phe
340 345 350
Ser Ser Ile Val Gly Arg Ser Ser Thr Met Asn Val Ile Ser Asn Ser
355 360 365
Ser Gly Gly Ser Lys Asp Gly Asn Leu Leu Leu Ile Gln Ala Glu Phe
370 375 380
Gln Val Pro Ser Ala Leu Val Pro Val Arg Gln Val Lys Phe Leu Arg
385 390 395 400
Phe Cys Lys Gln His Ala Glu Gly Val Trp Val Val Val Asp Val Ser
405 410 415
Ile Asp Ala Ile Gln Glu Gly Ser Gln Pro Arg Glu Ala Gly Asn Cys
420 425 430
Arg Arg Leu Pro Ser Gly Cys Ile Val Gln Asp Leu Pro Asn Gly Tyr
435 440 445
Ser Lys Val Ile Trp Ile Glu His Thr Glu Tyr Asp Glu Ser Thr Ile
450 455 460
His Asn Tyr Cys Arg Pro Tyr Ile Arg Ser Gly Leu Gly Phe Gly Ala
465 470 475 480
Gln Arg Trp Ile Ala Thr Leu Gln Arg Gln Cys Glu Phe Leu Ala Val
485 490 495
Ile Met Ser Ser Ala Val Pro Ser Gly Asp Asn Ser Val Val Ser Pro
500 505 510
Asn Gly Arg Arg Ser Ile Ala Met Leu Ala Arg Arg Val Thr Arg Asn
515 520 525
Phe Cys Ser Gly Val Cys Ser Thr Tyr Tyr Lys Trp Glu Pro Ile Gln
530 535 540
Ser Gly Ser Ala Glu Glu Ser Lys Leu Ile Met Arg Lys Ala Ile Gly
545 550 555 560
Glu Pro Gly Asp Pro His Gly Met Val Leu Ser Ala Ser Arg Thr Leu
565 570 575
Trp Leu Pro Val Thr His Lys Arg Leu Phe Asp Phe Leu Arg Asn Glu
580 585 590
Gln Thr Arg Ser Gln Trp Asp Val Leu Ser His Gly Gly Ser Met His
595 600 605
Pro Ile Val His Ile Ala Lys Gly Gln Asp Leu Gly Asn Ser Ile Ser
610 615 620
Leu Phe Arg Thr Asn Val Thr Asp Gly Asp Gly Asn Gln Asn Ser Leu
625 630 635 640
Leu Thr Leu Gln Glu Ser Cys Thr Asp Val Ser Gly Ser Ile Ile Ala
645 650 655
Tyr Thr Ser Leu Asp Thr Gly Asp Met Asn Val Val Met Asn Gly Gly
660 665 670
Asp Ser Ser Cys Val Ala Phe Leu Pro Ser Gly Leu Ala Ile Val Pro
675 680 685
Asp Cys Tyr Glu Asn Ser Asn Ser Glu Ser Glu Gly Arg Ser Asn Gly
690 695 700
Ser Leu Leu Thr Val Ala Phe Gln Ile Leu Val Asn Ser Leu Pro Ser
705 710 715 720
Gly Asn Leu Thr Met Asp Ser Val Asn Thr Val Asn Thr Leu Ile Asn
725 730 735
Arg Thr Val Gln Asn Ile Lys Ile Ala Phe Gln Cys Asn
740 745
<210> 10
<211> 2250
<212> DNA
<213> 茄子(Solanum melongena)
<400> 10
atgagttttg gaggtttcat tgggagtagt agtggaggaa aaggcagtga cggtggtagt 60
tctggggttt caagattggt ggctgatagt tcgtacgaag ccatgcctac tgctactatt 120
gctcagtcac aacttatcac atcatcttta ccccattcaa tgtttaactc ttccccgtta 180
tctcttgcgc ttaaaccaaa gatggaaggt gctggtgacg tgaatttcga tgctgttgcg 240
atgggaagga cctccagaga cgatgactat gagagcagtt cttttaagga gaatccacac 300
cctgatgaga aagcaagact tgaacttggt aagagactat cactggaaag caggcagacc 360
cagatggaac ggcatgagaa ttcgatgctg aaacaagaaa acgataagct ccgtattgaa 420
aacatagcga tgaaggaagc tatgaggaac ccagcttgcc cacattgtgg tggtccagcg 480
attctcgggg agatacatat tgaggagcac catctaaaga tagagaatgc ccgcctaaga 540
gacgaatata ataggatatg cgctgtggcc aataaattct tgggaaggcc tttggaaact 600
ttccatgctc ctgctccaat gccagctggg atggctaatt ctgctctgga gcttgctgtg 660
ggaagaaatg gctttggtgc tatgagctct gttgacactg cattgccaat gggacttaat 720
tttggcaatg gtatctcaat ttcccctagg cccaccccca acatggctgg tgtagatgta 780
tcctatgata agaacatgtt aatagagctt gcttttgttt ccatggctga gctgattaag 840
ctggccgata ttggtggtcc tctgtggctt agaaactttg atggaagtgc agaagaattg 900
aaccttgagg agtatgctag gtctttccct ccatgtattg gcatgaaacc cgcccacttc 960
acagctgaag caacaaaggc agctggtaca gtgatgatca acagtctggc cttggtggag 1020
agtctgatgg acacaagtcg atggatggat atattctcaa gtattgttgg cagaagctct 1080
acaatgaatg tgatctctaa cagctcaggt ggaagcaagg atggcaattt gctcttgatc 1140
caagctgagt tccaagttcc gtctgcttta gttcctgtcc gtcaagtaaa gtttctacgc 1200
ttctgcaagc aacacgctga aggtgtctgg gtagtggtgg atgtatctat tgatgctatc 1260
caagaaggtt cacaaccgcg tgaagctgga aactgcagga gactcccttc tggatgtatt 1320
gtgcaagact tgcccaatgg gtactccaag gttatttgga ttgagcacac ggaatatgat 1380
gagagtacca tccacaatta ctgccgccct tacatcaggt ctggcctggg ctttggtgcc 1440
cagcggtgga ttgccaccct acaaaggcaa tgcgagttct tggcagtcat catgtcttct 1500
gctgtgccca gtggtgataa ttcagttgtt agtcccaatg gtcggagaag tattgcaatg 1560
ctggctcgac gcgtaactcg caacttttgc agtggggttt gttcaaccta ttacaagtgg 1620
gaaccaatcc aatcagggtc tgcagaggag agtaagttga ttatgaggaa ggctattggt 1680
gaacctggtg accctcatgg tatggtgttg agtgcctcca ggaccctctg gctgccggtg 1740
acacataagc gtttgtttga cttccttcga aatgaacaaa caagaagtca atgggatgtg 1800
ttgtcccatg gtggttccat gcacccaata gtccacattg ccaagggtca ggatcttggc 1860
aacagcatct ctctgttccg cactaatgtg actgatggcg atggcaatca aaatagtctc 1920
ttgaccttgc aggagtcgtg cacggatgta tccggttcca ttatagcata tacatccctt 1980
gatactggag atatgaatgt tgtgatgaat ggtggagact cttcctgcgt ggcgttcctt 2040
ccatcaggac ttgctattgt tccagattgt tacgagaact cgaacagtga aagtgagggt 2100
aggagtaatg ggtctctgtt gacggttgca ttccaaattt tagtgaacag cctgccttca 2160
ggaaatctga cgatggattc ggtgaacact gtgaacaccc tcatcaaccg tacagtgcaa 2220
aatatcaaga ttgcattcca gtgcaattaa 2250
<210> 11
<211> 807
<212> PRT
<213> 潘那利番茄(Solanum pennellii)
<400> 11
Met Ser Phe Gly Gly Phe Ile Gly Ser Ser Ser Gly Gly Asn Gly Gly
1 5 10 15
Gly Val Ser Arg Leu Val Gly Asp Thr Ser Tyr Glu Ala Met Pro Thr
20 25 30
Ala Thr Met Ala Gln Ser Gln Leu Ile Thr Ser Ser Leu Ser His Ser
35 40 45
Met Phe Asn Ser Ser Pro Leu Ser Leu Ala Leu Lys Pro Lys Met Glu
50 55 60
Gly Ser Gly Asp Leu Ser Phe Asp Gly Met Gly Arg Asn Ser Arg Asp
65 70 75 80
Asp Glu Tyr Glu Ser Arg Ser Gly Thr Gly Ser Asp Asn Phe Asp Gly
85 90 95
Ile Gly Ser Gly Asp Glu Ile Glu Thr His Ile Gly Ser Ser Ser Lys
100 105 110
Ser Ala Lys Lys Tyr His Arg His Thr Pro Tyr Gln Ile Gln Glu Leu
115 120 125
Glu Ala Cys Phe Lys Glu Asn Pro His Pro Asp Glu Lys Ala Arg Leu
130 135 140
Glu Leu Gly Lys Arg Leu Thr Leu Glu Ser Arg Gln Val Lys Phe Trp
145 150 155 160
Phe Gln Asn Arg Arg Thr Gln Met Lys Thr Gln Met Glu Arg His Glu
165 170 175
Asn Ser Met Leu Lys Gln Glu Asn Asp Lys Leu Arg Ile Glu Asn Ile
180 185 190
Ala Met Lys Glu Ala Met Arg Ser Pro Ala Cys Pro His Cys Gly Gly
195 200 205
Gln Ala Ile Phe Gly Glu Ile His Ile Glu Glu His His Leu Lys Ile
210 215 220
Glu Asn Ala Arg Leu Arg Asp Glu Tyr Ser Arg Ile Cys Val Val Ala
225 230 235 240
Asn Lys Phe Leu Gly Arg Gln Val Glu Ser Val His Gly Pro Met Ser
245 250 255
Ala Gly Met Ala Asn Ser Gly Leu Glu Leu Ala Val Gly Arg Asn Gly
260 265 270
Tyr Gly Ala Met Ser Ser Val Asp Thr Ala Leu Pro Met Gly Leu Asn
275 280 285
Phe Gly Asn Asn Phe Ser Ser Ala Leu Pro Ala Ile Ser Pro Arg Pro
290 295 300
Ala Leu Ser Met Ala Gly Val Asp Val Ser Phe Asp Arg Asn Met Leu
305 310 315 320
Met Glu Leu Ala Phe Ala Ser Met Asn Glu Leu Ile Lys Leu Ala Asp
325 330 335
Ile Gly Ala Pro Leu Trp Leu Gly Asn Phe Asp Gly Thr Ala Glu Val
340 345 350
Leu Asn Leu Glu Glu Tyr Ala Arg Ser Phe Pro Pro Cys Ile Gly Ile
355 360 365
Lys Pro Ala His Leu Thr Ala Glu Ala Thr Lys Ala Thr Gly Thr Val
370 375 380
Met Ile Asn Ser Leu Thr Leu Val Glu Thr Leu Met Asp Thr Ser Arg
385 390 395 400
Trp Met Asp Ile Phe Ser Cys Ile Val Gly Lys Thr Ser Thr Ile Asn
405 410 415
Val Ile Ser Asn Ser Ser Gly Gly Ser Lys Asp Gly Asn Met Gln Leu
420 425 430
Ile Gln Ala Glu Phe Gln Val Pro Ser Ala Leu Val Pro Val Arg Arg
435 440 445
Val Lys Phe Leu Arg Phe Cys Lys Gln His Ala Glu Gly Val Trp Val
450 455 460
Met Val Asp Val Ser Ile Asp Ala Ile Gln Glu Gly Pro Leu Pro Leu
465 470 475 480
Asp Gly Ser Cys Arg Arg Leu Pro Ser Gly Cys Ile Val Gln Glu Leu
485 490 495
Pro Asn Gly Cys Ser Lys Val Ile Trp Ile Glu His Met Glu Tyr Asp
500 505 510
Glu Ser Val Val His Asn Tyr Tyr His Pro Tyr Ile Arg Ser Gly Leu
515 520 525
Gly Phe Gly Ala Gln Arg Trp Ile Ala Thr Leu Gln Arg Gln Cys Glu
530 535 540
Phe Leu Thr Ile Met Ser Ser Pro Val Pro Ser Gly Asp Asn Ser Val
545 550 555 560
Leu Thr Ser Ser Gly Arg Arg Ser Ile Ala Met Leu Ala Arg Arg Val
565 570 575
Ile Arg His Phe Cys Ile Gly Val Cys Ala Thr Tyr Tyr Asn Trp Glu
580 585 590
Ser Ile Gln Leu Gly Thr Ala Glu Glu Ser Lys Phe Ile Met Arg Lys
595 600 605
Gly Val Gly Glu Pro Gly Asp Leu Asn Gly Met Val Leu Ser Ala Ser
610 615 620
Arg Thr Leu Trp Leu Pro Ile Thr His Gln Arg Leu Phe Asp Phe Leu
625 630 635 640
Arg Asn Glu Gln Met Arg Gly Gln Trp Asp Val Leu Ser Gln Gly Gly
645 650 655
Ser Val His Arg Ile Val His Ile Ala Lys Gly Gln Asp Pro Gly Asn
660 665 670
Ser Ile Thr Leu Phe Arg Thr Thr Val Ala Asn Ser Asp Gly Ser Gln
675 680 685
Asn Ser Leu Leu Thr Leu Gln Glu Ser Cys Thr Asp Val Ser Gly Ser
690 695 700
Ile Ile Ala Tyr Ser Ser Leu Asn Thr Gly Asp Met Asn Ala Val Met
705 710 715 720
Asn Gly Gly Asp Ser Ser Cys Val Thr Phe Leu Pro Ser Gly Phe Ala
725 730 735
Ile Val Pro Asp Cys Tyr Glu Asn Ser Asn Gly Val Ala Gly Ile Gly
740 745 750
Thr Leu Glu Asn Gly Gly Lys Ile Asn Gly Cys Leu Leu Thr Met Gly
755 760 765
Tyr Gln Val Leu Met Ser Asn Pro Pro Thr Gly Asn Leu Thr Met Asp
770 775 780
Ser Val Asn Thr Val Asp Ser Leu Ile Thr Arg Thr Val Gln Asn Ile
785 790 795 800
Lys Leu Ala Phe Gln Cys Asn
805
<210> 12
<211> 2424
<212> DNA
<213> 潘那利番茄(Solanum pennellii)
<400> 12
atgagttttg gaggttttat tggaagtagt agcggaggaa acggtggtgg ggtttcaaga 60
ttggtgggtg atacttcata cgaagccatg cctactgcta ctatggctca gtcacagctt 120
atcacatcat ctttatctca ttcaatgttt aactcttcac cgttatctct tgctcttaaa 180
ccgaaaatgg aaggttctgg tgatttgagc tttgatggaa tgggaaggaa ctccagagat 240
gatgagtacg agagcaggtc cgggactggg agtgacaact ttgatggtat tggatcgggt 300
gatgaaattg aaactcacat tggtagctca tccaaatcgg caaagaagta ccataggcac 360
actccatacc aaatccaaga gctggaggct tgctttaagg agaatccaca cccggatgag 420
aaagcaaggc tggaacttgg taagaggttg acattggaaa gcaggcaggt taagttttgg 480
ttccagaaca ggagaaccca aatgaagacc cagatggagc gtcatgaaaa ttcaatgttg 540
aagcaagaga atgataagct tcgcattgag aacatagcga tgaaggaagc gatgagaagc 600
ccagcttgcc cacattgtgg tggtcaggca atttttggtg agatacacat tgaagagcat 660
catttgaaga ttgagaatgc tcggctgaga gatgaataca gtaggatctg tgttgtggca 720
aacaagtttc tgggtaggca ggtggaatct gtccatggtc caatgtcagc tggaatggct 780
aattcaggtt tggaacttgc tgtgggaaga aacggctatg gtgctatgag ttctgttgac 840
actgcattgc caatgggtct taattttggc aataatttct caagtgctct accagctatt 900
tcacctaggc ccgccctgag catggccggt gtagatgtat cctttgatag gaacatgcta 960
atggagcttg cttttgcttc catgaatgag ctgattaagc tggctgatat cggtgctcct 1020
ctgtggcttg gaaactttga tggaactgct gaagtattga accttgagga gtatgccagg 1080
tcttttcctc catgtattgg cattaaacct gcccatttga cagcagaagc aaccaaggca 1140
actggtactg tgatgattaa cagtctgacc ttggtggaga ctctgatgga cacaagtcga 1200
tggatggata tattttcatg cattgttggc aaaacctcta caattaatgt gatctccaac 1260
agctcaggtg gaagcaagga tggcaatatg cagttgatcc aagctgagtt ccaagttcct 1320
tctgctttag ttcctgtccg tcgagtgaag tttctacgct tctgcaagca gcatgctgaa 1380
ggtgtctggg tgatggtgga tgtgtctatt gatgctattc aggaaggtcc actaccgctt 1440
gatggaagtt gcaggaggct tccttcggga tgtatcgtgc aagagttgcc caatgggtgc 1500
tccaaggtta tttggattga gcacatggag tatgatgaga gtgtcgtcca caattactac 1560
cacccttaca tcaggtctgg cctggggttt ggtgcccaac ggtggatcgc caccctacaa 1620
aggcaatgcg agttcttgac aatcatgtct tctcctgtgc ccagtggtga taattcagtg 1680
cttacttcca gtggacggag aagtattgcg atgcttgctc gacgcgtgat tcgccacttt 1740
tgcattggtg tttgtgcaac ctattacaac tgggaatcaa tccaactagg gactgcagag 1800
gagagtaagt ttattatgag gaagggcgtt ggtgaacctg gtgaccttaa tggtatggtg 1860
ttgagtgcca gcaggaccct ctggctgccg ataacacatc aacgtttgtt tgacttcctg 1920
agaaatgaac agatgagagg tcaatgggat gtgttgtccc agggtggttc cgtgcaccga 1980
atagtccaca ttgccaaggg tcaggatcct ggcaatagca tcactctgtt tcgtactact 2040
gtggctaaca gcgatggtag ccaaaacagc ttgctgacct tgcaagagtc gtgcacagat 2100
gtatctggtt cgatcatagc atattcatca cttaataccg gagacatgaa tgctgtgatg 2160
aatggtggag attcctcctg cgtgacgttc cttccatctg gattcgccat tgttccagat 2220
tgttacgaga attccaacgg ggtagctggc attggaacac tggagaatgg tggtaagatt 2280
aatgggtgcc tattgaccat gggataccag gtactcatga gtaacccgcc tacaggaaat 2340
ctcactatgg attcagtgaa cactgttgac tccctcatca cccgtacagt gcagaacatc 2400
aagcttgctt tccagtgcaa ttaa 2424
<210> 13
<211> 824
<212> PRT
<213> 番茄(Solanum lycopersicum)
<400> 13
Met Ser Phe Gly Gly Phe Ile Gly Ser Ser Ser Gly Gly Asn Gly Gly
1 5 10 15
Gly Val Ser Arg Leu Val Gly Asp Thr Ser Tyr Glu Ala Met Pro Thr
20 25 30
Ala Thr Met Ala Gln Ser Gln Leu Ile Thr Ser Ser Leu Ser His Ser
35 40 45
Met Phe Asn Ser Ser Pro Leu Ser Leu Ala Leu Lys Pro Lys Met Glu
50 55 60
Gly Ser Gly Asp Leu Ser Phe Asp Gly Met Gly Arg Asn Ser Arg Asp
65 70 75 80
Asp Glu Tyr Glu Ser Arg Ser Gly Thr Gly Ser Asp Asn Phe Asp Gly
85 90 95
Val Gly Ser Gly Asp Glu Ile Glu Thr His Ile Gly Ser Ser Ser Lys
100 105 110
Ser Ala Lys Lys Tyr His Arg His Thr Pro Tyr Gln Ile Gln Glu Leu
115 120 125
Glu Ala Phe Phe Lys Glu Ser Pro His Pro Asp Glu Lys Ala Arg Leu
130 135 140
Glu Leu Gly Lys Arg Leu Thr Leu Glu Ser Arg Gln Val Lys Phe Trp
145 150 155 160
Phe Gln Asn Arg Arg Thr Gln Met Lys Thr Gln Met Glu Arg His Glu
165 170 175
Asn Ser Met Leu Lys Gln Glu Asn Asp Lys Leu Arg Ile Glu Asn Ile
180 185 190
Ala Met Lys Glu Ala Met Arg Ser Pro Ala Cys Pro His Cys Gly Gly
195 200 205
Gln Ala Ile Leu Gly Glu Ile His Ile Glu Glu His His Leu Lys Ile
210 215 220
Glu Asn Ala Arg Leu Arg Asp Glu Tyr Ser Arg Ile Cys Val Val Ala
225 230 235 240
Asn Lys Phe Leu Gly Arg Gln Val Glu Ser Val His Gly Pro Met Ser
245 250 255
Ala Gly Met Ala Asn Ser Gly Leu Glu Leu Ala Val Gly Arg Asn Gly
260 265 270
Tyr Gly Ala Met Asn Ser Val Asp Thr Ala Leu Pro Met Gly Leu Asn
275 280 285
Phe Gly Asn Asn Phe Ser Ser Ala Leu Pro Ala Ile Ser Pro Arg Pro
290 295 300
Ala Leu Ser Met Ala Gly Val Asp Val Ser Phe Asp Arg Asn Met Leu
305 310 315 320
Met Glu Leu Ala Phe Ala Ser Met Asn Glu Leu Ile Lys Leu Ala Asp
325 330 335
Ile Gly Ala Pro Leu Trp Leu Gly Asn Phe Asp Gly Thr Ala Glu Val
340 345 350
Leu Asn Leu Glu Glu Tyr Ala Arg Ser Phe Pro Pro Cys Ile Gly Ile
355 360 365
Lys Pro Ala His Phe Thr Ala Glu Ala Thr Lys Ala Thr Gly Thr Val
370 375 380
Met Ile Asn Ser Leu Thr Leu Val Glu Thr Leu Met Asp Thr Ser Arg
385 390 395 400
Trp Met Asp Ile Phe Ser Cys Ile Val Gly Lys Thr Ser Thr Ile Asn
405 410 415
Val Ile Ser Asn Ser Ser Gly Gly Ser Lys Asp Gly Asn Met Gln Leu
420 425 430
Val Arg Tyr Cys Tyr Phe Gly Gly Ser Arg Pro Phe Tyr Asn Val Leu
435 440 445
Gln Ile Gln Ala Glu Phe Gln Val Pro Ser Ala Leu Val Pro Val Arg
450 455 460
Arg Val Lys Phe Leu Arg Phe Cys Lys Gln His Ala Glu Gly Val Trp
465 470 475 480
Val Met Val Asp Val Ser Ile Asp Ala Ile Gln Glu Gly Pro Val Pro
485 490 495
Leu Asp Gly Ser Cys Arg Arg Leu Pro Ser Gly Cys Ile Val Gln Glu
500 505 510
Leu Pro Asn Gly Cys Ser Lys Val Ile Trp Ile Glu His Met Glu Tyr
515 520 525
Asp Glu Ser Val Thr His Asn Tyr Tyr His Pro Tyr Ile Arg Ser Gly
530 535 540
Leu Gly Phe Gly Ala Gln Arg Trp Ile Ala Thr Leu Gln Arg Gln Cys
545 550 555 560
Glu Phe Ile Thr Val Met Ser Ser Pro Val Pro Ser Gly Asp Asn Ser
565 570 575
Val Leu Ser Ser Ser Gly Arg Arg Ser Ile Ala Met Leu Ala Arg Arg
580 585 590
Val Thr Arg His Phe Cys Asn Gly Val Cys Ala Thr Tyr Tyr Lys Trp
595 600 605
Glu Ser Ile Gln Leu Gly Thr Ala Glu Glu Ser Lys Phe Ile Met Arg
610 615 620
Lys Gly Val Gly Glu Pro Gly Asp Leu Asn Gly Met Val Leu Ser Ala
625 630 635 640
Ser Arg Thr Leu Trp Leu Pro Ile Thr His Glu Arg Leu Ser Asp Phe
645 650 655
Leu Arg Asn Glu Gln Thr Arg Gly Gln Trp Asp Val Leu Ser Gln Gly
660 665 670
Gly Ser Val His Arg Ile Val His Ile Ala Lys Gly Gln Asp Pro Gly
675 680 685
Asn Ser Ile Thr Leu Phe Arg Thr Thr Val Ala Asn Ser Asp Gly Ser
690 695 700
Gln Asn Gly Leu Leu Thr Leu Gln Glu Ser Cys Thr Asp Val Ser Gly
705 710 715 720
Ser Ile Ile Ala Tyr Thr Ser Leu Asn Thr Gly Asp Met Asn Gly Val
725 730 735
Met Asn Gly Gly Asp Ser Ser Cys Val Thr Phe Leu Pro Ser Gly Phe
740 745 750
Ala Met Val Pro Asp Cys Tyr Glu Asn Ser Asn Gly Val Ala Gly Ile
755 760 765
Gly Thr Leu Glu Asn Gly Gly Lys Met Asn Gly Cys Leu Leu Thr Met
770 775 780
Gly Tyr Gln Val Leu Met Ser Asn Pro Pro Thr Gly Asn Leu Thr Met
785 790 795 800
Asp Ser Val Asn Thr Val Asp Ser Leu Ile Thr Arg Thr Val His Asn
805 810 815
Ile Lys Leu Ala Phe Gln Cys Asn
820
<210> 14
<211> 2475
<212> DNA
<213> 番茄(Solanum lycopersicum)
<400> 14
atgagttttg gaggttttat tggaagtagt agtggaggaa acggtggtgg ggtttcaaga 60
ttggtgggtg atacttcata cgaagccatg cctactgcta ctatggctca gtcacagctt 120
atcacatcat ctttatctca ttcaatgttt aactcttcac cgttatctct tgctcttaaa 180
ccgaaaatgg aaggttctgg tgatttaagc tttgatggaa tgggaaggaa ctccagagat 240
gatgagtacg agagcaggtc tgggactggg agtgacaact ttgatggcgt tggatcgggt 300
gatgaaattg aaactcacat tggtagctca tccaaatcgg caaagaagta ccataggcat 360
actccatacc aaatccaaga gctggaggct ttctttaagg agagtccaca cccggatgag 420
aaagcaaggc tggaacttgg taagaggttg acattggaaa gcaggcaggt taagttctgg 480
ttccagaaca ggagaaccca aatgaagact cagatggagc gtcatgaaaa ttcaatgttg 540
aagcaagaga atgataagct tcgcattgag aacatagcga tgaaggaagc gatgagaagc 600
ccagcttgcc cacattgtgg tggtcaggca attcttgggg agatacacat tgaagagcat 660
catttgaaga ttgagaatgc tcggctgaga gatgaataca gtaggatctg tgttgttgca 720
aacaagtttc tgggtaggca ggtggaatct gtccatggtc caatgtcagc tggaatggct 780
aattcaggtt tggaacttgc tgtgggaaga aacggctatg gtgctatgaa ttctgttgac 840
actgcattgc caatgggtct taattttggc aataatttct caagtgctct accagctatt 900
tcacctaggc ccgccctgag catggccggt gtagatgtat cctttgatag gaacatgcta 960
atggagcttg cttttgcttc catgaatgag ctgattaagc tggctgatat cggtgctcct 1020
ctgtggcttg gaaactttga tggaactgct gaagtattga accttgagga gtatgccagg 1080
tcttttcctc catgtattgg cattaaacct gcccatttca cagcagaagc aaccaaggca 1140
actggtactg tgatgattaa cagtctgacc ttggtggaga ctctgatgga cacaagtcga 1200
tggatggata tattttcatg cattgttggc aaaacctcta caattaatgt gatctccaac 1260
agctcaggtg gaagcaagga tggcaatatg caattggtac gttattgtta ttttggtgga 1320
agtcgcccat tctataatgt tttgcagatc caagctgagt tccaagttcc ttctgcttta 1380
gttcctgtcc gtcgagtgaa gtttctacgc ttctgcaagc agcatgctga aggtgtctgg 1440
gtgatggtgg atgtgtctat tgatgctatc caggaaggtc cagtaccgct tgatggaagt 1500
tgcaggaggc ttccttcggg atgtatcgtg caagagttgc ccaatgggtg ctccaaggtt 1560
atttggattg agcacatgga gtatgatgag agtgtcaccc acaattacta ccacccttac 1620
atcaggtctg ggctggggtt tggtgcccaa cggtggatcg ccaccctaca aaggcaatgc 1680
gagttcataa cagtcatgtc ttctcctgtg cccagtggtg ataattcagt gcttagttcc 1740
agtggacgga gaagtattgc gatgcttgct cgacgcgtta ctcgccactt ttgcaatggt 1800
gtttgtgcaa cctattacaa gtgggaatca atccaactgg ggactgcaga ggagagcaag 1860
tttattatga ggaagggcgt tggtgaacct ggcgacctta atggtatggt gttgagtgcc 1920
agcaggaccc tctggctgcc gataacacat gaacgtttgt ctgacttcct gcgaaatgaa 1980
cagacgagag gtcaatggga tgtgttgtcc cagggtggtt ccgtgcaccg aatagtccac 2040
attgccaagg gtcaggatcc tggcaatagc atcactctgt ttcgtactac tgtggctaac 2100
agcgatggta gccaaaacgg tttgctgacc ttgcaagagt cgtgcacaga tgtatctggt 2160
tcgatcatag catatacatc acttaatacc ggagacatga atggtgtgat gaatggtggc 2220
gattcctcct gcgtgacgtt ccttccatct ggattcgcca tggttccaga ttgttacgag 2280
aattccaacg gggtagctgg catcggaaca ctggagaacg gtggtaagat gaatgggtgt 2340
ctattgacca tgggatacca ggtactcatg agtaacccgc ctacaggcaa tctcactatg 2400
gattctgtca acactgttga ctctctcatc acccgtacag tgcacaacat caagcttgct 2460
ttccagtgca attaa 2475
Claims (11)
1.一种生产种子败育型果实的方法,所述方法包括使野生型SSPER-1基因的突变等位基因纯合的辣椒植物生长并收获由所述植物产生的果实,其中所述野生型SSPER-1基因编码具有SEQ ID NO: 1的氨基酸序列的蛋白,其中所述突变等位基因编码与野生型蛋白相比功能丧失的截短蛋白,并且其中所述突变等位基因的序列为SEQ ID NO: 4。
2.根据权利要求1所述的方法,其中所述植物是近交植物、双单倍体植物或杂种植物。
3.一种鉴别和/或选择包含SSPER-1基因的突变等位基因的辣椒植物或植物部分的方法,包括确定所述植物或植物部分是否包含SSPER-1基因的突变等位基因,其中所述突变等位基因编码与野生型蛋白相比功能丧失的截短蛋白,并且其中所述突变等位基因的序列为SEQ ID NO: 4,以及任选地选择包含SSPER-1基因的突变等位基因的至少一个拷贝的植物或植物部分,其中所述突变等位基因当以纯合形式存在时,引起种子败育型的果实形成,其中野生型SSPER-1基因编码具有SEQ ID NO: 1的氨基酸序列的蛋白。
4.根据权利要求3所述的方法,其中在确定所述植物或植物部分是否包含SSPER-1基因的突变等位基因之前,对所述植物或植物部分进行突变诱导步骤。
5.一种生产辣椒植物的方法,所述植物在其基因组中包含SSPER-1基因的突变等位基因的至少一个拷贝,其中所述突变等位基因当以纯合形式存在时,引起种子败育型的果实形成,所述方法包括以下步骤:
(i) 使第一辣椒植物和第二辣椒植物杂交,其中所述第一辣椒植物是在其基因组中包含野生型SSPER-1基因的突变等位基因的至少一个拷贝的植物,其中所述野生型SSPER-1基因编码具有SEQ ID NO: 1的氨基酸序列的蛋白,其中所述突变等位基因编码与野生型蛋白相比功能丧失的截短蛋白,并且其中所述突变等位基因的序列为SEQ ID NO: 4;
(ii) 任选地从(i)的杂交收获种子,并选择在基因组中包含所述SSPER-1基因的突变等位基因的至少一个拷贝的种子。
6.根据权利要求5所述的方法,其中在步骤(i)中,所述第一辣椒植物和所述第二辣椒植物都是包含权利要求5所限定的所述SSPER-1基因的突变等位基因的至少一个拷贝的植物。
7.在其基因组中包含野生型SSPER-1基因的突变等位基因的至少一个拷贝的辣椒植物作为食用作物的用途,其中所述突变等位基因当以纯合形式存在时,引起种子败育型的果实形成,其中所述野生型SSPER-1基因编码具有SEQ ID NO: 1的氨基酸序列的蛋白,其中所述突变等位基因编码与野生型蛋白相比功能丧失的截短蛋白,并且其中所述突变等位基因的序列为SEQ ID NO: 4。
8.在其基因组中包含野生型SSPER-1基因的突变等位基因的至少一个拷贝的辣椒植物作为繁殖材料来源的用途,其中所述突变等位基因当以纯合形式存在时,引起种子败育型的果实形成,其中所述野生型SSPER-1基因编码具有SEQ ID NO: 1的氨基酸序列的蛋白,其中所述突变等位基因编码与野生型蛋白相比功能丧失的截短蛋白,并且其中所述突变等位基因的序列为SEQ ID NO: 4。
9.根据权利要求7或8所述的用途,其中所述辣椒植物对于突变等位基因是纯合的。
10.根据权利要求7或8所述的用途,其中所述辣椒植物是近交植物、双单倍体植物或杂种植物。
11.根据权利要求9所述的用途,其中所述辣椒植物是近交植物、双单倍体植物或杂种植物。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18212422.2 | 2018-12-13 | ||
EP18212422 | 2018-12-13 | ||
PCT/EP2019/083605 WO2020120242A1 (en) | 2018-12-13 | 2019-12-04 | Solanaceous plant capable of stenospermocarpic fruit formation |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113365494A CN113365494A (zh) | 2021-09-07 |
CN113365494B true CN113365494B (zh) | 2023-12-15 |
Family
ID=64665481
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980090949.6A Active CN113365494B (zh) | 2018-12-13 | 2019-12-04 | 能够发生种子败育型的果实形成的茄子科植物 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20220053731A1 (zh) |
EP (1) | EP3893631A1 (zh) |
JP (1) | JP2022513467A (zh) |
KR (1) | KR20210100689A (zh) |
CN (1) | CN113365494B (zh) |
AU (1) | AU2019398268A1 (zh) |
CA (1) | CA3121350A1 (zh) |
IL (1) | IL283872A (zh) |
MX (1) | MX2021007009A (zh) |
WO (1) | WO2020120242A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112753581A (zh) * | 2021-02-04 | 2021-05-07 | 公孙国林 | 一种阿福花科十二卷属多肉植物多倍体植株培育配方 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170188535A1 (en) * | 2011-11-22 | 2017-07-06 | Seminis Vegetable Seeds, Inc. | Seedless pepper plants |
CN109476715A (zh) * | 2016-05-26 | 2019-03-15 | 纽海姆有限公司 | 产无籽果实的植物 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU672760B2 (en) | 1991-09-24 | 1996-10-17 | Keygene N.V. | Selective restriction fragment amplification: a general method for DNA fingerprinting |
US6060648A (en) | 1997-10-27 | 2000-05-09 | Seminis Vegetable Seeds, Inc. | Seedless tomatoes and method for making the same |
IL183902A0 (en) | 2007-06-13 | 2007-10-31 | Zeraim Gedera Ltd | Parthenocarpic pepper |
US8957286B2 (en) | 2008-02-05 | 2015-02-17 | Syngenta Participations Ag | Plant capable of bearing seedless fruits and method of producing variety bearing seedless fruits |
NL2005908C2 (en) | 2010-12-22 | 2012-06-28 | Rijk Zwaan Zaadteelt En Zaadhandel Bv | Fruit formation in the absence of fertilisation. |
NL2014215B1 (en) | 2015-01-30 | 2016-10-12 | Rijk Zwaan Zaadteelt En Zaadhandel Bv | Modified gene resulting in parthenocarpic fruit set. |
BR112018014902A2 (pt) | 2016-01-21 | 2018-12-18 | The State Of Israel Ministry Of Agriculture & Rural Development Agricultural Res Organization Aro Vo | plantas partenocárpicas do tipo solanácea, frutos e sementes de uma planta, produtos processados comestíveis, métodos de produção e de reprodução de uma planta, |
CN107254478B (zh) * | 2017-06-23 | 2020-07-10 | 山西大学 | 番茄sllcd基因及其应用 |
-
2019
- 2019-12-04 US US17/413,448 patent/US20220053731A1/en active Pending
- 2019-12-04 WO PCT/EP2019/083605 patent/WO2020120242A1/en unknown
- 2019-12-04 CN CN201980090949.6A patent/CN113365494B/zh active Active
- 2019-12-04 CA CA3121350A patent/CA3121350A1/en active Pending
- 2019-12-04 EP EP19813008.0A patent/EP3893631A1/en active Pending
- 2019-12-04 AU AU2019398268A patent/AU2019398268A1/en active Pending
- 2019-12-04 KR KR1020217021385A patent/KR20210100689A/ko unknown
- 2019-12-04 MX MX2021007009A patent/MX2021007009A/es unknown
- 2019-12-04 JP JP2021533576A patent/JP2022513467A/ja active Pending
-
2021
- 2021-06-10 IL IL283872A patent/IL283872A/en unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170188535A1 (en) * | 2011-11-22 | 2017-07-06 | Seminis Vegetable Seeds, Inc. | Seedless pepper plants |
CN109476715A (zh) * | 2016-05-26 | 2019-03-15 | 纽海姆有限公司 | 产无籽果实的植物 |
Non-Patent Citations (2)
Title |
---|
延安发现无籽辣椒突变体;韦海忠;《长江蔬菜》;19961231(第4期);第40页 * |
辣椒新品种‘德红1 号’的选育;贺洪军等;《中国瓜菜》;20161231;第29卷(第3期);摘要和第22页左栏第1段 * |
Also Published As
Publication number | Publication date |
---|---|
EP3893631A1 (en) | 2021-10-20 |
US20220053731A1 (en) | 2022-02-24 |
CN113365494A (zh) | 2021-09-07 |
IL283872A (en) | 2021-07-29 |
WO2020120242A1 (en) | 2020-06-18 |
MX2021007009A (es) | 2021-07-21 |
AU2019398268A1 (en) | 2021-06-10 |
CA3121350A1 (en) | 2020-06-18 |
KR20210100689A (ko) | 2021-08-17 |
JP2022513467A (ja) | 2022-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10306851B2 (en) | Yield QTLs in cucumber plants | |
JP6723996B2 (ja) | キュウリ植物体の収量qtl | |
AU2017336342B2 (en) | Parthenocarpic watermelon plants | |
WO2019068647A1 (en) | TOTAL RESISTANCE TO THE MILDIOU IN THE BASIL | |
CN113365494B (zh) | 能够发生种子败育型的果实形成的茄子科植物 | |
US20230371453A1 (en) | Parthenocarpic watermelon plants | |
JP6866303B2 (ja) | キュウリ(Cucumis sativus)植物における収量QTLの遺伝子移入 | |
JP2023547548A (ja) | 単為結果性スイカ植物体 | |
US20220307045A1 (en) | Tomato plant producing fruit having improved ripening characteristics | |
JP2019511237A (ja) | Cucumis sativus植物における2つの収量QTLの遺伝子導入 | |
US20230189732A1 (en) | Didymella bryoniae internal fruit rot resistance in cucumis sativus plants | |
US20230404007A1 (en) | Parthenocarpic watermelon plants | |
CN116615098A (zh) | 单性结实西瓜植物 | |
OA21227A (en) | Parthenocarpic watermelon plants. | |
WO2018091438A1 (en) | Multibranching artichoke plant |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |