CN113416738A - 包含雄性育性序列的组合物和方法 - Google Patents
包含雄性育性序列的组合物和方法 Download PDFInfo
- Publication number
- CN113416738A CN113416738A CN202110682594.9A CN202110682594A CN113416738A CN 113416738 A CN113416738 A CN 113416738A CN 202110682594 A CN202110682594 A CN 202110682594A CN 113416738 A CN113416738 A CN 113416738A
- Authority
- CN
- China
- Prior art keywords
- plant
- polynucleotide
- leu
- gly
- val
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000035558 fertility Effects 0.000 title claims abstract description 176
- 238000000034 method Methods 0.000 title claims abstract description 85
- 239000000203 mixture Substances 0.000 title abstract description 16
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 270
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 270
- 239000002157 polynucleotide Substances 0.000 claims abstract description 270
- 230000014509 gene expression Effects 0.000 claims abstract description 97
- 230000000694 effects Effects 0.000 claims abstract description 36
- 241000196324 Embryophyta Species 0.000 claims description 315
- 108090000623 proteins and genes Proteins 0.000 claims description 152
- 240000008042 Zea mays Species 0.000 claims description 131
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 126
- 229920001184 polypeptide Polymers 0.000 claims description 95
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 95
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 95
- 235000021307 Triticum Nutrition 0.000 claims description 59
- 239000002773 nucleotide Substances 0.000 claims description 44
- 125000003729 nucleotide group Chemical group 0.000 claims description 44
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 claims description 27
- 235000009973 maize Nutrition 0.000 claims description 27
- 239000003550 marker Substances 0.000 claims description 22
- 230000015572 biosynthetic process Effects 0.000 claims description 20
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 19
- 240000007594 Oryza sativa Species 0.000 claims description 17
- 235000007164 Oryza sativa Nutrition 0.000 claims description 16
- 150000001413 amino acids Chemical class 0.000 claims description 16
- 230000001965 increasing effect Effects 0.000 claims description 14
- 235000009566 rice Nutrition 0.000 claims description 14
- 239000013598 vector Substances 0.000 claims description 13
- 235000011684 Sorghum saccharatum Nutrition 0.000 claims description 12
- 244000062793 Sorghum vulgare Species 0.000 claims description 11
- 230000012010 growth Effects 0.000 claims description 10
- 244000068988 Glycine max Species 0.000 claims description 9
- 235000010469 Glycine max Nutrition 0.000 claims description 8
- 240000006394 Sorghum bicolor Species 0.000 claims description 8
- 241000209140 Triticum Species 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 7
- 230000001939 inductive effect Effects 0.000 claims description 6
- 241000219194 Arabidopsis Species 0.000 claims description 5
- 235000003255 Carthamus tinctorius Nutrition 0.000 claims description 5
- 244000020518 Carthamus tinctorius Species 0.000 claims description 5
- 229920000742 Cotton Polymers 0.000 claims description 5
- 241000209510 Liliopsida Species 0.000 claims description 5
- 235000007238 Secale cereale Nutrition 0.000 claims description 5
- 235000019713 millet Nutrition 0.000 claims description 5
- 244000020551 Helianthus annuus Species 0.000 claims description 4
- 235000003222 Helianthus annuus Nutrition 0.000 claims description 4
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 claims description 4
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 4
- 244000061176 Nicotiana tabacum Species 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 4
- 240000000385 Brassica napus var. napus Species 0.000 claims description 3
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 3
- 240000005979 Hordeum vulgare Species 0.000 claims description 3
- 230000003115 biocidal effect Effects 0.000 claims description 3
- 241001233957 eudicotyledons Species 0.000 claims description 3
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 2
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 claims description 2
- 235000006008 Brassica napus var napus Nutrition 0.000 claims description 2
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 claims description 2
- 235000004977 Brassica sinapistrum Nutrition 0.000 claims description 2
- 108010031746 Dam methyltransferase Proteins 0.000 claims description 2
- 240000004658 Medicago sativa Species 0.000 claims description 2
- 240000000111 Saccharum officinarum Species 0.000 claims description 2
- 235000007201 Saccharum officinarum Nutrition 0.000 claims description 2
- 241000209056 Secale Species 0.000 claims description 2
- 230000000007 visual effect Effects 0.000 claims description 2
- 239000004382 Amylase Substances 0.000 claims 1
- 102000013142 Amylases Human genes 0.000 claims 1
- 108010065511 Amylases Proteins 0.000 claims 1
- 101000621371 Homo sapiens WD and tetratricopeptide repeats protein 1 Proteins 0.000 claims 1
- 101000892274 Human adenovirus C serotype 2 Adenovirus death protein Proteins 0.000 claims 1
- 101000820656 Rattus norvegicus Seminal vesicle secretory protein 4 Proteins 0.000 claims 1
- 235000019418 amylase Nutrition 0.000 claims 1
- 239000003242 anti bacterial agent Substances 0.000 claims 1
- 239000012634 fragment Substances 0.000 abstract description 41
- 230000001105 regulatory effect Effects 0.000 abstract description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 abstract description 11
- 244000098338 Triticum aestivum Species 0.000 description 111
- 210000004027 cell Anatomy 0.000 description 103
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 99
- 235000005822 corn Nutrition 0.000 description 99
- 108020004414 DNA Proteins 0.000 description 67
- 102000004169 proteins and genes Human genes 0.000 description 46
- 230000035772 mutation Effects 0.000 description 32
- 210000001519 tissue Anatomy 0.000 description 28
- 235000013339 cereals Nutrition 0.000 description 20
- 238000003752 polymerase chain reaction Methods 0.000 description 19
- 150000007523 nucleic acids Chemical class 0.000 description 18
- 238000006467 substitution reaction Methods 0.000 description 18
- 241000209758 Aegilops Species 0.000 description 16
- 102000039446 nucleic acids Human genes 0.000 description 15
- 108020004707 nucleic acids Proteins 0.000 description 15
- 238000012217 deletion Methods 0.000 description 14
- 230000037430 deletion Effects 0.000 description 14
- 230000001066 destructive effect Effects 0.000 description 13
- 230000006780 non-homologous end joining Effects 0.000 description 13
- 241000894007 species Species 0.000 description 13
- 244000017020 Ipomoea batatas Species 0.000 description 12
- 235000002678 Ipomoea batatas Nutrition 0.000 description 12
- 238000005755 formation reaction Methods 0.000 description 12
- 108010042407 Endonucleases Proteins 0.000 description 11
- 102000004533 Endonucleases Human genes 0.000 description 11
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 11
- 238000003780 insertion Methods 0.000 description 11
- 230000037431 insertion Effects 0.000 description 11
- 230000037039 plant physiology Effects 0.000 description 10
- 230000009466 transformation Effects 0.000 description 10
- 241001522110 Aegilops tauschii Species 0.000 description 9
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 9
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 9
- 238000012546 transfer Methods 0.000 description 9
- 108010079364 N-glycylalanine Proteins 0.000 description 8
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 8
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 8
- 230000001850 reproductive effect Effects 0.000 description 8
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 7
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 7
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 7
- 241000209147 Triticum urartu Species 0.000 description 7
- 238000007792 addition Methods 0.000 description 7
- 108010047857 aspartylglycine Proteins 0.000 description 7
- 238000011161 development Methods 0.000 description 7
- 230000018109 developmental process Effects 0.000 description 7
- 108010017391 lysylvaline Proteins 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 231100000350 mutagenesis Toxicity 0.000 description 7
- 210000000056 organ Anatomy 0.000 description 7
- 230000006798 recombination Effects 0.000 description 7
- 238000005215 recombination Methods 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- 108010093581 aspartyl-proline Proteins 0.000 description 6
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 6
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 6
- 108010050848 glycylleucine Proteins 0.000 description 6
- 239000002245 particle Substances 0.000 description 6
- 230000035897 transcription Effects 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 5
- 241000219198 Brassica Species 0.000 description 5
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 5
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 5
- 108010047495 alanylglycine Proteins 0.000 description 5
- 210000002257 embryonic structure Anatomy 0.000 description 5
- 108010049041 glutamylalanine Proteins 0.000 description 5
- 108010092114 histidylphenylalanine Proteins 0.000 description 5
- 238000009396 hybridization Methods 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000011426 transformation method Methods 0.000 description 5
- 108700028369 Alleles Proteins 0.000 description 4
- 235000011331 Brassica Nutrition 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 4
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 4
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 4
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 4
- 244000082988 Secale cereale Species 0.000 description 4
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 4
- 208000035199 Tetraploidy Diseases 0.000 description 4
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 4
- 235000007244 Zea mays Nutrition 0.000 description 4
- 108010055615 Zein Proteins 0.000 description 4
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 4
- 230000004075 alteration Effects 0.000 description 4
- 108010013835 arginine glutamate Proteins 0.000 description 4
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 4
- 230000004071 biological effect Effects 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 108010082025 cyan fluorescent protein Proteins 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 230000005782 double-strand break Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 229940088598 enzyme Drugs 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 239000005090 green fluorescent protein Substances 0.000 description 4
- 230000002401 inhibitory effect Effects 0.000 description 4
- 230000000977 initiatory effect Effects 0.000 description 4
- 230000023409 microsporogenesis Effects 0.000 description 4
- 238000002703 mutagenesis Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 108010071207 serylmethionine Proteins 0.000 description 4
- 230000001052 transient effect Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 3
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 3
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 3
- SIGTYDNEPYEXGK-ZANVPECISA-N Ala-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 SIGTYDNEPYEXGK-ZANVPECISA-N 0.000 description 3
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 3
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 3
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 3
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 3
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 3
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 3
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 3
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 3
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 3
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 3
- SOYOSFXLXYZNRG-CIUDSAMLSA-N Asp-Arg-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O SOYOSFXLXYZNRG-CIUDSAMLSA-N 0.000 description 3
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 3
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 3
- PSLSTUMPZILTAH-BYULHYEWSA-N Asp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PSLSTUMPZILTAH-BYULHYEWSA-N 0.000 description 3
- XUVTWGPERWIERB-IHRRRGAJSA-N Asp-Pro-Phe Chemical compound N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O XUVTWGPERWIERB-IHRRRGAJSA-N 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 240000008067 Cucumis sativus Species 0.000 description 3
- WZZGXXNRSZIQFC-VGDYDELISA-N Cys-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CS)N WZZGXXNRSZIQFC-VGDYDELISA-N 0.000 description 3
- PJWIPBIMSKJTIE-DCAQKATOSA-N Cys-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CS)N PJWIPBIMSKJTIE-DCAQKATOSA-N 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- WLRYGVYQFXRJDA-DCAQKATOSA-N Gln-Pro-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 WLRYGVYQFXRJDA-DCAQKATOSA-N 0.000 description 3
- SXFPZRRVWSUYII-KBIXCLLPSA-N Gln-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N SXFPZRRVWSUYII-KBIXCLLPSA-N 0.000 description 3
- WVYJNPCWJYBHJG-YVNDNENWSA-N Glu-Ile-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O WVYJNPCWJYBHJG-YVNDNENWSA-N 0.000 description 3
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 3
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 3
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 3
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 3
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 3
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 3
- LXTRSHQLGYINON-DTWKUNHWSA-N Gly-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN LXTRSHQLGYINON-DTWKUNHWSA-N 0.000 description 3
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 3
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 3
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 3
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 3
- AIPUZFXMXAHZKY-QWRGUYRKSA-N His-Leu-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AIPUZFXMXAHZKY-QWRGUYRKSA-N 0.000 description 3
- FUOYNOXRWPJPAN-QEWYBTABSA-N Ile-Glu-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FUOYNOXRWPJPAN-QEWYBTABSA-N 0.000 description 3
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 3
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 3
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 3
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 3
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 3
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 3
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 3
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 3
- IDGRADDMTTWOQC-WDSOQIARSA-N Leu-Trp-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IDGRADDMTTWOQC-WDSOQIARSA-N 0.000 description 3
- FPFOYSCDUWTZBF-IHPCNDPISA-N Leu-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]([NH3+])CC(C)C)C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 FPFOYSCDUWTZBF-IHPCNDPISA-N 0.000 description 3
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 3
- KKFVKBWCXXLKIK-AVGNSLFASA-N Lys-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCCN)N KKFVKBWCXXLKIK-AVGNSLFASA-N 0.000 description 3
- YXPJCVNIDDKGOE-MELADBBJSA-N Lys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N)C(=O)O YXPJCVNIDDKGOE-MELADBBJSA-N 0.000 description 3
- 241000219823 Medicago Species 0.000 description 3
- JYCQGAGDJQYEDB-GUBZILKMSA-N Met-Gln-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O JYCQGAGDJQYEDB-GUBZILKMSA-N 0.000 description 3
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 3
- PZUUMQPMHBJJKE-AVGNSLFASA-N Met-Leu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCNC(N)=N PZUUMQPMHBJJKE-AVGNSLFASA-N 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 235000010617 Phaseolus lunatus Nutrition 0.000 description 3
- 244000046052 Phaseolus vulgaris Species 0.000 description 3
- WSXKXSBOJXEZDV-DLOVCJGASA-N Phe-Ala-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@H](C)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 WSXKXSBOJXEZDV-DLOVCJGASA-N 0.000 description 3
- ZYBUKTMPPFQSHL-JYJNAYRXSA-N Pro-Asp-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZYBUKTMPPFQSHL-JYJNAYRXSA-N 0.000 description 3
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 3
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 3
- VEUACYMXJKXALX-IHRRRGAJSA-N Pro-Tyr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VEUACYMXJKXALX-IHRRRGAJSA-N 0.000 description 3
- 108091028664 Ribonucleotide Proteins 0.000 description 3
- 241000209051 Saccharum Species 0.000 description 3
- 238000012300 Sequence Analysis Methods 0.000 description 3
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 3
- 101000898746 Streptomyces clavuligerus Clavaminate synthase 1 Proteins 0.000 description 3
- KVEWWQRTAVMOFT-KJEVXHAQSA-N Thr-Tyr-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O KVEWWQRTAVMOFT-KJEVXHAQSA-N 0.000 description 3
- 235000007264 Triticum durum Nutrition 0.000 description 3
- 241000209143 Triticum turgidum subsp. durum Species 0.000 description 3
- UHXOYRWHIQZAKV-SZMVWBNQSA-N Trp-Pro-Arg Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O UHXOYRWHIQZAKV-SZMVWBNQSA-N 0.000 description 3
- HTHCZRWCFXMENJ-KKUMJFAQSA-N Tyr-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HTHCZRWCFXMENJ-KKUMJFAQSA-N 0.000 description 3
- JBBYKPZAPOLCPK-JYJNAYRXSA-N Tyr-Arg-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O JBBYKPZAPOLCPK-JYJNAYRXSA-N 0.000 description 3
- 108010064997 VPY tripeptide Proteins 0.000 description 3
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 3
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 3
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 3
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 3
- SVFRYKBZHUGKLP-QXEWZRGKSA-N Val-Met-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVFRYKBZHUGKLP-QXEWZRGKSA-N 0.000 description 3
- OFQGGTGZTOTLGH-NHCYSSNCSA-N Val-Met-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N OFQGGTGZTOTLGH-NHCYSSNCSA-N 0.000 description 3
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 3
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 3
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 3
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 3
- DLLRRUDLMSJTMB-GUBZILKMSA-N Val-Ser-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N DLLRRUDLMSJTMB-GUBZILKMSA-N 0.000 description 3
- PFMSJVIPEZMKSC-DZKIICNBSA-N Val-Tyr-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PFMSJVIPEZMKSC-DZKIICNBSA-N 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 229920002494 Zein Polymers 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 3
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 108010062796 arginyllysine Proteins 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 108010054813 diprotin B Proteins 0.000 description 3
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 3
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 3
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 3
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 3
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 3
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 3
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 3
- 108010000761 leucylarginine Proteins 0.000 description 3
- 108010064235 lysylglycine Proteins 0.000 description 3
- 210000001161 mammalian embryo Anatomy 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- YCIMNLLNPGFGHC-UHFFFAOYSA-N o-dihydroxy-benzene Natural products OC1=CC=CC=C1O YCIMNLLNPGFGHC-UHFFFAOYSA-N 0.000 description 3
- 108010024607 phenylalanylalanine Proteins 0.000 description 3
- 230000010152 pollination Effects 0.000 description 3
- 108010031719 prolyl-serine Proteins 0.000 description 3
- 108010004914 prolylarginine Proteins 0.000 description 3
- 230000008929 regeneration Effects 0.000 description 3
- 238000011069 regeneration method Methods 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 239000002336 ribonucleotide Substances 0.000 description 3
- 125000002652 ribonucleotide group Chemical group 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 230000002623 sporogenic effect Effects 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 230000009261 transgenic effect Effects 0.000 description 3
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 3
- 108010084932 tryptophyl-proline Proteins 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- 239000005019 zein Substances 0.000 description 3
- 229940093612 zein Drugs 0.000 description 3
- LWTDZKXXJRRKDG-KXBFYZLASA-N (-)-phaseollin Chemical compound C1OC2=CC(O)=CC=C2[C@H]2[C@@H]1C1=CC=C3OC(C)(C)C=CC3=C1O2 LWTDZKXXJRRKDG-KXBFYZLASA-N 0.000 description 2
- PKOHVHWNGUHYRE-ZFWWWQNUSA-N (2s)-1-[2-[[(2s)-2-amino-3-(1h-indol-3-yl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)NCC(=O)N1CCC[C@H]1C(O)=O PKOHVHWNGUHYRE-ZFWWWQNUSA-N 0.000 description 2
- UPMXNNIRAGDFEH-UHFFFAOYSA-N 3,5-dibromo-4-hydroxybenzonitrile Chemical compound OC1=C(Br)C=C(C#N)C=C1Br UPMXNNIRAGDFEH-UHFFFAOYSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- 241000218642 Abies Species 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 2
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 2
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 2
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 2
- DWINFPQUSSHSFS-UVBJJODRSA-N Ala-Arg-Trp Chemical compound N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C12)C(=O)O DWINFPQUSSHSFS-UVBJJODRSA-N 0.000 description 2
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 2
- XAGIMRPOEJSYER-CIUDSAMLSA-N Ala-Cys-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N XAGIMRPOEJSYER-CIUDSAMLSA-N 0.000 description 2
- JPGBXANAQYHTLA-DRZSPHRISA-N Ala-Gln-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JPGBXANAQYHTLA-DRZSPHRISA-N 0.000 description 2
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 2
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 2
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 2
- IVKWMMGFLAMMKJ-XVYDVKMFSA-N Ala-His-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N IVKWMMGFLAMMKJ-XVYDVKMFSA-N 0.000 description 2
- HQJKCXHQNUCKMY-GHCJXIJMSA-N Ala-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C)N HQJKCXHQNUCKMY-GHCJXIJMSA-N 0.000 description 2
- BFMIRJBURUXDRG-DLOVCJGASA-N Ala-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 BFMIRJBURUXDRG-DLOVCJGASA-N 0.000 description 2
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 2
- JAQNUEWEJWBVAY-WBAXXEDZSA-N Ala-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 JAQNUEWEJWBVAY-WBAXXEDZSA-N 0.000 description 2
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 2
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 2
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 2
- 244000144725 Amygdalus communis Species 0.000 description 2
- 235000011437 Amygdalus communis Nutrition 0.000 description 2
- 244000226021 Anacardium occidentale Species 0.000 description 2
- 241000219195 Arabidopsis thaliana Species 0.000 description 2
- 235000017060 Arachis glabrata Nutrition 0.000 description 2
- 244000105624 Arachis hypogaea Species 0.000 description 2
- 235000010777 Arachis hypogaea Nutrition 0.000 description 2
- 235000018262 Arachis monticola Nutrition 0.000 description 2
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 2
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 2
- OTUQSEPIIVBYEM-IHRRRGAJSA-N Arg-Asn-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OTUQSEPIIVBYEM-IHRRRGAJSA-N 0.000 description 2
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 2
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 2
- HCIUUZGFTDTEGM-NAKRPEOUSA-N Arg-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HCIUUZGFTDTEGM-NAKRPEOUSA-N 0.000 description 2
- OKKMBOSPBDASEP-CYDGBPFRSA-N Arg-Ile-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O OKKMBOSPBDASEP-CYDGBPFRSA-N 0.000 description 2
- OGSQONVYSTZIJB-WDSOQIARSA-N Arg-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O OGSQONVYSTZIJB-WDSOQIARSA-N 0.000 description 2
- RIIVUOJDDQXHRV-SRVKXCTJSA-N Arg-Lys-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O RIIVUOJDDQXHRV-SRVKXCTJSA-N 0.000 description 2
- GITAWLWBTMJPKH-AVGNSLFASA-N Arg-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GITAWLWBTMJPKH-AVGNSLFASA-N 0.000 description 2
- FIQKRDXFTANIEJ-ULQDDVLXSA-N Arg-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FIQKRDXFTANIEJ-ULQDDVLXSA-N 0.000 description 2
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 2
- BECXEHHOZNFFFX-IHRRRGAJSA-N Arg-Ser-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BECXEHHOZNFFFX-IHRRRGAJSA-N 0.000 description 2
- JYHIVHINLJUIEG-BVSLBCMMSA-N Arg-Tyr-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JYHIVHINLJUIEG-BVSLBCMMSA-N 0.000 description 2
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 2
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 2
- XLDMSQYOYXINSZ-QXEWZRGKSA-N Asn-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XLDMSQYOYXINSZ-QXEWZRGKSA-N 0.000 description 2
- MYRLSKYSMXNLLA-LAEOZQHASA-N Asn-Val-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MYRLSKYSMXNLLA-LAEOZQHASA-N 0.000 description 2
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 2
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 2
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 2
- LJRPYAZQQWHEEV-FXQIFTODSA-N Asp-Gln-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O LJRPYAZQQWHEEV-FXQIFTODSA-N 0.000 description 2
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 2
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 2
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 2
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 2
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 2
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 2
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 2
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 240000002791 Brassica napus Species 0.000 description 2
- 239000005489 Bromoxynil Substances 0.000 description 2
- 244000045232 Canavalia ensiformis Species 0.000 description 2
- 235000009467 Carica papaya Nutrition 0.000 description 2
- 240000006432 Carica papaya Species 0.000 description 2
- 241000701489 Cauliflower mosaic virus Species 0.000 description 2
- 241000218631 Coniferophyta Species 0.000 description 2
- 241000219112 Cucumis Species 0.000 description 2
- 244000241257 Cucumis melo Species 0.000 description 2
- BYALSSDCQYHKMY-XGEHTFHBSA-N Cys-Arg-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N)O BYALSSDCQYHKMY-XGEHTFHBSA-N 0.000 description 2
- WYZLWZNAWQNLGQ-FXQIFTODSA-N Cys-Cys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N WYZLWZNAWQNLGQ-FXQIFTODSA-N 0.000 description 2
- HQZGVYJBRSISDT-BQBZGAKWSA-N Cys-Gly-Arg Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQZGVYJBRSISDT-BQBZGAKWSA-N 0.000 description 2
- 102000002004 Cytochrome P-450 Enzyme System Human genes 0.000 description 2
- 108010015742 Cytochrome P-450 Enzyme System Proteins 0.000 description 2
- 235000009355 Dianthus caryophyllus Nutrition 0.000 description 2
- 240000006497 Dianthus caryophyllus Species 0.000 description 2
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical compound O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 description 2
- 240000002395 Euphorbia pulcherrima Species 0.000 description 2
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 2
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 2
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 2
- 101710186901 Globulin 1 Proteins 0.000 description 2
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 2
- SYDJILXOZNEEDK-XIRDDKMYSA-N Glu-Arg-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SYDJILXOZNEEDK-XIRDDKMYSA-N 0.000 description 2
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 2
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 2
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 2
- CAVMESABQIKFKT-IUCAKERBSA-N Glu-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N CAVMESABQIKFKT-IUCAKERBSA-N 0.000 description 2
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 2
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 2
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 2
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 2
- OFIHURVSQXAZIR-SZMVWBNQSA-N Glu-Lys-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OFIHURVSQXAZIR-SZMVWBNQSA-N 0.000 description 2
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 2
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 2
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 2
- UCZXXMREFIETQW-AVGNSLFASA-N Glu-Tyr-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O UCZXXMREFIETQW-AVGNSLFASA-N 0.000 description 2
- VXEFAWJTFAUDJK-AVGNSLFASA-N Glu-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O VXEFAWJTFAUDJK-AVGNSLFASA-N 0.000 description 2
- FVGOGEGGQLNZGH-DZKIICNBSA-N Glu-Val-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FVGOGEGGQLNZGH-DZKIICNBSA-N 0.000 description 2
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 2
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 2
- MXXXVOYFNVJHMA-IUCAKERBSA-N Gly-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN MXXXVOYFNVJHMA-IUCAKERBSA-N 0.000 description 2
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 2
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 2
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 2
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 2
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 2
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 2
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 2
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 2
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 2
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 2
- 241000219146 Gossypium Species 0.000 description 2
- 235000005206 Hibiscus Nutrition 0.000 description 2
- 235000007185 Hibiscus lunariifolius Nutrition 0.000 description 2
- 244000284380 Hibiscus rosa sinensis Species 0.000 description 2
- SOFSRBYHDINIRG-QTKMDUPCSA-N His-Arg-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N)O SOFSRBYHDINIRG-QTKMDUPCSA-N 0.000 description 2
- ZJSMFRTVYSLKQU-DJFWLOJKSA-N His-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ZJSMFRTVYSLKQU-DJFWLOJKSA-N 0.000 description 2
- NQKRILCJYCASDV-QWRGUYRKSA-N His-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 NQKRILCJYCASDV-QWRGUYRKSA-N 0.000 description 2
- FSOXZQBMPBQKGJ-QSFUFRPTSA-N His-Ile-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 FSOXZQBMPBQKGJ-QSFUFRPTSA-N 0.000 description 2
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 2
- FFYYUUWROYYKFY-IHRRRGAJSA-N His-Val-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O FFYYUUWROYYKFY-IHRRRGAJSA-N 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 2
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 2
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 2
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 2
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 2
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 2
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 2
- VUEXLJFLDONGKQ-PYJNHQTQSA-N Ile-His-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N VUEXLJFLDONGKQ-PYJNHQTQSA-N 0.000 description 2
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 2
- XMYURPUVJSKTMC-KBIXCLLPSA-N Ile-Ser-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XMYURPUVJSKTMC-KBIXCLLPSA-N 0.000 description 2
- WIYDLTIBHZSPKY-HJWJTTGWSA-N Ile-Val-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WIYDLTIBHZSPKY-HJWJTTGWSA-N 0.000 description 2
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 2
- 206010021929 Infertility male Diseases 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- 235000003228 Lactuca sativa Nutrition 0.000 description 2
- 240000008415 Lactuca sativa Species 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 2
- VKOAHIRLIUESLU-ULQDDVLXSA-N Leu-Arg-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VKOAHIRLIUESLU-ULQDDVLXSA-N 0.000 description 2
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 2
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 2
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 2
- SGIIOQQGLUUMDQ-IHRRRGAJSA-N Leu-His-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N SGIIOQQGLUUMDQ-IHRRRGAJSA-N 0.000 description 2
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 2
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 2
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 2
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 2
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 2
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 2
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 2
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 2
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 2
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 2
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 2
- MTBBHUKKPWKXBT-ULQDDVLXSA-N Lys-Met-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MTBBHUKKPWKXBT-ULQDDVLXSA-N 0.000 description 2
- UDXSLGLHFUBRRM-OEAJRASXSA-N Lys-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCCN)N)O UDXSLGLHFUBRRM-OEAJRASXSA-N 0.000 description 2
- CUHGAUZONORRIC-HJGDQZAQSA-N Lys-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O CUHGAUZONORRIC-HJGDQZAQSA-N 0.000 description 2
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 2
- 241000723994 Maize dwarf mosaic virus Species 0.000 description 2
- 208000007466 Male Infertility Diseases 0.000 description 2
- 235000014826 Mangifera indica Nutrition 0.000 description 2
- 240000007228 Mangifera indica Species 0.000 description 2
- XUMBMVFBXHLACL-UHFFFAOYSA-N Melanin Chemical compound O=C1C(=O)C(C2=CNC3=C(C(C(=O)C4=C32)=O)C)=C2C4=CNC2=C1C XUMBMVFBXHLACL-UHFFFAOYSA-N 0.000 description 2
- VTKPSXWRUGCOAC-GUBZILKMSA-N Met-Ala-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCSC VTKPSXWRUGCOAC-GUBZILKMSA-N 0.000 description 2
- FVKRQMQQFGBXHV-QXEWZRGKSA-N Met-Asp-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FVKRQMQQFGBXHV-QXEWZRGKSA-N 0.000 description 2
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 2
- MQASRXPTQJJNFM-JYJNAYRXSA-N Met-Pro-Phe Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MQASRXPTQJJNFM-JYJNAYRXSA-N 0.000 description 2
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 101710202365 Napin Proteins 0.000 description 2
- 241000234479 Narcissus Species 0.000 description 2
- 241000581017 Oliva Species 0.000 description 2
- 101150053185 P450 gene Proteins 0.000 description 2
- 235000007195 Pennisetum typhoides Nutrition 0.000 description 2
- 244000025272 Persea americana Species 0.000 description 2
- 235000008673 Persea americana Nutrition 0.000 description 2
- 240000007377 Petunia x hybrida Species 0.000 description 2
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 2
- AJOKKVTWEMXZHC-DRZSPHRISA-N Phe-Ala-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 AJOKKVTWEMXZHC-DRZSPHRISA-N 0.000 description 2
- AYPMIIKUMNADSU-IHRRRGAJSA-N Phe-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AYPMIIKUMNADSU-IHRRRGAJSA-N 0.000 description 2
- GNUCSNWOCQFMMC-UFYCRDLUSA-N Phe-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 GNUCSNWOCQFMMC-UFYCRDLUSA-N 0.000 description 2
- HTTYNOXBBOWZTB-SRVKXCTJSA-N Phe-Asn-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HTTYNOXBBOWZTB-SRVKXCTJSA-N 0.000 description 2
- HNFUGJUZJRYUHN-JSGCOSHPSA-N Phe-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HNFUGJUZJRYUHN-JSGCOSHPSA-N 0.000 description 2
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 2
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 2
- ZUQACJLOHYRVPJ-DKIMLUQUSA-N Phe-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZUQACJLOHYRVPJ-DKIMLUQUSA-N 0.000 description 2
- MGLBSROLWAWCKN-FCLVOEFKSA-N Phe-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MGLBSROLWAWCKN-FCLVOEFKSA-N 0.000 description 2
- RVEVENLSADZUMS-IHRRRGAJSA-N Phe-Pro-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RVEVENLSADZUMS-IHRRRGAJSA-N 0.000 description 2
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 2
- BTAIJUBAGLVFKQ-BVSLBCMMSA-N Phe-Trp-Val Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](C(C)C)C(O)=O)C1=CC=CC=C1 BTAIJUBAGLVFKQ-BVSLBCMMSA-N 0.000 description 2
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 2
- 235000005205 Pinus Nutrition 0.000 description 2
- 241000218602 Pinus <genus> Species 0.000 description 2
- 235000013264 Pinus jeffreyi Nutrition 0.000 description 2
- 235000008577 Pinus radiata Nutrition 0.000 description 2
- 241000218621 Pinus radiata Species 0.000 description 2
- 240000007320 Pinus strobus Species 0.000 description 2
- 235000008566 Pinus taeda Nutrition 0.000 description 2
- 241000218679 Pinus taeda Species 0.000 description 2
- 235000010582 Pisum sativum Nutrition 0.000 description 2
- 240000004713 Pisum sativum Species 0.000 description 2
- 229920002873 Polyethylenimine Polymers 0.000 description 2
- PZSCUPVOJGKHEP-CIUDSAMLSA-N Pro-Gln-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PZSCUPVOJGKHEP-CIUDSAMLSA-N 0.000 description 2
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 2
- ABSSTGUCBCDKMU-UWVGGRQHSA-N Pro-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 ABSSTGUCBCDKMU-UWVGGRQHSA-N 0.000 description 2
- HRIXMVRZRGFKNQ-HJGDQZAQSA-N Pro-Thr-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HRIXMVRZRGFKNQ-HJGDQZAQSA-N 0.000 description 2
- YIPFBJGBRCJJJD-FHWLQOOXSA-N Pro-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 YIPFBJGBRCJJJD-FHWLQOOXSA-N 0.000 description 2
- DGDCSVGVWWAJRS-AVGNSLFASA-N Pro-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 DGDCSVGVWWAJRS-AVGNSLFASA-N 0.000 description 2
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 2
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 2
- 240000001416 Pseudotsuga menziesii Species 0.000 description 2
- 108010003201 RGH 0205 Proteins 0.000 description 2
- 241000208422 Rhododendron Species 0.000 description 2
- 241000607142 Salmonella Species 0.000 description 2
- 241001116459 Sequoia Species 0.000 description 2
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 2
- QGMLKFGTGXWAHF-IHRRRGAJSA-N Ser-Arg-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGMLKFGTGXWAHF-IHRRRGAJSA-N 0.000 description 2
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 2
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 2
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 2
- DLPXTCTVNDTYGJ-JBDRJPRFSA-N Ser-Ile-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(O)=O DLPXTCTVNDTYGJ-JBDRJPRFSA-N 0.000 description 2
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 2
- JAWGSPUJAXYXJA-IHRRRGAJSA-N Ser-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=CC=C1 JAWGSPUJAXYXJA-IHRRRGAJSA-N 0.000 description 2
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 2
- YXEYTHXDRDAIOJ-CWRNSKLLSA-N Ser-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N)C(=O)O YXEYTHXDRDAIOJ-CWRNSKLLSA-N 0.000 description 2
- 235000002634 Solanum Nutrition 0.000 description 2
- 241000207763 Solanum Species 0.000 description 2
- 240000003768 Solanum lycopersicum Species 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 2
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 2
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 2
- DGDCHPCRMWEOJR-FQPOAREZSA-N Thr-Ala-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DGDCHPCRMWEOJR-FQPOAREZSA-N 0.000 description 2
- UNURFMVMXLENAZ-KJEVXHAQSA-N Thr-Arg-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UNURFMVMXLENAZ-KJEVXHAQSA-N 0.000 description 2
- VASYSJHSMSBTDU-LKXGYXEUSA-N Thr-Asn-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)O VASYSJHSMSBTDU-LKXGYXEUSA-N 0.000 description 2
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 2
- YJCVECXVYHZOBK-KNZXXDILSA-N Thr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H]([C@@H](C)O)N YJCVECXVYHZOBK-KNZXXDILSA-N 0.000 description 2
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 2
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 2
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 2
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 2
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 2
- HUPLKEHTTQBXSC-YJRXYDGGSA-N Thr-Ser-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUPLKEHTTQBXSC-YJRXYDGGSA-N 0.000 description 2
- RPECVQBNONKZAT-WZLNRYEVSA-N Thr-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H]([C@@H](C)O)N RPECVQBNONKZAT-WZLNRYEVSA-N 0.000 description 2
- CYCGARJWIQWPQM-YJRXYDGGSA-N Thr-Tyr-Ser Chemical compound C[C@@H](O)[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CO)C([O-])=O)CC1=CC=C(O)C=C1 CYCGARJWIQWPQM-YJRXYDGGSA-N 0.000 description 2
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 2
- 241000218638 Thuja plicata Species 0.000 description 2
- 241000723792 Tobacco etch virus Species 0.000 description 2
- 241000723873 Tobacco mosaic virus Species 0.000 description 2
- 240000000359 Triticum dicoccon Species 0.000 description 2
- 240000003834 Triticum spelta Species 0.000 description 2
- MVHHTXAUJCIOMZ-WDSOQIARSA-N Trp-Arg-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N MVHHTXAUJCIOMZ-WDSOQIARSA-N 0.000 description 2
- KULBQAVOXHQLIY-HSCHXYMDSA-N Trp-Ile-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 KULBQAVOXHQLIY-HSCHXYMDSA-N 0.000 description 2
- UEFHVUQBYNRNQC-SFJXLCSZSA-N Trp-Phe-Thr Chemical compound C([C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=CC=C1 UEFHVUQBYNRNQC-SFJXLCSZSA-N 0.000 description 2
- BOBZBMOTRORUPT-XIRDDKMYSA-N Trp-Ser-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 BOBZBMOTRORUPT-XIRDDKMYSA-N 0.000 description 2
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 2
- BBSPTGPYIPGTKH-JYJNAYRXSA-N Tyr-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N BBSPTGPYIPGTKH-JYJNAYRXSA-N 0.000 description 2
- BIWVVOHTKDLRMP-ULQDDVLXSA-N Tyr-Pro-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BIWVVOHTKDLRMP-ULQDDVLXSA-N 0.000 description 2
- MNWINJDPGBNOED-ULQDDVLXSA-N Tyr-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 MNWINJDPGBNOED-ULQDDVLXSA-N 0.000 description 2
- NMANTMWGQZASQN-QXEWZRGKSA-N Val-Arg-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N NMANTMWGQZASQN-QXEWZRGKSA-N 0.000 description 2
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 2
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 2
- ZSZFTYVFQLUWBF-QXEWZRGKSA-N Val-Asp-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N ZSZFTYVFQLUWBF-QXEWZRGKSA-N 0.000 description 2
- CWSIBTLMMQLPPZ-FXQIFTODSA-N Val-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N CWSIBTLMMQLPPZ-FXQIFTODSA-N 0.000 description 2
- PMXBARDFIAPBGK-DZKIICNBSA-N Val-Glu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PMXBARDFIAPBGK-DZKIICNBSA-N 0.000 description 2
- MJXNDRCLGDSBBE-FHWLQOOXSA-N Val-His-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N MJXNDRCLGDSBBE-FHWLQOOXSA-N 0.000 description 2
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 2
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 2
- BZOSBRIDWSSTFN-AVGNSLFASA-N Val-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N BZOSBRIDWSSTFN-AVGNSLFASA-N 0.000 description 2
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 2
- MJOUSKQHAIARKI-JYJNAYRXSA-N Val-Phe-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 MJOUSKQHAIARKI-JYJNAYRXSA-N 0.000 description 2
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 2
- 241000219873 Vicia Species 0.000 description 2
- 108020005202 Viral DNA Proteins 0.000 description 2
- 108020000999 Viral RNA Proteins 0.000 description 2
- 239000011543 agarose gel Substances 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 229930002877 anthocyanin Natural products 0.000 description 2
- 235000010208 anthocyanin Nutrition 0.000 description 2
- 239000004410 anthocyanin Substances 0.000 description 2
- 150000004636 anthocyanins Chemical class 0.000 description 2
- 230000000845 anti-microbial effect Effects 0.000 description 2
- 238000011203 antimicrobial therapy Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 108010036533 arginylvaline Proteins 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 235000020289 caffè mocha Nutrition 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000036978 cell physiology Effects 0.000 description 2
- 239000012707 chemical precursor Substances 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000002512 chemotherapy Methods 0.000 description 2
- 229960005091 chloramphenicol Drugs 0.000 description 2
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 2
- 239000003593 chromogenic compound Substances 0.000 description 2
- 239000013611 chromosomal DNA Substances 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000012350 deep sequencing Methods 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 229910001882 dioxygen Inorganic materials 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000004077 genetic alteration Effects 0.000 description 2
- 231100000118 genetic alteration Toxicity 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 150000003278 haem Chemical class 0.000 description 2
- 230000002363 herbicidal effect Effects 0.000 description 2
- 108010002685 hygromycin-B kinase Proteins 0.000 description 2
- 108010027338 isoleucylcysteine Proteins 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 235000021374 legumes Nutrition 0.000 description 2
- 108010034529 leucyl-lysine Proteins 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000008774 maternal effect Effects 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 230000021121 meiosis Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- 108010085203 methionylmethionine Proteins 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000008775 paternal effect Effects 0.000 description 2
- 235000020232 peanut Nutrition 0.000 description 2
- 108010072637 phenylalanyl-arginyl-phenylalanine Proteins 0.000 description 2
- 108010018625 phenylalanylarginine Proteins 0.000 description 2
- 108010082527 phosphinothricin N-acetyltransferase Proteins 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000003764 sweet protein Substances 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 230000025366 tissue development Effects 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 108010045269 tryptophyltryptophan Proteins 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- 239000003643 water by type Substances 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- KQRMGBSYWRUESQ-UHFFFAOYSA-N (2-chlorophenyl)sulfonylurea Chemical compound NC(=O)NS(=O)(=O)C1=CC=CC=C1Cl KQRMGBSYWRUESQ-UHFFFAOYSA-N 0.000 description 1
- FCHBECOAGZMTFE-ZEQKJWHPSA-N (6r,7r)-3-[[2-[[4-(dimethylamino)phenyl]diazenyl]pyridin-1-ium-1-yl]methyl]-8-oxo-7-[(2-thiophen-2-ylacetyl)amino]-5-thia-1-azabicyclo[4.2.0]oct-2-ene-2-carboxylate Chemical compound C1=CC(N(C)C)=CC=C1N=NC1=CC=CC=[N+]1CC1=C(C([O-])=O)N2C(=O)[C@@H](NC(=O)CC=3SC=CC=3)[C@H]2SC1 FCHBECOAGZMTFE-ZEQKJWHPSA-N 0.000 description 1
- 239000005631 2,4-Dichlorophenoxyacetic acid Substances 0.000 description 1
- HXKWSTRRCHTUEC-UHFFFAOYSA-N 2,4-Dichlorophenoxyaceticacid Chemical compound OC(=O)C(Cl)OC1=CC=C(Cl)C=C1 HXKWSTRRCHTUEC-UHFFFAOYSA-N 0.000 description 1
- KDZIGQIDPXKMBA-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-3-methylbutanoyl)amino]acetyl]amino]-3-hydroxypropanoyl]amino]pentanedioic acid Chemical compound CC(C)C(N)C(=O)NCC(=O)NC(CO)C(=O)NC(C(O)=O)CCC(O)=O KDZIGQIDPXKMBA-UHFFFAOYSA-N 0.000 description 1
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical compound O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 1
- 235000014081 Abies amabilis Nutrition 0.000 description 1
- 244000101408 Abies amabilis Species 0.000 description 1
- 241001133760 Acoelorraphe Species 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- GFBLJMHGHAXGNY-ZLUOBGJFSA-N Ala-Asn-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GFBLJMHGHAXGNY-ZLUOBGJFSA-N 0.000 description 1
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 1
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 1
- KMGOBAQSCKTBGD-DLOVCJGASA-N Ala-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CN=CN1 KMGOBAQSCKTBGD-DLOVCJGASA-N 0.000 description 1
- PEIBBAXIKUAYGN-UBHSHLNASA-N Ala-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 PEIBBAXIKUAYGN-UBHSHLNASA-N 0.000 description 1
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 1
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 1
- JNJHNBXBGNJESC-KKXDTOCCSA-N Ala-Tyr-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JNJHNBXBGNJESC-KKXDTOCCSA-N 0.000 description 1
- MUGAESARFRGOTQ-IGNZVWTISA-N Ala-Tyr-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N MUGAESARFRGOTQ-IGNZVWTISA-N 0.000 description 1
- 241000724328 Alfalfa mosaic virus Species 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 235000005255 Allium cepa Nutrition 0.000 description 1
- 244000291564 Allium cepa Species 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 235000001274 Anacardium occidentale Nutrition 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 101100059544 Arabidopsis thaliana CDC5 gene Proteins 0.000 description 1
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 1
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 1
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 1
- JAYIQMNQDMOBFY-KKUMJFAQSA-N Arg-Glu-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JAYIQMNQDMOBFY-KKUMJFAQSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 1
- FBXMCPLCVYUWBO-BPUTZDHNSA-N Arg-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N FBXMCPLCVYUWBO-BPUTZDHNSA-N 0.000 description 1
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 1
- PYDIIVKGTBRIEL-SZMVWBNQSA-N Arg-Trp-Pro Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(O)=O PYDIIVKGTBRIEL-SZMVWBNQSA-N 0.000 description 1
- QHUOOCKNNURZSL-IHRRRGAJSA-N Arg-Tyr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O QHUOOCKNNURZSL-IHRRRGAJSA-N 0.000 description 1
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 1
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- WQSCVMQDZYTFQU-FXQIFTODSA-N Asn-Cys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WQSCVMQDZYTFQU-FXQIFTODSA-N 0.000 description 1
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 1
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 1
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 1
- DXHINQUXBZNUCF-MELADBBJSA-N Asn-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O DXHINQUXBZNUCF-MELADBBJSA-N 0.000 description 1
- AAIUGNSRQDGCDC-ZLUOBGJFSA-N Asp-Cys-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)C(=O)O AAIUGNSRQDGCDC-ZLUOBGJFSA-N 0.000 description 1
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 1
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 1
- RRUWMFBLFLUZSI-LPEHRKFASA-N Asp-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N RRUWMFBLFLUZSI-LPEHRKFASA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- 235000005638 Austrian pine Nutrition 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 235000007558 Avena sp Nutrition 0.000 description 1
- 101150076489 B gene Proteins 0.000 description 1
- 108010016529 Bacillus amyloliquefaciens ribonuclease Proteins 0.000 description 1
- 241000193388 Bacillus thuringiensis Species 0.000 description 1
- 235000021533 Beta vulgaris Nutrition 0.000 description 1
- 241000335053 Beta vulgaris Species 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 244000060924 Brassica campestris Species 0.000 description 1
- 235000005637 Brassica campestris Nutrition 0.000 description 1
- 235000003351 Brassica cretica Nutrition 0.000 description 1
- 244000178993 Brassica juncea Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 240000008100 Brassica rapa Species 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 235000003343 Brassica rupestris Nutrition 0.000 description 1
- 235000004936 Bromus mango Nutrition 0.000 description 1
- 229910000906 Bronze Inorganic materials 0.000 description 1
- 241001674345 Callitropsis nootkatensis Species 0.000 description 1
- 244000052707 Camellia sinensis Species 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- 241000218645 Cedrus Species 0.000 description 1
- 229930186147 Cephalosporin Natural products 0.000 description 1
- 235000013912 Ceratonia siliqua Nutrition 0.000 description 1
- 240000008886 Ceratonia siliqua Species 0.000 description 1
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 1
- 108091060290 Chromatid Proteins 0.000 description 1
- 235000007516 Chrysanthemum Nutrition 0.000 description 1
- 244000189548 Chrysanthemum x morifolium Species 0.000 description 1
- 235000010523 Cicer arietinum Nutrition 0.000 description 1
- 244000045195 Cicer arietinum Species 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- 244000060011 Cocos nucifera Species 0.000 description 1
- 235000013162 Cocos nucifera Nutrition 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 241000222680 Collybia Species 0.000 description 1
- 101710190853 Cruciferin Proteins 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- 235000009847 Cucumis melo var cantalupensis Nutrition 0.000 description 1
- 235000010071 Cucumis prophetarum Nutrition 0.000 description 1
- 235000009849 Cucumis sativus Nutrition 0.000 description 1
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 1
- 244000007835 Cyamopsis tetragonoloba Species 0.000 description 1
- PLBJMUUEGBBHRH-ZLUOBGJFSA-N Cys-Ala-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLBJMUUEGBBHRH-ZLUOBGJFSA-N 0.000 description 1
- IZUNQDRIAOLWCN-YUMQZZPRSA-N Cys-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N IZUNQDRIAOLWCN-YUMQZZPRSA-N 0.000 description 1
- ZXCAQANTQWBICD-DCAQKATOSA-N Cys-Lys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N ZXCAQANTQWBICD-DCAQKATOSA-N 0.000 description 1
- 241001071944 Cyta Species 0.000 description 1
- 101710112752 Cytotoxin Proteins 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- 108010076804 DNA Restriction Enzymes Proteins 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 230000009946 DNA mutation Effects 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 208000005156 Dehydration Diseases 0.000 description 1
- 102000003668 Destrin Human genes 0.000 description 1
- 108090000082 Destrin Proteins 0.000 description 1
- 241000588700 Dickeya chrysanthemi Species 0.000 description 1
- 102000016680 Dioxygenases Human genes 0.000 description 1
- 108010028143 Dioxygenases Proteins 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 101800000585 Diphtheria toxin fragment A Proteins 0.000 description 1
- AHMIDUVKSGCHAU-UHFFFAOYSA-N Dopaquinone Natural products OC(=O)C(N)CC1=CC(=O)C(=O)C=C1 AHMIDUVKSGCHAU-UHFFFAOYSA-N 0.000 description 1
- 235000014466 Douglas bleu Nutrition 0.000 description 1
- 241001057636 Dracaena deremensis Species 0.000 description 1
- 235000007351 Eleusine Nutrition 0.000 description 1
- 241000209215 Eleusine Species 0.000 description 1
- 241000710188 Encephalomyocarditis virus Species 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 235000008730 Ficus carica Nutrition 0.000 description 1
- 244000025361 Ficus carica Species 0.000 description 1
- 102100034013 Gamma-glutamyl phosphate reductase Human genes 0.000 description 1
- 101710198928 Gamma-glutamyl phosphate reductase Proteins 0.000 description 1
- 108090001064 Gelsolin Proteins 0.000 description 1
- 206010071602 Genetic polymorphism Diseases 0.000 description 1
- DTCCMDYODDPHBG-ACZMJKKPSA-N Gln-Ala-Cys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O DTCCMDYODDPHBG-ACZMJKKPSA-N 0.000 description 1
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 1
- NUMFTVCBONFQIQ-DRZSPHRISA-N Gln-Ala-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NUMFTVCBONFQIQ-DRZSPHRISA-N 0.000 description 1
- RKAQZCDMSUQTSS-FXQIFTODSA-N Gln-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RKAQZCDMSUQTSS-FXQIFTODSA-N 0.000 description 1
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 1
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 1
- XZUUUKNKNWVPHQ-JYJNAYRXSA-N Gln-Phe-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O XZUUUKNKNWVPHQ-JYJNAYRXSA-N 0.000 description 1
- PDXIOFXRBVDSHD-JBACZVJFSA-N Gln-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CCC(=O)N)N PDXIOFXRBVDSHD-JBACZVJFSA-N 0.000 description 1
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 1
- JPHYJQHPILOKHC-ACZMJKKPSA-N Glu-Asp-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JPHYJQHPILOKHC-ACZMJKKPSA-N 0.000 description 1
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 1
- ZPASCJBSSCRWMC-GVXVVHGQSA-N Glu-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N ZPASCJBSSCRWMC-GVXVVHGQSA-N 0.000 description 1
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 1
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 1
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 239000005561 Glufosinate Substances 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 1
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 1
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 1
- NMROINAYXCACKF-WHFBIAKZSA-N Gly-Cys-Cys Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O NMROINAYXCACKF-WHFBIAKZSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- FHQRLHFYVZAQHU-IUCAKERBSA-N Gly-Lys-Gln Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O FHQRLHFYVZAQHU-IUCAKERBSA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 1
- JYPCXBJRLBHWME-IUCAKERBSA-N Gly-Pro-Arg Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JYPCXBJRLBHWME-IUCAKERBSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 1
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 239000005562 Glyphosate Substances 0.000 description 1
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- YXBRCTXAEYSCHS-XVYDVKMFSA-N His-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N YXBRCTXAEYSCHS-XVYDVKMFSA-N 0.000 description 1
- WMKXFMUJRCEGRP-SRVKXCTJSA-N His-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N WMKXFMUJRCEGRP-SRVKXCTJSA-N 0.000 description 1
- FAQYEASGXHQQAA-XIRDDKMYSA-N His-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC3=CN=CN3)N FAQYEASGXHQQAA-XIRDDKMYSA-N 0.000 description 1
- FLXCRBXJRJSDHX-AVGNSLFASA-N His-Pro-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O FLXCRBXJRJSDHX-AVGNSLFASA-N 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101000899240 Homo sapiens Endoplasmic reticulum chaperone BiP Proteins 0.000 description 1
- 101000829367 Homo sapiens Src substrate cortactin Proteins 0.000 description 1
- 244000267823 Hydrangea macrophylla Species 0.000 description 1
- 235000014486 Hydrangea macrophylla Nutrition 0.000 description 1
- 206010020843 Hyperthermia Diseases 0.000 description 1
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 1
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- UFRXVQGGPNSJRY-CYDGBPFRSA-N Ile-Met-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N UFRXVQGGPNSJRY-CYDGBPFRSA-N 0.000 description 1
- XOZOSAUOGRPCES-STECZYCISA-N Ile-Pro-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XOZOSAUOGRPCES-STECZYCISA-N 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 235000021506 Ipomoea Nutrition 0.000 description 1
- 241000207783 Ipomoea Species 0.000 description 1
- 108010025815 Kanamycin Kinase Proteins 0.000 description 1
- WTDRDQBEARUVNC-LURJTMIESA-N L-DOPA Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-LURJTMIESA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- AHMIDUVKSGCHAU-LURJTMIESA-N L-dopaquinone Chemical compound [O-]C(=O)[C@@H]([NH3+])CC1=CC(=O)C(=O)C=C1 AHMIDUVKSGCHAU-LURJTMIESA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241000219729 Lathyrus Species 0.000 description 1
- 235000014647 Lens culinaris subsp culinaris Nutrition 0.000 description 1
- 244000043158 Lens esculenta Species 0.000 description 1
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 1
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 1
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 1
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 1
- CPONGMJGVIAWEH-DCAQKATOSA-N Leu-Met-Ala Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O CPONGMJGVIAWEH-DCAQKATOSA-N 0.000 description 1
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 1
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- UFPLDOKWDNTTRP-ULQDDVLXSA-N Leu-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CC=C(O)C=C1 UFPLDOKWDNTTRP-ULQDDVLXSA-N 0.000 description 1
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 1
- 241000234280 Liliaceae Species 0.000 description 1
- 241000209082 Lolium Species 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 1
- IBQMEXQYZMVIFU-SRVKXCTJSA-N Lys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N IBQMEXQYZMVIFU-SRVKXCTJSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- LXNPMPIQDNSMTA-AVGNSLFASA-N Lys-Gln-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 LXNPMPIQDNSMTA-AVGNSLFASA-N 0.000 description 1
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 1
- KNKJPYAZQUFLQK-IHRRRGAJSA-N Lys-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCCCN)N KNKJPYAZQUFLQK-IHRRRGAJSA-N 0.000 description 1
- DAOSYIZXRCOKII-SRVKXCTJSA-N Lys-His-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O DAOSYIZXRCOKII-SRVKXCTJSA-N 0.000 description 1
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 1
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 1
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 1
- OKCJTECLRDARDZ-XIRDDKMYSA-N Lys-Trp-Cys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CS)C(O)=O)=CNC2=C1 OKCJTECLRDARDZ-XIRDDKMYSA-N 0.000 description 1
- ZVZRQKJOQQAFCF-ULQDDVLXSA-N Lys-Tyr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZVZRQKJOQQAFCF-ULQDDVLXSA-N 0.000 description 1
- 101150115300 MAC1 gene Proteins 0.000 description 1
- 241000208467 Macadamia Species 0.000 description 1
- 235000018330 Macadamia integrifolia Nutrition 0.000 description 1
- 240000007575 Macadamia integrifolia Species 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241001565331 Margarodes Species 0.000 description 1
- 235000010624 Medicago sativa Nutrition 0.000 description 1
- ACYHZNZHIZWLQF-BQBZGAKWSA-N Met-Asn-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ACYHZNZHIZWLQF-BQBZGAKWSA-N 0.000 description 1
- FWTBMGAKKPSTBT-GUBZILKMSA-N Met-Gln-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FWTBMGAKKPSTBT-GUBZILKMSA-N 0.000 description 1
- STTRPDDKDVKIDF-KKUMJFAQSA-N Met-Glu-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 STTRPDDKDVKIDF-KKUMJFAQSA-N 0.000 description 1
- FYRUJIJAUPHUNB-IUCAKERBSA-N Met-Gly-Arg Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N FYRUJIJAUPHUNB-IUCAKERBSA-N 0.000 description 1
- WXJLBSXNUHIGSS-OSUNSFLBSA-N Met-Thr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WXJLBSXNUHIGSS-OSUNSFLBSA-N 0.000 description 1
- 241000234295 Musa Species 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 102000018463 Myo-Inositol-1-Phosphate Synthase Human genes 0.000 description 1
- 108091000020 Myo-Inositol-1-Phosphate Synthase Proteins 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 102000011931 Nucleoproteins Human genes 0.000 description 1
- 108010061100 Nucleoproteins Proteins 0.000 description 1
- 241000795633 Olea <sea slug> Species 0.000 description 1
- 240000007817 Olea europaea Species 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 101710149663 Osmotin Proteins 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 108010029182 Pectin lyase Proteins 0.000 description 1
- 108010087702 Penicillinase Proteins 0.000 description 1
- 244000038248 Pennisetum spicatum Species 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 101710163504 Phaseolin Proteins 0.000 description 1
- 244000100170 Phaseolus lunatus Species 0.000 description 1
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 1
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 1
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- OYQBFWWQSVIHBN-FHWLQOOXSA-N Phe-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O OYQBFWWQSVIHBN-FHWLQOOXSA-N 0.000 description 1
- SWCOXQLDICUYOL-ULQDDVLXSA-N Phe-His-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SWCOXQLDICUYOL-ULQDDVLXSA-N 0.000 description 1
- GYEPCBNTTRORKW-PCBIJLKTSA-N Phe-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O GYEPCBNTTRORKW-PCBIJLKTSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- METZZBCMDXHFMK-BZSNNMDCSA-N Phe-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N METZZBCMDXHFMK-BZSNNMDCSA-N 0.000 description 1
- KLXQWABNAWDRAY-ACRUOGEOSA-N Phe-Lys-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 KLXQWABNAWDRAY-ACRUOGEOSA-N 0.000 description 1
- OXKJSGGTHFMGDT-UFYCRDLUSA-N Phe-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C1=CC=CC=C1 OXKJSGGTHFMGDT-UFYCRDLUSA-N 0.000 description 1
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 1
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 1
- VGTJSEYTVMAASM-RPTUDFQQSA-N Phe-Thr-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VGTJSEYTVMAASM-RPTUDFQQSA-N 0.000 description 1
- 241000218657 Picea Species 0.000 description 1
- 240000000020 Picea glauca Species 0.000 description 1
- 235000008127 Picea glauca Nutrition 0.000 description 1
- 241000709664 Picornaviridae Species 0.000 description 1
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 1
- 235000008565 Pinus banksiana Nutrition 0.000 description 1
- 235000011613 Pinus brutia Nutrition 0.000 description 1
- 241000018646 Pinus brutia Species 0.000 description 1
- 235000005018 Pinus echinata Nutrition 0.000 description 1
- 235000011334 Pinus elliottii Nutrition 0.000 description 1
- 241000142776 Pinus elliottii Species 0.000 description 1
- 235000016013 Pinus leiophylla var chihuahuana Nutrition 0.000 description 1
- 235000013267 Pinus ponderosa Nutrition 0.000 description 1
- 241000555277 Pinus ponderosa Species 0.000 description 1
- 235000008578 Pinus strobus Nutrition 0.000 description 1
- 235000008585 Pinus thunbergii Nutrition 0.000 description 1
- 235000014030 Podocarpus spicatus Nutrition 0.000 description 1
- 241000710078 Potyvirus Species 0.000 description 1
- GRIRJQGZZJVANI-CYDGBPFRSA-N Pro-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 GRIRJQGZZJVANI-CYDGBPFRSA-N 0.000 description 1
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 1
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 1
- SZZBUDVXWZZPDH-BQBZGAKWSA-N Pro-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 SZZBUDVXWZZPDH-BQBZGAKWSA-N 0.000 description 1
- HQVPQXMCQKXARZ-FXQIFTODSA-N Pro-Cys-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O HQVPQXMCQKXARZ-FXQIFTODSA-N 0.000 description 1
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 1
- CLJLVCYFABNTHP-DCAQKATOSA-N Pro-Leu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O CLJLVCYFABNTHP-DCAQKATOSA-N 0.000 description 1
- SRBFGSGDNNQABI-FHWLQOOXSA-N Pro-Leu-Trp Chemical compound N([C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C(=O)[C@@H]1CCCN1 SRBFGSGDNNQABI-FHWLQOOXSA-N 0.000 description 1
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 1
- 101710083689 Probable capsid protein Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 235000008572 Pseudotsuga menziesii Nutrition 0.000 description 1
- 235000005386 Pseudotsuga menziesii var menziesii Nutrition 0.000 description 1
- 241000508269 Psidium Species 0.000 description 1
- 240000001679 Psidium guajava Species 0.000 description 1
- 235000013929 Psidium pyriferum Nutrition 0.000 description 1
- 108010079005 RDV peptide Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 235000011449 Rosa Nutrition 0.000 description 1
- 241000220317 Rosa Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 108010016634 Seed Storage Proteins Proteins 0.000 description 1
- 241001138418 Sequoia sempervirens Species 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- LWMQRHDTXHQQOV-MXAVVETBSA-N Ser-Ile-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LWMQRHDTXHQQOV-MXAVVETBSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 1
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 1
- ATEQEHCGZKBEMU-GQGQLFGLSA-N Ser-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N ATEQEHCGZKBEMU-GQGQLFGLSA-N 0.000 description 1
- VAIWUNAAPZZGRI-IHPCNDPISA-N Ser-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N VAIWUNAAPZZGRI-IHPCNDPISA-N 0.000 description 1
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 1
- 235000008515 Setaria glauca Nutrition 0.000 description 1
- 240000005498 Setaria italica Species 0.000 description 1
- 235000007226 Setaria italica Nutrition 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000007230 Sorghum bicolor Nutrition 0.000 description 1
- 241001300193 Speranskia Species 0.000 description 1
- 241000968236 Sphaerococcus <mealybug> Species 0.000 description 1
- 235000009184 Spondias indica Nutrition 0.000 description 1
- 102100023719 Src substrate cortactin Human genes 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 241000187191 Streptomyces viridochromogenes Species 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- 229940100389 Sulfonylurea Drugs 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 235000006468 Thea sinensis Nutrition 0.000 description 1
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 1
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 1
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 1
- 235000001484 Trigonella foenum graecum Nutrition 0.000 description 1
- 244000250129 Trigonella foenum graecum Species 0.000 description 1
- 235000019714 Triticale Nutrition 0.000 description 1
- 244000228852 Triticum baeoticum Species 0.000 description 1
- 240000006716 Triticum compactum Species 0.000 description 1
- 240000008056 Triticum dicoccoides Species 0.000 description 1
- 235000018680 Triticum dicoccoides Nutrition 0.000 description 1
- 235000001468 Triticum dicoccon Nutrition 0.000 description 1
- 240000000581 Triticum monococcum Species 0.000 description 1
- 244000085553 Triticum polonicum Species 0.000 description 1
- 235000004240 Triticum spelta Nutrition 0.000 description 1
- 244000152061 Triticum turgidum ssp durum Species 0.000 description 1
- 235000003404 Triticum turgidum ssp. durum Nutrition 0.000 description 1
- KIMOCKLJBXHFIN-YLVFBTJISA-N Trp-Ile-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O)=CNC2=C1 KIMOCKLJBXHFIN-YLVFBTJISA-N 0.000 description 1
- YCEHCFIOIYNQTR-NYVOZVTQSA-N Trp-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)N[C@@H](CO)C(=O)O)N YCEHCFIOIYNQTR-NYVOZVTQSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 240000003021 Tsuga heterophylla Species 0.000 description 1
- 241000722923 Tulipa Species 0.000 description 1
- 241000722921 Tulipa gesneriana Species 0.000 description 1
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 1
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- YSGAPESOXHFTQY-IHRRRGAJSA-N Tyr-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N YSGAPESOXHFTQY-IHRRRGAJSA-N 0.000 description 1
- GAKBTSMAPGLQFA-JNPHEJMOSA-N Tyr-Thr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 GAKBTSMAPGLQFA-JNPHEJMOSA-N 0.000 description 1
- BXJQKVDPRMLGKN-PMVMPFDFSA-N Tyr-Trp-Leu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 BXJQKVDPRMLGKN-PMVMPFDFSA-N 0.000 description 1
- QRCBQDPRKMYTMB-IHPCNDPISA-N Tyr-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N QRCBQDPRKMYTMB-IHPCNDPISA-N 0.000 description 1
- 108060008724 Tyrosinase Proteins 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 241000505722 Uraria Species 0.000 description 1
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- WFENBJPLZMPVAX-XVKPBYJWSA-N Val-Gly-Glu Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O WFENBJPLZMPVAX-XVKPBYJWSA-N 0.000 description 1
- ZTKGDWOUYRRAOQ-ULQDDVLXSA-N Val-His-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N ZTKGDWOUYRRAOQ-ULQDDVLXSA-N 0.000 description 1
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 1
- HPOSMQWRPMRMFO-GUBZILKMSA-N Val-Pro-Cys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N HPOSMQWRPMRMFO-GUBZILKMSA-N 0.000 description 1
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 1
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 1
- ODUHAIXFXFACDY-SRVKXCTJSA-N Val-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)C(C)C ODUHAIXFXFACDY-SRVKXCTJSA-N 0.000 description 1
- 235000010749 Vicia faba Nutrition 0.000 description 1
- 240000006677 Vicia faba Species 0.000 description 1
- 235000002098 Vicia faba var. major Nutrition 0.000 description 1
- 241000219977 Vigna Species 0.000 description 1
- 240000004922 Vigna radiata Species 0.000 description 1
- 235000010721 Vigna radiata var radiata Nutrition 0.000 description 1
- 235000011469 Vigna radiata var sublobata Nutrition 0.000 description 1
- 235000010726 Vigna sinensis Nutrition 0.000 description 1
- 108700010756 Viral Polyproteins Proteins 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 101001036768 Zea mays Glucose-1-phosphate adenylyltransferase large subunit 1, chloroplastic/amyloplastic Proteins 0.000 description 1
- 101000662549 Zea mays Sucrose synthase 1 Proteins 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009418 agronomic effect Effects 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 235000020224 almond Nutrition 0.000 description 1
- 108090000637 alpha-Amylases Proteins 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 229940097012 bacillus thuringiensis Drugs 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 102000023732 binding proteins Human genes 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- QKSKPIVNLNLAAV-UHFFFAOYSA-N bis(2-chloroethyl) sulfide Chemical compound ClCCSCCCl QKSKPIVNLNLAAV-UHFFFAOYSA-N 0.000 description 1
- 244000022203 blackseeded proso millet Species 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 239000010974 bronze Substances 0.000 description 1
- 102000028861 calmodulin binding Human genes 0.000 description 1
- 108091000084 calmodulin binding Proteins 0.000 description 1
- 235000020226 cashew nut Nutrition 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 229940124587 cephalosporin Drugs 0.000 description 1
- 150000001780 cephalosporins Chemical class 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000000078 claw Anatomy 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- KUNSUQLRTQLHQQ-UHFFFAOYSA-N copper tin Chemical compound [Cu].[Sn] KUNSUQLRTQLHQQ-UHFFFAOYSA-N 0.000 description 1
- 244000038559 crop plants Species 0.000 description 1
- 230000010154 cross-pollination Effects 0.000 description 1
- 239000012297 crystallization seed Substances 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- UQHKFADEQIVWID-UHFFFAOYSA-N cytokinin Natural products C1=NC=2C(NCC=C(CO)C)=NC=NC=2N1C1CC(O)C(CO)O1 UQHKFADEQIVWID-UHFFFAOYSA-N 0.000 description 1
- 239000004062 cytokinin Substances 0.000 description 1
- 231100000599 cytotoxic agent Toxicity 0.000 description 1
- 239000002619 cytotoxin Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000016574 developmental growth Effects 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 244000013123 dwarf bean Species 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 230000004720 fertilization Effects 0.000 description 1
- 244000037666 field crops Species 0.000 description 1
- 229930003935 flavonoid Natural products 0.000 description 1
- 229930002879 flavonoid pigment Natural products 0.000 description 1
- 150000002215 flavonoids Chemical class 0.000 description 1
- 235000017173 flavonoids Nutrition 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 238000005558 fluorometry Methods 0.000 description 1
- 210000000973 gametocyte Anatomy 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 1
- 229940097068 glyphosate Drugs 0.000 description 1
- 235000021331 green beans Nutrition 0.000 description 1
- 239000004009 herbicide Substances 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 239000010903 husk Substances 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 230000036031 hyperthermia Effects 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229910000833 kovar Inorganic materials 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 235000013490 limbo Nutrition 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 230000017494 microgametogenesis Effects 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- VYQNWZOUAUKGHI-UHFFFAOYSA-N monobenzone Chemical compound C1=CC(O)=CC=C1OCC1=CC=CC=C1 VYQNWZOUAUKGHI-UHFFFAOYSA-N 0.000 description 1
- 235000010460 mustard Nutrition 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 101150041247 p1 gene Proteins 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 229950009506 penicillinase Drugs 0.000 description 1
- LWTDZKXXJRRKDG-UHFFFAOYSA-N phaseollin Natural products C1OC2=CC(O)=CC=C2C2C1C1=CC=C3OC(C)(C)C=CC3=C1O2 LWTDZKXXJRRKDG-UHFFFAOYSA-N 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- XEBWQGVWTUSTLN-UHFFFAOYSA-M phenylmercury acetate Chemical compound CC(=O)O[Hg]C1=CC=CC=C1 XEBWQGVWTUSTLN-UHFFFAOYSA-M 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- 238000003976 plant breeding Methods 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 101150021296 rip2 gene Proteins 0.000 description 1
- 235000017985 rocky mountain lodgepole pine Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000003345 scintillation counting Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- 230000008117 seed development Effects 0.000 description 1
- 230000007226 seed germination Effects 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000014639 sexual reproduction Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 108010048090 soybean lectin Proteins 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 230000028070 sporulation Effects 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 229940124530 sulfonamide Drugs 0.000 description 1
- 150000003456 sulfonamides Chemical class 0.000 description 1
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical class OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 238000007862 touchdown PCR Methods 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 235000001019 trigonella foenum-graecum Nutrition 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 101150101900 uidA gene Proteins 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
- 241000228158 x Triticosecale Species 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8287—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
- C12N15/8289—Male sterility
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H5/00—Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
- A01H5/10—Seeds
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H6/00—Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
- A01H6/46—Gramineae or Poaceae, e.g. ryegrass, rice, wheat or maize
- A01H6/4678—Triticum sp. [wheat]
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8287—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Botany (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Cell Biology (AREA)
- Plant Pathology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Developmental Biology & Embryology (AREA)
- Physiology (AREA)
- Environmental Sciences (AREA)
- Natural Medicines & Medicinal Plants (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了用于调节植物中的雄性育性的组合物和方法。所述组合物包含调节雄性育性的核苷酸序列及其活性片段和变体。本发明还提供了表达盒,所述表达盒包含有效连接到启动子的雄性育性多核苷酸或其活性片段或变体,其中所述多核苷酸的表达调节植物的雄性育性。本发明还提供了各种方法,其中影响雄性育性的序列的水平和/或活性在植物或植物部分中得到调节。
Description
本申请是与母案发明名称相同的分案申请,母案的中国申请号是201380046655.6,国际申请号是PCT/US2013/058500,申请日是2013年9月6日。
技术领域
本发明涉及植物分子生物学领域,更具体地讲,涉及影响雄性育性。
对以电子方式提交的序列表的引用
通过EFS-Web以电子方式将序列表的正式文本作为ASCII格式的序列表提交,该文件名称为5282-PCT_ST25.txt,最后修改日期为2013年9月6日,文件大小为42KB,并且该文件与本说明书同时提交。该ASCII格式文档中所含的序列表是本说明书的一部分,并且全文以引用的方式并入本文。
背景技术
杂交植物育种的发展已使产生的作物在质量和数量方面取得相当大的进展成为可能。由于经过了杂交程序,故产量增加,所需特性的组合如对病害和虫害的抗性、耐热性和耐旱性,以及植物组成发生变化都可能出现。这些程序在很多情况下主要依赖于提供向雌性亲本贡献花粉的雄性亲本以产生所得的杂交体。
大田作物通过利用植物的授粉方法的技术进行育种。如果来自植物的一朵花的花粉转移到同一植物或遗传上相同的植物的同一朵花或另一朵花,则植物自花授粉。如果花粉来自遗传上不同的植物的花,则植物异花授粉。
在某些物种中,诸如芸苔(Brassica campestris),植物通常自花不育,并且只能够异花授粉。在自花授粉的物种中,诸如大豆和棉花,雄性和雌性植株在解剖学上是雌雄同株的。在自然授粉过程中,一朵花的雄性繁殖器官给同一朵花的雌性繁殖器官授粉。
普通小麦(Triticum aestivum)是具有限定基因组A、B和D的三对同源染色体的六倍体植物。小麦籽粒的胚乳包括来自母本细胞的2个单倍体补体和来自父本细胞的1个单倍体补体。小麦籽粒的胚包括来自母本细胞和父本细胞中的每一者的一个单倍体补体。六倍性被认为是研究和开发小麦的有用变体的过程中的重大障碍。实际上,人们对小麦的同源基因如何相互作用、如何调控这些同源基因的表达、以及由同源基因产生的不同蛋白质如何独立或协同地发挥作用方面知之甚少。
用遗传性雄性不育体系进行的大部分工作的必要方面是识别影响雄性育性的基因。这种基因可以在包括本文所述的那些体系在内的多种体系中使用以控制雄性育性。
发明内容
本发明提供了用于调节植物中的雄性育性的组合物和方法。组合物包含调节雄性育性的核苷酸序列,及其活性片段和变体。本发明还提供了表达盒,该表达盒包含有效连接到启动子的雄性育性多核苷酸、或其活性片段或变体中的一者或多者,其中所述多核苷酸的表达调节植物的雄性育性。本发明还提供了各种方法,其中影响雄性育性的多核苷酸的水平和/或活性在植物或植物部分中得到调节。
附图简述
图1示出小麦MS26基因,即A基因组(SEQ ID NO:28)、B基因组(SEQ ID NO:29)和D基因组(SEQ ID NO:30),较之玉蜀黍的MS26直系同源基因(SEQ ID NO:31)、高梁的MS26直系同源基因(SEQ ID NO:32)和水稻的MS26直系同源基因(SEQ ID NO:33)横跨MS26+靶标位点(SEQ ID NO:21)进行的比对。
图2示出本文所述的由MS26+归巢核酸内切酶诱导的NHEJ(非同源末端连接)突变的比对。所述突变通过深度测序进行鉴定。参考序列示出未经修饰的基因座,基因组靶标位点以下划线表示。还指示了预期的切割位点。由于不完美的NHEJ导致的缺失以“-”示出。参考序列对应于Fielder小麦Ms26(SEQ ID NO:34)。
图3示出本文所述的由MS26+归巢核酸内切酶诱导的NHEJ突变的类型。所述突变通过对DNA载体中的亚克隆PCR产物进行测序来鉴定。MS26等位基因标号1、2和3很可能分别指小麦基因组拷贝D、A和B。
图4示出由MS26+归巢核酸内切酶诱导的NHEJ突变的比对。顶部序列是与示出未经修饰的基因座的参考序列(SEQ ID NO:45)进行比较的MS26靶标位点(SEQ ID NO:21)。由于不完美的NHEJ导致的缺失以“-”示出,而空位代表SEQ ID NO:50中的C核苷酸插入。所述突变通过对DNA载体中的亚克隆PCR产物进行测序来鉴定。
具体实施方式
下文将结合附图更详细地描述本发明,附图中只显示了本发明的一些实施例,而非全部实施例。事实上,这些发明可以多种不同形式呈现,且不应理解为受限于本文陈述的实施例;更确切地说,提供这些实施例以使得本公开将满足适用的法律要求。类似的编号在全文中是指类似的要素。
借助前面的描述和随附的附图中给出的教导,本发明所属领域的技术人员将会想到本文所述的发明的许多修改形式和其他实施例。因此,应当了解,本发明不限于所公开的特定实施例,并旨在将修改形式和其他实施例包括在所附权利要求的范围内。虽然本文中采用特定术语,但所述术语仅在一般性和描述性意义上使用而并非用于限制目的。
I.雄性育性多核苷酸
本文所公开的组合物包含影响雄性育性的多核苷酸和多肽。具体地讲,提供了分离的多核苷酸,其包含编码SEQ ID NO:2、4、6、8、10、12、14、16或18示出的氨基酸序列或它们的活性片段或变体的核苷酸序列。还提供了具有由本文所述的多核苷酸编码的氨基酸序列的多肽,所述多核苷酸例如SEQ ID NO:1、3、5、7、9、11、13、15或17示出的那些或它们的活性片段或变体。
有性繁殖植物发育出特用于产生雄性配子和雌性配子的特化组织。雄性配子的成功产生依赖于雄性繁殖组织的正确形成。体现植物的雄性繁殖器官的雄蕊包含各种细胞类型,包括例如花丝、花药、绒毡层和花粉。如本文所用,“雄性组织”是指有性繁殖植物中的负责产生雄性配子的特化组织。雄性组织包括但不限于雄蕊、花丝、花药、绒毡层和花粉。
成熟花粉粒形成的过程始于小孢子发生,其中性母细胞形成于花药的造孢组织中。随后是小配子发生,其中小孢子以有丝分裂的形式分裂,随后发育成小配子体或花粉粒。“雄性育性”或“雄性能育的”的状态是指产生成熟花粉粒的那些植物,所述成熟花粉粒能够使雌性配子受精以产生后代。如本文所用,术语“影响雄性育性”或“调节雄性育性”是指在与合适的对照比较时植物产生成熟花粉粒的能力的任何增强或下降。“成熟花粉粒”或“成熟花粉”是指任何能够使雌性配子受精以产生后代的花粉粒。同样,术语“雄性育性多核苷酸”或“雄性育性多肽”是指调节雄性育性的多核苷酸或多肽。雄性育性多核苷酸可例如编码参与小孢子发生或小配子发生的过程的多肽。
本文所公开的雄性育性多核苷酸包括被证实影响雄性育性的多核苷酸的同源物和直系同源物。例如,本文所公开的雄性育性多核苷酸及其活性片段和变体包括Ms22(也称为Mscal)的同源物和直系同源物。Ms22的诱变研究得到了表型为雄性不育的玉蜀黍植物,其花药不从穗伸出并且缺乏造孢组织。West and Albertsen(1985)Maize Newsletter 59:87(West和Albertsen,1985年,《玉蜀黍时事通讯》,第59卷,第87页);Neuffer et al.(1977)Mutants of maize.Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY(Neuffer等人,1977年,《玉蜀黍突变体》,冷泉港实验室出版社,纽约冷泉港)。
缺乏Ms22表达的植物在繁殖组织发育早期表现出生理改变。据信,Ms22在另一种发育中具有作用,该作用的出现早于Ms45或Ms26的作用。某些雄性不育基因诸如MAC1、EMS1或GNE2(Sorensen et al.(2002)Plant J.29:581-594(Sorensen等人,2002年,《植物杂志》,第29卷,第581-594页))阻止四分孢子阶段中的细胞生长。SPOROCYTELESS/NOZZLE基因中的突变在发育早期起作用,但不仅影响花药形成而且影响胚珠形成,使得植物为雄性不育和雌性不育。拟南芥(Arabidopsis)的SPOROCYTELESS基因是孢子发生的起始所必需的,并且编码新型的核蛋白(Genes Dev.1999 Aug 15;13(16):2108-17(《基因和发育》,1999年8月15日,第13卷,第16期,第2108-2117页))。由于Ms22对于小孢子发生的进展至关重要,所以与其他雄性不育突变构建体相比,在Ms22突变体中维持雄性非常可靠。如本文别处所公开,来自小麦的Ms22多核苷酸由SEQ ID NO:1、3和5示出。
另外的雄性育性多核苷酸包括Ms26多核苷酸及其同源物和直系同源物。已报道Ms26多肽与存在于酵母、植物和哺乳动物中的P450酶具有显著同源性。P450酶已被广泛地研究并且特征性蛋白结构域已被阐明。Ms26蛋白质包含真核P450蛋白质的若干结构基序特征,包括血红素结合结构域FxxGxRxCxG(结构域D;SEQ ID NO:19)、结构域A A/GGXD/ETT/S(双氧结合结构域;SEQ ID NO:20)、结构域B(类固醇结合结构域)和结构域C在内。系谱树分析表明,Ms26与存在于拟南芥(Arabidopsis thaliana)和救荒野豌豆(Vicia sattva)中的脂肪酸ω羟化所涉及的P450最密切相关。参见例如美国专利公布No.2012/0005792,该专利公布以引用的方式并入本文。如本文别处所公开,来自小麦的Ms26多核苷酸由SEQ ID NO:7、9和11示出。
本文所公开的另外的雄性育性多核苷酸及其活性片段和变体还可包括Ms45多核苷酸的同源物和直系同源物。Ms45多核苷酸是在玉蜀黍中得到表征的雄性育性多核苷酸。在小孢子空泡化期间,Ms45的突变可导致小孢子发生出现中断,从而致使突变的植物雄性不育。当克隆的玉蜀黍Ms45多核苷酸被引入到此类突变的雄性不育植物中时,该基因可与所述突变互补并赋予雄性育性。如本文别处所公开,来自小麦的Ms45多核苷酸由SEQ IDNO:13、15和17示出。
操纵雄性育性多核苷酸在小麦中的表达的策略将需要考虑各个小麦品种的倍性水平。普通小麦是包含被指定为A、B和D的三个基因组的六倍体(N=21);每个基因组包含七对非同源染色体。一粒小麦品种是二倍体(N=7),而二粒小麦品种是四倍体(N=14)。
本文公开了分离的或实质上纯化的核酸分子或蛋白质组合物。“分离的”或“纯化的”核酸分子、多核苷酸、或蛋白质、或它们的生物活性部分,实质上或基本上不含通常在该多核苷酸或蛋白质的天然环境中存在的、与该多核苷酸或蛋白质相伴随或相互作用的组分。因此,分离的或纯化的多核苷酸或蛋白质,当通过重组技术产生时基本上不含其他细胞物质或培养基,或者当通过化学法合成时基本上不含化学前体或其他化学品。最优的是,“分离的”多核苷酸不含在得到该多核苷酸的生物体的基因组DNA中天然位于该多核苷酸的旁侧的序列(即,位于该多核苷酸的5′和3′末端的序列)(最佳的是蛋白质编码序列)。例如,在各种实施例中,分离的多核苷酸可含有少于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的在衍生该多核苷酸的细胞的基因组DNA中天然位于该多核苷酸的旁侧的核苷酸序列。基本上不含细胞物质的蛋白质包括具有小于约30%、20%、10%、5%或1%(以干重计)的污染性蛋白质的蛋白质制备物。当本文所公开的多肽或其生物活性部分用重组法产生时,最佳的是,培养基具有少于约30%、20%、10%、5%或1%(以干重计)的化学前体或非目的蛋白质的化学品。
“受试植物”或“受试植物细胞”是其中已针对目的基因实现了遗传变更(诸如转化)的植物或植物细胞,或者是从经如此变更的植物或细胞遗传下来并包含该变更的植物或植物细胞。“对照”或“对照植物”或“对照植物细胞”提供测量受试植物或植物细胞的表型变化的参考点。
对照植物或植物细胞可例如包括:(a)野生型植物或植物细胞,即,具有与用于进行遗传变更的起始材料相同的基因型的植物或植物细胞,该遗传变更会得到受试植物或细胞;(b)具有与起始材料相同的基因型但已用无效构建体(即,用对目的性状不具有已知效果的构建体,诸如包含标记基因的构建体)转化的植物或植物细胞;(c)为受试植物或植物细胞的子代中的非转化分离子的植物或植物细胞;(d)在遗传上与受试植物或植物细胞相同但不暴露于会诱导目的基因的表达的条件或刺激因素的植物或植物细胞;或者(e)处于目的基因不被表达的条件下的受试植物或植物细胞本身。
A.雄性育性序列的片段和变体
还提供了本发明所公开的多核苷酸的片段和变体以及由其编码的蛋白质。所谓“片段”,意指多核苷酸的一部分或由其编码的氨基酸序列从而由其编码的蛋白质的一部分。多核苷酸的片段可编码保留该天然蛋白质的生物活性从而影响雄性育性的蛋白质片段。作为另一种选择,可用作杂交探针的多核苷酸片段通常不编码保持生物活性的片段蛋白质。因此,核苷酸序列的片段的范围可为本文所公开的编码多肽的至少约20个核苷酸、约50个核苷酸、约100个核苷酸、直至全长多核苷酸。
编码影响雄性育性的多肽的生物活性部分的多核苷酸的片段将编码至少15、25、30、50、100、150、200、250、300、350、400、450、500、525或537个连续的氨基酸,或直至存在于影响雄性育性的全长多肽(例如,分别为SEQ ID NO:2、4、6、8、10、12、14、16和18)中的氨基酸的总数。编码影响雄性育性的多肽的多核苷酸的可用作杂交探针或PCR引物的片段,通常不需要编码影响雄性育性的多肽的生物活性部分。
因此,如本文所公开的雄性育性多核苷酸的片段可以编码雄性育性多肽的生物活性部分,或者其可以是可使用下文所公开的方法被用作杂交探针或PCR引物的片段。雄性育性多肽的生物活性部分可通过以下所述来制备:分离本文所公开的雄性育性多核苷酸中的一者的一部分,表达雄性育性蛋白质的编码部分(例如,通过体外重组表达),以及评估雄性育性多肽的编码部分的活性。作为雄性育性多核苷酸的片段的多核苷酸包含至少16、20、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、800、900、1000、1100、1200、1300、1400、1500、1600或1629个核苷酸、或者直至本文所公开的全长雄性育性多核苷酸(即,分别为SEQ ID NO:1、3、5、7、9、11、13、15或17)中存在的核苷酸的数目。
“变体”旨在意指实质上相似的序列。对于多核苷酸,变体包含在天然多核苷酸当中的一个或多个内部位点处的一个或多个核苷酸的缺失和/或添加,和/或在天然多核苷酸中的一个或多个位点处的一个或多个核苷酸的置换。如本文所用,“天然”或“野生型”多核苷酸或多肽分别包含天然存在的核苷酸序列或氨基酸序列。对于多核苷酸而言,保守变体包含那些由于遗传密码的简并性而编码本文所公开的雄性育性多肽中的一者的氨基酸序列的序列。诸如这些变体的天然存在的等位基因变体可用公知的分子生物学技术(例如,用下文概述的聚合酶链反应(PCR)和杂交技术)进行鉴定。变体多核苷酸还包括通过合成获得的多核苷酸,诸如那些例如通过使用定点诱变产生但仍编码雄性育性多肽的多核苷酸。通常,本文所公开的特定多核苷酸的变体将与该特定多核苷酸(例如SEQ ID NO:1、3、5、7、9、11、13、15或17中的任一者)具有至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性,这通过本文别处所述的序列比对程序和参数进行测定。
本文所公开的特定多核苷酸(即,参考多核苷酸)的变体还可通过比较变体多核苷酸所编码的多肽与该参考多核苷酸所编码的多肽之间的序列同一性百分数来进行评估。因此,例如,公开了编码与SEQ ID NO:2、4、6、8、10、12、14、16或18的多肽具有给定序列同一性百分数的多肽的分离的多核苷酸。任何两种多肽之间的序列同一性百分数可用本文别处描述的序列比对程序和参数来计算。在任何给定的本文所公开的多核苷酸对是通过比较它们编码的两种多肽所共享的序列同一性百分数进行评估的情况中,两种被编码的多肽之间的序列同一性百分数为至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。
“变体”蛋白质旨在意指通过在天然蛋白质中的一个或多个内部位点处缺失或添加一个或多个氨基酸和/或在天然蛋白质的一个或多个位点处置换一个或多个氨基酸而从该天然蛋白质衍生的蛋白质。本文所公开的变体蛋白质具有生物活性,即它们继续具有天然蛋白质的所需生物活性,即本文所述的雄性育性活性。这种变体可例如由遗传多态性或由人类操纵而得到。本文所公开的雄性育性蛋白质的生物活性变体将与该天然蛋白质的氨基酸序列(例如,SEQ ID NO:2、4、6、8、10、12、14、16或18中的任一者)具有至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性,这通过本文别处所述的序列比对程序和参数进行测定。本文所公开的蛋白质的生物活性变体与该蛋白质可相差少至1-15个氨基酸残基,少至1-10个(诸如6-10个)、少至5个、少至4个、3个、2个或甚至1个氨基酸残基。
本文所公开的蛋白质可通过各种方式(包括氨基酸置换、缺失、截短和插入)进行变更。这类操纵的方法是本领域公知的。例如,雄性育性多肽的氨基酸序列变体和片段可通过在DNA中作出突变来制备。诱变和多核苷酸变更的方法是本领域熟知的。参见,例如,Kunkel(1985)Proc.Natl.Acad.Sci.USA 82:488-492(Kunkel,1985年,《美国国家科学院院刊》,第82卷,第488-492页);Kunkel et al.(1987)Methods in Enzymol.154:367-382(Kunkel等人,1987年,《酶学方法》,第154卷,第367-382页);美国专利No.4,873,192;Walker and Gaastra,eds.(1983)Techniques in Molecular Biology(MacMillanPublishing Company,New York)(Walker和Gaastra编辑,1983年,《分子生物学技术》,麦克米兰出版公司,纽约)以及其中引用的参考文献。有关不影响目的蛋白质的生物活性的适当氨基酸置换的指导,可见于Dayhoff et al.(1978)Atlas of Protein Sequence andStructure(Natl.Biomed.Res.Found.,Washington,D.C.(Dayhoff等人,1978年,《蛋白质序列和结构图表集》,美国国家生物医学研究基金会,华盛顿特区)的模型,该文献以引用方式并入本文。保守置换,诸如将一个氨基酸用另一个具有相似性质的氨基酸进行交换,可能是最佳的。
因此,本文所公开的基因和多核苷酸包括天然存在的序列以及保持功能的DNA序列变体这两者。同样,雄性育性多肽和蛋白质涵盖天然存在的多肽以及其变型形式和修饰形式这两者。此类多核苷酸和多肽变体将继续具有所需的雄性育性活性。将在编码该变体的DNA中所作的突变一定不能将序列设置在阅读框外,并且最佳地将不会产生互补区域,该互补区域可能产生二级mRNA结构。参见EP专利申请公开No.75,444。
本文所涵盖的蛋白质序列的缺失、插入和置换预期不会造成该蛋白质特性的根本变化。然而,当在进行置换、缺失或插入之前难以预测其确切效应时,本领域技术人员将认识到该效应将通过常规的筛选测定法进行评估。即,该活性可通过测定雄性育性活性来评估。
雄性育性的增强或下降可以以多种方式来测定。本领域的普通技术人员可以通过以下所述来容易地评估变体或片段的活性:将该多核苷酸引入到对于该多核苷酸的稳定雄性不育等位基因而言为纯合的植物中,随后观察植物中的雄性组织发育。例如,要测定Ms22(即,SEQ ID NO:1、3或5)的雄性育性活性,本领域的技术人员可通过构造对于导致雄性不育的天然Ms22基因中的突变而言为纯合的植物来开始。随后,技术人员可通过以下所述来对突变进行弥补:提供Ms22多核苷酸、或其活性片段或变体,随后观察植物的雄性组织是否正常发育以及是否能够产生成熟花粉。同样,本文还公开了可以执行相同的程序来测定Ms26(即,SEQ ID NO:7、9或11)或Ms45(即,SEQ ID NO:13、15或17)的变体或片段的雄性育性活性。
功能性变体多核苷酸和蛋白质还涵盖由诱变和重组程序(诸如DNA改组)获得的序列和蛋白质。用这种程序,可操纵一种或多种不同的雄性育性序列以产生具有所需性质的新的雄性育性多肽。以此方式,从一组相关的多核苷酸序列产生重组多核苷酸的文库,所述相关的多核苷酸序列包含具有实质的序列同一性且可以在体外或体内同源重组的序列区域。例如,使用该方法,可将编码目的结构域的序列基序在本文所公开的雄性育性多核苷酸和其他已知的雄性育性多核苷酸之间进行改组,以获得编码具有改善的目的性质(诸如在酶的情况中为提高的Km)的蛋白质的新基因。这种DNA改组的策略是本领域已知的。参见,例如,Stemmer(1994)Proc.Natl.Acad.Sci.USA 91:10747-10751(Stemmer,1994年,《美国国家科学院院刊》,第91卷,第10747-10751页);Stemmer(1994)Nature 370:389-391(Stemmer,1994年,《自然》,第370卷,第389-391页);Crameri et al.(1997)NatureBiotech.15:436-438(Crameri等人,1997年,《自然生物技术》,第15卷,第436-438页);Moore et al.(1997)J.Mol.Biol.272:336-347(Moore等人,1997年,《分子生物学杂志》,第272卷,第336-347页);Zhang et al.(1997)Proc.Natl.Acad.Sci.USA 94:4504-4509(Zhang等人,1997年,《美国国家科学院院刊》,第94卷,第4504-4509页);Crameri et al.(1998)Nature 391:288-291(Crameri等人,1998年,《自然》,第391卷,第288-291页);以及美国专利No.5,605,793和No.5,837,458。
II.序列分析
如本文所用,“序列同一性”或“同一性”在两个多核苷酸或多肽序列的情形中是指当在指定的比较窗口上进行比对以获得最大对应时两个序列中相同的残基。当序列同一性百分数针对蛋白质使用时,认识到不相同的残基位置往往差别在于保守氨基酸置换,其中氨基酸残基由具有相似化学性质(例如电荷或疏水性)的其他氨基酸残基置换,因此不会改变分子的功能性质。当序列差别在于保守置换,则可以上调序列同一性百分数以校正置换的保守性质。差异在于这类保守置换的序列称为具有“序列相似性”或“相似性”。作出这个调整的方法是本领域技术人员公知的。通常,这涉及将保守置换评定为部分错配而不是完全错配,从而增加序列同一性百分数。因而,例如,如果相同的氨基酸给予1分,非保守置换给予0分,则保守置换给予0至1之间的分数。保守置换的评分是例如在程序PC/GENE(美国加利福尼亚州山景城(Mountain View,California)的Intelligenetics公司)中所执行那样进行计算。
本文所用的“序列同一性百分数”意指通过在比较窗口上比较两个最佳比对的序列所确定的数值,其中多核苷酸序列在该比较窗口中的部分与参比序列(不包含添加或缺失)相比可包含添加或缺失(即,空位),以便两个序列的最佳比对。通过以下方式计算这种百分数:确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以得到匹配的位置的数目,将匹配的位置的数目除以比较窗口中位置的总数目,然后将结果乘以100以得到序列同一性百分数。
除非另外指明,否则本文提供的序列同一性/相似性值指使用采用如下参数的GAP版本10或其任何等同程序获得的值:核苷酸序列的%同一性和%相似性采用GAP权重50和长度权重3以及nwsgapdna.cmp评分矩阵;氨基酸序列的%同一性和%相似性采用GAP权重8和长度权重2以及BLOSUM62评分矩阵。所谓“等同程序”意指任何这样的序列比较程序,其对于任何两个所考虑的序列,相比于GAP版本10所产生的相应比对,能产生出具有相同的核苷酸或氨基酸残基匹配和相同的序列同一性百分数的比对。
术语“多核苷酸”的使用并不旨在将本发明局限于包含DNA的多核苷酸。本领域普通技术人员会认识到,多核苷酸可包含核糖核苷酸以及包含核糖核苷酸和脱氧核糖核苷酸的组合。这种脱氧核糖核苷酸和核糖核苷酸既包括天然的分子也包括合成的类似物。本文所公开的多核苷酸还涵盖所有形式的序列,包括但不限于单链形式、双链形式、发夹结构、茎-环结构等。
III.表达盒
本文所公开的雄性育性多核苷酸可在表达盒中提供,以用于在目的生物体中表达。表达盒可包含有效连接到本文所公开的雄性育性多核苷酸的5′和3′调控序列。“有效连接”旨在意指两个或更多个元件之间的功能性连接。例如,目的多核苷酸与调控序列(例如,启动子)之间的有效连接是可使该目的多核苷酸得以表达的功能性连接。有效连接的元件可以是连续的或非连续的。当用来指两个蛋白质编码区域的连接时,所谓有效连接意指所述编码区域处于相同的阅读框中。
本文所公开的表达盒在5′-3′转录方向上可包含在宿主细胞(即,植物)中起作用的转录和翻译起始区(即,启动子)、目的多核苷酸、以及转录和翻译终止区(即,终止区)。表达盒还提供有多个限制性位点和/或重组位点,以使雄性育性多核苷酸的插入处于本文别处所述的调控区的转录调控之下。调控区(即,启动子、转录调控区和翻译终止区)和/或目的多核苷酸对于宿主细胞而言或彼此之间可以是天然的/同功的。作为另一种选择,调控区和/或目的多核苷酸对于宿主细胞而言或彼此之间可以是异源的。如本文所用,指涉多核苷酸或多肽序列的“异源”为起源于外来物种的序列,或者,如果起源于相同物种的话,则为通过蓄意的人为干预从其天然形式在组成和/或基因座方面进行实质性修饰得到的序列。例如,有效连接到异源多核苷酸的启动子来自与衍生这种多核苷酸的物种不同的物种,或者如果来自于相同/相似的物种,则一者或者两者实质上从它们的原始形式和/或基因座修饰而获得,或者该启动子不是用于有效连接的多核苷酸的天然启动子。如本文所周,嵌合多核苷酸包括与转录起始区有效连接的编码序列,该转录起始区对于该编码序列是异源的。
在某些实施例中,本文所公开的多核苷酸可与本文别处所公开的目的多核苷酸序列或表达盒的任何组合进行堆叠。例如,本文所公开的雄性育性多核苷酸可与本文别处所公开的编码雄性配子破坏性多核苷酸或多肽、细胞毒素、标记、或其他雄性育性序列的任何其他多核苷酸堆叠。堆叠的多核苷酸可有效连接到与雄性育性多核苷酸相同的启动子,或者可有效连接到另外的启动子多核苷酸。
如本文别处所述,表达盒可包含有效连接到目的多核苷酸的启动子,连同对应的终止区。终止区对于转录起始区可以是天然的,对于有效连接的目的雄性育性多核苷酸或雄性育性启动子序列可以是天然的,对于植物宿主可以是天然的,或者可以源自另一来源(即,外来的或异源的)。便利的终止区可获自根瘤农杆菌(A.tumefaciens)的Ti质粒,诸如章鱼氨酸合酶和胭脂氨酸合酶终止区。还可参见Guerineau et al.(1991)Mol.Gen.Genet.262:141-144(Guerineau等人,1991年,《分子遗传学与普通遗传学》,第262卷,第141-144页);Proudfoot(1991)Cell 64:671-674(Proudfoot,1991年,《细胞》,第64卷,第671-674页);Sanfacon et al.(1991)Genes Dev.5:141-149(Sanfacon等人,1991年,《基因和发育》,第5卷,第141-149页);Mogen et al.(1990)Plant Cell 2:1261-1272(Mogen等人,1990年,《植物细胞》,第2卷,第1261-1272页);Munroe et al.(1990)Gene 91:151-158(Munroe等人,1990年,《基因》,第91卷,第151-158页);Ballas et al.(1989)Nucleic Acids Res.17:7891-7903(Ballas等人,1989年,《核酸研究》,第17卷,第7891-7903页);以及Joshi et al.(1987)Nucleic Acids Res.15:9627-9639(Joshi等人,1987年,《核酸研究》,第15卷,第9627-9639页)。
如适当的话,可对目的多核苷酸进行优化以使其在转化的植物中的表达提高。也就是说,可使用植物优选的密码子来合成多核苷酸,以改进表达。有关宿主优选密码子用法的讨论,参见例如Campbell and Gowri(1990)Plant Physiol.92:1-11(Campbell和Gowri,1990年,《植物生理学》,第92卷,第1-11页)。本领域可获得用于合成植物优选的基因的方法。参见,例如,美国专利No.5,380,831和No.5,436,391,以及Murray et al.(1989)Nucleic Acids Res.17:477-498(Murray等人,1989年,《核酸研究》,第17卷,第477-498页),所述专利和文献以引用方式并入本文。
已知有另外的序列修饰能增强细胞宿主中的基因表达。这些包括消除以下序列:编码假多腺苷酸化信号、外显子-内含子剪接位点信号的序列、转座子样重复序列以及其他此类得到充分表征的可能有害于基因表达的序列。可将序列的G-C含量调整到给定的细胞宿主的平均水平,这通过参考在宿主细胞中表达的已知基因计算得到。当可能时,修饰序列以避免预测的发夹二级mRNA结构。
表达盒可以另外含有5′前导序列。此类前导序列可以起到增强翻译的作用。翻译前导序列是本领域已知的并且包括:小核糖核酸病毒前导序列,例如,EMCV前导序列(脑心肌炎5′非编码区)(Elroy-Stein et al.(1989)Proc.Natl.Acad.Sci.USA 86:6126-6130(Elroy-Stein等人,1989年,《美国国家科学院院刊》,第86页,第6126-6130页));马铃薯Y病毒组前导序列,例如TEV前导序列(烟草蚀纹病毒)(Gallie,et al.,(1995)Gene 165(2):233-238(Gallie等人,1995年,《基因》,第165卷,第2期,第233-238页))、MDMV前导序列(玉蜀黍矮花叶病毒)(Johnson,et al.,(1986)Virology 154:9-20(Johnson等人,1986年,《病毒学》,第154卷,第9-20页))和人免疫球蛋白重链结合蛋白(BiP)(Macejak,et al.,(1991)Nature 353:90-94(Macejak等人,1991年,《自然》,第353卷,第90-94页));来自苜蓿花叶病毒的外壳蛋白mRNA的非翻译前导序列(AMV RNA 4)(Jobling et al.(1987)Nature 325:622-625(Jobling等人,1987年,《自然》,第325卷,第622-625页));烟草花叶病毒前导序列(TMV)(Gallie et al.(1989)in Molecular Biology of RNA,ed.Cech(Liss,New York),pp.237-256(Gallie等人,1989年,载于《RNA的分子生物学》,Cech编辑(Liss,纽约),第237-256页));以及玉蜀黍枯黄斑点病毒前导序列(MCMV)(Lommel et al.(1991)Virology 81:382-385(Lommel等人,1991年,《病毒学》,第81卷,第382-385页))。还可参见Della-Cioppaet al.(1987)Plant Physiol.84:965-968(Della-Cioppa等人,1987年,《植物生理学》,第84卷,第965-968页)。也可利用其他已知的用于增强翻译的方法,例如内含子等等。
在制备表达盒时,可对各种DNA片段进行操纵,以提供处于正确取向的DNA序列,且适当时提供处于正确的阅读框的DNA序列。为此目的,可应用衔接子或接头将DNA片段连接在一起,或者可涉及其他的操纵以提供便利的限制性位点、去除多余的DNA、去除限制性位点等。出于这个目的,可涉及到体外诱变、引物修复、限制性酶切、退火、再置换(例如,转换和颠换)。
A.包含雄性育性多核苷酸的表达盒
在特定实施例中,本文所公开的表达盒包含有效连接到雄性育性多核苷酸的启动子、或其活性片段或变体,如本文所公开。在某些实施例中,雄性育性启动子或其活性片段或变体有效连接到本文所公开的雄性育性多核苷酸,诸如SEQ ID NO:1、3、5、7、9、11、13、15或17示出的雄性育性多核苷酸、或其活性片段或变体。
在某些实施例中,植物启动子可优先地在某些组织(诸如雄蕊、花药、花丝和花粉)或发育生长阶段(诸如造孢组织、小孢子和小配子体)中起始转录。此类植物启动子称为“组织优选的”、“细胞类型优选的”或“生长阶段优选的”。仅在某些组织中起始转录的启动子称为“组织特异性的”。同样,仅在某些生长阶段起始转录的启动子称为“生长阶段特异性的”。“细胞类型特异性的”启动子仅在一个或多个器官中的某些细胞类型(例如,雄蕊细胞)或雄蕊内的各细胞类型(诸如花药、花丝或花粉细胞)中驱动表达。
本文所公开的雄性育性多核苷酸及其活性片段和变体可有效连接到雄性组织特异性的或雄性组织优选的启动子,包括例如雄蕊特异性的或雄蕊优选的启动子、花药特异性的或花药优选的启动子、花粉特异性的或花粉优选的启动子、绒毡层特异性的启动子或绒毡层优选的启动子,等等。可基于所需的结果来选择启动子。例如,目的多核苷酸可有效连接到组成型启动子、组织优选的启动子、生长阶段优选的启动子或其他启动子,以在植物中表达。
在一个实施例中,启动子可以是在植物的雄性组织中优先地表达目的多核苷酸的那些启动子。该过程中没有一定要使用特定的雄性育性组织优选的启动子,而是可以使用本领域的技术人员已知的许多此类启动子中的任一种。一个这种启动子为5126启动子,其优先地将其所连接的多核苷酸的表达引导向植物的雄性组织,如在美国专利No.5,837,851和No.5,689,051中所述。其他例子包括美国专利No.6,037,523中描述的玉蜀黍Ms45启动子;美国专利No.6,452,069中描述的SF3启动子;WO 02/063021中描述的BS92-7启动子;美国专利No.5,470,359中描述的SGB6调控元件;TA29启动子(Koltunow,et al.,(1990)PlantCell 2:1201-1224(Koltunow等人,1990年,《植物细胞》,第2卷,第1201-1224页);Goldberg,et al.,(1993)Plant Cell 5:1217-1229(Goldberg等人,1993年,《植物细胞》,第5卷,第1217-1229页)以及美国专利No.6,399,856);2型金属硫蛋白样基因启动子(Charbonnel-Campaa,et al.,Gene(2000)254:199-208(Charbonnel-Campaa等人,《基因》,2000年,第254卷,第199-208页))以及芸苔属Bca9启动子(Lee,et al.,(2003)Plant CellRep.22:268-273(Lee等人,2003年,《植物细胞报告》,第22卷,第268-273页))。
在一些实施例中,表达盒包含有效连接到雄性育性多核苷酸的雄性配子优选的启动子。雄性配子优选的启动子包括PG47启动子(US 5,412,085;US 5,545,546;Plant J 3(2):261-271(1993)(《植物杂志》,第3卷,第2期,第261-271页,1993年)),以及ZM13启动子(Hamilton,et al.,(1998)Plant Mol.Biol.38:663-669(Hamilton等人,1998年,《植物分子生物学》,第38卷,第663-669页));肌动蛋白解聚因子启动子(诸如Zmabp1、Zmabp2;参见例如Lopez,et al.,(1996)Proc.Natl.Acad.Sci.USA 93:7415-7420(Lopez等人,1996年,《美国国家科学院院刊》,第93卷,第7415-7420页));玉蜀黍果胶甲酯酶样基因的启动子ZmC5(Wakeley,et al.,(1998)Plant Mol.Biol.37:187-192(Wakeley等人,1998年,《植物分子生物学》,第37卷,第187-192页));肌动蛋白抑制蛋白基因启动子Zmpro1(Kovar,etal.,(2000)The Plant Cell 12:583-598(Kovar等人,2000年,《植物细胞》,第12卷,第583-598页));硫酸化五肽phytosulphokine基因启动子ZmPSK1(Lorbiecke,et al.,(2005)Journal of Experimental Botany 56(417):1805-1819(Lorbiecke等人,2005年,《实验植物学杂志》,第56卷,第417期,第1805-1819页));钙调蛋白结合蛋白的启动子Mpcbp(Reddy,et al.,(2000)J.Biol.Chem.275(45):35457-70(Reddy等人,2000年,《生物化学杂志》,第275卷,第45期,第35457-35470页))。
如本文所公开,组成型启动子包括例如Rsyn7启动子的核心启动子和WO 99/43838和美国专利No.6,072,050中公开的其他组成型启动子;CaMV35S核心启动子(Odell et al.(1985)Nature 313:810-812(Odell等人,1985年,《自然》,第313卷,第810-812页));水稻肌动蛋白(McElroy et al.(1990)Plant Cell 2:163-171(McElroy等人,1990年,《植物细胞》,第2卷,第163-171页));遍在蛋白(Christensen et al.(1989)Plant Mol.Biol.12:619-632(Christensen等人,1989年,《植物分子生物学》,第12卷,第619-632页)和Christensen et al.(1992)Plant Mol.Biol.18:675-689(Christensen等人,1992年,《植物分子生物学》,第18卷,第675-689页));pEMU(Last et al.(1991)Theor.Appl.Genet.81:581-588(Last等人,1991年,《理论和应用遗传学》,第81卷,第581-588页));MAS(Velten etal.(1984)EMBO J.3:2723-2730(Velten等人,1984年,《欧洲分子生物学组织杂志》,第3卷,第2723-2730页));ALS启动子(美国专利No.5,659,026),等等。其他组成型启动子包括例如美国专利No.5,608,149、No.5,608,144、No.5,604,121、No.5,569,597、No.5,466,785、No.5,399,680、No.5,268,463、No.5,608,142、和No.6,177,611。
“种子优选的”启动子包括在种子发育期间活跃的那些启动子(诸如种子贮藏蛋白的启动子)以及在种子萌发期间活跃的那些启动子。参见Thompson et al.(1989)BioEssays 10:108(Thompson等人,1989年,《生物测定法》,第10卷,第108页),该文献以引用方式并入本文。这类种子优选的启动子包括但不限于Cim1(细胞分裂素诱导信息);cZ19B1(玉蜀黍19kDa玉米醇溶蛋白);milps(肌醇-1-磷酸合酶)(参见WO 00/11177和美国专利No.6,225,529;所述专利以引用方式并入本文)。γ-玉米醇溶蛋白基因启动子是胚乳特异性启动子。球蛋白-1(Glob-1)基因启动子是代表性的胚特异性启动子。对于双子叶植物而言,种子特异性启动子包括但不限于菜豆β-菜豆蛋白基因启动子、油菜籽蛋白(napin)基因启动子、β-伴球蛋白基因启动子、大豆凝集素基因启动子、十字花科蛋白基因启动子等。对于单子叶植物而言,种子特异性启动子包括但不限于玉蜀黍15kDa玉米醇溶蛋白基因启动子、22kDa玉米醇溶蛋白基因启动子、27kDa玉米醇溶蛋白基因启动子、γ-玉米醇溶蛋白基因启动子、糯性蛋白基因(waxy)启动子、超甜蛋白1(shrunken 1)基因启动子、超甜蛋白2(shrunken 2)基因启动子、球蛋白1基因启动子等。还可参见WO 00/12733,其中公开了来自endl和end2基因的种子优选的启动子;该专利以引用方式并入本文。另外的胚特异性启动子在如下文献中公开:Sato et al.(1996)Proc.Natl.Acad.Sci.93:8117-8122(Sato等人,1996年,《美国国家科学院院刊》,第93卷,第8117-8122页);Nakase et al.(1997)Plant J 12:235-46(Nakase等人,1997年,《植物杂志》,第12卷,第235-246页);以及Postma-Haarsma et al.(1999)Plant Mol.Biol.,39:257-71(Postma-Haarsma等人,1999年,《植物分子生物学》,第39卷,第257-271页)。另外的胚乳特异性启动子在如下文献中公开:Albani et al.(1984)EMBO 3:1405-15(Albani等人,1984年,《欧洲分子生物学组织杂志》,第3卷,第1405-1415页);Albani et al.(1999)Theor.Appl.Gen.98:1253-62(Albani等人,1999年,《理论与应用遗传学》,第98卷,第1253-1262页);Albani et al.(1993)PlantJ.4:343-55(Albani等人,1993年,《植物杂志》,第4卷,第343-355页);Mena et al.(1998)The Plant Journal 116:53-62(Mena等人,1998年,《植物杂志》,第116卷,第53-62页),以及Wu et al.(1998)Plant Cell Physiology 39:885-889(Wu等人,1998年,《植物细胞生理学》,第39卷,第885-889页)。
分裂细胞或分生组织优选的启动子已在如下文献中公开:Ito et al.(1994)Plant Mol.Biol.24:863-878(Ito等人,1994年,《植物分子生物学》,第24卷,第863-878页);Reyad et al.(1995)Mo.Gen.Genet.248:703-711(Reyad等人,1995年,《分子遗传学与普通遗传学》,第248卷,第703-711页);Shaul et al.(1996)Proc.Natl.Acad.Sci.93:4868-4872(Shaul等人,1996年,《美国国家科学院院刊》,第93卷,第4868-4872页);Ito etal.(1997)Plant J.11:983-992(Ito等人,1997年,《植物杂志》,第11卷,第983-992页);以及Trehin et al.(1997)Plant Mol.Biol.,35:667-672(Trehin等人,1997年,《植物分子生物学》,第35卷,第667-672页)。
胁迫诱导型启动子包括盐/水胁迫诱导型启动子,诸如P5CS(Zang et al.(1997)Plant Sciences 129:81-89(Zang等人,1997年,《植物科学》,第129卷,第81-89页));冷诱导型启动子,诸如cor15a(Hajela et al.(1990)Plant Physiol.93:1246-1252(Hajela等人,1990年,《植物生理学》,第93卷,第1246-1252页))、cor15b(Wlihelm et al.(1993)Plant Mol Biol 23:1073-1077(Wlihelm等人,1993年,《植物分子生物学》,第23卷,第1073-1077页))、wsc120(Ouellet et al.(1998)FEBS Lett.423-324-328(Ouellet等人,1998年,《欧洲微生物学会联合会微生物学快报》,第423卷,第324-328页))、ci7(Kirch etal.(1997)Plant Mol Biol.33:897-909(Kirch等人,1997年,《植物分子生物学》,第33卷,第897-909页))、ci21A(Schneider et al.(1997)Plant Physiol.113:335-45(Schneider等人,1997年,《植物生理学》,第113卷,第335-345页));干旱诱导型启动子,诸如Trg-31(Chaudhary et al(1996)Plant Mol.Biol.30:1247-57(Chaudhary等人,1996年,《植物分子生物学》,第30卷,第1247-1257页))、rd29(Kasuga et al.(1999)NatureBiotechnology18:287-291(Kasuga等人,1999年,《自然生物技术》,第18卷,第287.291页));渗透诱导型启动子,诸如Rab17(Vilardell,et al.,(1991)Plant Mol.Biol.17:985-93(Vilardell等人,1991年,《植物分子生物学》,第17卷,第985-993页))和渗透蛋白(Raghothama et al.(1993)Plant Mol Biol23:1117-28(Raghothama等人,1993年,《植物分子生物学》,第23卷,第1117-1128页));以及热诱导型启动子,诸如热休克蛋白(Barroset al.(1992)Plant Mol.19:665-75(Barros等人,1992年,《植物分子生物学》,第19卷,第665-675页);Marrs et al.(1993)Dev.Genet.14:27-41(Marrs等人,1993年,《遗传学发展》,第14卷,第27-41页))和smHSP(Waters et al.(1996)J.Experimental Botany 47:325-338(Waters等人,1996年,《实验植物学杂志》,第47卷,第325-338页))。其他胁迫诱导型启动子包括rip2(美国专利No.5,332,808和美国专利公开No.2003/0217393)和rp29a(Yamaguchi-Shinozaki et al.(1993)Mol.Gen.Genetics 236:331-340(Yamaguchi-Shinozaki等人,1993年,《分子遗传学与普通遗传学》,第236卷,第331-340页))。
如本文别处所述,包含雄性育性多核苷酸的表达盒可与其他目的多核苷酸堆叠。任何目的多核苷酸均可与雄性育性多核苷酸堆叠,包括例如雄性配子破坏性多核苷酸和标记多核苷酸。
本文所公开的雄性育性多核苷酸可堆叠在包含有效连接到具有雄性配子破坏性的多核苷酸(即,干扰雄性配子的功能、形成或传播的多核苷酸)的启动子的表达盒中,或与该表达盒堆叠。可通过多种方法中的任一种来操作雄性配子破坏性多核苷酸以阻止雄性配子的功能、形成或传播。以举例而非限制的方式,这可包括使用这样的多核苷酸,其编码基因产物诸如DAM-甲基化酶或芽孢杆菌RNA酶(参见例如,美国专利No.5,792,853或No.5,689,049,PCT/EP89/00495);编码干扰淀粉累积或影响花粉中的渗透平衡的基因产物(参见例如,美国专利No.7,875,764、No.8,013,218、No.7,696,405);抑制对于雄性配子的功能、形成或传播而言重要的基因产物的形成(参见例如,美国专利No.5,859,341、No.6,297,426);编码与另一种基因产物结合以阻止雄性配子的形成或功能的基因产物(参见美国专利No.6,162,964、No.6,013,859、No.6,281,348、No.6,399,856、No.6,248,935、No.6,750,868、No.5,792,853);与对雄性配子的功能、形成或传播至关重要的基因反义,或导致所述基因的共抑制(参见美国专利No.6,184,439、No.5,728,926、No.6,191,343、No.5,728,558、No.5,741,684);通过使用发夹式形成物干扰雄性育性多核苷酸的表达(Smith et al.(2000)Nature 407:319-320(Smith等人,2000年,《自然》,第407卷,第319-320页);WO 99/53050和WO 98/53083)等。
雄性配子破坏性多核苷酸包括显性负基因,诸如甲基化酶基因和生长抑制基因。参见美国专利No.6,399,856。显性负基因包括白喉毒素A链基因(Czako and An(1991)Plant Physiol.95687-692(Czako和An,1991年,《植物生理学》,第95卷,第687-692页);Greenfield et al.(1983)PNAS80:6853(Greenfield等人,1983年,《美国国家科学院院刊》,第80卷,第6853页));细胞周期分裂突变体诸如玉蜀黍中的CDC(Colasanti et al.(1991)PNAS 88:3377-3381(Colasanti等人,1991年,《美国国家科学院院刊》,第88卷,第3377-3381页));WT基因(Farmer et al.(1994)Mol.Genet.3:723-728(Farmer等人,1994年,《分子遗传学》,第3卷,第723-728页));以及P68(Chen et al.(1991)PNAS 88:315-319(Chen等人,1991年,《美国国家科学院院刊》,第88卷,第315-319页))。
雄性配子破坏性多核苷酸的另外的例子包括但不限于来自菊欧文氏菌(Erwiniachrysanthermi)的果胶裂解酶基因pelE(Kenn et al(1986)J.Bacteriol.168:595(Kenn等人,1986年,《细菌学杂志》,第168卷,第595页));来自苏云金芽孢杆菌以色列亚种(Bacillus thuringiensis Israeliensis)的CytA毒素基因(McLean et al(1987)J.Bacteriol.169:1017(1987)(McLean等人,1987年,《细菌学杂志》,第169卷,第1017页),美国专利No.4,918,006);DNA酶、RNA酶、蛋白酶、或表达反义RNA的多核苷酸。雄性配子破坏性多核苷酸可编码涉及抑制花粉和柱头的相互作用、花粉管生长、受精或它们的组合的蛋白质。
本文所公开的雄性育性多核苷酸可与本文所公开的表达盒堆叠,所述表达盒包含有效连接到编码报道分子或标记产物的目的多核苷酸的启动子。本领域已知的合适报道分子多核苷酸的例子可见于例如以下文献:Jefferson et al.(1991)in Plant MolecularBiology Manual,ed.Gelvin et al.(Kluwer Academic Publishers),pp.1-33(Jefferson等人,1991年,载于《植物分子生物学手册》,Gelvin等人编辑,克吕维尔学术出版社,第1-33页);DeWet et al.Mol.Cell.Biol.7:725-737(1987)(DeWet等人,《分子细胞生物学》,第7卷,第725-737页,1987年);Goff et al.EMBO J.9:2517-2522(1990)(Goff等人,《欧洲分子生物学组织杂志》,第9卷,第2517-2522页,1990年);Kain et al.BioTechniques 19:650-655(1995)(Kain等人,《生物技术》,第19卷,第650-655页,1995年);以及Chiu etal.Current Biology 6:325-330(1996)(Chiu等人,1996年,《当代生物学》,第6卷,第325-330页)。在某些实施例中,目的多核苷酸编码选择性报道分子。这些多核苷酸可包括赋予抗生素抗性或除草剂抗性的多核苷酸。合适的选择性标记多核苷酸的例子包括但不限于编码对氯霉素、甲氨蝶呤、潮霉素、链霉素、壮观霉素、博来霉素、磺酰胺、溴苯腈、草甘膦和膦丝菌素的抗性的基因。
在一些实施例中,本文公开的表达盒包含编码可评分的或可筛选的标记的目的多核苷酸,其中所述多核苷酸的存在产生可测量的产物。例子包括β-葡糖苷酸酶或uidA基因(GUS),其编码各种显色底物已知的酶(例如,美国专利No.5,268,463和No.5,599,670);氯霉素乙酰转移酶和碱性磷酸酶。其他可筛选的标记包括花青素/类黄酮多核苷酸,包括例如编码调控植物组织中花青素色素(红色)的产生的产物的R-基因座多核苷酸,控制类黄酮色素的生物合成的基因,诸如玉蜀黍C1和C2、B基因、p1基因和bronze基因座基因等。由目的多核苷酸编码的合适的标记的另外的例子包括青色荧光蛋白(CYP)基因、黄色荧光蛋白基因、编码荧光素酶的发光基因(其存在可使用例如X光片、闪烁计数、荧光分光光度法、微光摄像机、光子计数照相机或多孔发光测定法来检测)、绿色荧光蛋白(GFP)和DsRed2,其中用标记基因转化的植物细胞为红色,并因而为视觉上可选择的。另外的例子包括编码各种显色底物(例如,PADAC、显色头孢菌素)已知的酶的p-内酰胺酶基因、编码可转化显色儿茶酚的儿茶酚双加氧酶的xylE基因、α-淀粉酶基因和编码能够将酪氨酸氧化为多巴和多巴醌(其继而缩合以形成易于检测的化合物黑色素)的酶的酪氨酸酶基因。
表达盒还可包含用于选择转化的细胞的选择性标记基因。选择性标记基因用于选择转化的细胞或组织。标记基因包括编码抗生素抗性的基因,诸如那些编码新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT)的基因,以及赋予对除草化合物的抗性的基因,所述除草化合物为例如草铵膦、溴苯腈、咪唑啉酮和2,4-二氯苯氧基乙酸(2,4-D)。另外的选择性标记包括表型标记诸如β-半乳醣苷酶和荧光蛋白诸如绿色荧光蛋白(GFP)(Su et al.(2004)Biotechnol Bioeng 85:610-9(Su等人,2004年,《生物技术和生物工程》,第85卷,第610-619页)和Fetter et al.(2004)Plant Cell 16:215-28(Fetter等人,2004年,《植物细胞》,第16卷,第215-228页))、青色荧光蛋白(CYP)(Bolte et al.(2004)J.Cell Science117:943-54(Bolte等人,2004年,《细胞科学杂志》,第117卷,第943-954页)和Kato et al.(2002)Plant Physiol 129:913-42(Kato等人,2002年,《植物生理学》,第129卷,第913-942页))和黄色荧光蛋白(来自Evrogen公司的PhiYFPTM,参见Bolte et al.(2004)J.CellScience 117:943-54(Bolte等人,2004年,《细胞科学杂志》,第117卷,第943-54页))。对于另外的选择性标记,通常参见Yarranton(1992)Curr.Opin.Biotech.3:506-511(Yarranton,1992年,《生物技术新见》,第3卷,第506-511页);Christopherson et al.(1992)Proc.Natl.Acad.Sci.USA 89:6314-6318(Christopherson等人,1992年,《美国国家科学院院刊》,第89卷,第6314-6318页);Yao et al.(1992)Cell71:63-72(Yao等人,1992年,《细胞》,第71卷,第63-72页);Reznikoff(1992)Mol.Microbiol.6:2419-2422(Reznikoff,1992年,《分子微生物学》,第6卷,第2419-2422页);Barkley et al.(1980)inThe Operon,pp.177-220(Barkley等人,1980年,载于《操纵子》,第177-220页);Hu et al.(1987)Cell 48:555-566(Hu等人,1987年,《细胞》,第48卷,第555-566页);Brown et al.(1987)Cell 49:603-612(Brown等人,1987年,《细胞》,第49卷,第603-612页);Figge etal.(1988)Cell 52:713-722(Figge等人,1988年,《细胞》,第52卷,第713-722页);Deuschleet al.(1989)Proc.Natl.Acad.Aci.USA 86:5400-5404(Deuschle等人,1989年,《美国国家科学院院刊》,第86卷,第5400-5404页);Fuerst et al.(1989)Proc.Natl.Acad.Sci.USA86:2549-2553(Fuerst等人,1989年,《美国国家科学院院刊》,第86卷,第2549-2553页);Deuschle et al.(1990)Science248:480-483(Deuschle等人,1990年,《科学》,第248卷,第480-483页);Gossen(1993)Ph.D.Thesis,University of Heidelberg(Gossen,1993年,海德尔堡大学博士论文);Reines et al.(1993)Proc.Natl.Acad.Sci.USA90:1917-1921(Reines等人,1993年,《美国国家科学院院刊》,第90卷,第1917-1921页);Labow et al.(1990)Mol.Cell.Biol.10:3343-3356(Labow等人,1990年,《分子细胞生物学》,第10卷,第3343-3356页);Zambretti et al.(1992)Proc.Natl.Acad.Sci.USA 89:3952-3956(Zambretti等人,1992年,《美国国家科学院院刊》,第89卷,第3952-3956页);Baim et al.(1991)Proc.Natl.Acad.Sci.USA 88:5072-5076(Baim等人,1991年,《美国国家科学院院刊》,第88卷,第5072-5076页);Wyborski et al.(1991)Nucleic Acids Res.19:4647-4653(Wyborski等人,1991年,《核酸研究》,第19卷,第4647-4653页);Hillenand-Wissman(1989)Topics Mol.Struc.Biol.10:143-162(Hillenand-Wissman,1989年,《分子和结构生物学专题》,第10卷,第143-162页);Degenkolb et al.(1991)Antimicrob.Agents Chemother.35:1591-1595(Degenkolb等人,1991年,《抗微生物剂和化学治疗》,第35卷,第1591-1595页);Kleinschnidt et al.(1988)Biochemistry 27:1094-1104(Kleinschnidt等人,1988年,《生物化学》,第27卷,第1094-1104页);Bonin(1993)Ph.D.Thesis,University ofHeidelberg(Bonin,1993年,海德尔堡大学博士论文);Gossen et al.(1992)Proc.Natl.Acad.Sci.USA 89:5547-5551(Gossen等人,1992年,《美国国家科学院院刊》,第89卷,第5547-5551页);Oliva et al.(1992)Antimicrob.Agents Chemother.36:913-919(Oliva等人,1992年,《抗微生物剂和化学治疗》,第36卷,第913-919页);Hlavka et al.(1985)Handbook of Experimental Pharmacology,Vol.78(Springer-Verlag,Berlin)(Hlavka等人,1985年,《实验药理学手册》,第78卷,斯普林格出版社,柏林);Gill et al.(1988)Nature 334:721-724(Gill等人,1988年,《自然》,第334卷,第721-724页)。这些公开内容以引用的方式并入本文。上面关于选择性标记基因的列表并不意指是限制性的。任何选择性标记基因均可用于本文所公开的组合物和方法中。
在一些实施例中,本文所公开的表达盒包含编码有效连接到第一启动子多核苷酸的雄性育性多核苷酸的第一目的多核苷酸,该第一目的多核苷酸与编码有效连接到雄性组织优选的启动子多核苷酸的雄性配子破坏性基因产物的第二目的多核苷酸堆叠。在其他实施例中,本文所述的表达盒还可以与编码有效连接到第三启动子多核苷酸的标记多核苷酸的第三目的多核苷酸堆叠。
在特定实施例中,本文所公开的表达盒包含编码本文所公开的有效连接到组成型启动子(诸如花椰菜花叶病毒(CaMV)35S启动子)的小麦雄性育性基因(诸如Ms22、Ms26或Ms45)的第一目的多核苷酸。表达盒还可以包含编码有效连接到雄性组织优选的启动子的雄性配子破坏性基因产物的第二目的多核苷酸。在某些实施例中,本文所公开的表达盒还可以包含编码有效连接到组成型启动子(诸如花椰菜花叶病毒(CaMV)35S启动子)的标记基因(诸如来自产绿色链霉菌(Streptomyces viridochomagenes)的膦丝菌素乙酰基转移酶(PAT)基因)的第三目的多核苷酸。
IV.植物
A.具有改变的雄性育性多肽的水平/活性的植物
还提供了具有改变的雄性育性多肽的水平和/或活性和/或改变的雄性育性水平的植物。在一些实施例中,本文所公开的植物已在它们的基因组中稳定地整合了如本文所公开的异源雄性育性多核苷酸或其活性片段或变体。因此,提供了这样的植物、植物细胞、植物部分和种子,它们包含本文所公开的如SEQ ID NO:1、3、5、7、9、11、13、15或17的任一者示出的至少一种异源雄性育性多核苷酸或任何活性片段或变体。
还提供了包含本文所公开的表达盒的植物,该表达盒包含有效连接到在植物中有活性的启动子的雄性育性多核苷酸。在一些实施例中,雄性育性多核苷酸的表达调节植物的雄性育性。在某些实施例中,雄性育性多核苷酸的表达增强植物的雄性育性。例如,提供了包含这样的表达盒的植物,该表达盒包含有效连接到组成型启动子(诸如CaMV 35S启动子)的如SEQ ID NO:1、3或5示出的Ms22多核苷酸、或其活性片段或变体。当Ms22多核苷酸表达时,植物的雄性育性增强。
在某些实施例中,向雄性不育植物提供表达盒,该表达盒包含如本文所公开的有效连接到在植物中有活性的启动子的异源雄性育性多核苷酸、或其活性片段或变体。当异源雄性育性多核苷酸表达时,植物的雄性育性得到恢复。在特定实施例中,本文所公开的植物包含具有如本文所公开的有效连接到启动子的异源雄性育性多核苷酸、或其活性片段或变体的表达盒,该表达盒与包含有效连接到在植物中有活性的启动子的目的多核苷酸的一个或多个表达盒堆叠。例如,目的堆叠多核苷酸可包括雄性配子破坏性多核苷酸和/或标记多核苷酸。
本文所公开的植物还可以包含本文所述的具有至少两种多核苷酸的堆叠表达盒,使得所述至少两种多核苷酸在超过50%的减数分裂中(即,不是随机地)被一起继承。因此,当包含具有两种多核苷酸的堆叠表达盒的植物或植物细胞发生减数分裂时,所述两种多核苷酸分离到同一个子代(子系)细胞中。这样,堆叠的多核苷酸将很可能在它们被呈递至的任何细胞中一起表达。例如,植物可以包含具有雄性育性多核苷酸的表达盒,该表达盒与包含雄性配子破坏性多核苷酸的表达盒堆叠,使得雄性育性多核苷酸和雄性配子破坏性多核苷酸被一起继承。特别地,雄性不育植物可以包含具有本文所公开的有效连接到组成型启动子的雄性育性多核苷酸的表达盒,该表达盒与包含有效连接到雄性组织优选启动子的雄性配子破坏性多核苷酸的表达盒堆叠,使得所述植物产生成熟的花粉粒。然而,在这种植物中,具有雄性育性多核苷酸的花粉子细胞的发育将被雄性配子破坏性多核苷酸的表达阻止。
B.植物和方法介绍
如本文所用,术语“植物”包括植物细胞、植物原生质体、从中可再生出植物的植物细胞组织培养物、植物愈伤组织、在植物或植物部分中完好的植物块和植物细胞诸如胚、花粉、胚珠、种子、叶、花、枝、果实、仁、穗、穗轴、壳、茎、根、根尖、花药、谷粒等。如本文所用,“谷粒”意指商业种植者出于栽培或繁殖物种之外的目的生产的成熟种子。再生植物的子代、变体和突变体也包括在本发明的范围内,前提条件是这些部分包含所引入的核酸序列。
本文所公开的方法包括将多肽或多核苷酸引入植物细胞。“引入”旨在意指以使得多核苷酸或多肽的序列得以进入细胞内部的方式将多核苷酸或多肽呈递到植物。本文所公开的方法不依赖于将序列引入宿主细胞的具体方法,只要多核苷酸或多肽可进入宿主的至少一个细胞的内部即可。用于将多核苷酸或多肽引入宿主细胞(即,植物)的方法是本领域已知的,包括但不限于稳定转化方法、瞬时转化方法和病毒介导的方法。
“稳定转化”旨在意指被引入宿主(即,植物)的核苷酸构建体整合到了植物的基因组中,并能够被其子代继承。“瞬时转化”旨在意指多核苷酸被引入宿主(即,植物)并短暂表达,或者多肽被引入宿主(即,植物)。
转化规程以及将多肽或多核苷酸序列引入到植物中的规程,可根据要进行转化的植物或植物细胞的类型(即,单子叶植物或双子叶植物)而异。将多肽和多核苷酸引入植物细胞的合适方法包括微注射(Crossway et al.(1986)Biotechniques 4:320-334)(Crossway等人,1986年,《生物技术》,第4卷,第320-334页))、电穿孔(Riggs et al.(1986)Proc.Natl.Acad.Sci.USA 83:5602-5606(Riggs等人,1986年,《美国国家科学院院刊》,第83卷,第5602-5606页))、农杆菌(Agrobacterium)介导的转化(Townsend等人,美国专利No.5,563,055;Zhao等人,美国专利No.5,981,840)、直接基因转移(Paszkowski et al.(1984)EMBO J.3:2717-2722(Paszkowski等人,1984年,《欧洲分子生物学学会杂志》,第3卷,第2717-2722页))和弹道粒子加速法(参见例如Sanford等人,美国专利No.4,945,050;Tomes等人,美国专利No.5,879,918;Tomes等人,美国专利No.5,886,244;Bidney等人,美国专利No.5,932,782;Tomes et al.(1995)“Direct DNA Transfer into Intact PlantCells via Microprojectile Bombardment,”in Plant Cell,Tissue,and OrganCulture:Fundamental Methods,ed.Gamborg and Phillips(Springer-Verlag,Berlin)(Tomes等人,1995年,“通过微粒轰击直接将DNA转移进完整植物细胞中”,载于《植物细胞、组织和器官培养:基本方法》,Gamborg和Phillips编辑(施普林格,柏林));McCabe et al.(1988)Biotechnology 6:923-926)(McCabe等人,1988年,《生物技术》,第6卷,第923-926页);以及Lecl转化(WO 00/28058)。另参见Weissinger et al.(1988)Ann.Rev.Genet.22:421-477(Weissinger等人,1988年,《遗传学年鉴》,第22卷,第421-477页);Sanford et al.(1987)Particulate Science and Technology 5:27-37(Sanford等人,1987年,《颗粒科学与技术》,第5卷,第27-37页)(洋葱);Christou et al.(1988)Plant Physiol.87:671-674(Christou等人,1988年,《植物生理学》,第87卷,第671-674页)(大豆);McCabe et al.(1988)Bio/Technology 6:923-926(McCabe等人,1988年,《生物技术》,第6卷,第923-926页)(大豆);Finer and McMullen(1991)In Vitro Cell Dev.Biol.27P:175-182(Finer和McMullen,1991年,《体外细胞发育生物学》,第27P卷,第175-182页)(大豆);Singh et al.(1998)Theor.Appl.Genet.96:319-324(Singh等人,1998年,《理论和应用遗传学》,第96卷,第319-324页)(大豆);Datta et al.(1990)Biotechnology8:736-740(Datta等人,1990年,《生物技术》,第8卷,第736-740页)(水稻);Klein et al.(1988)Proc.Natl.Acad.Sci.USA85:4305-4309(Klein等人,1988年,《美国国家科学院院刊》,第85卷,第4305-4309页)(玉蜀黍);Klein et al.(1988)Biotechnology 6:559-563(Klein等人,1988年,《生物技术》,第6卷,第559-563页)(玉蜀黍);Tomes,美国专利No.5,240,855;Buising等人,美国专利No.5,322,783和5,324,646;Tomes et al.(1995)“Direct DNA Transfer into Intact PlantCeUs via Microprojectile Bombardment,”in Plant Cell,Tissue,and Organ Culture:Fundamental Methods,ed.Gamborg(Springer-Verlag,Berlin)(maize)(Tomes等人,1995年,“通过微粒轰击直接将DNA转移到完整植物细胞中”,载于《植物细胞、组织和器官培养:基本方法》,Gamborg编辑,施普林格出版社,柏林)(玉蜀黍);Klein et al.(1988)PlantPhysiol.91:440-444(Klein等人,1988年,《植物生理学》,第91卷,第440-444页)(玉蜀黍);Fromm et al.(1990)Biotechnology 8:833-839(Fromm等人,1990年,《生物技术》,第8卷,第833-839页)(玉蜀黍);Hooykaas-Van Slogteren et al.(1984)Nature(London)311:763-764(Hooykaas-Van Slogteren等人,1984年,《自然》(伦敦),第311卷,第763-764页);Bowen等人,美国专利No.5,736,369(谷类);Bytebier et al.(1987)Proc.Natl.Acad.Sci.USA 84:5345-5349(Bytebier等人,1987年,《美国国家科学院院刊》,第84卷,第5345-5349页)(百合科);De Wet et al.(1985)in The ExperimentalManipulation of Ovule Tissues,ed.Chapman et al.(Longman,New York),pp.197-209(De Wet等人,1985年,载于《胚珠组织的实验操纵》,Chapman等人编辑,(朗文公司,纽约),第197-209页)(花粉);Kaeppler et al.(1990)Plant Cell Reports 9:415-418(Kaeppler等人,1990年,《植物细胞报道》,第9卷,第415-418页)以及Kaeppler et al.(1992)Theor.Appl.Genet.84:560-566(Kaeppler等人,1992年,《理论和应用遗传学》,第84卷,第560-566页)(晶须介导的转化);D′Halluin et al.(1992)Plant Cell 4:1495-1505(D′Halluin等人,1992年,《植物细胞》,第4卷,第1495-1505页)(电穿孔);Li et al.(1993)Plant Cell Reports 12:250-255(Li等人,1993年,《植物细胞报道》,第12卷,第250-255页)以及Christou and Ford(1995)Annals of Botany 75:407-413(Christou和Ford,1995年,《植物学年鉴》,第75卷,第407-413页)(水稻);Osjoda et al.(1996)NatureBiotechnology 14:745-750(Osjoda等人,1996年,《自然生物技术》,第14卷,第745-750页)(玉蜀黍,通过根瘤农杆菌(Agrobacterium tumefaciens));所有这些文献均以引用方式并入本文。
在具体的实施例中,可以使用多种瞬时转化方法为植物提供本发明所公开的雄性育性多核苷酸或表达盒。此类瞬时转化方法包括但不限于直接向植物中引入雄性育性多肽或其变体和片段,或者向植物中引入雄性育性转录物。这类方法包括例如微注射或粒子轰击。参见例如Crossway et al.(1986)Mol Gen.Genet.202:179-185(Crossway等人,1986年,《分子遗传学与普通遗传学》,第202卷,第179-185页);Nomura et al.(1986)PlantSci.44:53-58(Nomura等人,1986年,《植物科学》,第44卷,第53-58页);Hepler et al.(1994)Proc.Natl.Acad.Sci.91:2176-2180(Hepler等人,1994年,《美国国家科学院院刊》,第91卷,第2176-2180页)以及Hush et al.(1994)The Journal of Cell Science 107:775-784(Hush等人,1994年,《细胞科学杂志》,第107卷,第775-784页),所有文献均以引用方式并入本文。作为另一种选择,可以使用本领域已知的技术将本文所公开的雄性育性多核苷酸或表达盒瞬时转化到植物中。此类技术包括病毒载体系统以及将多核苷酸以避免DNA随后释放的方式进行沉淀。因此,从粒子结合的DNA可发生转录,但它释放出来而整合到基因组中的频率则大大降低。此类方法包括使用包被有聚乙基亚胺(PEI;Sigma#P3143)的粒子。
在其他实施例中,通过使植物与病毒或病毒核酸接触,可以将本文所公开的雄性育性多核苷酸或表达盒引入植物中。一般来讲,此类方法涉及将本文所公开的核苷酸构建体整合到病毒DNA或RNA分子内部。认识到,本文所公开的雄性育性序列可最初作为病毒聚蛋白的一部分来合成,其随后可通过体内或体外蛋白水解进行加工,由此产生所需的重组蛋白。涉及病毒DNA或RNA分子的用于将多核苷酸引入植物中并表达其中所编码的蛋白质的方法是本领域已知的。参见例如美国专利No.5,889,191、No.5,889,190、No.5,866,785、No.5,589,367、No.5,316,931,以及Porta et al.(1996)Molecular Biotechnology 5:209-221(Porta等人,1996年,《分子生物技术》,第5卷,第209-221页);这些专利和文献以引用方式并入本文。
用于在植物基因组中特定位置处定向插入多核苷酸的方法是本领域已知的。在一个实施例中,使用位点特异性重组系统,实现在所需的基因组位置处插入多核苷酸。参见例如WO99/25821、WO99/25854、WO99/25840、WO99/25855和WO99/25853,所有这些专利以引用方式并入本文。简而言之,可将本文所公开的多核苷酸包含在旁侧分布有两个不相同的重组位点的转移盒中。将转移盒引入到在其基因组中稳定整合了这样的靶标位点的植物中,该靶标位点在旁侧分布有与该转移盒的所述位点对应的两个不相同的重组位点。提供适当的重组酶,将转移盒整合在该靶标位点处。目的多核苷酸因此整合在植物基因组中的特定染色体位置处。
可以根据常规方式将已转化的细胞培育成植物。参见例如McCormick et al.(1986)Plant Cell Reports 5:81-84(McCormick等人,1986年,《植物细胞报道》,第5卷,第81-84页)。然后可使这些植物生长,用相同的转化植株或不同的植株进行授粉,所得的子代具有所鉴定的所需表型特征的所需表达。可培养两代或更多代以确保所需表型特征的表达得到稳定保持和遗传,然后收获种子以确保所需表型特征的表达已得到实现。以此方式,本公开提供在其基因组中稳定整合了本文所公开的雄性育性多核苷酸(例如本文所公开的表达盒)的转化种子(也称为“转基因种子”)。包含本文所公开的任何表达盒的种子可根据尺寸参数分选,所述尺寸参数包括但不限于种子长度、种子宽度、种子密度、或它们的任何组合。
本文所公开的雄性育性多核苷酸和表达盒可用于任何植物物种的转化,包括但不限于单子叶植物和双子叶植物。目的植物物种的例子包括但不限于:玉米(Zea mays)、芸苔属(Brassica)物种(例如,卷心菜型油菜(B.napus)、芜菁(B.rapa)、芥菜(B.juncea))、苜蓿(Medicago sativa)、水稻(Oryza sativa)、黑麦(Secale cereale)、高粱(Sorghumbicolor,Sorghum vulgare)、粟(例如珍珠粟(Pennisetum glaucum)、黄米(Panicummiliaceum)、谷子(Setaria italica)、龙爪稷(Eleusine coracana))、向日葵(Helianthusannuus)、红花(Carthamus tinctorius)、小麦(Triticum aestivum)、大豆(Glycine max)、烟草(Nicotiana tabacum)、马铃薯(Solanum tuberosum)、落花生(Arachis hypogaea)、棉花(海岛棉(Gossypium barbadense)、陆地棉(Gossypium hirsutum))、甘薯(Ipomoeabatatus)、木薯(Manihot esculenta)、咖啡(Coffea spp.)、椰子(Cocos nucifera)、菠萝(Ananas comosus)、柑橘属果树(Citrus spp.)、可可(Theobroma cacao)、茶(Camelliasinensis)、香蕉(Musa spp.)、鳄梨(Persea americana)、无花果(Ficus casica)、番石榴(Psidium guajava)、芒果(Mangifera indica)、橄榄(Olea europaea)、木瓜(Caricapapaya)、腰果(Anacardium occidentale)、澳洲坚果(Macadamia integrifolia)、扁桃树(Prunus amygdalus)、糖用甜菜(Beta vulgaris)、甘蔗(Saccharum spp.)、燕麦、大麦、蔬菜、观赏植物、稻科植物和针叶树。
在特定实施例中,将小麦植物用于本文所公开的方法和组合物中。如本文所用,术语“小麦”是指小麦属(Triticum)的任何物种,包括其亲代以及通过与其他物种进行杂交而得到的其子代。小麦包括“六倍体小麦”和“四倍体小麦”,前者具有AABBDD的基因组结构、由42条染色体构成,后者具有AABB的基因组结构、由28条染色体构成。六倍体小麦包括普通小麦(T.aestivum)、斯佩耳特小麦(T.spelta)、摩卡小麦(T.mocha)、密穗小麦(T.compactum)、印度圆粒小麦(T.sphaerococcum)、瓦维洛夫小麦(T.vavilovii),以及它们的种间杂交品种。四倍体小麦包括硬粒小麦(T.durum)(也称为硬质小麦或Triticumturgidum ssp.durum)、野生二粒小麦(T.dicoccoides)、栽培二粒小麦(T.dicoccum)、波兰小麦(T.polonicum),以及它们的种间杂交品种。此外,术语“小麦”包括六倍体或四倍体小麦属物种的可能亲代,诸如提供A基因组的乌拉尔图小麦(T.uartu)、栽培一粒小麦(T.monococcum)或野生一粒小麦(T.boeoticum),提供B基因组的拟斯卑尔托山羊草(Aegilops speltoides),以及提供D基因组的粗山羊草(T.tauschii)(也称为节节麦(Aegilops squarrosa)或Aegilops tauschii)。用于本公开中的小麦栽培种可属于但不限于上文列出物种中的任一种。还涵盖了通过常规技术使用小麦属物种作为亲本与非小麦属物种进行有性杂交产生的植物,所述非小麦属物种诸如黑麦(Secale cereale),包括但不限于黑小麦。在一些实施例中,小麦植物适用于具有本领域技术人员已知的合适农学特性的谷物(诸如六倍体小麦或硬质小麦的商业品种)的商业生产。
蔬菜包括番茄(Lycopersicon esculentum)、莴苣(例如Lactuca sativa)、青豆(Phaseolus vulgaris)、利马豆(Phaseolus limensis)、豌豆(Lathyrus spp.)和黄瓜属(Cucumis)的成员诸如黄瓜(C.sativus)、香瓜(C.cantalupensis)和甜瓜(C.melo)。观赏植物包括杜鹃(Rhododendron spp.)、八仙花(Macrophylla hydrangea)、朱槿(Hibiscusrosasanensis)、玫瑰(Rosa spp.)、郁金香(Tulipa spp.)、水仙(Narcissus spp.)、矮牵牛(Petunia hybrida)、康乃馨(Dianthus caryophyllus)、一品红(Euphorbia pulcherrima)和菊花(chrysanthemum)。
可用于实施本发明的方法和组合物的针叶树包括例如松树诸如火炬松(Pinustaeda)、湿地松(Pinus elliotii)、西黄松(Pinus ponderosa)、美国黑松(Pinuscontorta)和辐射松(Pinus radiata);花旗松(Pseudotsuga menziesii);西铁杉(Tsugacanadensis);北美云杉(Picea glauca);红杉(Sequoia sempervirens);枞树(true firs)诸如银枞(Abies amabilis)和胶枞(Abies balsamea);以及雪松诸如西方红雪松(Thujaplicata)和阿拉斯加黄雪松(Chamaecyparis nootkatensis)。在特定实施例中,本文所公开的植物是作物植物(例如玉米、苜蓿、向日葵、芸苔属、大豆、棉花、红花、花生、高梁、小麦、粟、烟草等等)。在其他实施例中,玉米和大豆植物是最佳的,在另外其他实施例中,玉米植物是最佳的。
其他目的植物包括提供目的种子的谷物植物、油料种子植物和豆科植物。目的种子包括谷物种子,诸如玉米、小麦、大麦、水稻、高梁、黑麦等。油料种子植物包括棉花、大豆、红花、向日葵、芸苔、玉蜀黍、苜蓿、棕榈、椰子等。豆科植物包括豆类和豌豆。豆类包括瓜尔豆、槐豆、胡芦巴、大豆、四季豆、豇豆、绿豆、利马豆、蚕豆、小扁豆、鹰嘴豆等等。
通常,中间宿主细胞将被用于实施本文所公开的方法和组合物,以增加克隆载体的拷贝数。随着拷贝数增加,可分离极大数量的含有目的核酸的载体来引入所需的植物细胞中。在一个实施例中,采用不会引起所述多肽在细菌中的表达的植物启动子。
原核生物最常由各种大肠杆菌(E.coli)菌株代表;然而,也可以使用其他微生物菌株。在本文中定义为包括用于转录起始的启动子(任选具有操纵子)以及核糖体结合序列的常用原核控制序列包括诸如β-内酰胺酶(青霉素酶)启动子系统和乳糖(lac)启动子系统(Chang et al.(1977)Nature198:1056(Chang等人,1977年,《自然》,第198卷,第1056页))、色氨酸(trp)启动子系统(Goeddel et al.(1980)Nucleic Acids Res.8:4057(Goeddel等人,1980年,《核酸研究》,第8卷,第4057页))和λ衍生的PL启动子之类的常用启动子,以及N-基因核糖体结合位点(Shimatake et al.(1981)Nature 292:128(Shimatake等人,1981年,《自然》,第292卷,第128页))。在转柒进大肠杆菌中的DNA载体中包含选择标记也是有用的。这种标记的例子包括确定对氨苄青霉素、四环素或氯霉素的抗性的基因。
选择载体以使得能引入到适当的宿主细胞中。细菌载体通常是质粒或噬菌体起源的。将适当的细菌细胞用噬菌体载体颗粒感染或用裸噬菌体载体DNA转染。如果使用质粒载体,则将细菌细胞用质粒载体DNA转染。用于表达本文所公开的蛋白质的表达系统可用芽孢杆菌属(Bacillus)物种和沙门氏菌属(Salmonella)提供(Palva et al.(1983)Gene 22:229-235(Palva等人,1983年,《基因》,第22卷,第229-235页));Mosbach et al.(1983)Nature 302:543-545(Mosbach等人,1983年,《自然》,第302卷,第543-545页))。
在一些实施例中,本文所公开的表达盒或雄性育性多核苷酸在植物中维持在半合子状态。半合子状态为当仅有基因(或一组基因)的一个拷贝,而在姊妹染色体上没有对应等位基因时存在的遗传状态。在某些实施例中,本文所公开的表达盒包含有效连接到雄性育性多核苷酸的第一启动子,该雄性育性多核苷酸与有效连接到雄性组织优选启动子的雄性配子破坏性多核苷酸堆叠,并且将此类表达盒引入处于半合子状态的雄性不育植物。当雄性育性多核苷酸表达时,由于雄性育性多核苷酸使该植物恢复到能育状态,故该植物能够成功地产生成熟的花粉粒。鉴于表达盒处于半合子状态,故在花粉粒形成过程中,只有某些子细胞将遗传该表达盒。由于堆叠的被编码的雄性配子破坏性基因产物的雄性组织优选的表达,遗传了包含雄性育性多核苷酸的表达盒的子细胞将不会发育为成熟的花粉粒。未遗传该表达盒的那些花粉粒将继续发育为成熟的花粉粒并具有功能性,但它们将不包含该表达盒的雄性育性多核苷酸,因此将不会通过花粉将雄性育性多核苷酸传递到子代。
V.调节雄性育性多肽的浓度和/或活性
提供了用于调节植物中的本文所公开的雄性育性多肽的浓度和/或活性的方法。本文针对雄性育性多肽的浓度和/或活性所用的术语“影响”或“调节”,是指当与适当的对照比较时,雄性育性多肽的浓度和/或活性的任何增大或减小。一般来讲,本文所公开的雄性育性多肽的浓度和/或活性相对于天然的对照植物、植物部分或细胞增大或减小至少1%、5%、10%、20%、30%、40%、50%、60%、70%、80%或90%。本文所公开的调节可在植物生长至所需的发育阶段过程中和/或在其后进行。在特定的实施例中,在单子叶植物(特别是小麦)中对本文所公开的雄性育性多肽进行调节。
可采用多种方法来测定雄性育性多肽的浓度和/或活性的调节。例如,雄性育性多肽的表达水平可以例如通过测定植物中雄性育性多肽的水平来直接测量(即,蛋白质印迹法或RNA印迹法),或者例如通过测定植物中雄性育性多肽的雄性育性活性来间接测量。用于测量雄性育性活性的方法在本文别处进行描述。在特定的实施例中,对雄性育性多肽浓度和/或活性的调节包括对植物中的雄性育性多肽的水平的调节(即,增大或减小)。测量雄性育性多肽的水平和/或活性的方法在本领域中是已知的并且在本文别处进行讨论。在另有其他实施例中,对营养组织中、繁殖组织中、或营养组织和繁殖组织两者中的雄性育性多肽的水平和/或活性进行调节。
在一个实施例中,通过将雄性育性多肽或相应的雄性育性多核苷酸引入植物来增大该多肽的活性和/或浓度。随后,使用本领域技术人员已知的方法选出具有引入的雄性育性序列的植物,所述方法诸如但不限于DNA印迹分析、DNA测序、PCR分析或表型分析。在某些实施例中,将标记多核苷酸与雄性育性多核苷酸一起引入,以便帮助选择具有或缺乏本文所公开的雄性育性多核苷酸的植物。将经前述实施例改变或修饰的植物或植物部分在形成植物的条件下培育足以调节雄性育性多肽在该植物中的浓度和/或活性的时间。形成植物的条件在本领域中是公知的。
如本文别处所讨论,许多用来将多肽提供给植物的方法是本领域已知的,包括但不限于将多肽直接引入植物中,或者将编码雄性育性多肽的多核苷酸构建体引入植物中(瞬时引入或稳定引入)。还应认识到,本文所公开的方法可采用不能够在转化的植物中指导蛋白质或RNA的表达的多核苷酸。因而,雄性育性多肽的水平和/或活性可通过改变编码雄性育性多肽的基因或其启动子来增大。参见例如,Kmiec的美国专利5,565,350;Zarling等人的PCT/US93/03868。因此提供了在雄性育性基因中携带突变的经诱变处理的植物,其中所述突变增加雄性育性基因的表达或增大被编码的雄性育性多肽的活性。
在其他实施例中,通过向植物引入如本文别处所公开的包含雄性育性多核苷酸(例如SEQ ID NO:1、3、5、7、9、11、13、15或17)或其活性片段或变体的表达盒来增大雄性育性多肽的浓度和/或活性。雄性育性多核苷酸可以有效连接到对于植物是异源的或者对于植物是天然的启动子。通过增大植物中的雄性育性多肽的浓度和/或活性,该植物的雄性育性也增大。因此,可以通过增大雄性育性多肽的浓度和/或活性来增大植物的雄性育性。例如,通过增大雄性育性多肽的浓度和/或活性,可使雄性不育植物恢复雄性育性。
还应认识到,可通过采用不能够在转化的植物中指导蛋白质或RNA的表达的多核苷酸,来调节该多肽的水平和/或活性。例如,本文所公开的多核苷酸可用来设计可在用于改变或突变生物体中的基因组核苷酸序列的方法中应用的多核苷酸构建体。这类多核苷酸构建体包括但不限于:RNA:DNA载体、RNA:DNA突变载体、RNA:DNA修复载体、混合双链体寡核苷酸、自身互补RNA:DNA寡核苷酸和引起重组的寡核苷酸。这类核苷酸构建体和使用方法是本领域已知的。参见美国专利No.5,565,350、No.5,731,181、No.5,756,325、No.5,760,012、No.5,795,972和No.5,871,984,所有这些专利以引用方式并入本文。还可参见WO 98/49350、WO 99/07865、WO 99/25821和Beetham,et al.,(1999)Proc.Natl.Acad.Sci.USA96:8774-8778(Beetham等人,1999年,《美国国家科学院院刊》,第96卷,第8774-8778页);这些专利和文献以引用方式并入本文。因此应认识到,本文所公开的方法并不依赖于将完整多核苷酸整合到基因组中,只要将该多核苷酸引入细胞而使植物或其细胞被改变即可。
在一个实施例中,基因组可在将该多核苷酸引入细胞之后被改变。例如,可将多核苷酸或其任何部分整合到植物的基因组中。本文所公开的基因组的变更包括但不限于基因组中核苷酸的添加、缺失和置换。虽然本文所公开的方法并不依赖于任何具体数目的核苷酸的添加、缺失和置换,但应认识到此类添加、缺失或置换包含至少一个核苷酸。
表1:SEO ID NO汇总
本文所用的词语“一个”和“一种”指一个(种)或不止一个(种)(即,指至少一个(种))该词语的语法对象。举例而言,“一个要素”意指一个或多个要素。
本说明书中提到的所有公布和专利申请指示了本发明所属领域的技术人员的水平。所有公布和专利申请以引用方式并入本文,如同每个单独的公布或专利申请被具体地和独立地指出以引用方式并入本文一样。
虽然为了清楚地理解而已经通过举例说明和实例较详细地描述了本发明,但显然可以在权利要求书范围内实施一些改变和修饰。
实验
实例1:小麦中雄性育性多核苷酸的鉴定
可以使用生物信息学方法鉴定本文所公开的雄性育性多核苷酸。例如,推定为代表小麦中的雄性育性基因的序列最初通过使用来自其他物种(诸如玉蜀黍)的已知育性基因对专有数据库进行计算机(in silico)搜索来鉴定。基于与参考序列的蛋白质水平同源性和对候选序列所源于的库的考虑来选择候选EST,例如代表雄性繁殖组织中的表达。基于候选EST序列创建引物,并使用该引物对专有的小麦BAC库进行筛选。使用适当的引物对鉴定出的超级池(super-pool)进行进一步筛选,以鉴定包含EST的特定BAC克隆。
可使用如下循环参数进行降落式PCR(PCR系统9700,应用生物系统公司(Applied Biosystems)):94℃3分钟(1个循环);94℃1分钟,55℃1分钟,随后72℃1分30秒(35个循环);72℃7分钟,结束于4℃。Pfu Ultra HotstartTM DNA聚合酶(Stratagene公司)可能是优选的,因为其具有非常低的平均误差率(每500bp的扩增片段小于0.5%)。
将分离自BAC克隆的小麦DNA插入物消化,用于使用候选EST克隆作为探针进行DNA印迹确认。将BAC片段亚克隆进(美国加利福利亚州拉荷亚的Stratagene有限公司(Stratagene Inc.,La Jolla,CA))。LB培养基上长出白色菌落,使用斑点印迹程序将其转移到膜上。在变性之后,用候选EST克隆对膜进行探测。鉴定阳性克隆,并测序。
实例2:小麦雄性育性多核苷酸与已知序列的比较
表2:小麦、玉蜀黍和水稻Ms22多核苷酸和多肽的全局同一性
(多核苷酸结果在阴影框中列出;多肽结果在非阴影框中列出。)
表3:小麦、玉蜀黍和水稻Ms26多核苷酸和多肽的全局同一性
(多核苷酸结果在阴影框中列出;多肽结果在非阴影框中列出。)
表4:小麦、玉蜀黍和水稻Ms45多核苷酸和多肽的全局同一性
(多核苷酸结果在阴影框中列出;多肽结果在非阴影框中列出。)
实例3:小麦转化
本领域技术人员可获知小麦转化方案。参见例如,He et al.(2010)J.Exp.Botany61(6):1567-1581(He等人,2010年,《实验植物学杂志》,第61卷,第6期,第1567-1581页);Wuet al.(2008)Transgenic Res.17:425-436(Wu等人,2008年,《转基因研究》,第17卷,第425-436页);Nehra et al.(1994)Plant J.5(2):285-297(Nehra等人,1994年,《植物杂志》,第5卷,第2期,第285-297页);Rasco-Gaunt et al.(2001)J.Exp.Botany 52(357):865-874(Rasco-Gaunt等人,2001年,《实验植物学杂志》,第52卷,第357期,第865-874页);Razzaq et al.(2011)African J.Biotech.10(5):740-750(Razzaq等人,2011年,《非洲生物技术杂志》,第10卷,第5期,第740-750页)。
实例4:MS26的定向修饰。
本实例描述了使用双链断裂技术使小麦基因突变以使得能够进行定向DNA修饰或经由同源重组进行基因插入的方法。更具体地讲,本实例描述了一种方法,其包括但不限于递送定制的归巢核酸内切酶MS26+,以便识别、切割小麦染色体DNA并通过不精确的非同源末端连接(NHEJ)修复对该DNA进行突变。
载体和转化:
位于小麦基因组A、B和D内的雄性育性MS26基因包含22个碱基对的序列(5’-GATGGTGACGTACGTGCCCTAC-3’;SEQ ID NO:21),该序列被MS26+归巢核酸内切酶识别为用于引入双链断裂的底物。22bp的MS26识别位点存在于A、B和D小麦基因组内,并且在整个玉蜀黍、高粱和水稻MS26直系同源基因中为保守的(图1)。已证实MS26+归巢核酸内切酶在玉蜀黍、水稻和高粱植物中产生突变,参见2013年5月10日公布的WO2013/066423。为了在小麦植物的基因组Ms26基因中产生突变,通过类似于以下文献所述方法的农杆菌介导的转化方法将PHP42063引入小麦Fielder品种中(Tamas-Nyitrai et al Plant Cell CulturesProtocols Methods in Molecular Biology 877,2012,357-384(Tamas-Nyitrai等人,植物细胞培养方案方法,载于《分子生物学》,2012年,第877卷,第357-384页);He,et al.,(2010)J.Exp.Botany 61(6):1567-1581(He等人,2010年,《实验植物学杂志》,第61卷,第6期,第1567-1581页);Wu,et l.,(2008)Transgenic Res.17:425-436(Wu等人,2008年,《转基因研究》,第17卷,第425-436页);Nehra,et al.,(1994)Plant J.5(2):285-297(Nehra等人,1994年,《植物杂志》,第5卷,第2期,第285-297页);Rasco-Gaunt,et al.,(2001)J.Exp.Botany 52(357):865-874(Rasco-Gaunt等人,2001年,《实验植物学杂志》,第52卷,第357期,第865-874页);Razzaq,et al.,(2011)African J.Biotech.10(5):740-750(Razzaq等人,2011年,《非洲生物技术杂志》,第10卷,第5期,第740-750页))。
PHP42063包含处于玉蜀黍CAS1启动子的转录控制下的单链MS26+。CAS1启动子可通过磺酰脲类安全剂2-CBSU、或通过高温以转录方式诱导(2013年5月17日提交的美国专利申请13/896,437)。PHP42063还包含由ZmEND2启动子调节的蓝色荧光基因(CFP),其被用作对T-DNA向小麦细胞中的整合进行选择的可视标记。此外,PHP42063包含由玉蜀黍组蛋白2B启动子调节的红色荧光基因的拷贝。该构建体中的红色荧光基因的一部分以正向取向的方式复制,由具有369bp重叠的RFP基因的两个片段组成。这两个片段被包含MS26靶标位点的136bp的间隔区隔开。选择发蓝色荧光的愈伤组织并用于小麦植物的再生,随后使该小麦植物在温室中生长至成熟和结实。通过拷贝数分析对包含PHP42063的TDNA插入的小麦植物进行验证。选择四株独立的转化了单拷贝或低拷贝PHP42063的植物用于另外的实验。在授粉、杀菌、放置于维持培养基上并在暗处于37℃温育24小时之后的14-20天收获发蓝色荧光的未成熟胚。在该期间结束时,将在高温下温育的胚移至室温(<26C),随后使胚在暗处生长。在高温处理起始之后的大约72小时,于37C下温育的胚开始发育出发红色荧光的部分。该观察结果表明,热诱导型基因盒CAS1:MS26+已导致在RF-FP报告基因的两个重叠序列之间的MS26靶标位点处发生双链断裂,从而促成分子内重组并产生功能性RFP基因,该功能性RFP基因由相对蓝色荧光背景发红色荧光的细胞的出现而显示。选择发红色荧光的愈伤组织事件进行另外的分子表征和植物再生。
植物组织中TaMS26靶标位点处的突变的鉴定。
从用MS26+归巢核酸内切酶转化的经热处理和未经热处理的愈伤组织提取总基因组DNA,随后用高保真PCR扩增预混试剂(High Fidelity PCR MasterMix)(纽英伦生物技术公司(New England Biolabs),M0531L)对基因组靶标位点周围的区域进行PCR扩增,从而添加上扩增子特异性条形码所必需的序列,由此使用“带尾的”引物通过两轮PCR进行Illumnia测序。一级PCR反应中所用的引物在表5中示出。
表5:PCR引物序列
二级PCR反应中所用的引物为AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACG(正向,SEQ ID NO:24)和CAAGCAGAAGACGGCATA(反向,SEQ ID NO:25)。从未转化的Fielder植物的叶片中提取的基因组DNA充当阴性对照。
使用凯杰公司(Qiagen)的Minielute PCR纯化离心柱将所得的PCR扩增产物浓缩,接着置于2%的琼脂糖凝胶上进行电泳,随后切除适当的扩增产物并用凯杰公司的凝胶提取离心柱进行纯化。采用基于Hoechst染料的荧光测定法,以等摩尔比结合测量凝胶纯化的扩增产物的浓度,随后在Illumina的基因组分析仪IIx(Genome Analyzer IIx,ELIM生物制药有限公司(ELIM Biopharmaceuticals,Inc.))上周PhiX对照v3(Illumina,FC-110-3001)的30-40%(v/v)加标(用于抵消序列偏差)来进行100核苷酸长度的深度单端(singleread)测序。只有在以预期的裂解位点为中心的6核苷酸窗口内出现的核苷酸插入与缺失(indel)≥1,并且不以类似的水平存在于阴性对照中的那些读段(read)才被归类为NHEJ突变。然后使用NHEJ突变的总数,基于具有包含与条形码和正向引物的完全匹配的适当长度的读段的总数来计算突变读段的百分比(%)。
表6中示出通过深度测序为用MS26+归巢核酸内切酶转化的未经热处理和经热处理的愈伤组织回收的NHEJ突变的频率与阴性对照的比较。从经热处理的愈伤组织回收的十种最普遍的NHEJ突变类型在图2中示出。这些数据表明,MS26+归巢核酸内切酶将NHEJ突变和变更有效地引入到了天然的MS26小麦基因中。
表6:小麦MS26+归巢核酸内切酶靶标基因座处的突变读段的百分比(%)。
再生植物中TaMS26靶标位点处的突变的鉴定。
选择发红色荧光的愈伤组织事件进行植物再生。使植物在温室中生长,然后对来自各个再生小麦植株(n=122)的叶片DNA进行MS26-1靶标位点突变的筛选,方式为:使用引物对UNIMS265’-2(GACGTGGTGCTCAACTTCGTGAT;SEQ ID NO:26)和UNIMS263’-1(GCCATGGAGAGGATGGTCATCAT;SEQ ID NO:27),通过PCR将该区域扩增,随后使用识别序列5’-CGTACG-3’的DNA限制性酶BsiWI将扩增的产物消化。使这些反应的产物在1%的琼脂糖凝胶上进行电泳,随后筛选耐BsiWI消化的条带,这些条带指示在MS26-1靶标位点处的突变。
从PHP42063经热处理的胚筛选的122株再生植物中的10株包含耐BsiWI限制性酶消化的PCR产物,其指示MS26靶标位点处的突变。对这些PCR产物的亚克隆和DNA序列分析表明,在整个MS26靶标位点上的多种突变从插入单个核苷酸到缺失4至98个核苷酸不等。在这些再生的小麦植株中,总共鉴定出七种不相同的突变(图3)。使包含这些突变的植株进行自花授粉。通过PCR扩增以显示指示MS26-1靶标位点处的突变的耐BsiWI消化的条带(如上所述),来对子代植物进行针对上述突变的减数分裂遗传的筛选。在由从包含突变型Ms26等位基因的亲本植株得到的自交种子生长而来的子代植物中鉴定出耐BsiWI的PCR扩增产物,同时对这些产物的DNA序列分析证实原始突变经有性繁殖方式传递到了下一代。
本实例证明了通过定向递送双链断裂试剂(在这种情况下是定制的归巢核酸内切酶)对小麦基因的修饰,该双链断裂试剂识别、切割小麦染色体DNA并通过了末端连接修复对该DNA进行突变。
序列表
<110> 先锋国际良种公司(PIONEER HI-BRED INTERNATIONAL, INC.)
<120> 包含雄性育性序列的组合物和方法
<130> 5282-PCT
<150> US 61/697,590
<151> 2012-09-06
<160> 52
<170> PatentIn版本3.5
<210> 1
<211> 414
<212> DNA
<213> 乌拉尔图小麦(Triticum urartu)
<400> 1
atgttgagga tgcagcagca ggtggagggc gtggtgggcg gcggcatcgt ggccgaggcg 60
gaggaggcgg cggtgtacga gcgggtggct cgcatggcca gcggcaacgc ggtggtcgtc 120
ttcagcgccm gcggctgctg catgtgccac gtcgtcaagc gcctcctgct tggcctgggg 180
gtcggcccca ccgtctacga gttggaccag atgggcggcg ccgggcgaga gatccaggcg 240
gcgctggcgc agctgctgcc ccccggaccc ggcgccggcc accaccagca gccgccagtg 300
cccgtggtgt tcgtcggcgg gaggctcctg ggcggcgtgg agaaggtcat ggcgtgccac 360
atcaacggca cgctcgtccc gctcctcaag gacgccggcg cgctctggct ctga 414
<210> 2
<211> 137
<212> PRT
<213> 乌拉尔图小麦(Triticum urartu)
<220>
<221> misc_feature
<223> Xaa =任何氨基酸
<220>
<221> misc_feature
<222> (44)..(44)
<223> Xaa可以是任何天然存在的氨基酸
<400> 2
Met Leu Arg Met Gln Gln Gln Val Glu Gly Val Val Gly Gly Gly Ile
1 5 10 15
Val Ala Glu Ala Glu Glu Ala Ala Val Tyr Glu Arg Val Ala Arg Met
20 25 30
Ala Ser Gly Asn Ala Val Val Val Phe Ser Ala Xaa Gly Cys Cys Met
35 40 45
Cys His Val Val Lys Arg Leu Leu Leu Gly Leu Gly Val Gly Pro Thr
50 55 60
Val Tyr Glu Leu Asp Gln Met Gly Gly Ala Gly Arg Glu Ile Gln Ala
65 70 75 80
Ala Leu Ala Gln Leu Leu Pro Pro Gly Pro Gly Ala Gly His His Gln
85 90 95
Gln Pro Pro Val Pro Val Val Phe Val Gly Gly Arg Leu Leu Gly Gly
100 105 110
Val Glu Lys Val Met Ala Cys His Ile Asn Gly Thr Leu Val Pro Leu
115 120 125
Leu Lys Asp Ala Gly Ala Leu Trp Leu
130 135
<210> 3
<211> 414
<212> DNA
<213> 拟斯卑尔托山羊草(Aegilops speltoides)
<400> 3
atgttgagga tgcagcagca ggtggagggc gtggtgggcg gcggcatcgt ggcggaggcg 60
gaggaggcgg ccgtgtacga gcgggtggct cgcatggcca gcggcaacgc ggtggtcgtc 120
ttcagcgcca gcggctgctg catgtgccac gtcgtcaagc gcctcctgct tggcctggga 180
gtcggcccca ccgtgtacga gttggaccag atgggcggcg ccgggcggga gatccaggcg 240
gccctggcgc agctgctgcc ccccggaccc ggcgccggcc accaccagca gccgccggtg 300
cccgtggtgt tcgtyggcgg gaggctcctg ggcggcgtgg agaaggtgat ggcgtgccac 360
atcaacggca cgctcgtccc gctcctcaag gacgccggcg cgctctggct ctga 414
<210> 4
<211> 137
<212> PRT
<213> 拟斯卑尔托山羊草(Aegilops speltoides)
<220>
<221> misc_feature
<223> Xaa =任何氨基酸
<220>
<221> misc_feature
<222> (105)..(105)
<223> Xaa可以是任何天然存在的氨基酸
<400> 4
Met Leu Arg Met Gln Gln Gln Val Glu Gly Val Val Gly Gly Gly Ile
1 5 10 15
Val Ala Glu Ala Glu Glu Ala Ala Val Tyr Glu Arg Val Ala Arg Met
20 25 30
Ala Ser Gly Asn Ala Val Val Val Phe Ser Ala Ser Gly Cys Cys Met
35 40 45
Cys His Val Val Lys Arg Leu Leu Leu Gly Leu Gly Val Gly Pro Thr
50 55 60
Val Tyr Glu Leu Asp Gln Met Gly Gly Ala Gly Arg Glu Ile Gln Ala
65 70 75 80
Ala Leu Ala Gln Leu Leu Pro Pro Gly Pro Gly Ala Gly His His Gln
85 90 95
Gln Pro Pro Val Pro Val Val Phe Xaa Gly Gly Arg Leu Leu Gly Gly
100 105 110
Val Glu Lys Val Met Ala Cys His Ile Asn Gly Thr Leu Val Pro Leu
115 120 125
Leu Lys Asp Ala Gly Ala Leu Trp Leu
130 135
<210> 5
<211> 414
<212> DNA
<213> 粗山羊草(Aegilopsm tauschii)
<400> 5
atgttgagga tgcagcagca ggtggagggc gtggtgggcg gcggcatcat ggcggaggcg 60
gaggaggcgg cggtgtacga gcgggtggct cgcatggcca gcggcaacgc ggtggtcgtc 120
ttcagcgcca gcggctgctg catgtgccac gtcgtcaagc gcctcctgct tggcctgggg 180
gtcggcccca ccgtctacga gttggaccag atgggcggcg ccgggcgaga gatccaggcg 240
gcgctggcgc agctgctgcc ccccggaccc ggcgccggcc accaccagca gccgccagtg 300
cccgtggtgt tcgtcggcgg gaggctcctg ggcggcgtgg agaaggtgat ggcgtgccac 360
atcaacggca cgctcgtccc gctcctcaag gacgccggcg cgctctggct ctga 414
<210> 6
<211> 137
<212> PRT
<213> 粗山羊草(Aegilopsm tauschii)
<400> 6
Met Leu Arg Met Gln Gln Gln Val Glu Gly Val Val Gly Gly Gly Ile
1 5 10 15
Met Ala Glu Ala Glu Glu Ala Ala Val Tyr Glu Arg Val Ala Arg Met
20 25 30
Ala Ser Gly Asn Ala Val Val Val Phe Ser Ala Ser Gly Cys Cys Met
35 40 45
Cys His Val Val Lys Arg Leu Leu Leu Gly Leu Gly Val Gly Pro Thr
50 55 60
Val Tyr Glu Leu Asp Gln Met Gly Gly Ala Gly Arg Glu Ile Gln Ala
65 70 75 80
Ala Leu Ala Gln Leu Leu Pro Pro Gly Pro Gly Ala Gly His His Gln
85 90 95
Gln Pro Pro Val Pro Val Val Phe Val Gly Gly Arg Leu Leu Gly Gly
100 105 110
Val Glu Lys Val Met Ala Cys His Ile Asn Gly Thr Leu Val Pro Leu
115 120 125
Leu Lys Asp Ala Gly Ala Leu Trp Leu
130 135
<210> 7
<211> 1934
<212> DNA
<213> 乌拉尔图小麦(Triticum urartu)
<400> 7
atggaggaag ctcacggcgg catgccgtcg acgacgacgg cgttcttccc gctggcaggg 60
ctccacaagt tcatggccat cttcctcgtg ttcctctcgt ggatcttggt ccactggtgg 120
agcctgagga agcagaaggg gccgaggtca tggccggtca tcggcgcgac gctggagcag 180
ctgaggaact actaccggat gcacgactgg ctcgtggagt acctgtccaa gcaccggacg 240
gtcaccgtcg acatgccctt cacctcctac acctacatcg ccgaccccgt gaacgtcgag 300
catgtgctca agaccaattt caacaattac cccaaggtga aacaatcctc gagatgtcag 360
acaaggttca gtaatcggta ctgacagtgt tacaaatgtc tgaaatctga aattgtatgt 420
ctagggggag gtgtacaggt cctacatgga cgtgctgctc ggcgacggca tattcaacgc 480
cgacggcgag ctctggagga agcagaggaa gacggcgagc ttcgagttcg cttccaagaa 540
cctgagagac ttcagcacga tcgtgttcag ggagtactcg ctgaagctgt ccagcatcct 600
gagccaggct tgcaaggccg gcaaagtcgt ggacatgcag gcaactgaac tcattccctt 660
ggtcatctga acgttgattt cttggacaaa atttcaagat tctgacgcga gcggacgaat 720
tcaggagctg tacatgagga tgacgctgga ctcgatctgc aaggtcgggt tcggggtcga 780
gatcggcacg ctgtcgccgg agctgccgga gaacagcttc gcgcaggcgt tcgacgccgc 840
caacatcatc gtgacgctgc ggttcatcga cccgctgtgg cgcgtgaaga agttcctgca 900
cgtcggctcg gaggcgctgc tggagcagag catcaagctc gtcgacgagt tcacctacag 960
cgtcatccgc cggcgcaagg ccgagatcgt gcaggcccgg gccagcggca agcaggagaa 1020
ggtgcgtgcg tgatcatcgt cattcgtcaa gctccggatc gctggtttgt gtagtaggtg 1080
ccattgatca ctgacacgtt aactgggtgc gcagatcaag cacgacatac tgtcgcggtt 1140
catcgagctg ggcgaggccg gcggcgacga cggcggcagc ctgttcgggg acgacaaggg 1200
cctccgcgac gtggtgctca acttcgtgat cgccgggcgg gacaccacgg ccacgacgct 1260
gtcctggttc acctacatgg ccatgacgca cccggccgtg gccgagaagc tccgccgcga 1320
gctggccgcc ttcgaggcgg atcgcgcccg cgaggagggc gtcgctctgg tcccctgcag 1380
cgacggcgag ggcgccgacg aggccttcgc cgcccgcgtg gcgcagttcg cggggctcct 1440
gagctacgac gggctcggga agctggtgta cctccacgcg tgcgtgacgg agacgctgcg 1500
gctgtacccg gcggtgccgc aggaccccaa gggcatcgcg gaggacgacg tgctcccgga 1560
cggcaccaag gtgcgcgccg gcgggatggt gacgtacgtg ccctactcca tggggcggat 1620
ggagtataac tggggccccg acgccgccag cttccggccg gagcggtgga tcggcgacga 1680
cggcgcgttc cgcaacgcgt cgccgttcaa gttcacggcg ttccaggcgg ggccgcggat 1740
ctgcctcggc aaggactcgg cgtacctgca gatgaagatg gcgctggcca tactgtgcag 1800
gttcttcagg ttcgagctcg tggagggcca ccccgtcaag taccgcatga tgaccatcct 1860
ctccatggcg cacggcctca aggtccgcgt ctccagggcg ccgctcgcct gatcttgatc 1920
tgggttccgg cgag 1934
<210> 8
<211> 548
<212> PRT
<213> 乌拉尔图小麦(Triticum urartu)
<400> 8
Met Glu Glu Ala His Gly Gly Met Pro Ser Thr Thr Thr Ala Phe Phe
1 5 10 15
Pro Leu Ala Gly Leu His Lys Phe Met Ala Ile Phe Leu Val Phe Leu
20 25 30
Ser Trp Ile Leu Val His Trp Trp Ser Leu Arg Lys Gln Lys Gly Pro
35 40 45
Arg Ser Trp Pro Val Ile Gly Ala Thr Leu Glu Gln Leu Arg Asn Tyr
50 55 60
Tyr Arg Met His Asp Trp Leu Val Glu Tyr Leu Ser Lys His Arg Thr
65 70 75 80
Val Thr Val Asp Met Pro Phe Thr Ser Tyr Thr Tyr Ile Ala Asp Pro
85 90 95
Val Asn Val Glu His Val Leu Lys Thr Asn Phe Asn Asn Tyr Pro Lys
100 105 110
Gly Glu Val Tyr Arg Ser Tyr Met Asp Val Leu Leu Gly Asp Gly Ile
115 120 125
Phe Asn Ala Asp Gly Glu Leu Trp Arg Lys Gln Arg Lys Thr Ala Ser
130 135 140
Phe Glu Phe Ala Ser Lys Asn Leu Arg Asp Phe Ser Thr Ile Val Phe
145 150 155 160
Arg Glu Tyr Ser Leu Lys Leu Ser Ser Ile Leu Ser Gln Ala Cys Lys
165 170 175
Ala Gly Lys Val Val Asp Met Gln Glu Leu Tyr Met Arg Met Thr Leu
180 185 190
Asp Ser Ile Cys Lys Val Gly Phe Gly Val Glu Ile Gly Thr Leu Ser
195 200 205
Pro Glu Leu Pro Glu Asn Ser Phe Ala Gln Ala Phe Asp Ala Ala Asn
210 215 220
Ile Ile Val Thr Leu Arg Phe Ile Asp Pro Leu Trp Arg Val Lys Lys
225 230 235 240
Phe Leu His Val Gly Ser Glu Ala Leu Leu Glu Gln Ser Ile Lys Leu
245 250 255
Val Asp Glu Phe Thr Tyr Ser Val Ile Arg Arg Arg Lys Ala Glu Ile
260 265 270
Val Gln Ala Arg Ala Ser Gly Lys Gln Glu Lys Ile Lys His Asp Ile
275 280 285
Leu Ser Arg Phe Ile Glu Leu Gly Glu Ala Gly Gly Asp Asp Gly Gly
290 295 300
Ser Leu Phe Gly Asp Asp Lys Gly Leu Arg Asp Val Val Leu Asn Phe
305 310 315 320
Val Ile Ala Gly Arg Asp Thr Thr Ala Thr Thr Leu Ser Trp Phe Thr
325 330 335
Tyr Met Ala Met Thr His Pro Ala Val Ala Glu Lys Leu Arg Arg Glu
340 345 350
Leu Ala Ala Phe Glu Ala Asp Arg Ala Arg Glu Glu Gly Val Ala Leu
355 360 365
Val Pro Cys Ser Asp Gly Glu Gly Ala Asp Glu Ala Phe Ala Ala Arg
370 375 380
Val Ala Gln Phe Ala Gly Leu Leu Ser Tyr Asp Gly Leu Gly Lys Leu
385 390 395 400
Val Tyr Leu His Ala Cys Val Thr Glu Thr Leu Arg Leu Tyr Pro Ala
405 410 415
Val Pro Gln Asp Pro Lys Gly Ile Ala Glu Asp Asp Val Leu Pro Asp
420 425 430
Gly Thr Lys Val Arg Ala Gly Gly Met Val Thr Tyr Val Pro Tyr Ser
435 440 445
Met Gly Arg Met Glu Tyr Asn Trp Gly Pro Asp Ala Ala Ser Phe Arg
450 455 460
Pro Glu Arg Trp Ile Gly Asp Asp Gly Ala Phe Arg Asn Ala Ser Pro
465 470 475 480
Phe Lys Phe Thr Ala Phe Gln Ala Gly Pro Arg Ile Cys Leu Gly Lys
485 490 495
Asp Ser Ala Tyr Leu Gln Met Lys Met Ala Leu Ala Ile Leu Cys Arg
500 505 510
Phe Phe Arg Phe Glu Leu Val Glu Gly His Pro Val Lys Tyr Arg Met
515 520 525
Met Thr Ile Leu Ser Met Ala His Gly Leu Lys Val Arg Val Ser Arg
530 535 540
Ala Pro Leu Ala
545
<210> 9
<211> 1929
<212> DNA
<213> 拟斯卑尔托山羊草(Aegilops speltoides)
<400> 9
atggaggaag ctcaccttgg catgccgtcg acgacggcct tcttcccgct ggcagggctc 60
cacaagttca tggccatctt cctcgtgttc ctctcgtgga tcctggtcca ctggtggagc 120
ctgaggaagc agaaggggcc gaggtcatgg ccggtcatcg gcgccacgct ggagcagctg 180
aggaactact accggatgca cgactggctc gtggagtacc tgtccaagca ccggacggtc 240
accgtcgaca tgcccttcac ctcctacacc tacatcgccg acccggtgaa cgtcgagcat 300
gtgctcaaga ccaacttcaa caattacccc aaggtgaaac aatcctcgag atgtcagtca 360
aggttcggta taatcggtac tgacagtgtt acaaatgtct gaaatctgaa attgtgtgtg 420
tagggggagg tgtacaggtc ctacatggac gtgctgctcg gcgacggcat attcaacgcc 480
gacggcgagc tctggaggaa gcagaggaag acggcgagct tcgagttcgc ttccaagaac 540
ctgagagact tcagcacgat cgtgttccgg gagtactccc tgaagctgtc cagcatcctg 600
agccaggctt gcaaggccgg caaagttgtg gacatgcagg taactgaact ctttcccttg 660
gtcatctgaa cgttgatttc ttggacaaaa tttcaagatt gtgacgcgag cgagccaatt 720
caggagctgt acatgaggat gacgctggac tcgatctgca aggtggggtt cggggtggag 780
atcggcacgc tgtcgccgga gctgccggag aacagcttcg cgcaggcctt cgacgccgcc 840
aacatcatcg tgacgctgcg gttcatcgac ccgctgtggc gcgtgaagaa gttcctgcac 900
gtcggctcgg aggcgctgct ggagcagagc atcaagctcg tcgacgagtt cacctacagc 960
gtcatccgcc ggcgcaaggc cgagatcgtg caggcccggg ccagcggcaa gcaggagaag 1020
gtgcgtacgc ggtcatcgtc attcgtcaag ctcccgatcg ctggtttgtg cagatgccat 1080
tgatcactga cacattaact gggcgcgcag atcaagcacg acatactgtc gcggttcatc 1140
gagctgggcg aggccggcgg cgacgacggc ggcagcctgt tcggggacga caagggcctc 1200
cgcgacgtgg tgctcaactt cgtgatcgcc gggcgggaca ccacggccac gacgctctcc 1260
tggttcacct acatggccat gacgcacccg gacgtggccg agaagctccg ccgcgagctg 1320
gccgccttcg agtccgagcg cgcccgcgag gagggcgtcg ctctggtccc ctgcagcgac 1380
ggcgagggct ccgacgaggc cttcgccgcc cgcgtggcgc agttcgcggg gctcctgagc 1440
tacgacgggc tcgggaagct ggtgtacctc cacgcgtgcg tgacggagac gctgcgcctg 1500
tacccggcgg tgccgcagga tcccaagggc atcgcggagg acgacgtgct cccggacggc 1560
accaaggtgc gcgccggcgg gatggtgacg tacgtgccct actccatggg gcggatggag 1620
tacaactggg gccccgacgc cgccagcttc cggccggagc ggtggatcgg cgacgatggc 1680
gccttccgca acgcgtcgcc gttcaagttc acggcgttcc aggcggggcc gcggatctgc 1740
ctgggcaagg actcggcgta cctgcagatg aagatggcgc tggccatcct gtgcaggttc 1800
ttcaggttcg agctcgtgga gggccacccc gtcaagtacc gcatgatgac catcctctcc 1860
atggcgcacg gcctcaaggt ccgcgtctcc agggcgccgc tcgcctgatc ttgatctggt 1920
tccggcgag 1929
<210> 10
<211> 547
<212> PRT
<213> 拟斯卑尔托山羊草(Aegilops speltoides)
<400> 10
Met Glu Glu Ala His Leu Gly Met Pro Ser Thr Thr Ala Phe Phe Pro
1 5 10 15
Leu Ala Gly Leu His Lys Phe Met Ala Ile Phe Leu Val Phe Leu Ser
20 25 30
Trp Ile Leu Val His Trp Trp Ser Leu Arg Lys Gln Lys Gly Pro Arg
35 40 45
Ser Trp Pro Val Ile Gly Ala Thr Leu Glu Gln Leu Arg Asn Tyr Tyr
50 55 60
Arg Met His Asp Trp Leu Val Glu Tyr Leu Ser Lys His Arg Thr Val
65 70 75 80
Thr Val Asp Met Pro Phe Thr Ser Tyr Thr Tyr Ile Ala Asp Pro Val
85 90 95
Asn Val Glu His Val Leu Lys Thr Asn Phe Asn Asn Tyr Pro Lys Gly
100 105 110
Glu Val Tyr Arg Ser Tyr Met Asp Val Leu Leu Gly Asp Gly Ile Phe
115 120 125
Asn Ala Asp Gly Glu Leu Trp Arg Lys Gln Arg Lys Thr Ala Ser Phe
130 135 140
Glu Phe Ala Ser Lys Asn Leu Arg Asp Phe Ser Thr Ile Val Phe Arg
145 150 155 160
Glu Tyr Ser Leu Lys Leu Ser Ser Ile Leu Ser Gln Ala Cys Lys Ala
165 170 175
Gly Lys Val Val Asp Met Gln Glu Leu Tyr Met Arg Met Thr Leu Asp
180 185 190
Ser Ile Cys Lys Val Gly Phe Gly Val Glu Ile Gly Thr Leu Ser Pro
195 200 205
Glu Leu Pro Glu Asn Ser Phe Ala Gln Ala Phe Asp Ala Ala Asn Ile
210 215 220
Ile Val Thr Leu Arg Phe Ile Asp Pro Leu Trp Arg Val Lys Lys Phe
225 230 235 240
Leu His Val Gly Ser Glu Ala Leu Leu Glu Gln Ser Ile Lys Leu Val
245 250 255
Asp Glu Phe Thr Tyr Ser Val Ile Arg Arg Arg Lys Ala Glu Ile Val
260 265 270
Gln Ala Arg Ala Ser Gly Lys Gln Glu Lys Ile Lys His Asp Ile Leu
275 280 285
Ser Arg Phe Ile Glu Leu Gly Glu Ala Gly Gly Asp Asp Gly Gly Ser
290 295 300
Leu Phe Gly Asp Asp Lys Gly Leu Arg Asp Val Val Leu Asn Phe Val
305 310 315 320
Ile Ala Gly Arg Asp Thr Thr Ala Thr Thr Leu Ser Trp Phe Thr Tyr
325 330 335
Met Ala Met Thr His Pro Asp Val Ala Glu Lys Leu Arg Arg Glu Leu
340 345 350
Ala Ala Phe Glu Ser Glu Arg Ala Arg Glu Glu Gly Val Ala Leu Val
355 360 365
Pro Cys Ser Asp Gly Glu Gly Ser Asp Glu Ala Phe Ala Ala Arg Val
370 375 380
Ala Gln Phe Ala Gly Leu Leu Ser Tyr Asp Gly Leu Gly Lys Leu Val
385 390 395 400
Tyr Leu His Ala Cys Val Thr Glu Thr Leu Arg Leu Tyr Pro Ala Val
405 410 415
Pro Gln Asp Pro Lys Gly Ile Ala Glu Asp Asp Val Leu Pro Asp Gly
420 425 430
Thr Lys Val Arg Ala Gly Gly Met Val Thr Tyr Val Pro Tyr Ser Met
435 440 445
Gly Arg Met Glu Tyr Asn Trp Gly Pro Asp Ala Ala Ser Phe Arg Pro
450 455 460
Glu Arg Trp Ile Gly Asp Asp Gly Ala Phe Arg Asn Ala Ser Pro Phe
465 470 475 480
Lys Phe Thr Ala Phe Gln Ala Gly Pro Arg Ile Cys Leu Gly Lys Asp
485 490 495
Ser Ala Tyr Leu Gln Met Lys Met Ala Leu Ala Ile Leu Cys Arg Phe
500 505 510
Phe Arg Phe Glu Leu Val Glu Gly His Pro Val Lys Tyr Arg Met Met
515 520 525
Thr Ile Leu Ser Met Ala His Gly Leu Lys Val Arg Val Ser Arg Ala
530 535 540
Pro Leu Ala
545
<210> 11
<211> 1930
<212> DNA
<213> 粗山羊草(Aegilopsm tauschii)
<400> 11
atggaggaag ctcacggcgg catgccgtcg acgacggcct tcttcccgct ggcagggctc 60
cacaagttca tggccatctt cctcgtgttc ctctcgtgga tcttggtcca ctggtggagc 120
ctgaggaagc agaaggggcc gaggtcatgg ccggtcatcg gcgcgacgct ggagcagctg 180
aggaactact accggatgca cgactggctc gtggagtacc tgtccaagca ccggacggtg 240
accgtcgaca tgcccttcac ctcctacacc tacatcgccg acccggtgaa cgtcgagcat 300
gtgctcaaga ccaacttcaa caattacccc aaggtgaaac aatcctcgag atgtcagtaa 360
aggttcagta taatcggtac tgacagtgtt acaaatgtct gaaatctgaa attgtatgtg 420
tagggggagg tgtacaggtc ctacatggac gtgctgctcg gcgacggcat attcaacgcc 480
gacggcgagc tctggaggaa gcagaggaag acggcgagct tcgagttcgc ttccaagaac 540
ttgagagact tcagcacgat cgtgttcagg gagtactccc tgaagctgtc cagcatactg 600
agccaggctt gcaaggccgg caaagttgtg gacatgcagg taactgaact cattcccttg 660
gtcatctgaa cgttgatttc ttggacaaaa tttcaagatt ctgacgcgag cgagcgaatt 720
caggagctgt atatgaggat gacgctggac tcgatctgca aagtggggtt cggagtcgag 780
atcggcacgc tgtcgccgga gctgccggag aacagcttcg cgcaggcgtt cgacgccgcc 840
aacatcatcg tgacgctgcg gttcatcgac ccgctgtggc gcgtgaagaa gttcctgcac 900
gtcggctcgg aggcgctgct ggagcagagc atcaagctcg tcgacgagtt cacctacagc 960
gtcatccgcc ggcgcaaggc cgagatcgtg caggcccggg ccagcggcaa gcaggagaag 1020
gtgcgtgcgt ggtcatcgtc attcgtcaag ctcccggtcg ctggtttgtg tagatgccat 1080
ggatcactga cacactaact gggcgcgcag atcaagcacg acatactgtc gcggttcatc 1140
gagctgggcg aggccggcgg cgacgacggc ggcagtctgt tcggggacga caagggcctc 1200
cgcgacgtgg tgctcaactt cgtgatcgcc gggcgggaca ccacggccac gacgctgtcc 1260
tggttcacct acatggccat gacgcacccg gacgtggccg agaagctccg ccgcgagctg 1320
gccgccttcg aggcggagcg cgcccgcgag gatggcgtcg ctctggtccc ctgcggcgac 1380
ggcgagggct ccgacgaggc cttcgctgcc cgcgtggcgc agttcgcggg gttcctgagc 1440
tacgacggcc tcgggaagct ggtgtacctc cacgcgtgcg tgacggagac gctgcgcctg 1500
tacccggcgg tgccgcagga ccccaagggc atcgcggagg acgacgtgct cccggacggc 1560
accaaggtgc gcgccggcgg gatggtgacg tacgtgccct actccatggg gcggatggag 1620
tacaactggg gccccgacgc cgccagcttc cggccggagc ggtggatcgg cgacgacggc 1680
gccttccgca acgcgtcgcc gttcaagttc acggcgttcc aggcggggcc gcggatttgc 1740
ctcggcaagg actcggcgta cctgcagatg aagatggcgc tggcaatcct gtgcaggttc 1800
ttcaggttcg agctcgtgga gggccacccc gtcaagtacc gcatgatgac catcctctcc 1860
atggcgcacg gcctcaaggt ccgcgtctcc agggcgccgc tcgcctgatc ttgatctggt 1920
tccggcgagg 1930
<210> 12
<211> 547
<212> PRT
<213> 粗山羊草(Aegilopsm tauschii)
<400> 12
Met Glu Glu Ala His Gly Gly Met Pro Ser Thr Thr Ala Phe Phe Pro
1 5 10 15
Leu Ala Gly Leu His Lys Phe Met Ala Ile Phe Leu Val Phe Leu Ser
20 25 30
Trp Ile Leu Val His Trp Trp Ser Leu Arg Lys Gln Lys Gly Pro Arg
35 40 45
Ser Trp Pro Val Ile Gly Ala Thr Leu Glu Gln Leu Arg Asn Tyr Tyr
50 55 60
Arg Met His Asp Trp Leu Val Glu Tyr Leu Ser Lys His Arg Thr Val
65 70 75 80
Thr Val Asp Met Pro Phe Thr Ser Tyr Thr Tyr Ile Ala Asp Pro Val
85 90 95
Asn Val Glu His Val Leu Lys Thr Asn Phe Asn Asn Tyr Pro Lys Gly
100 105 110
Glu Val Tyr Arg Ser Tyr Met Asp Val Leu Leu Gly Asp Gly Ile Phe
115 120 125
Asn Ala Asp Gly Glu Leu Trp Arg Lys Gln Arg Lys Thr Ala Ser Phe
130 135 140
Glu Phe Ala Ser Lys Asn Leu Arg Asp Phe Ser Thr Ile Val Phe Arg
145 150 155 160
Glu Tyr Ser Leu Lys Leu Ser Ser Ile Leu Ser Gln Ala Cys Lys Ala
165 170 175
Gly Lys Val Val Asp Met Gln Glu Leu Tyr Met Arg Met Thr Leu Asp
180 185 190
Ser Ile Cys Lys Val Gly Phe Gly Val Glu Ile Gly Thr Leu Ser Pro
195 200 205
Glu Leu Pro Glu Asn Ser Phe Ala Gln Ala Phe Asp Ala Ala Asn Ile
210 215 220
Ile Val Thr Leu Arg Phe Ile Asp Pro Leu Trp Arg Val Lys Lys Phe
225 230 235 240
Leu His Val Gly Ser Glu Ala Leu Leu Glu Gln Ser Ile Lys Leu Val
245 250 255
Asp Glu Phe Thr Tyr Ser Val Ile Arg Arg Arg Lys Ala Glu Ile Val
260 265 270
Gln Ala Arg Ala Ser Gly Lys Gln Glu Lys Ile Lys His Asp Ile Leu
275 280 285
Ser Arg Phe Ile Glu Leu Gly Glu Ala Gly Gly Asp Asp Gly Gly Ser
290 295 300
Leu Phe Gly Asp Asp Lys Gly Leu Arg Asp Val Val Leu Asn Phe Val
305 310 315 320
Ile Ala Gly Arg Asp Thr Thr Ala Thr Thr Leu Ser Trp Phe Thr Tyr
325 330 335
Met Ala Met Thr His Pro Asp Val Ala Glu Lys Leu Arg Arg Glu Leu
340 345 350
Ala Ala Phe Glu Ala Glu Arg Ala Arg Glu Asp Gly Val Ala Leu Val
355 360 365
Pro Cys Gly Asp Gly Glu Gly Ser Asp Glu Ala Phe Ala Ala Arg Val
370 375 380
Ala Gln Phe Ala Gly Phe Leu Ser Tyr Asp Gly Leu Gly Lys Leu Val
385 390 395 400
Tyr Leu His Ala Cys Val Thr Glu Thr Leu Arg Leu Tyr Pro Ala Val
405 410 415
Pro Gln Asp Pro Lys Gly Ile Ala Glu Asp Asp Val Leu Pro Asp Gly
420 425 430
Thr Lys Val Arg Ala Gly Gly Met Val Thr Tyr Val Pro Tyr Ser Met
435 440 445
Gly Arg Met Glu Tyr Asn Trp Gly Pro Asp Ala Ala Ser Phe Arg Pro
450 455 460
Glu Arg Trp Ile Gly Asp Asp Gly Ala Phe Arg Asn Ala Ser Pro Phe
465 470 475 480
Lys Phe Thr Ala Phe Gln Ala Gly Pro Arg Ile Cys Leu Gly Lys Asp
485 490 495
Ser Ala Tyr Leu Gln Met Lys Met Ala Leu Ala Ile Leu Cys Arg Phe
500 505 510
Phe Arg Phe Glu Leu Val Glu Gly His Pro Val Lys Tyr Arg Met Met
515 520 525
Thr Ile Leu Ser Met Ala His Gly Leu Lys Val Arg Val Ser Arg Ala
530 535 540
Pro Leu Ala
545
<210> 13
<211> 1581
<212> DNA
<213> 乌拉尔图小麦(Triticum urartu)
<400> 13
atggaagaga agaagccgcg gcggcaggga gccgcaggac gcgatggcat cgtgcagtac 60
ccgcacctct tcatcgcggc cctggcgctg gccctggtcc tcatggaccc cttccacctc 120
ggcccgctgg ccgggatcga ctaccggccg gtgaagcacg agctggcgcc gtacagggag 180
gtcatgcagc gctggccgag ggacaacggc agccgcctca ggctcggcag gctcgagttc 240
gtcaacgagg tgttcgggcc ggagtccatc gagttcgacc gccagggccg cgggccctac 300
gccgggctcg ccgacggccg cgtcgtgcgg tggatggggg acaaggccgg gtgggagacg 360
ttcgccgtca tgaatcctga ctggtattgg cttactgcag aaaaaccata gcttacctgt 420
gtgtgtgcaa actaaaatag tttctttcgg aaaaaaaaag gtcggagaaa gtttgtgcta 480
acggagtgga gtcgacgacg aagaagcagc acgggaagga gaagtggtgc ggccggcctc 540
tcgggctgag gttccacagg gagaccggcg agctcttcat cgccgacgcg tactatgggc 600
tcatggccgt tggcgaaagc ggcggcgtgg cgacctccct ggcgagggag gccggcgggg 660
acccggtcca cttcgccaac gacctcgaca tccacatgaa cggctcgata ttcttcaccg 720
acacgagcac gagatacagc agaaagtgag cggagtactg ctgccgatct cctttttctg 780
ttcttgagat ttgtgtttga caaatgactg atcatgcagg gaccatttga acattttgct 840
ggaaggagaa ggcacgggga ggctgctgag atatgaccga gaaaccggtg ccgttcatgt 900
cgtgctcaac gggctggtct tcccaaacgg cgtgcagatc tcacaggacc agcaatttct 960
cctcttctcc gagacaacaa actgcaggtg agataaactc aggttttcag tatgatccgg 1020
ctcgagagat ccaggaactg atgacgcctt tattaatcgg ctcatgcatg cacactagga 1080
tcatgaggta ctggctggaa ggtccaagag cgggccaggt ggaggtgttc gcgaacctgc 1140
cggggttccc cgacaacgtg cgcttgaaca gcaaggggca gttctgggtg gcgatcgact 1200
gctgccggac gccgacgcag gaggtgttcg cgcggtggcc gtggctgcgg accgcctact 1260
tcaagatccc ggtgtcgatg aagacgctgg ggaagatggt gagcatgaag atgtacacgc 1320
ttctcgcgct cctcgacggc gaggggaacg tggtcgaggt actcgaggac cggggcggcg 1380
aggtgatgaa gctggtgagc gaggtgaggg aggtggaccg gaggctgtgg atcgggaccg 1440
ttgcgcacaa ccacatcgcc acgatccctt acccgttgga ctagagtgtg tagtgtctca 1500
tttgatttgc tggttttata ttagcaagga ggtgtatcag tttatggttt gcttgtttat 1560
tgggttcgtg tgatgatcgt g 1581
<210> 14
<211> 413
<212> PRT
<213> 乌拉尔图小麦(Triticum urartu)
<400> 14
Met Glu Glu Lys Lys Pro Arg Arg Gln Gly Ala Ala Gly Arg Asp Gly
1 5 10 15
Ile Val Gln Tyr Pro His Leu Phe Ile Ala Ala Leu Ala Leu Ala Leu
20 25 30
Val Leu Met Asp Pro Phe His Leu Gly Pro Leu Ala Gly Ile Asp Tyr
35 40 45
Arg Pro Val Lys His Glu Leu Ala Pro Tyr Arg Glu Val Met Gln Arg
50 55 60
Trp Pro Arg Asp Asn Gly Ser Arg Leu Arg Leu Gly Arg Leu Glu Phe
65 70 75 80
Val Asn Glu Val Phe Gly Pro Glu Ser Ile Glu Phe Asp Arg Gln Gly
85 90 95
Arg Gly Pro Tyr Ala Gly Leu Ala Asp Gly Arg Val Val Arg Trp Met
100 105 110
Gly Asp Lys Ala Gly Trp Glu Thr Phe Ala Val Met Asn Pro Asp Trp
115 120 125
Ser Glu Lys Val Cys Ala Asn Gly Val Glu Ser Thr Thr Lys Lys Gln
130 135 140
His Gly Lys Glu Lys Trp Cys Gly Arg Pro Leu Gly Leu Arg Phe His
145 150 155 160
Arg Glu Thr Gly Glu Leu Phe Ile Ala Asp Ala Tyr Tyr Gly Leu Met
165 170 175
Ala Val Gly Glu Ser Gly Gly Val Ala Thr Ser Leu Ala Arg Glu Ala
180 185 190
Gly Gly Asp Pro Val His Phe Ala Asn Asp Leu Asp Ile His Met Asn
195 200 205
Gly Ser Ile Phe Phe Thr Asp Thr Ser Thr Arg Tyr Ser Arg Lys Asp
210 215 220
His Leu Asn Ile Leu Leu Glu Gly Glu Gly Thr Gly Arg Leu Leu Arg
225 230 235 240
Tyr Asp Arg Glu Thr Gly Ala Val His Val Val Leu Asn Gly Leu Val
245 250 255
Phe Pro Asn Gly Val Gln Ile Ser Gln Asp Gln Gln Phe Leu Leu Phe
260 265 270
Ser Glu Thr Thr Asn Cys Arg Ile Met Arg Tyr Trp Leu Glu Gly Pro
275 280 285
Arg Ala Gly Gln Val Glu Val Phe Ala Asn Leu Pro Gly Phe Pro Asp
290 295 300
Asn Val Arg Leu Asn Ser Lys Gly Gln Phe Trp Val Ala Ile Asp Cys
305 310 315 320
Cys Arg Thr Pro Thr Gln Glu Val Phe Ala Arg Trp Pro Trp Leu Arg
325 330 335
Thr Ala Tyr Phe Lys Ile Pro Val Ser Met Lys Thr Leu Gly Lys Met
340 345 350
Val Ser Met Lys Met Tyr Thr Leu Leu Ala Leu Leu Asp Gly Glu Gly
355 360 365
Asn Val Val Glu Val Leu Glu Asp Arg Gly Gly Glu Val Met Lys Leu
370 375 380
Val Ser Glu Val Arg Glu Val Asp Arg Arg Leu Trp Ile Gly Thr Val
385 390 395 400
Ala His Asn His Ile Ala Thr Ile Pro Tyr Pro Leu Asp
405 410
<210> 15
<211> 1536
<212> DNA
<213> 拟斯卑尔托山羊草(Aegilops speltoides)
<400> 15
atggaagaga agaagccgcg gcggcaggga gccgcagtac gcgatggcat cgtgcagtac 60
ccgcacctct tcatcgcggc cctggcgctg gccctggtcg tcatggaccc cttccacctc 120
ggcccgctgg ccgggatcga ctaccggccg gtgaagcacg agctggcgcc gtacagggag 180
gtcatgcagc gctggccgag ggacaacggc agccggctga gactcggcag gctcgagttc 240
gtcaacgagg tgttcgggcc ggagtccatc gagttcgacc gccagggccg cgggccctac 300
gccggcctcg ccgacggccg cgtcgtgcgg tggatggggg agaaggccgg gtgggagacg 360
ttcgccgtca tgaatcctga ctggtattgg cttactgcag ataaatccat agcttacctg 420
tgtgtttgca aactaaaatg gtttcttgga aaaaaaaagg tcggagaaag tttgtgctaa 480
cggagtggag tcaacgacga agaagcagca cgggaaggag aagtggtgcg gccggcctct 540
cgggctgagg ttccacaggg agaccggcga gctcttcatc gccgacgcgt actatgggct 600
catggccgtc ggcgaaagcg gcggcgtggc gacctccctg gcaagggagg ccggcgggga 660
cccggtccac ttcgccaacg accttgacat ccacatgaac ggctcgatat tcttcaccga 720
cacgagcacg agatacagca gaaagtgagc gaactgctgc cgctgttctc catttttgtt 780
aatgagatgt tgtgtttgag tgtctgacac catgactgat catgcaggga ccatttgaac 840
attttgctgg aaggagaagg cacggggagg ctgctgagat atgaccgaga aaccggtgcc 900
gttcatgtcg tgctcaacgg gctggtcttc ccaaacggcg tgcagatttc acaggaccag 960
caatttctcc tcttctccga gacaacaaac tgcaggtgag ataaactcag attttcagta 1020
tgatccggct cgagagatcc aggaactgat gacggctcat gcacgcacgc taggatcatg 1080
aggtactggc tggaaggtcc aagagcgggc caggtggagg tgttcgcgaa cctgccgggg 1140
ttccccgaca acgtgcgcct gaacagcaag gggcagttct gggtggcgat cgactgctgc 1200
cggacgccga cgcaggaggt gttcgcgcgg tggccgtggc tgcggaccgc ctacttcaag 1260
atcccggtgt cgatgaagac gctggggaag atggtgagca tgaagatgta cacgcttctc 1320
gcgctcctcg acggcgaggg gaacgtcgtg gaggtgctcg aggaccgggg cggcgaggtg 1380
atgaagctgg tgagcgaggt gagggaggtg gaccggaggc tgtggatcgg gaccgttgcg 1440
cacaaccaca tcgccacgat cccttacccg ctggactaga gggagtgtgt agtgtccatt 1500
tgctggttta tattagcaag gaggtgtatc agttta 1536
<210> 16
<211> 413
<212> PRT
<213> 拟斯卑尔托山羊草(Aegilops speltoides)
<400> 16
Met Glu Glu Lys Lys Pro Arg Arg Gln Gly Ala Ala Val Arg Asp Gly
1 5 10 15
Ile Val Gln Tyr Pro His Leu Phe Ile Ala Ala Leu Ala Leu Ala Leu
20 25 30
Val Val Met Asp Pro Phe His Leu Gly Pro Leu Ala Gly Ile Asp Tyr
35 40 45
Arg Pro Val Lys His Glu Leu Ala Pro Tyr Arg Glu Val Met Gln Arg
50 55 60
Trp Pro Arg Asp Asn Gly Ser Arg Leu Arg Leu Gly Arg Leu Glu Phe
65 70 75 80
Val Asn Glu Val Phe Gly Pro Glu Ser Ile Glu Phe Asp Arg Gln Gly
85 90 95
Arg Gly Pro Tyr Ala Gly Leu Ala Asp Gly Arg Val Val Arg Trp Met
100 105 110
Gly Glu Lys Ala Gly Trp Glu Thr Phe Ala Val Met Asn Pro Asp Trp
115 120 125
Ser Glu Lys Val Cys Ala Asn Gly Val Glu Ser Thr Thr Lys Lys Gln
130 135 140
His Gly Lys Glu Lys Trp Cys Gly Arg Pro Leu Gly Leu Arg Phe His
145 150 155 160
Arg Glu Thr Gly Glu Leu Phe Ile Ala Asp Ala Tyr Tyr Gly Leu Met
165 170 175
Ala Val Gly Glu Ser Gly Gly Val Ala Thr Ser Leu Ala Arg Glu Ala
180 185 190
Gly Gly Asp Pro Val His Phe Ala Asn Asp Leu Asp Ile His Met Asn
195 200 205
Gly Ser Ile Phe Phe Thr Asp Thr Ser Thr Arg Tyr Ser Arg Lys Asp
210 215 220
His Leu Asn Ile Leu Leu Glu Gly Glu Gly Thr Gly Arg Leu Leu Arg
225 230 235 240
Tyr Asp Arg Glu Thr Gly Ala Val His Val Val Leu Asn Gly Leu Val
245 250 255
Phe Pro Asn Gly Val Gln Ile Ser Gln Asp Gln Gln Phe Leu Leu Phe
260 265 270
Ser Glu Thr Thr Asn Cys Arg Ile Met Arg Tyr Trp Leu Glu Gly Pro
275 280 285
Arg Ala Gly Gln Val Glu Val Phe Ala Asn Leu Pro Gly Phe Pro Asp
290 295 300
Asn Val Arg Leu Asn Ser Lys Gly Gln Phe Trp Val Ala Ile Asp Cys
305 310 315 320
Cys Arg Thr Pro Thr Gln Glu Val Phe Ala Arg Trp Pro Trp Leu Arg
325 330 335
Thr Ala Tyr Phe Lys Ile Pro Val Ser Met Lys Thr Leu Gly Lys Met
340 345 350
Val Ser Met Lys Met Tyr Thr Leu Leu Ala Leu Leu Asp Gly Glu Gly
355 360 365
Asn Val Val Glu Val Leu Glu Asp Arg Gly Gly Glu Val Met Lys Leu
370 375 380
Val Ser Glu Val Arg Glu Val Asp Arg Arg Leu Trp Ile Gly Thr Val
385 390 395 400
Ala His Asn His Ile Ala Thr Ile Pro Tyr Pro Leu Asp
405 410
<210> 17
<211> 1573
<212> DNA
<213> 粗山羊草(Aegilopsm tauschii)
<400> 17
atggaagaga agaaaccgcg gcggcaggga gccgcagtac gcgatggcat cgtgcagtac 60
ccgcacctct tcatcgcggc cctggcgctg gccctggtcc tcatggaccc gttccacctc 120
ggcccgctgg ccgggatcga ctaccgaccg gtgaagcacg agctggcgcc gtacagggag 180
gtcatgcagc gctggccgag ggacaacggc agccgcctca ggctcggcag gctcgagttc 240
gtcaacgagg tgttcgggcc ggagtccatc gagttcgacc gccagggccg cgggccttac 300
gccgggctcg ccgacggccg cgtcgtgcgg tggatggggg acaaggccgg gtgggagacg 360
ttcgccgtca tgaatcctga ctggtactgg cttactgcag aaaaacccat agcttacctg 420
tgtgtgtgca gactaaaata gtttctttca taaaaaaaaa ggtcggagaa agtttgtgct 480
aacggagtgg agtcgacgac gaagaagcag cacgggaagg agaagtggtg cggccggcct 540
ctcggcctga ggttccacag ggagaccggc gagctcttca tcgccgacgc gtactatggg 600
ctcatggccg tcggcgaaag gggcggcgtg gcgacctccc tggcgaggga ggccggcggg 660
gacccggtcc acttcgccaa cgaccttgac atccacatga acggctcgat attcttcacc 720
gacacgagca cgagatacag cagaaagtga gcggagtact gctgccgatc tcctttttct 780
gttcttgaga tttgtgtttg acaaatgact gatcatgcag ggaccatttg aacattttgc 840
tggaaggaga aggcacgggg aggctgctga gatatgaccg agaaaccggt gccgttcatg 900
tcgtgctcaa cgggctggtc ttcccaaacg gcgtgcagat atcacaggac cagcaatttc 960
tcctcttctc cgagacaaca aactgcaggt gagataaact caggttttca gtatgatccg 1020
gctcgagaga tccaggaact gatgacggct catgcatgca cactaggatc atgaggtact 1080
ggctggaagg tccaagagcg ggccaggtgg aggtgttcgc gaacctgccg gggttccccg 1140
acaatgtgcg cctgaacagc aaggggcagt tctgggtggc catcgactgc tgccgtacgc 1200
cgacgcagga ggtgttcgcg cggtggccgt ggctgcggac cgcctacttc aagatcccgg 1260
tgtcgatgaa gacgctgggg aagatggtga gcatgaagat gtacacgctt ctcgcgctcc 1320
tcgacggcga ggggaacgtc gtggaggtgc tcgaggaccg gggcggcgag gtgatgaagc 1380
tggtgagcga ggtgagggag gtggaccgga ggctgtggat cgggaccgtt gcgcacaacc 1440
acatcgccac gatcccttac ccgctggact agagggagtg tgtagtgtcc catttgattt 1500
gctggtttta tattagcaag gaggtgtatc agtttatggt ttgcttgttc attgggttcg 1560
tgtgatgatc gtg 1573
<210> 18
<211> 415
<212> PRT
<213> 粗山羊草(Aegilopsm tauschii)
<400> 18
Met Glu Glu Lys Lys Pro Arg Arg Gln Gly Ala Ala Val Arg Asp Gly
1 5 10 15
Ile Val Gln Tyr Pro His Leu Phe Ile Ala Ala Leu Ala Leu Ala Leu
20 25 30
Val Leu Met Asp Pro Phe His Leu Gly Pro Leu Ala Gly Ile Asp Tyr
35 40 45
Arg Pro Val Lys His Glu Leu Ala Pro Tyr Arg Glu Val Met Gln Arg
50 55 60
Trp Pro Arg Asp Asn Gly Ser Arg Leu Arg Leu Gly Arg Leu Glu Phe
65 70 75 80
Val Asn Glu Val Phe Gly Pro Glu Ser Ile Glu Phe Asp Arg Gln Gly
85 90 95
Arg Gly Pro Tyr Ala Gly Leu Ala Asp Gly Arg Val Val Arg Trp Met
100 105 110
Gly Asp Lys Ala Gly Trp Glu Thr Phe Ala Val Met Asn Pro Asp Trp
115 120 125
Tyr Trp Ser Glu Lys Val Cys Ala Asn Gly Val Glu Ser Thr Thr Lys
130 135 140
Lys Gln His Gly Lys Glu Lys Trp Cys Gly Arg Pro Leu Gly Leu Arg
145 150 155 160
Phe His Arg Glu Thr Gly Glu Leu Phe Ile Ala Asp Ala Tyr Tyr Gly
165 170 175
Leu Met Ala Val Gly Glu Arg Gly Gly Val Ala Thr Ser Leu Ala Arg
180 185 190
Glu Ala Gly Gly Asp Pro Val His Phe Ala Asn Asp Leu Asp Ile His
195 200 205
Met Asn Gly Ser Ile Phe Phe Thr Asp Thr Ser Thr Arg Tyr Ser Arg
210 215 220
Lys Asp His Leu Asn Ile Leu Leu Glu Gly Glu Gly Thr Gly Arg Leu
225 230 235 240
Leu Arg Tyr Asp Arg Glu Thr Gly Ala Val His Val Val Leu Asn Gly
245 250 255
Leu Val Phe Pro Asn Gly Val Gln Ile Ser Gln Asp Gln Gln Phe Leu
260 265 270
Leu Phe Ser Glu Thr Thr Asn Cys Arg Ile Met Arg Tyr Trp Leu Glu
275 280 285
Gly Pro Arg Ala Gly Gln Val Glu Val Phe Ala Asn Leu Pro Gly Phe
290 295 300
Pro Asp Asn Val Arg Leu Asn Ser Lys Gly Gln Phe Trp Val Ala Ile
305 310 315 320
Asp Cys Cys Arg Thr Pro Thr Gln Glu Val Phe Ala Arg Trp Pro Trp
325 330 335
Leu Arg Thr Ala Tyr Phe Lys Ile Pro Val Ser Met Lys Thr Leu Gly
340 345 350
Lys Met Val Ser Met Lys Met Tyr Thr Leu Leu Ala Leu Leu Asp Gly
355 360 365
Glu Gly Asn Val Val Glu Val Leu Glu Asp Arg Gly Gly Glu Val Met
370 375 380
Lys Leu Val Ser Glu Val Arg Glu Val Asp Arg Arg Leu Trp Ile Gly
385 390 395 400
Thr Val Ala His Asn His Ile Ala Thr Ile Pro Tyr Pro Leu Asp
405 410 415
<210> 19
<211> 10
<212> PRT
<213> 人工
<220>
<223> MS26的血红素结合结构域
<220>
<221> misc_feature
<223> Xaa =任何氨基酸
<220>
<221> misc_feature
<222> (2)..(3)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (5)..(5)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (7)..(7)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (9)..(9)
<223> Xaa可以是任何天然存在的氨基酸
<400> 19
Phe Xaa Xaa Gly Xaa Arg Xaa Cys Xaa Gly
1 5 10
<210> 20
<211> 9
<212> PRT
<213> 人工
<220>
<223> 双氧结合结构域
<220>
<221> misc_feature
<222> (1)..(10)
<223> Xaa =任何氨基酸
<400> 20
Ala Gly Gly Xaa Asp Glu Thr Thr Ser
1 5
<210> 21
<211> 22
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 21
gatggtgacg tacgtgccct ac 22
<210> 22
<211> 58
<212> DNA
<213> 人工
<220>
<223> 一级PCR正向引物
<400> 22
ctacactctt tccctacacg acgctcttcc gatctaaccc gcggaggacg acgtgctc 58
<210> 23
<211> 54
<212> DNA
<213> 人工
<220>
<223> 一级PCR反向引物
<400> 23
caagcagaag acggcatacg agctcttccg atctcgtcgg ggccccagtt gtac 54
<210> 24
<211> 43
<212> DNA
<213> 人工
<220>
<223> 二级PCR正向引物
<400> 24
aatgatacgg cgaccaccga gatctacact ctttccctac acg 43
<210> 25
<211> 18
<212> DNA
<213> 人工
<220>
<223> 二级PCR反向引物
<400> 25
caagcagaag acggcata 18
<210> 26
<211> 23
<212> DNA
<213> 人工
<220>
<223> UNIMS26 5'-2引物
<400> 26
gacgtggtgc tcaacttcgt gat 23
<210> 27
<211> 23
<212> DNA
<213> 人工
<220>
<223> UNIMS26 3'-1引物
<400> 27
gccatggaga ggatggtcat cat 23
<210> 28
<211> 112
<212> DNA
<213> 乌拉尔图小麦(Triticum urartu)
<400> 28
ggaggacgac gtgctcccgg acggcaccaa ggtgcgcgcc ggcgggatgg tgacgtacgt 60
gccctactcc atggggcgga tggagtataa ctggggcccc gacgccgcca gc 112
<210> 29
<211> 112
<212> DNA
<213> 拟斯卑尔托山羊草(Aegilops speltoides)
<400> 29
ggaggacgac gtgctcccgg acggcaccaa ggtgcgcgcc ggcgggatgg tgacgtacgt 60
gccctactcc atggggcgga tggagtacaa ctggggcccc gacgccgcca gc 112
<210> 30
<211> 112
<212> DNA
<213> 粗山羊草(Aegilopsm tauschii)
<400> 30
ggaggacgac gtgctcccgg acggcaccaa ggtgcgcgcc ggcgggatgg tgacgtacgt 60
gccctactcc atggggcgga tggagtacaa ctggggcccc gacgccgcca gc 112
<210> 31
<211> 112
<212> DNA
<213> 玉米(Zea mays)
<400> 31
ggaggacgac gtgctgccgg acgggacgaa ggtgagggcc ggcgggatgg tgacgtacgt 60
gccctactcg atggggcgga tggagtacaa ctggggcccc gacgcggcga gc 112
<210> 32
<211> 112
<212> DNA
<213> 高粱(Sorghum bicolor)
<400> 32
ggaggacgac gtgctgccgg acgggacgaa ggtgagggcc ggcgggatgg tgacgtacgt 60
gccctactcg atggggcgga tggagtacaa ctggggaccc gacgcggcga gc 112
<210> 33
<211> 112
<212> DNA
<213> 水稻(Oryza sativa)
<400> 33
ggaggacgac gtgctccccg acggcaccaa ggtgcgcgcc ggcgggatgg tgacgtacgt 60
gccctactcc atggggagga tggagtacaa ctggggcccc gacgcggcga gc 112
<210> 34
<211> 100
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 34
cgcggaggac gacgtgctcc cggacggcac caaggtgcgc gccggcggga tggtgacgta 60
cgtgccctac tccatggggc ggatggagta caactggggc 100
<210> 35
<211> 77
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 35
aacccgcgga ggacgacgtg ctcccggacg gcaccaaggt gccctactcc atggggcgga 60
tggagtacaa ctggggc 77
<210> 36
<211> 95
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 36
aacccgcgga ggacgacgtg ctcccggacg gcaccaaggt gcgcgccggc gggatggtga 60
cgtactccat ggggcggatg gagtacaact ggggc 95
<210> 37
<211> 71
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 37
aacccgcgga ggacgacgtg ctcccggacg gcaccaaggt gcgcgccggc gggatggagt 60
acaactgggg c 71
<210> 38
<211> 100
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 38
aacccgcgga ggacgacgtg ctcccggacg gcaccaaggt gcgcgccggc gggatggtga 60
cgtgccctac tccatggggc ggatggagta caactggggc 100
<210> 39
<211> 77
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 39
aacccgcgga ggacgacgtg ctcccggacg gcaccaacgt gccctactcc atggggcgga 60
tggagtacaa ctggggc 77
<210> 40
<211> 94
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 40
aacccgcgga ggacgacgtg ctcccggacg gcaccaaggt gcgcgccggc gggatggtga 60
cgtacccatg gggcggatgg agtacaactg gggc 94
<210> 41
<211> 87
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 41
aacccgcgga ggacgacgtg ctcccggacg gcaccaaggt gcgcgccggc gggatactcc 60
atggggcgga tggagtacaa ctggggc 87
<210> 42
<211> 81
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 42
aacccgcgga ggacgacgtg ctcccggacg gcaccaaggt acgtgcccta ctccatgggg 60
cggatggagt acaactgggg c 81
<210> 43
<211> 98
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 43
aacccgcgga ggacgacgtg ctcccggacg gcaccaaggt gcgcgccggc gggatggtga 60
cgtactactc catggggcgg atggagtaca actggggc 98
<210> 44
<211> 76
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 44
aacccgcgga ggacgacgtg ctcccggacg gcaccaaggt gcgcgccggc gggatgtcca 60
tggggcggat ggagta 76
<210> 45
<211> 156
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 45
ctgcgcctgt acccggcggt gccgcaggac cccaagggca tcgcggagga cgacgtgctc 60
ccggacggca ccaaggtgcg cgccggcggg atggtgacgt acgtgcccta ctccatgggg 120
cggatggagt acaactgggg ccccgacgcc gccagc 156
<210> 46
<211> 66
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 46
ctgcgcctgt acgtgcccta ctccatgggg cggatggagt acaactgggg ccccgacgcc 60
gccagc 66
<210> 47
<211> 60
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 47
ctgcgcctgt acccggcggt gccgcaggac cccaagggca tcgcggagga cgacgtcggc 60
<210> 48
<211> 133
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 48
ctccgcctgt acccggcggt gccgcaggac cccaagggca tcgcggagga cgacgtgctc 60
ccggacggca ccaaggtacg tgccctactc catggggcgg atggagtaca actggggccc 120
cgacgccgcc agc 133
<210> 49
<211> 152
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 49
ctgcgcctgt acccggcggt gccgcaggac cccaagggca tcgcggagga cgacgtgctc 60
ccggacggca ccaaggtgcg cgccggcggg atggtgacgt gccctactcc atggggcgga 120
tggagtacaa ctggggcccc gacgccgcca gc 152
<210> 50
<211> 157
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 50
ctccgcctgt acccggcggt gccgcaggac cccaagggca tcgcggagga cgacgtgctc 60
ccggacggca ccaaggtgcg cgccggcggg atggtgacgt accgtgccct actccatggg 120
gcggatggag tacaactggg gccccgacgc cgccagc 157
<210> 51
<211> 75
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 51
ctccgcctgt acccggcggt gccgcaggac cccaagggca tcgcggagga cgacgtgctc 60
ccggacggca ccaag 75
<210> 52
<211> 147
<212> DNA
<213> 普通小麦(Triticum aestivum)
<400> 52
ctccgcctgt acccggcggt gccgcaggac cccaagggca tcgcggagga cgacgtgctc 60
ccggacggca ccaaggtgcg cgccggcggg atggtgacgt actccatggg gcggatggag 120
tacaactggg gccccgacgc cgccagc 147
Claims (43)
1.一种赋予突变的 MS45 雄性不育小麦植物,相对于对照植物,雄性育性的方法,其中所述方法包括:
将与在植物中驱动表达的启动子可操作地连接的多核苷酸引入到所述突变的MS45雄性不育小麦植物中,所述多核苷酸包含选自由以下组成的组的核苷酸序列:
(a) 包含 SEQ ID NO: 15 的核苷酸序列; 和
(b) 包含与 SEQ ID NO: 15 至少 95% 序列同一性的核苷酸序列,其中当在所述植物中表达时,所述核苷酸赋予突变的 MS45 雄性不育植物雄性育性; 和
在植物中表达所述多核苷酸以赋予植物雄性育性。
2.根据权利要求1所述的方法,其中所述启动子是组成型启动子、诱导型启动子、组织优选启动子或生长阶段优选启动子。
3.根据权利要求2所述的的方法,其中所述组织优选启动子是雄性组织优选启动子。
4.一种分离的多核苷酸,其包含选自以下的核苷酸序列:
(a) 包含SEQ ID NO: 1、7或13的核苷酸序列;
(b) 编码包含SEQ ID NO: 2、8或14的氨基酸序列的核苷酸序列;
(c) 与SEQ ID NO: 1、7或13具有至少85%的序列同一性的核苷酸序列,其中所述多核苷酸编码调节雄性育性的多肽;
(d) 包含SEQ ID NO: 1、7或13的至少50个连续核苷酸的核苷酸序列,其中所述多核苷酸编码调节雄性育性的多肽;以及
(e) 编码与SEQ ID NO: 2、8或14具有至少85%的同一性的多肽的核苷酸序列,其中所述多肽调节雄性育性。
5.根据权利要求4所述的分离的多核苷酸,其中所述核苷酸序列选自:
(a) 包含SEQ ID NO: 3、5、9、11、15或17的核苷酸序列;以及
(b) 编码包含SEQ ID NO: 4、6、10、12、16或18的氨基酸序列的核苷酸序列。
6.一种包含表达盒的多核苷酸,所述表达盒包含有效连接到驱动在植物中的表达的第一异源启动子的第一多核苷酸,所述第一多核苷酸是权利要求4-5中任一项所述的多核苷酸。
7.根据权利要求6所述的多核苷酸,其中所述表达盒的所述第一启动子是组成型启动子、诱导型启动子、组织优选的启动子、或生长阶段优选的启动子。
8.根据权利要求7所述的多核苷酸,其中所述表达盒的所述第一启动子是雄性组织优选的启动子。
9.根据权利要求6-8中任一项所述的多核苷酸,还包括有效连接到驱动在植物中的表达的第二启动子的第二多核苷酸。
10.根据权利要求9所述的多核苷酸,其中所述第二多核苷酸编码干扰雄性配子的功能、形成或传播的多核苷酸或多肽。
11.根据权利要求10所述的多核苷酸,其中所述第二多核苷酸编码芽孢杆菌RNA酶、DAM-甲基化酶、淀粉酶、或ADP核糖基化酶。
12.根据权利要求9-11中任一项所述的多核苷酸,还包括有效连接到第三启动子的第三多核苷酸,其中所述第三多核苷酸编码标记基因产物。
13.根据权利要求12所述的表达盒,其中所述标记基因产物包括抗生素抗性标记基因产物或可视标记基因产物。
14.一种分离的多肽,其包含选自以下的氨基酸序列:
(a) 包含SEQ ID NO: 2、8或14的氨基酸序列;
(b) 与SEQ ID NO: 2、8或14具有至少85%的序列同一性的氨基酸序列,其中所述多肽调节雄性育性;以及
(c) 包含SEQ ID NO: 2、8或14的至少50个连续氨基酸的氨基酸序列,其中所述多肽调节雄性育性。
15.根据权利要求14所述的分离的多肽,其包含选自以下的氨基酸序列:SEQ ID NO:4、6、10、12、16和18。
16.一种载体,其包含权利要求6-13中任一项所述的表达盒。
17.一种植物细胞,其包含权利要求4-5中任一项所述的多核苷酸,其中所述多核苷酸对于所述植物细胞而言是异源的。
18.根据权利要求17所述的植物细胞,其中所述多核苷酸有效连接到其天然启动子序列。
19.一种植物细胞,其包含权利要求6-13中任一项所述的表达盒。
20.根据权利要求17-19中任一项所述的植物细胞,其中所述植物细胞来自单子叶植物或双子叶植物。
21.根据权利要求20所述的植物细胞,其中所述植物是玉蜀黍、大麦、粟、小麦、水稻、高粱、黑麦、大豆、卡诺拉油菜、苜蓿、向日葵、红花、甘蔗、烟草、拟南芥(Arabidopsis)或棉花。
22.一种植物,其包含权利要求17-21中任一项所述的植物细胞。
23.根据权利要求22所述的植物,其中当与对照植物比较时,所述多核苷酸的表达调节所述植物的雄性育性。
24.根据权利要求22或23所述的植物,其中当与对照植物比较时,所述植物具有增强的雄性育性。
25.根据权利要求22-24中任一项所述的植物,其中所述多核苷酸的表达赋予雄性不育植物雄性育性。
26.根据权利要求22-25中任一项所述的植物,其中所述植物是雌性能育植物。
27.根据权利要求22-26中任一项所述的植物,其中当与对照植物比较时,所述植物的至少一种雄性组织的形成在所述第一多核苷酸表达之后得到调节。
28.根据权利要求27所述的植物,其中所述雄性组织包括雄蕊、花药、花丝或花粉。
29.根据权利要求27或28所述的植物,其中至少一种雄性组织的所述得到调节的形成包括至少一种雄性组织的形成增加。
30.根据权利要求22-26中任一项所述的植物,其中所述异源第一多核苷酸被稳定地整合到所述植物的基因组中。
31.一种权利要求22-30中任一项所述的植物的种子,其中所述种子包含所述异源第一多核苷酸。
32.一种用于增加植物中的多肽的活性和/或水平的方法,其包括向所述植物提供权利要求14或15中任一项所述的多肽。
33.一种增加植物中的多肽的活性和/或水平的方法,其包括向所述植物中引入有效连接到在所述植物中有活性的启动子的多核苷酸,所述多核苷酸包含选自以下的核苷酸序列:
(a) 包含SEQ ID NO: 1、7或13的核苷酸序列;
(b) 编码包含SEQ ID NO: 2、8或14的氨基酸序列的核苷酸序列;
(c) 与SEQ ID NO: 1、7或13具有至少85%的序列同一性的核苷酸序列,其中所述多核苷酸编码调节雄性育性的多肽;
(d) 包含SEQ ID NO: 1、7或13的至少50个连续核苷酸的核苷酸序列,其中所述多核苷酸编码调节雄性育性的多肽;以及
(e) 编码与SEQ ID NO: 2、8或14具有至少85%的同一性的多肽的核苷酸序列,其中所述多肽调节雄性育性。
34.根据权利要求33所述的方法,其中所述多核苷酸包含SEQ ID NO: 3、5、9、11、15或17示出的核苷酸序列。
35.根据权利要求33-34中任一项所述的方法,其中当与对照植物比较时,所述多核苷酸的表达调节所述植物中的雄性育性。
36.根据权利要求35所述的方法,其中当与对照植物比较时,所述多核苷酸的表达增强所述植物中的雄性育性。
37.根据权利要求33-36中任一项所述的方法,其中所述多核苷酸的表达赋予雄性不育植物雄性育性。
38.根据权利要求33-37中任一项所述的方法,其中所述植物是雌性能育植物。
39.根据权利要求33-38中任一项所述的方法,其中所述启动子是组成型启动子、诱导型启动子、组织优选的启动子、或生长阶段优选的启动子。
40.根据权利要求39所述的方法,其中所述启动子是雄性组织优选的启动子。
41.根据权利要求33-40中任一项所述的方法,其中当与对照植物比较时,所述多核苷酸的表达调节至少一种雄性组织的形成。
42.根据权利要求41所述的方法,其中所述雄性组织包括雄蕊、花药、花丝或花粉。
43.根据权利要求41或42所述的方法,其中至少一种雄性组织的所述得到调节的形成包括至少一种雄性组织的形成增加。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261697590P | 2012-09-06 | 2012-09-06 | |
US61/697590 | 2012-09-06 | ||
CN201380046655.6A CN104837861A (zh) | 2012-09-06 | 2013-09-06 | 包含雄性育性序列的组合物和方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380046655.6A Division CN104837861A (zh) | 2012-09-06 | 2013-09-06 | 包含雄性育性序列的组合物和方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113416738A true CN113416738A (zh) | 2021-09-21 |
Family
ID=49209557
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380046655.6A Pending CN104837861A (zh) | 2012-09-06 | 2013-09-06 | 包含雄性育性序列的组合物和方法 |
CN202110682594.9A Pending CN113416738A (zh) | 2012-09-06 | 2013-09-06 | 包含雄性育性序列的组合物和方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380046655.6A Pending CN104837861A (zh) | 2012-09-06 | 2013-09-06 | 包含雄性育性序列的组合物和方法 |
Country Status (8)
Country | Link |
---|---|
US (4) | US20140075597A1 (zh) |
EP (1) | EP2892915A2 (zh) |
CN (2) | CN104837861A (zh) |
AU (4) | AU2013312392C1 (zh) |
CA (3) | CA2884049C (zh) |
EA (1) | EA029014B1 (zh) |
IL (1) | IL237521A0 (zh) |
WO (1) | WO2014039815A2 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113943729A (zh) * | 2021-10-20 | 2022-01-18 | 翌圣生物科技(上海)股份有限公司 | U型接头及采用u型接头介导的磁珠偶联转座酶进行rna快速均一化建库的方法 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2884049C (en) | 2012-09-06 | 2022-11-22 | Pioneer Hi-Bred International, Inc. | Compositions and methods comprising male fertility sequences |
US9803214B2 (en) | 2013-03-12 | 2017-10-31 | Pioneer Hi-Bred International, Inc. | Breeding pair of wheat plants comprising an MS45 promoter inverted repeat that confers male sterility and a construct that restores fertility |
WO2016048891A1 (en) | 2014-09-26 | 2016-03-31 | Pioneer Hi-Bred International, Inc. | Wheat ms1 polynucleotides, polypeptides, and mehtods of use |
US20170369902A1 (en) * | 2014-12-16 | 2017-12-28 | Pioneer Hi-Bred International, Inc. | Restoration of male fertility in wheat |
CN107267527B (zh) * | 2016-07-25 | 2021-03-19 | 未名兴旺系统作物设计前沿实验室(北京)有限公司 | 雄性育性的保持方法及其应用 |
US11203752B2 (en) | 2017-12-11 | 2021-12-21 | Pioneer Hi-Bred International, Inc. | Compositions and methods of modifying a plant genome to produce a MS9, MS22, MS26, or MS45 male-sterile plant |
US20220056472A1 (en) * | 2018-09-14 | 2022-02-24 | Pioneer Hi-Bred International, Inc. | Fertility restoration in plants |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101182523A (zh) * | 2007-11-22 | 2008-05-21 | 中国农业大学 | 植物花药特异性启动子及其应用 |
CN101248183A (zh) * | 2005-06-24 | 2008-08-20 | 先锋高级育种国际公司 | 介导植物雄性生育力的核苷酸序列以及使用其的方法 |
CN101688215A (zh) * | 2007-06-01 | 2010-03-31 | 克罗普迪塞恩股份有限公司 | 在植物中通过调节GARP转录因子ZmRR10_p的产量增强 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2415327A1 (en) | 2000-07-13 | 2002-01-24 | Pioneer Hi-Bred International, Inc. | Zmaxig1 polynucleotides and methods of use |
US7612251B2 (en) * | 2000-09-26 | 2009-11-03 | Pioneer Hi-Bred International, Inc. | Nucleotide sequences mediating male fertility and method of using same |
US7214786B2 (en) * | 2000-12-14 | 2007-05-08 | Kovalic David K | Nucleic acid molecules and other molecules associated with plants and uses thereof for plant improvement |
US20060150283A1 (en) * | 2004-02-13 | 2006-07-06 | Nickolai Alexandrov | Sequence-determined DNA fragments and corresponding polypeptides encoded thereby |
WO2006081029A2 (en) * | 2004-12-22 | 2006-08-03 | Ceres, Inc. | Nucleotide sequences and corresponding polypeptides conferring modulated plant size and biomass and other characteristics in plants |
MX2010001347A (es) * | 2007-08-03 | 2010-03-01 | Pioneer Hi Bred Int | Secuencias de nucleotidos msca1 que afectan la fertilidad vegetal masculina y metodo para usar las mismas. |
KR100894909B1 (ko) | 2007-08-21 | 2009-04-30 | 한국전자통신연구원 | 재구성 하이브리드 안테나 장치 |
KR101126893B1 (ko) * | 2009-12-03 | 2012-03-19 | 기아자동차주식회사 | 저소음 밸란스샤프트모듈 |
WO2011135527A2 (en) * | 2010-04-28 | 2011-11-03 | Evogene Ltd. | Isolated polynucleotides and polypeptides, and methods of using same for increasing plant yield and/or agricultural characteristics |
EA201490056A1 (ru) * | 2011-06-21 | 2014-05-30 | Пайонир Хай-Бред Интернэшнл, Инк. | Способы и композиции для получения растений, обладающих мужской стерильностью |
CA2884049C (en) | 2012-09-06 | 2022-11-22 | Pioneer Hi-Bred International, Inc. | Compositions and methods comprising male fertility sequences |
-
2013
- 2013-09-06 CA CA2884049A patent/CA2884049C/en active Active
- 2013-09-06 AU AU2013312392A patent/AU2013312392C1/en active Active
- 2013-09-06 US US14/019,695 patent/US20140075597A1/en not_active Abandoned
- 2013-09-06 CN CN201380046655.6A patent/CN104837861A/zh active Pending
- 2013-09-06 CA CA3172506A patent/CA3172506A1/en active Pending
- 2013-09-06 EA EA201590507A patent/EA029014B1/ru not_active IP Right Cessation
- 2013-09-06 CN CN202110682594.9A patent/CN113416738A/zh active Pending
- 2013-09-06 CA CA3172512A patent/CA3172512A1/en active Pending
- 2013-09-06 WO PCT/US2013/058500 patent/WO2014039815A2/en active Application Filing
- 2013-09-06 US US14/425,916 patent/US10155962B2/en active Active
- 2013-09-06 EP EP13763163.6A patent/EP2892915A2/en not_active Ceased
-
2015
- 2015-03-03 IL IL237521A patent/IL237521A0/en unknown
-
2017
- 2017-11-23 AU AU2017265123A patent/AU2017265123A1/en not_active Abandoned
-
2018
- 2018-11-13 US US16/189,499 patent/US11377668B2/en active Active
-
2019
- 2019-10-07 AU AU2019240727A patent/AU2019240727B2/en active Active
-
2021
- 2021-03-11 AU AU2021201561A patent/AU2021201561A1/en active Pending
-
2022
- 2022-06-02 US US17/805,226 patent/US20220403411A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101248183A (zh) * | 2005-06-24 | 2008-08-20 | 先锋高级育种国际公司 | 介导植物雄性生育力的核苷酸序列以及使用其的方法 |
CN101688215A (zh) * | 2007-06-01 | 2010-03-31 | 克罗普迪塞恩股份有限公司 | 在植物中通过调节GARP转录因子ZmRR10_p的产量增强 |
CN101182523A (zh) * | 2007-11-22 | 2008-05-21 | 中国农业大学 | 植物花药特异性启动子及其应用 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113943729A (zh) * | 2021-10-20 | 2022-01-18 | 翌圣生物科技(上海)股份有限公司 | U型接头及采用u型接头介导的磁珠偶联转座酶进行rna快速均一化建库的方法 |
CN113943729B (zh) * | 2021-10-20 | 2023-05-16 | 翌圣生物科技(上海)股份有限公司 | U型接头及采用u型接头介导的磁珠偶联转座酶进行rna快速均一化建库的方法 |
Also Published As
Publication number | Publication date |
---|---|
CA2884049A1 (en) | 2014-03-13 |
WO2014039815A2 (en) | 2014-03-13 |
AU2021201561A1 (en) | 2021-04-01 |
EA029014B1 (ru) | 2018-01-31 |
AU2019240727A1 (en) | 2019-10-24 |
CA2884049C (en) | 2022-11-22 |
AU2013312392C1 (en) | 2018-03-08 |
EA201590507A1 (ru) | 2015-06-30 |
US20220403411A1 (en) | 2022-12-22 |
US20140075597A1 (en) | 2014-03-13 |
CA3172512A1 (en) | 2014-03-13 |
CN104837861A (zh) | 2015-08-12 |
AU2013312392B2 (en) | 2017-08-24 |
IL237521A0 (en) | 2015-04-30 |
AU2019240727B2 (en) | 2021-02-25 |
CA3172506A1 (en) | 2014-03-13 |
US11377668B2 (en) | 2022-07-05 |
WO2014039815A3 (en) | 2014-06-19 |
AU2017265123A1 (en) | 2017-12-14 |
US20150252382A1 (en) | 2015-09-10 |
WO2014039815A9 (en) | 2015-04-30 |
US10155962B2 (en) | 2018-12-18 |
US20190062781A1 (en) | 2019-02-28 |
AU2013312392A1 (en) | 2015-03-12 |
EP2892915A2 (en) | 2015-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020202241B2 (en) | Manipulation of dominant male sterility | |
AU2019240727B2 (en) | Compositions and methods comprising male fertility sequences | |
CN107072165B (zh) | 小麦Ms1多核苷酸、多肽以及使用方法 | |
US20170369902A1 (en) | Restoration of male fertility in wheat |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |