CN102656270A - 具有增强的产量相关性状的植物和用于产生该植物的方法 - Google Patents
具有增强的产量相关性状的植物和用于产生该植物的方法 Download PDFInfo
- Publication number
- CN102656270A CN102656270A CN2010800365778A CN201080036577A CN102656270A CN 102656270 A CN102656270 A CN 102656270A CN 2010800365778 A CN2010800365778 A CN 2010800365778A CN 201080036577 A CN201080036577 A CN 201080036577A CN 102656270 A CN102656270 A CN 102656270A
- Authority
- CN
- China
- Prior art keywords
- plant
- nucleic acid
- polypeptide
- seq
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 355
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 577
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 538
- 229920001184 polypeptide Polymers 0.000 claims abstract description 524
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 501
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 484
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 484
- 230000014509 gene expression Effects 0.000 claims abstract description 196
- 102100030667 Eukaryotic peptide chain release factor subunit 1 Human genes 0.000 claims abstract description 100
- 101710175705 Eukaryotic peptide chain release factor subunit 1 Proteins 0.000 claims abstract description 99
- 230000002708 enhancing effect Effects 0.000 claims abstract description 4
- 241000196324 Embryophyta Species 0.000 claims description 670
- 108090000623 proteins and genes Proteins 0.000 claims description 258
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 208
- 125000003729 nucleotide group Chemical group 0.000 claims description 149
- 239000002773 nucleotide Substances 0.000 claims description 148
- 102000004169 proteins and genes Human genes 0.000 claims description 122
- 230000002596 correlated effect Effects 0.000 claims description 119
- 235000018102 proteins Nutrition 0.000 claims description 109
- 238000009396 hybridization Methods 0.000 claims description 97
- 241000321461 Mycteroperca phenax Species 0.000 claims description 89
- 101000846893 Homo sapiens Fibrillin-1 Proteins 0.000 claims description 84
- 102100031509 Fibrillin-1 Human genes 0.000 claims description 83
- 235000001014 amino acid Nutrition 0.000 claims description 66
- 150000001413 amino acids Chemical class 0.000 claims description 66
- 230000012010 growth Effects 0.000 claims description 64
- 230000001105 regulatory effect Effects 0.000 claims description 61
- 230000009261 transgenic effect Effects 0.000 claims description 61
- 238000004519 manufacturing process Methods 0.000 claims description 54
- 235000007164 Oryza sativa Nutrition 0.000 claims description 43
- 235000009566 rice Nutrition 0.000 claims description 42
- 230000002068 genetic effect Effects 0.000 claims description 39
- 230000000295 complement effect Effects 0.000 claims description 38
- 230000035882 stress Effects 0.000 claims description 26
- 241000209140 Triticum Species 0.000 claims description 25
- 235000021307 Triticum Nutrition 0.000 claims description 24
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 23
- 241000209094 Oryza Species 0.000 claims description 22
- 241000227653 Lycopersicon Species 0.000 claims description 19
- 235000013339 cereals Nutrition 0.000 claims description 19
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims description 16
- 241000209056 Secale Species 0.000 claims description 14
- 240000008042 Zea mays Species 0.000 claims description 14
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 14
- 244000038559 crop plants Species 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 14
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 13
- 235000005822 corn Nutrition 0.000 claims description 13
- 235000013311 vegetables Nutrition 0.000 claims description 13
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 claims description 12
- 241001233957 eudicotyledons Species 0.000 claims description 12
- 241000219194 Arabidopsis Species 0.000 claims description 11
- 238000007899 nucleic acid hybridization Methods 0.000 claims description 11
- 241000219000 Populus Species 0.000 claims description 10
- 230000008635 plant growth Effects 0.000 claims description 10
- 150000003839 salts Chemical class 0.000 claims description 10
- 241000228158 x Triticosecale Species 0.000 claims description 9
- 235000002262 Lycopersicon Nutrition 0.000 claims description 8
- 235000007688 Lycopersicon esculentum Nutrition 0.000 claims description 8
- 238000012258 culturing Methods 0.000 claims description 8
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 7
- 235000007238 Secale cereale Nutrition 0.000 claims description 7
- 235000019714 Triticale Nutrition 0.000 claims description 7
- 230000008641 drought stress Effects 0.000 claims description 7
- 241000218998 Salicaceae Species 0.000 claims description 6
- 229910052757 nitrogen Inorganic materials 0.000 claims description 6
- 238000005728 strengthening Methods 0.000 claims description 6
- 241000209504 Poaceae Species 0.000 claims description 4
- 241000208292 Solanaceae Species 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 4
- 241000219193 Brassicaceae Species 0.000 claims description 3
- 241000219195 Arabidopsis thaliana Species 0.000 claims description 2
- 238000010374 somatic cell nuclear transfer Methods 0.000 claims description 2
- 101150104463 GOS2 gene Proteins 0.000 claims 20
- 244000046109 Sorghum vulgare var. nervosum Species 0.000 claims 12
- 241000209763 Avena sativa Species 0.000 claims 6
- 244000077283 Distichlis palmeri Species 0.000 claims 6
- 235000005422 Distichlis palmeri Nutrition 0.000 claims 6
- 244000140063 Eragrostis abyssinica Species 0.000 claims 6
- 240000005979 Hordeum vulgare Species 0.000 claims 6
- 240000003834 Triticum spelta Species 0.000 claims 6
- 235000004240 Triticum spelta Nutrition 0.000 claims 6
- 230000005030 transcription termination Effects 0.000 claims 6
- 101000732336 Homo sapiens Transcription factor AP-2 gamma Proteins 0.000 claims 1
- 101000802094 Homo sapiens mRNA decay activator protein ZFP36L1 Proteins 0.000 claims 1
- 108010058432 Chaperonin 60 Proteins 0.000 abstract description 5
- 108010088577 zinc-binding protein Proteins 0.000 abstract description 3
- 102000006303 Chaperonin 60 Human genes 0.000 abstract description 2
- 108050001186 Chaperonin Cpn60 Proteins 0.000 abstract 1
- 102000052603 Chaperonins Human genes 0.000 abstract 1
- 101000693908 Pisum sativum Secretory carrier-associated membrane protein Proteins 0.000 abstract 1
- 101100364975 Homo sapiens SCAMP1 gene Proteins 0.000 description 77
- 102100037230 Secretory carrier-associated membrane protein 1 Human genes 0.000 description 77
- 210000004027 cell Anatomy 0.000 description 54
- 238000004422 calculation algorithm Methods 0.000 description 31
- 240000007594 Oryza sativa Species 0.000 description 30
- 210000002706 plastid Anatomy 0.000 description 30
- 210000001519 tissue Anatomy 0.000 description 29
- 108020004414 DNA Proteins 0.000 description 28
- 241000894007 species Species 0.000 description 28
- 238000006243 chemical reaction Methods 0.000 description 26
- 108020004999 messenger RNA Proteins 0.000 description 25
- 230000000692 anti-sense effect Effects 0.000 description 24
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 23
- 239000003550 marker Substances 0.000 description 22
- 238000005516 engineering process Methods 0.000 description 21
- 230000002441 reversible effect Effects 0.000 description 21
- 230000000694 effects Effects 0.000 description 20
- 230000004071 biological effect Effects 0.000 description 19
- 230000008859 change Effects 0.000 description 19
- 230000000875 corresponding effect Effects 0.000 description 16
- 230000008521 reorganization Effects 0.000 description 16
- 241001493096 Apple stem pitting virus Species 0.000 description 15
- 108091035707 Consensus sequence Proteins 0.000 description 15
- 239000012634 fragment Substances 0.000 description 15
- OFLGYLDXUIXHQY-UHFFFAOYSA-N 1,3-bis(prop-2-enoxy)propan-2-ol Chemical compound C=CCOCC(O)COCC=C OFLGYLDXUIXHQY-UHFFFAOYSA-N 0.000 description 14
- 102000053187 Glucuronidase Human genes 0.000 description 14
- 108010060309 Glucuronidase Proteins 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 238000003306 harvesting Methods 0.000 description 14
- 238000013507 mapping Methods 0.000 description 14
- 238000011160 research Methods 0.000 description 14
- 230000001965 increasing effect Effects 0.000 description 13
- 239000000203 mixture Substances 0.000 description 13
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 11
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 11
- 235000002639 sodium chloride Nutrition 0.000 description 11
- 241000589158 Agrobacterium Species 0.000 description 10
- 239000005090 green fluorescent protein Substances 0.000 description 10
- 239000000523 sample Substances 0.000 description 10
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 10
- -1 FLAG Proteins 0.000 description 9
- 230000008034 disappearance Effects 0.000 description 9
- 230000002349 favourable effect Effects 0.000 description 9
- 210000000056 organ Anatomy 0.000 description 9
- 230000002103 transcriptional effect Effects 0.000 description 9
- 239000002028 Biomass Substances 0.000 description 8
- 230000036579 abiotic stress Effects 0.000 description 8
- 125000000539 amino acid group Chemical group 0.000 description 8
- 238000009395 breeding Methods 0.000 description 8
- 230000001488 breeding effect Effects 0.000 description 8
- 230000001939 inductive effect Effects 0.000 description 8
- 210000001161 mammalian embryo Anatomy 0.000 description 8
- 230000000442 meristematic effect Effects 0.000 description 8
- 239000000243 solution Substances 0.000 description 8
- 230000001131 transforming effect Effects 0.000 description 8
- 108700011259 MicroRNAs Proteins 0.000 description 7
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 7
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 7
- 239000002253 acid Substances 0.000 description 7
- 238000013461 design Methods 0.000 description 7
- 230000001976 improved effect Effects 0.000 description 7
- 230000006872 improvement Effects 0.000 description 7
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Natural products C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 7
- 239000002679 microRNA Substances 0.000 description 7
- 231100000350 mutagenesis Toxicity 0.000 description 7
- 108091033319 polynucleotide Proteins 0.000 description 7
- 102000040430 polynucleotide Human genes 0.000 description 7
- 239000002157 polynucleotide Substances 0.000 description 7
- 230000009467 reduction Effects 0.000 description 7
- 230000028327 secretion Effects 0.000 description 7
- 238000009331 sowing Methods 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 238000005406 washing Methods 0.000 description 7
- 239000011701 zinc Substances 0.000 description 7
- 229910052725 zinc Inorganic materials 0.000 description 7
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 6
- 241000209761 Avena Species 0.000 description 6
- 235000005781 Avena Nutrition 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- 235000010469 Glycine max Nutrition 0.000 description 6
- 244000068988 Glycine max Species 0.000 description 6
- 108700001094 Plant Genes Proteins 0.000 description 6
- 150000007513 acids Chemical class 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 6
- 230000004927 fusion Effects 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 238000002703 mutagenesis Methods 0.000 description 6
- 108091092562 ribozyme Proteins 0.000 description 6
- 238000012225 targeting induced local lesions in genomes Methods 0.000 description 6
- 241000219198 Brassica Species 0.000 description 5
- 108090000994 Catalytic RNA Proteins 0.000 description 5
- 102000053642 Catalytic RNA Human genes 0.000 description 5
- 241000088885 Chlorops Species 0.000 description 5
- 241000512897 Elaeis Species 0.000 description 5
- 108700008625 Reporter Genes Proteins 0.000 description 5
- 101100465559 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PRE7 gene Proteins 0.000 description 5
- 241000207763 Solanum Species 0.000 description 5
- 230000027455 binding Effects 0.000 description 5
- 210000003763 chloroplast Anatomy 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 230000010856 establishment of protein localization Effects 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 230000030279 gene silencing Effects 0.000 description 5
- 238000012226 gene silencing method Methods 0.000 description 5
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Chemical compound O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 5
- 238000002744 homologous recombination Methods 0.000 description 5
- 230000006801 homologous recombination Effects 0.000 description 5
- 238000002372 labelling Methods 0.000 description 5
- 230000036542 oxidative stress Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 101150076896 pts1 gene Proteins 0.000 description 5
- 238000002741 site-directed mutagenesis Methods 0.000 description 5
- GUGNSJAORJLKGP-UHFFFAOYSA-K sodium 8-methoxypyrene-1,3,6-trisulfonate Chemical compound [Na+].[Na+].[Na+].C1=C2C(OC)=CC(S([O-])(=O)=O)=C(C=C3)C2=C2C3=C(S([O-])(=O)=O)C=C(S([O-])(=O)=O)C2=C1 GUGNSJAORJLKGP-UHFFFAOYSA-K 0.000 description 5
- 239000002689 soil Substances 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 108091026821 Artificial microRNA Proteins 0.000 description 4
- 244000075850 Avena orientalis Species 0.000 description 4
- 235000011331 Brassica Nutrition 0.000 description 4
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- 244000281702 Dioscorea villosa Species 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 241000233866 Fungi Species 0.000 description 4
- 241000209219 Hordeum Species 0.000 description 4
- 108091092724 Noncoding DNA Proteins 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 108010076504 Protein Sorting Signals Proteins 0.000 description 4
- 108020004459 Small interfering RNA Proteins 0.000 description 4
- 235000002634 Solanum Nutrition 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 238000005520 cutting process Methods 0.000 description 4
- 230000012202 endocytosis Effects 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 230000005764 inhibitory process Effects 0.000 description 4
- 150000002632 lipids Chemical class 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 238000003499 nucleic acid array Methods 0.000 description 4
- 230000006798 recombination Effects 0.000 description 4
- 238000005215 recombination Methods 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 230000004960 subcellular localization Effects 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 238000011282 treatment Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 102100038222 60 kDa heat shock protein, mitochondrial Human genes 0.000 description 3
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 3
- 241001677738 Aleuron Species 0.000 description 3
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 3
- 240000002791 Brassica napus Species 0.000 description 3
- 235000006008 Brassica napus var napus Nutrition 0.000 description 3
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 3
- 241001301148 Brassica rapa subsp. oleifera Species 0.000 description 3
- 244000025254 Cannabis sativa Species 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 3
- 101710096438 DNA-binding protein Proteins 0.000 description 3
- 235000001942 Elaeis Nutrition 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 3
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 3
- 241000209510 Liliopsida Species 0.000 description 3
- 241001093152 Mangifera Species 0.000 description 3
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 3
- 244000061176 Nicotiana tabacum Species 0.000 description 3
- 108010038807 Oligopeptides Proteins 0.000 description 3
- 102000015636 Oligopeptides Human genes 0.000 description 3
- 240000004713 Pisum sativum Species 0.000 description 3
- 241000124033 Salix Species 0.000 description 3
- CWHJIJJSDGEHNS-MYLFLSLOSA-N Senegenin Chemical compound C1[C@H](O)[C@H](O)[C@@](C)(C(O)=O)[C@@H]2CC[C@@]3(C)C(CC[C@]4(CCC(C[C@H]44)(C)C)C(O)=O)=C4[C@@H](CCl)C[C@@H]3[C@]21C CWHJIJJSDGEHNS-MYLFLSLOSA-N 0.000 description 3
- 108091036066 Three prime untranslated region Proteins 0.000 description 3
- 108700019146 Transgenes Proteins 0.000 description 3
- 241000219793 Trifolium Species 0.000 description 3
- 244000098338 Triticum aestivum Species 0.000 description 3
- 244000193174 agave Species 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 229940088710 antibiotic agent Drugs 0.000 description 3
- 102000005936 beta-Galactosidase Human genes 0.000 description 3
- 108010005774 beta-Galactosidase Proteins 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006378 damage Effects 0.000 description 3
- 235000004879 dioscorea Nutrition 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000002438 mitochondrial effect Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 230000035764 nutrition Effects 0.000 description 3
- 235000016709 nutrition Nutrition 0.000 description 3
- 239000003921 oil Substances 0.000 description 3
- 235000019198 oils Nutrition 0.000 description 3
- 230000026731 phosphorylation Effects 0.000 description 3
- 238000006366 phosphorylation reaction Methods 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000008929 regeneration Effects 0.000 description 3
- 238000011069 regeneration method Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 239000004055 small Interfering RNA Substances 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 239000009871 tenuigenin Substances 0.000 description 3
- 241001075517 Abelmoschus Species 0.000 description 2
- 241000208140 Acer Species 0.000 description 2
- 241000219068 Actinidia Species 0.000 description 2
- 241000209136 Agropyron Species 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- 241000234282 Allium Species 0.000 description 2
- 244000296825 Amygdalus nana Species 0.000 description 2
- 244000099147 Ananas comosus Species 0.000 description 2
- 240000006199 Annona purpurea Species 0.000 description 2
- 240000007087 Apium graveolens Species 0.000 description 2
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 description 2
- 235000010591 Appio Nutrition 0.000 description 2
- 244000105624 Arachis hypogaea Species 0.000 description 2
- 235000005340 Asparagus officinalis Nutrition 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 241000209128 Bambusa Species 0.000 description 2
- 235000004936 Bromus mango Nutrition 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 2
- 241000415246 Callisia navicularis Species 0.000 description 2
- 241001237259 Campanella <basidiomycete fungus> Species 0.000 description 2
- 235000005273 Canna coccinea Nutrition 0.000 description 2
- 240000008555 Canna flaccida Species 0.000 description 2
- 235000002566 Capsicum Nutrition 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 244000132069 Carica monoica Species 0.000 description 2
- 235000014649 Carica monoica Nutrition 0.000 description 2
- 235000009467 Carica papaya Nutrition 0.000 description 2
- 240000006432 Carica papaya Species 0.000 description 2
- 241000723418 Carya Species 0.000 description 2
- 241001070941 Castanea Species 0.000 description 2
- 108700031407 Chloroplast Genes Proteins 0.000 description 2
- 241000723347 Cinnamomum Species 0.000 description 2
- 241000219109 Citrullus Species 0.000 description 2
- 241000207199 Citrus Species 0.000 description 2
- 241000723377 Coffea Species 0.000 description 2
- 101800004637 Communis Proteins 0.000 description 2
- 108020004635 Complementary DNA Proteins 0.000 description 2
- 241000723382 Corylus Species 0.000 description 2
- 235000004237 Crocus Nutrition 0.000 description 2
- 241000596148 Crocus Species 0.000 description 2
- 241000219122 Cucurbita Species 0.000 description 2
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 2
- 240000001008 Dimocarpus longan Species 0.000 description 2
- 235000002723 Dioscorea alata Nutrition 0.000 description 2
- 235000007056 Dioscorea composita Nutrition 0.000 description 2
- 235000009723 Dioscorea convolvulacea Nutrition 0.000 description 2
- 235000005362 Dioscorea floribunda Nutrition 0.000 description 2
- 235000004868 Dioscorea macrostachya Nutrition 0.000 description 2
- 235000005361 Dioscorea nummularia Nutrition 0.000 description 2
- 235000005360 Dioscorea spiculiflora Nutrition 0.000 description 2
- 241001057636 Dracaena deremensis Species 0.000 description 2
- 241000192043 Echinochloa Species 0.000 description 2
- 235000001950 Elaeis guineensis Nutrition 0.000 description 2
- 241001092070 Eriobotrya Species 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- 244000166124 Eucalyptus globulus Species 0.000 description 2
- 235000000235 Euphoria longan Nutrition 0.000 description 2
- 240000008620 Fagopyrum esculentum Species 0.000 description 2
- 241001070947 Fagus Species 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- 235000011201 Ginkgo Nutrition 0.000 description 2
- 244000194101 Ginkgo biloba Species 0.000 description 2
- 235000008100 Ginkgo biloba Nutrition 0.000 description 2
- 241000208818 Helianthus Species 0.000 description 2
- 244000020551 Helianthus annuus Species 0.000 description 2
- 108091027305 Heteroduplex Proteins 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 235000005206 Hibiscus Nutrition 0.000 description 2
- 235000007185 Hibiscus lunariifolius Nutrition 0.000 description 2
- 244000284380 Hibiscus rosa sinensis Species 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- 235000006350 Ipomoea batatas var. batatas Nutrition 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 241000219729 Lathyrus Species 0.000 description 2
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 2
- 241000208202 Linaceae Species 0.000 description 2
- 241000219745 Lupinus Species 0.000 description 2
- 241000220225 Malus Species 0.000 description 2
- 235000014826 Mangifera indica Nutrition 0.000 description 2
- 240000003183 Manihot esculenta Species 0.000 description 2
- 241000219823 Medicago Species 0.000 description 2
- 241000213996 Melilotus Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 241001230286 Narenga Species 0.000 description 2
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 2
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 2
- 244000183278 Nephelium litchi Species 0.000 description 2
- 241000208125 Nicotiana Species 0.000 description 2
- 241000795633 Olea <sea slug> Species 0.000 description 2
- 241000209117 Panicum Species 0.000 description 2
- 235000006443 Panicum miliaceum subsp. miliaceum Nutrition 0.000 description 2
- 235000009037 Panicum miliaceum subsp. ruderale Nutrition 0.000 description 2
- 241001520808 Panicum virgatum Species 0.000 description 2
- 240000004370 Pastinaca sativa Species 0.000 description 2
- 241000209046 Pennisetum Species 0.000 description 2
- 244000025272 Persea americana Species 0.000 description 2
- 235000008673 Persea americana Nutrition 0.000 description 2
- 241000745991 Phalaris Species 0.000 description 2
- 241000219833 Phaseolus Species 0.000 description 2
- 244000046052 Phaseolus vulgaris Species 0.000 description 2
- 235000014676 Phragmites communis Nutrition 0.000 description 2
- 244000064622 Physalis edulis Species 0.000 description 2
- 240000003889 Piper guineense Species 0.000 description 2
- 235000010582 Pisum sativum Nutrition 0.000 description 2
- 241000768494 Polymorphum Species 0.000 description 2
- 241000218976 Populus trichocarpa Species 0.000 description 2
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 2
- 241001494501 Prosopis <angiosperm> Species 0.000 description 2
- 241000508269 Psidium Species 0.000 description 2
- 241000220324 Pyrus Species 0.000 description 2
- 241000219492 Quercus Species 0.000 description 2
- 241000220259 Raphanus Species 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 241000220483 Ribes Species 0.000 description 2
- 241001092459 Rubus Species 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 241000208829 Sambucus Species 0.000 description 2
- 108091081021 Sense strand Proteins 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 241000862632 Soja Species 0.000 description 2
- 240000006394 Sorghum bicolor Species 0.000 description 2
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 2
- 235000009184 Spondias indica Nutrition 0.000 description 2
- 244000045719 Syzygium Species 0.000 description 2
- 244000299461 Theobroma cacao Species 0.000 description 2
- 235000005764 Theobroma cacao ssp. cacao Nutrition 0.000 description 2
- 235000005767 Theobroma cacao ssp. sphaerocarpum Nutrition 0.000 description 2
- 102000008579 Transposases Human genes 0.000 description 2
- 108010020764 Transposases Proteins 0.000 description 2
- 241000208241 Tropaeolum Species 0.000 description 2
- 235000004424 Tropaeolum majus Nutrition 0.000 description 2
- 240000001260 Tropaeolum majus Species 0.000 description 2
- 241000736767 Vaccinium Species 0.000 description 2
- 241000405217 Viola <butterfly> Species 0.000 description 2
- 241000209149 Zea Species 0.000 description 2
- 241001247821 Ziziphus Species 0.000 description 2
- DZBUGLKDJFMEHC-UHFFFAOYSA-N acridine Chemical compound C1=CC=CC2=CC3=CC=CC=C3N=C21 DZBUGLKDJFMEHC-UHFFFAOYSA-N 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 229920001222 biopolymer Polymers 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 235000001046 cacaotero Nutrition 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 229910052791 calcium Inorganic materials 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 238000006555 catalytic reaction Methods 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 231100000045 chemical toxicity Toxicity 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 210000001163 endosome Anatomy 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000013213 extrapolation Methods 0.000 description 2
- 230000008014 freezing Effects 0.000 description 2
- 238000007710 freezing Methods 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000009368 gene silencing by RNA Effects 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 230000002363 herbicidal effect Effects 0.000 description 2
- 239000004009 herbicide Substances 0.000 description 2
- 238000003898 horticulture Methods 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 230000008595 infiltration Effects 0.000 description 2
- 238000001764 infiltration Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- KWGKDLIKAYFUFQ-UHFFFAOYSA-M lithium chloride Chemical compound [Li+].[Cl-] KWGKDLIKAYFUFQ-UHFFFAOYSA-M 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000002887 multiple sequence alignment Methods 0.000 description 2
- 231100000219 mutagenic Toxicity 0.000 description 2
- 230000003505 mutagenic effect Effects 0.000 description 2
- 108010058731 nopaline synthase Proteins 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000008723 osmotic stress Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 230000029553 photosynthesis Effects 0.000 description 2
- 238000010672 photosynthesis Methods 0.000 description 2
- 230000035479 physiological effects, processes and functions Effects 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 238000004064 recycling Methods 0.000 description 2
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000003584 silencer Effects 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000000638 stimulation Effects 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 239000005418 vegetable material Substances 0.000 description 2
- VRYALKFFQXWPIH-PBXRRBTRSA-N (3r,4s,5r)-3,4,5,6-tetrahydroxyhexanal Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)CC=O VRYALKFFQXWPIH-PBXRRBTRSA-N 0.000 description 1
- NWXMGUDVXFXRIG-WESIUVDSSA-N (4s,4as,5as,6s,12ar)-4-(dimethylamino)-1,6,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4,4a,5,5a-tetrahydrotetracene-2-carboxamide Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(=O)C(C(N)=O)=C(O)[C@@]4(O)C(=O)C3=C(O)C2=C1O NWXMGUDVXFXRIG-WESIUVDSSA-N 0.000 description 1
- 108020004463 18S ribosomal RNA Proteins 0.000 description 1
- WVXRAFOPTSTNLL-NKWVEPMBSA-N 2',3'-dideoxyadenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1CC[C@@H](CO)O1 WVXRAFOPTSTNLL-NKWVEPMBSA-N 0.000 description 1
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical compound O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 1
- OPIFSICVWOWJMJ-AEOCFKNESA-N 5-bromo-4-chloro-3-indolyl beta-D-galactoside Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1OC1=CNC2=CC=C(Br)C(Cl)=C12 OPIFSICVWOWJMJ-AEOCFKNESA-N 0.000 description 1
- 101710129138 ATP synthase subunit 9, mitochondrial Proteins 0.000 description 1
- 101710168506 ATP synthase subunit C, plastid Proteins 0.000 description 1
- 101710114069 ATP synthase subunit c Proteins 0.000 description 1
- 101710197943 ATP synthase subunit c, chloroplastic Proteins 0.000 description 1
- 101710187091 ATP synthase subunit c, sodium ion specific Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 244000198134 Agave sisalana Species 0.000 description 1
- 241000743339 Agrostis Species 0.000 description 1
- 240000007241 Agrostis stolonifera Species 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- 101710153593 Albumin A Proteins 0.000 description 1
- 241000219318 Amaranthus Species 0.000 description 1
- 240000001592 Amaranthus caudatus Species 0.000 description 1
- 241000368670 Ammophila <wasp> Species 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 235000003840 Amygdalus nana Nutrition 0.000 description 1
- 235000007119 Ananas comosus Nutrition 0.000 description 1
- 235000007755 Annona Nutrition 0.000 description 1
- 235000011518 Annona purpurea Nutrition 0.000 description 1
- 101710117679 Anthocyanidin 3-O-glucosyltransferase Proteins 0.000 description 1
- 241000208306 Apium Species 0.000 description 1
- 241001605719 Appias drusilla Species 0.000 description 1
- 235000003911 Arachis Nutrition 0.000 description 1
- 241000534456 Arenaria <Aves> Species 0.000 description 1
- 102000008682 Argonaute Proteins Human genes 0.000 description 1
- 108010088141 Argonaute Proteins Proteins 0.000 description 1
- 241001167018 Aroa Species 0.000 description 1
- 108090000328 Arrestin Proteins 0.000 description 1
- 102000003916 Arrestin Human genes 0.000 description 1
- 244000018217 Artocarpus elasticus Species 0.000 description 1
- 244000025352 Artocarpus heterophyllus Species 0.000 description 1
- 206010003694 Atrophy Diseases 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 235000007320 Avena fatua Nutrition 0.000 description 1
- 241001647031 Avena sterilis Species 0.000 description 1
- 235000004535 Avena sterilis Nutrition 0.000 description 1
- 235000014417 Averrhoa Nutrition 0.000 description 1
- 241001072280 Averrhoa Species 0.000 description 1
- 235000010082 Averrhoa carambola Nutrition 0.000 description 1
- 240000006063 Averrhoa carambola Species 0.000 description 1
- 235000011273 Benincasa Nutrition 0.000 description 1
- 235000011274 Benincasa cerifera Nutrition 0.000 description 1
- 244000036905 Benincasa cerifera Species 0.000 description 1
- 241000219164 Bertholletia Species 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- ZOXJGFHDIHLPTG-UHFFFAOYSA-N Boron Chemical compound [B] ZOXJGFHDIHLPTG-UHFFFAOYSA-N 0.000 description 1
- 244000140786 Brassica hirta Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 241000219357 Cactaceae Species 0.000 description 1
- 241001167712 Cadaba Species 0.000 description 1
- 235000008635 Cadaba farinosa Nutrition 0.000 description 1
- 101100327692 Caenorhabditis elegans hsp-60 gene Proteins 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 240000001548 Camellia japonica Species 0.000 description 1
- 241000218236 Cannabis Species 0.000 description 1
- 235000012766 Cannabis sativa ssp. sativa var. sativa Nutrition 0.000 description 1
- 235000012765 Cannabis sativa ssp. sativa var. spontanea Nutrition 0.000 description 1
- 240000008574 Capsicum frutescens Species 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 1
- 241000722731 Carex Species 0.000 description 1
- 241000973255 Carex elata Species 0.000 description 1
- 235000017350 Carissa Nutrition 0.000 description 1
- 240000004927 Carissa macrocarpa Species 0.000 description 1
- WLYGSPLCNKYESI-RSUQVHIMSA-N Carthamin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1[C@@]1(O)C(O)=C(C(=O)\C=C\C=2C=CC(O)=CC=2)C(=O)C(\C=C\2C([C@](O)([C@H]3[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O)C(O)=C(C(=O)\C=C\C=3C=CC(O)=CC=3)C/2=O)=O)=C1O WLYGSPLCNKYESI-RSUQVHIMSA-N 0.000 description 1
- 241000208809 Carthamus Species 0.000 description 1
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 1
- 244000020518 Carthamus tinctorius Species 0.000 description 1
- 235000014036 Castanea Nutrition 0.000 description 1
- 241000332382 Ceiba Species 0.000 description 1
- 235000003301 Ceiba pentandra Nutrition 0.000 description 1
- 244000146553 Ceiba pentandra Species 0.000 description 1
- 108010001857 Cell Surface Receptors Proteins 0.000 description 1
- 108091092236 Chimeric RNA Proteins 0.000 description 1
- 241000723343 Cichorium Species 0.000 description 1
- 240000006740 Cichorium endivia Species 0.000 description 1
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 description 1
- 244000175448 Citrus madurensis Species 0.000 description 1
- 102000005853 Clathrin Human genes 0.000 description 1
- 108010019874 Clathrin Proteins 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- 241000737241 Cocos Species 0.000 description 1
- 235000013162 Cocos nucifera Nutrition 0.000 description 1
- 244000060011 Cocos nucifera Species 0.000 description 1
- 108091033380 Coding strand Proteins 0.000 description 1
- 241001584859 Colocasia <moth> Species 0.000 description 1
- 244000205754 Colocasia esculenta Species 0.000 description 1
- 235000006481 Colocasia esculenta Nutrition 0.000 description 1
- 108020004394 Complementary RNA Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 235000010203 Corchorus Nutrition 0.000 description 1
- 241000332384 Corchorus Species 0.000 description 1
- 240000000491 Corchorus aestuans Species 0.000 description 1
- 241000208308 Coriandrum Species 0.000 description 1
- 235000002787 Coriandrum sativum Nutrition 0.000 description 1
- 244000018436 Coriandrum sativum Species 0.000 description 1
- 235000014493 Crataegus Nutrition 0.000 description 1
- 241001092040 Crataegus Species 0.000 description 1
- 240000000171 Crataegus monogyna Species 0.000 description 1
- 241000219112 Cucumis Species 0.000 description 1
- 244000241257 Cucumis melo Species 0.000 description 1
- 235000010071 Cucumis prophetarum Nutrition 0.000 description 1
- 240000001980 Cucurbita pepo Species 0.000 description 1
- 235000009852 Cucurbita pepo Nutrition 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- 235000003198 Cynara Nutrition 0.000 description 1
- 241000208947 Cynara Species 0.000 description 1
- 244000019459 Cynara cardunculus Species 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 241000208175 Daucus Species 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 1
- 241000522190 Desmodium Species 0.000 description 1
- 102000040623 Dicer family Human genes 0.000 description 1
- 108091070648 Dicer family Proteins 0.000 description 1
- 235000000522 Dimocarpus Nutrition 0.000 description 1
- 241000613447 Dimocarpus Species 0.000 description 1
- 235000005903 Dioscorea Nutrition 0.000 description 1
- 235000000504 Dioscorea villosa Nutrition 0.000 description 1
- 235000011511 Diospyros Nutrition 0.000 description 1
- 241000723267 Diospyros Species 0.000 description 1
- 244000236655 Diospyros kaki Species 0.000 description 1
- 101150073803 ERF1 gene Proteins 0.000 description 1
- 235000018060 Elaeis melanococca Nutrition 0.000 description 1
- 241001608549 Elaeis oleifera Species 0.000 description 1
- 235000007351 Eleusine Nutrition 0.000 description 1
- 241000209215 Eleusine Species 0.000 description 1
- 244000078127 Eleusine coracana Species 0.000 description 1
- 235000013499 Eleusine coracana subsp coracana Nutrition 0.000 description 1
- 101100491986 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) aromA gene Proteins 0.000 description 1
- 241001518935 Eragrostis Species 0.000 description 1
- 235000009008 Eriobotrya japonica Nutrition 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 241000266331 Eugenia Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 101150062966 FBN1 gene Proteins 0.000 description 1
- 235000009419 Fagopyrum esculentum Nutrition 0.000 description 1
- 241000234642 Festuca Species 0.000 description 1
- 241000234643 Festuca arundinacea Species 0.000 description 1
- 241000218218 Ficus <angiosperm> Species 0.000 description 1
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 1
- 235000017317 Fortunella Nutrition 0.000 description 1
- 241000220223 Fragaria Species 0.000 description 1
- 240000009088 Fragaria x ananassa Species 0.000 description 1
- TWHDOEYLXXQYOZ-FXQIFTODSA-N Gln-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N TWHDOEYLXXQYOZ-FXQIFTODSA-N 0.000 description 1
- SDSMVVSHLAAOJL-UKJIMTQDSA-N Gln-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N SDSMVVSHLAAOJL-UKJIMTQDSA-N 0.000 description 1
- 241000235503 Glomus Species 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 239000005562 Glyphosate Substances 0.000 description 1
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- 235000009438 Gossypium Nutrition 0.000 description 1
- 235000009429 Gossypium barbadense Nutrition 0.000 description 1
- 244000299507 Gossypium hirsutum Species 0.000 description 1
- 101150105462 HIS6 gene Proteins 0.000 description 1
- 108090001102 Hammerhead ribozyme Proteins 0.000 description 1
- 235000003222 Helianthus annuus Nutrition 0.000 description 1
- 241000756137 Hemerocallis Species 0.000 description 1
- RNAYRCNHRYEBTH-IHRRRGAJSA-N His-Met-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RNAYRCNHRYEBTH-IHRRRGAJSA-N 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 108020005210 Integrons Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 235000021506 Ipomoea Nutrition 0.000 description 1
- 241000207783 Ipomoea Species 0.000 description 1
- 235000002678 Ipomoea batatas Nutrition 0.000 description 1
- 244000017020 Ipomoea batatas Species 0.000 description 1
- 241000758789 Juglans Species 0.000 description 1
- 235000013757 Juglans Nutrition 0.000 description 1
- 240000007049 Juglans regia Species 0.000 description 1
- 101100288095 Klebsiella pneumoniae neo gene Proteins 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- 241000208822 Lactuca Species 0.000 description 1
- 235000003228 Lactuca sativa Nutrition 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- 241000446313 Lamella Species 0.000 description 1
- 241000219739 Lens Species 0.000 description 1
- 235000014647 Lens culinaris subsp culinaris Nutrition 0.000 description 1
- 244000043158 Lens esculenta Species 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- 241000234435 Lilium Species 0.000 description 1
- 241000208204 Linum Species 0.000 description 1
- 235000004431 Linum usitatissimum Nutrition 0.000 description 1
- 241000219743 Lotus Species 0.000 description 1
- 241001480167 Lotus japonicus Species 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 1
- 235000003956 Luffa Nutrition 0.000 description 1
- 244000050983 Luffa operculata Species 0.000 description 1
- 241000202831 Luzula Species 0.000 description 1
- 241000219816 Macrotyloma Species 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- 241000779599 Malpighia Species 0.000 description 1
- 235000014837 Malpighia glabra Nutrition 0.000 description 1
- 240000003394 Malpighia glabra Species 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 235000016876 Mammea Nutrition 0.000 description 1
- 241001051112 Mammea Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 240000001794 Manilkara zapota Species 0.000 description 1
- 235000011339 Manilkara zapota Nutrition 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- 206010027336 Menstruation delayed Diseases 0.000 description 1
- 235000014435 Mentha Nutrition 0.000 description 1
- 241001072983 Mentha Species 0.000 description 1
- 235000006679 Mentha X verticillata Nutrition 0.000 description 1
- 235000002899 Mentha suaveolens Nutrition 0.000 description 1
- 235000001636 Mentha x rotundifolia Nutrition 0.000 description 1
- 235000000551 Mimusops kauki Nutrition 0.000 description 1
- 244000182072 Mimusops kauki Species 0.000 description 1
- 240000003433 Miscanthus floridulus Species 0.000 description 1
- 235000009815 Momordica Nutrition 0.000 description 1
- 241000218984 Momordica Species 0.000 description 1
- 241000218213 Morus <angiosperm> Species 0.000 description 1
- 240000000249 Morus alba Species 0.000 description 1
- 235000008708 Morus alba Nutrition 0.000 description 1
- 241000234295 Musa Species 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 240000002853 Nelumbo nucifera Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 235000015742 Nephelium litchi Nutrition 0.000 description 1
- 101100329389 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cre-1 gene Proteins 0.000 description 1
- 101100395023 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) his-7 gene Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 240000001439 Opuntia Species 0.000 description 1
- 241001446528 Ornithopus Species 0.000 description 1
- 240000001516 Oryza latifolia Species 0.000 description 1
- 108700023764 Oryza sativa OSH1 Proteins 0.000 description 1
- 101710160107 Outer membrane protein A Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 101150084513 PETE gene Proteins 0.000 description 1
- 241000218996 Passiflora Species 0.000 description 1
- 235000000370 Passiflora edulis Nutrition 0.000 description 1
- 244000288157 Passiflora edulis Species 0.000 description 1
- 235000017769 Pastinaca sativa subsp sativa Nutrition 0.000 description 1
- 239000006002 Pepper Substances 0.000 description 1
- 241000218196 Persea Species 0.000 description 1
- 241000208317 Petroselinum Species 0.000 description 1
- 244000174556 Phaseolus adenanthus Species 0.000 description 1
- RVRRHFPCEOVRKQ-KKUMJFAQSA-N Phe-His-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVRRHFPCEOVRKQ-KKUMJFAQSA-N 0.000 description 1
- 241000746981 Phleum Species 0.000 description 1
- 241000746983 Phleum pratense Species 0.000 description 1
- 241000233805 Phoenix Species 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 244000273256 Phragmites communis Species 0.000 description 1
- 241000195888 Physcomitrella Species 0.000 description 1
- 235000005205 Pinus Nutrition 0.000 description 1
- 241000218602 Pinus <genus> Species 0.000 description 1
- 241000018646 Pinus brutia Species 0.000 description 1
- 235000016761 Piper aduncum Nutrition 0.000 description 1
- 235000017804 Piper guineense Nutrition 0.000 description 1
- 235000008184 Piper nigrum Nutrition 0.000 description 1
- 235000003445 Pistacia Nutrition 0.000 description 1
- 241000543704 Pistacia Species 0.000 description 1
- 235000003447 Pistacia vera Nutrition 0.000 description 1
- 240000006711 Pistacia vera Species 0.000 description 1
- 241000219843 Pisum Species 0.000 description 1
- 108090000051 Plastocyanin Proteins 0.000 description 1
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 241001349593 Praecitrullus Species 0.000 description 1
- QMABBZHZMDXHKU-FKBYEOEOSA-N Pro-Tyr-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O QMABBZHZMDXHKU-FKBYEOEOSA-N 0.000 description 1
- 101710083689 Probable capsid protein Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 235000011432 Prunus Nutrition 0.000 description 1
- 241001083505 Punica Species 0.000 description 1
- 244000294611 Punica granatum Species 0.000 description 1
- 235000014360 Punica granatum Nutrition 0.000 description 1
- 244000184734 Pyrus japonica Species 0.000 description 1
- 241001506137 Rapa Species 0.000 description 1
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108700005075 Regulator Genes Proteins 0.000 description 1
- 241000219061 Rheum Species 0.000 description 1
- 241000235504 Rhizophagus intraradices Species 0.000 description 1
- 235000011483 Ribes Nutrition 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 1
- 235000003846 Ricinus Nutrition 0.000 description 1
- 241000322381 Ricinus <louse> Species 0.000 description 1
- 240000000528 Ricinus communis Species 0.000 description 1
- 235000004443 Ricinus communis Nutrition 0.000 description 1
- 241000209051 Saccharum Species 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- 235000009367 Sesamum alatum Nutrition 0.000 description 1
- 240000000452 Sesamum alatum Species 0.000 description 1
- 235000003434 Sesamum indicum Nutrition 0.000 description 1
- 241000220261 Sinapis Species 0.000 description 1
- 235000002597 Solanum melongena Nutrition 0.000 description 1
- 244000061458 Solanum melongena Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 241000219315 Spinacia Species 0.000 description 1
- 244000300264 Spinacia oleracea Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 241000475042 Stolonifera Species 0.000 description 1
- 241001493533 Streptophyta Species 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- 235000012096 Syzygium samarangense Nutrition 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 235000012308 Tagetes Nutrition 0.000 description 1
- 241000736851 Tagetes Species 0.000 description 1
- 240000000785 Tagetes erecta Species 0.000 description 1
- 241000596504 Tamarindus Species 0.000 description 1
- 240000004584 Tamarindus indica Species 0.000 description 1
- 235000004298 Tamarindus indica Nutrition 0.000 description 1
- 108700007696 Tetrahydrofolate Dehydrogenase Proteins 0.000 description 1
- 244000152045 Themeda triandra Species 0.000 description 1
- 241000219161 Theobroma Species 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 244000078912 Trichosanthes cucumerina Species 0.000 description 1
- 241000209138 Tripsacum Species 0.000 description 1
- 235000007264 Triticum durum Nutrition 0.000 description 1
- 241000209143 Triticum turgidum subsp. durum Species 0.000 description 1
- ZKVANNIVSDOQMG-HKUYNNGSSA-N Trp-Tyr-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)NCC(=O)O)N ZKVANNIVSDOQMG-HKUYNNGSSA-N 0.000 description 1
- CRHFOYCJGVJPLE-AVGNSLFASA-N Tyr-Gln-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CRHFOYCJGVJPLE-AVGNSLFASA-N 0.000 description 1
- 235000012511 Vaccinium Nutrition 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- 241000219873 Vicia Species 0.000 description 1
- 241000219977 Vigna Species 0.000 description 1
- 244000042314 Vigna unguiculata Species 0.000 description 1
- 241001464837 Viridiplantae Species 0.000 description 1
- 235000009392 Vitis Nutrition 0.000 description 1
- 241000219095 Vitis Species 0.000 description 1
- 240000006365 Vitis vinifera Species 0.000 description 1
- 241000307523 Xenostegia media Species 0.000 description 1
- 108700040099 Xylose isomerases Proteins 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- 241000746966 Zizania Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 101150099105 alien gene Proteins 0.000 description 1
- PMMURAAUARKVCB-UHFFFAOYSA-N alpha-D-ara-dHexp Natural products OCC1OC(O)CC(O)C1O PMMURAAUARKVCB-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-PQMKYFCFSA-N alpha-D-mannose Chemical compound OC[C@H]1O[C@H](O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-PQMKYFCFSA-N 0.000 description 1
- SRBFZHDQGSBBOR-LECHCGJUSA-N alpha-D-xylose Chemical compound O[C@@H]1CO[C@H](O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-LECHCGJUSA-N 0.000 description 1
- KLOHDWPABZXLGI-YWUHCJSESA-M ampicillin sodium Chemical compound [Na+].C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C([O-])=O)(C)C)=CC=CC=C1 KLOHDWPABZXLGI-YWUHCJSESA-M 0.000 description 1
- 235000019728 animal nutrition Nutrition 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 229940041181 antineoplastic drug Drugs 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 230000003078 antioxidant effect Effects 0.000 description 1
- 235000006708 antioxidants Nutrition 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 238000009305 arable farming Methods 0.000 description 1
- 101150037081 aroA gene Proteins 0.000 description 1
- 101150036080 at gene Proteins 0.000 description 1
- 230000037444 atrophy Effects 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 239000002551 biofuel Substances 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 229930189065 blasticidin Natural products 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 229910052796 boron Inorganic materials 0.000 description 1
- 235000020113 brazil nut Nutrition 0.000 description 1
- 235000008429 bread Nutrition 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 239000001390 capsicum minimum Substances 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 235000011089 carbon dioxide Nutrition 0.000 description 1
- 235000021466 carotenoid Nutrition 0.000 description 1
- 150000001747 carotenoids Chemical class 0.000 description 1
- 230000010001 cellular homeostasis Effects 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 230000004700 cellular uptake Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 235000003733 chicria Nutrition 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 229930193282 clathrin Natural products 0.000 description 1
- 239000004927 clay Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000004581 coalescence Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 235000018597 common camellia Nutrition 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 239000012297 crystallization seed Substances 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000005553 drilling Methods 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 1
- 230000006353 environmental stress Effects 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 235000008995 european elder Nutrition 0.000 description 1
- 210000003499 exocrine gland Anatomy 0.000 description 1
- 108010079502 exoribonuclease T Proteins 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000008124 floral development Effects 0.000 description 1
- 235000013312 flour Nutrition 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000028245 fruit abscission Effects 0.000 description 1
- ZZUFCTLCJUWOSV-UHFFFAOYSA-N furosemide Chemical compound C1=C(Cl)C(S(=O)(=O)N)=CC(C(O)=O)=C1NCC1=CC=CO1 ZZUFCTLCJUWOSV-UHFFFAOYSA-N 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 230000000799 fusogenic effect Effects 0.000 description 1
- 230000005021 gait Effects 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 244000037671 genetically modified crops Species 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 1
- 229940097068 glyphosate Drugs 0.000 description 1
- UKWAMSAUNRIURK-BWYYQZIESA-N gmgg Chemical compound C1=CC(OC)=CC=C1OC[C@@H]1[C@@H](O[C@H]2[C@@H]([C@@H](OCC=3C=CC=CC=3)[C@H](O[C@H]3[C@H]([C@@H](OCC=C)[C@H](O[C@H]4[C@@H]([C@@H](OCC=5C=CC=CC=5)[C@H](OCC=5C=CC=CC=5)[C@@H](COCC=5C=CC=CC=5)O4)N4C(C5=CC=CC=C5C4=O)=O)[C@@H](COCC=C)O3)OCC=3C=CC=CC=3)[C@@H](COCC=3C=CC=CC=3)O2)N2C(C3=CC=CC=C3C2=O)=O)[C@H](OCC=2C=CC=CC=2)[C@@H](N2C(C3=CC=CC=C3C2=O)=O)[C@H](OCC=C)O1 UKWAMSAUNRIURK-BWYYQZIESA-N 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 230000008642 heat stress Effects 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- YQYJSBFKSSDGFO-FWAVGLHBSA-N hygromycin A Chemical compound O[C@H]1[C@H](O)[C@H](C(=O)C)O[C@@H]1Oc1ccc(\C=C(/C)C(=O)N[C@@H]2[C@@H]([C@H]3OCO[C@H]3[C@@H](O)[C@@H]2O)O)cc1O YQYJSBFKSSDGFO-FWAVGLHBSA-N 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 229940065638 intron a Drugs 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000003973 irrigation Methods 0.000 description 1
- 230000002262 irrigation Effects 0.000 description 1
- 230000006122 isoprenylation Effects 0.000 description 1
- OOYGSFOGFJDDHP-KMCOLRRFSA-N kanamycin A sulfate Chemical group OS(O)(=O)=O.O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N OOYGSFOGFJDDHP-KMCOLRRFSA-N 0.000 description 1
- 229940048662 kwai Drugs 0.000 description 1
- 235000021374 legumes Nutrition 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 102000019758 lipid binding proteins Human genes 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 239000002075 main ingredient Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- WPBNNNQJVZRUHP-UHFFFAOYSA-L manganese(2+);methyl n-[[2-(methoxycarbonylcarbamothioylamino)phenyl]carbamothioyl]carbamate;n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[S-]C(=S)NCCNC([S-])=S.COC(=O)NC(=S)NC1=CC=CC=C1NC(=S)NC(=O)OC WPBNNNQJVZRUHP-UHFFFAOYSA-L 0.000 description 1
- 235000005739 manihot Nutrition 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 102000006240 membrane receptors Human genes 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 230000002073 mitogenetic effect Effects 0.000 description 1
- 230000004660 morphological change Effects 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 235000006286 nutrient intake Nutrition 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000000050 nutritive effect Effects 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 229940049547 paraxin Drugs 0.000 description 1
- 235000021017 pears Nutrition 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 239000000575 pesticide Substances 0.000 description 1
- 101150086495 petG gene Proteins 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 238000000206 photolithography Methods 0.000 description 1
- 230000000243 photosynthetic effect Effects 0.000 description 1
- 235000020233 pistachio Nutrition 0.000 description 1
- 230000001863 plant nutrition Effects 0.000 description 1
- 230000037039 plant physiology Effects 0.000 description 1
- 230000010152 pollination Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 235000014774 prunus Nutrition 0.000 description 1
- 238000000197 pyrolysis Methods 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 210000000614 rib Anatomy 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 230000021749 root development Effects 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 239000013606 secretion vector Substances 0.000 description 1
- 210000004739 secretory vesicle Anatomy 0.000 description 1
- 230000008117 seed development Effects 0.000 description 1
- 230000007226 seed germination Effects 0.000 description 1
- 238000005204 segregation Methods 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 239000005368 silicate glass Substances 0.000 description 1
- 238000002791 soaking Methods 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- QTENRWWVYAAPBI-YCRXJPFRSA-N streptomycin sulfate Chemical compound OS(O)(=O)=O.OS(O)(=O)=O.OS(O)(=O)=O.CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](N=C(N)N)[C@H](O)[C@@H](N=C(N)N)[C@H](O)[C@H]1O.CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](N=C(N)N)[C@H](O)[C@@H](N=C(N)N)[C@H](O)[C@H]1O QTENRWWVYAAPBI-YCRXJPFRSA-N 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 230000019635 sulfation Effects 0.000 description 1
- 238000005670 sulfation reaction Methods 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 238000007910 systemic administration Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- UMGDCJDMYOKAJW-UHFFFAOYSA-N thiourea Chemical compound NC(N)=S UMGDCJDMYOKAJW-UHFFFAOYSA-N 0.000 description 1
- 210000002377 thylakoid Anatomy 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 229910000406 trisodium phosphate Inorganic materials 0.000 description 1
- 235000019801 trisodium phosphate Nutrition 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 235000018322 upland cotton Nutrition 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229910052720 vanadium Inorganic materials 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
- 229960003487 xylose Drugs 0.000 description 1
- 238000001086 yeast two-hybrid system Methods 0.000 description 1
- 229910052727 yttrium Inorganic materials 0.000 description 1
- 230000004572 zinc-binding Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8273—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Abstract
本发明一般地涉及分子生物学领域,并涉及通过调节编码eRF1多肽、SCAMP样(分泌载体膜蛋白)多肽、PLATZ(植物富含AT序列和锌结合蛋白质)多肽、PLST样多肽或Glomalin(HSP60,陪伴蛋白CNP60)多肽的核酸在植物中的表达而增强产量相关性状的方法。本发明还涉及具有调节了编码所述多肽之核酸的表达的植物,所述植物相对于相应的野生型植物或其他对照植物而言具有增强的产量相关性状。本发明还提供可用于本发明方法的构建体。
Description
本发明一般地涉及分子生物学领域,并涉及通过调节编码eRF1多肽的核酸在植物中的表达而增强产量相关性状的方法。本发明还涉及具有调节了编码该eRF1多肽之核酸的表达的植物,所述植物相对于相应的野生型植物或其他对照植物而言具有增强的产量相关性状。本发明还提供可用于本发明方法的构建体。
本发明一般地涉及分子生物学领域,并涉及用于在植物中增强多种经济上重要的产量相关性状的方法。更具体地,本发明涉及通过调节编码SCAMP样(分泌载体膜蛋白)多肽的核酸在植物中的表达而增强产量相关性状的方法。本发明还涉及具有调节了编码SCAMP样多肽之核酸的表达的植物,所述植物相对于对照植物而言具有增强的产量相关性状。本发明还提供可用于实施本发明方法的迄今为止未知的SCAMP样编码核酸以及包含该核酸的构建体。
本发明一般地涉及分子生物学领域,并涉及通过调节编码肌原纤蛋白多肽的核酸在植物的质体中的表达而增强多种产量相关性状的方法。本发明还涉及具有调节了编码肌原纤蛋白之核酸在植物的质体中表达的植物,所述植物相对于相应的野生型植物或其他对照植物而言具有增强的产量相关性状。本发明还提供可用于本发明方法的构建体。
本发明一般地涉及分子生物学领域,并涉及通过调节编码PLATZ(植物富含AT序列和锌结合蛋白质)多肽的核酸在植物中的表达而改进多种植物生长特性的方法。本发明还涉及具有调节了编码PLATZ多肽之核酸的表达的植物,所述植物相对于相应的野生型植物或其他对照植物而言具有改进的生长特性。本发明还提供可用于本发明方法的构建体。
本发明一般地涉及分子生物学领域,并涉及通过调节编码PLST样多肽的核酸在植物中的表达而增强产量相关性状的方法。本发明还涉及具有调节了编码PLST样多肽之核酸的表达的植物,所述植物相对于相应的野生型植物或其他对照植物而言具有增强的产量相关性状。本发明还提供可用于本发明方法的构建体。
本发明一般地涉及分子生物学领域,并涉及通过调节编码Glomalin(HSP60,陪伴蛋白CNP60)多肽的核酸在植物中的表达而增强产量相关性状的方法。本发明还涉及具有调节了编码Glomalin多肽之核酸的表达的植物,所述植物相对于相应的野生型植物或其他对照植物而言具有增强的产量相关性状。本发明还提供可用于本发明方法的构建体。
持续增长的世界人口和农业用可耕地供应萎缩刺激了有关增加农业效率的研究。常规的作物及园艺学改进手段利用选择育种技术来鉴定具有受欢迎特性的植物。然而,此类选择育种技术具有几个缺陷,即这些技术一般耗费很多劳动并且产生这样的植物,其经常含有异源性遗传组分,这可能不总是导致从亲代植物中传递所希望的性状。分子生物学进展已经允许人类改进动物及植物的种质。植物的遗传工程使得可以分离和操作遗传物质(一般处于DNA或RNA形式)并且随后引入该遗传物质至植物中。此类技术具有产生具备多种经济学、农学或园艺学改进性状的作物或植物的能力。
具有特殊经济意义的性状是增加的产量特性。产量通常定义为作物产生的可测量的经济价值。这可以就数量和/或品质方面进行定义。产量直接取决于几个因素,例如器官的数目和大小、植物构造(例如枝的数目)、种子产生、叶衰老等。根发育、养分摄入量、胁迫耐性和早期萌发势(earlyvigor)也可以是决定产量的重要因素。因此,优化前述因素可以对增加作物产量有贡献。
种子产量是特别重要的性状,这是因为许多植物的种子对于人类和动物营养而言至关重要。诸如玉米、稻、小麦、卡诺拉(canola)和大豆等作物占人类总卡路里摄取量的一半以上,不论是通过种子本身的直接消耗,还是通过由加工的种子所饲养的肉类产品的消耗。它们也是工业加工所用的糖类、油类和多类代谢物的来源。种子含有胚(新的苗和根的来源)和胚乳(萌发和幼苗早期生长过程中胚生长的营养源)。种子的发育涉及许多基因,并且需要代谢物自根、叶和茎转移至正在生长的种子。特别是胚乳,同化糖类、油类和蛋白质的代谢前体,将其合成为贮存性高分子,以充盈籽粒。
植物生物量为饲料作物如苜蓿、青贮谷物和干草的产量。在谷物作物中使用产量的许多替代参数。其中首要的是估算植物大小。根据物种以及发育阶段的不同,可以通过许多方法测量植物大小,但是包括植物总干重、地上干重、地上鲜重、叶面积、茎体积、植物高度、莲座(rosette)直径、叶长、根长、根生物量、分蘖数和叶数。许多物种在给定的发育阶段维持植物不同部分大小间的保守比。利用这些异速生长关系而对这些有关大小的测量结果进行由此及彼的外推(如Tittonell等2005 Agric Ecosys &Environ 105:213)。早期发育阶段的植物大小通常将与晚期发育阶段的植物大小有关。具有更大叶面积的较大植物通常能够比较小的植物吸收更多的光和二氧化碳,因此很可能在同期增重更多(Fasoula & Tollenaar 2005Maydica 50:39)。除了植物所具有的最初达到较大大小的微环境或遗传优势的潜在延续,此为其附加效应。植物大小和生长速率存在着强遗传组分(如ter Steege等2005 Plant Physiology 139:1078),且因此对于多种多样化基因型植物在一种环境条件下的大小很可能与另一种环境条件下的大小有关(Hittalmani等2003Theoretical Applied Genetics 107:679)。以这种方式,使用标准环境作为田地中作物在不同时间和地点所遭遇的多样化动态环境的替代参数。
对于众多作物的另一个重要性状是早期萌发势。改进早期萌发势是现代稻育种计划在温带和热带稻栽培品种上的一个重要目标。长根在水栽稻中对于正确土壤固着是重要的。在将稻直接播种至涝田的情况下,以及在植物必须从水中迅速出苗的情况下,较长的苗与萌发势相关。在实施条播(drill-seeding)的情况下,较长的中胚轴和胚芽鞘对于良好的出苗是重要的。人工改造植物内早期萌发势的能力将在农业中是极其重要的。例如,不良的早期萌发势已经限制了基于玉米带生殖质(Corn Belt germplasm)的玉米(Zea mayes L.)杂种在欧洲大西洋地区的引种。
收获指数为种子产量与地上干重的比值,其在许多环境条件下相对稳定,因此在植物大小和谷物产量之间通常能够获得比较稳固的相关性(如Rebetzke等2002 Crop Science 42:739)。这些过程固有地联系在一起,因为谷物生物量的大多数取决于植物叶和茎当前或贮存的光合作用生产力(Gardener等1985 Physiology of Crop Plants.Iowa State University Press,第68-73页)。因此,对植物大小的选择,甚至是在发育早期阶段的选择,已经用作为未来潜在产量的指标(如Tittonell等,2005,Agric Ecosys &Environ 105:213)。当测试遗传差异对胁迫耐性的影响时,温室或植物培养室环境与田地相比具有固有的优势:即能够使土壤性能、温度、水和营养的可用性以及光强度标准化。不过,因缺乏风力或昆虫导致不良授粉,或由于空间不足以让成熟根或株冠生长等等,对产量造成的这些人工局限性会限制这些受控环境在测试产量差异中的应用。因此,在培养室或温室标准条件下测量早期发育阶段的植物大小,是提供潜在遗传产量优势指标的标准方法。
另外的重要性状是改进的非生物胁迫耐受性。非生物胁迫是世界范围作物损失的主要原因,对于大多数主要作物植物而言降低平均产量超过50%(Wang等、(2003)Planta 218:1-14)。非生物胁迫可以由干旱、盐度、极端温度、化学毒性、养分(大量元素和/或微量元素)过剩或者缺乏、辐射和氧化胁迫引起。改进植物对非生物胁迫(即干旱)耐受性的能力将在世界范围对农民具有极大的经济优势并且会允许在不利条件期间及在作物栽培否则是不可能的陆地上栽培作物。
作物产量因而可以通过优化前述因素之一而增加。
取决于最终用途,对某些产量性状的改进可能优先于其它产量性状。例如对于应用如饲料或木材生产或生物燃料资源而言,增加植物营养体部分可能是期望的,而对于应用如面粉、淀粉或油生产而言,增加种子参数可能是尤其希望的。即便在种子参数当中,某些参数可以更优先于其它参数,这取决于应用。多种机制可以对增加种子产量有贡献,无论形式为增加的种子大小或是增加的种子数目。
现已发现可以通过在植物中调节编码eRF1蛋白质样的核酸在植物中的表达而增强植物中的多种产量相关性状。
现已发现可以通过在植物中调节编码SCAMP样的核酸在植物中的表达而改进植物中的多种生长特性。
现已发现可以通过在植物中调节编码肌原纤蛋白多肽的核酸的表达而改进植物中的多种产量相关性状。
现已发现可以通过在植物中调节编码PLATZ(植物富含AT序列和锌结合蛋白质)的核酸在植物中的表达而改进植物中的多种生长特性。
现已发现可以通过在植物中调节编码PLST样蛋白质的核酸在植物中的表达而增强植物中的多种产量相关性状。
现已发现可以通过在植物中调节编码Glomalin(HSP60,陪伴蛋白CNP60)多肽的核酸在植物中的表达而改进植物中的多种产量相关性状。
背景
1.SCAMP样多肽
植物中的胞吞作用已经在最近几年期间积累了相当多的证据(Samaj等人,2004;Plant Physiol.135:1150-1161)。已经鉴定了基于网格蛋白的内化结构的一些组分,并积累了摄取细胞表面受体-配体复合物的数据(Russinova等人2004,Plant Cell 16:3216-3229)。最近,推测植物SCAMP蛋白可以在介导植物细胞的胞吞作用中发挥作用(Lam等人2007;ThePlant Cell,Vol.19:296-319)。最初,将SCAMP蛋白鉴定为哺乳动物外分泌腺中的分泌小泡组分,并后来发现其是真核细胞中普遍存在的蛋白质(Fernandez-Chacon和Sudhof,2000;J.Neurosci.20:7941-7950)。在高尔基体反面和内体再循环区室中都发现了SCAMP,并且它们集中在早期和再循环内体的能动群体内(Castle和Castle,2005J.Cell Sci.118:3769-3780)。其中,已经在稻(Oryza sativa)、拟南芥(Arabidopsis)和豌豆(Pisum sativum)中发现了植物SCAMP同源物,并认为其存在于许多其他植物物种中(Fernandez-Chacon和Sudhof,2000)。在植物中,SCAMP位于质膜和能动胞质细胞器(Lam等人2007)。
2.肌原纤蛋白多肽
在质体小球(PG)中最主要的蛋白质是肌原纤蛋白。肌原纤蛋白是质体相关的脂质结合蛋白质,其遍布于植物和蓝细菌中。主要在番茄和胡椒果实的色质体中表征了它们,并且已知它们在非生物胁迫期间(例如,受强光、冷冻和干旱胁迫),以及在病原体感染期间在质体中积累。肌原纤蛋白样蛋白质家族含有疏水结构域,其与脂质相关或者锚定在脂质内。肌原纤蛋白与类囊体的基质片层和色质体的含纤维类胡萝卜素(fibrilliccarotenoid)结构相关。纤维结构的模型预测肌原纤蛋白层屏蔽极性脂质和类胡萝卜素。此外,已知肌原纤蛋白在强光条件期间积累,并且肌原纤蛋白影响光合效率(参见Yang等人,Proc Natl Acad Sci U S A.2006年4月11日;103(15):6061-6066)。可利用的证据还有这些蛋白质在非胁迫条件下与多种脂质小球结合,以阻止质体球(plastoglobule)聚结(参见CAB摘要,Simkin等人,Recent Research Developments in Biochemistry,2004)。
拟南芥基因组具有13个肌原纤蛋白基因,经预测它们都编码质体定位的蛋白质(Laizet等人,2004)。Rey等人,(Plant J.2000年3月;21(5):483-94)公开了使用组成型启动子过表达肌原纤蛋白的转基因烟草(Nicotiana tabacum)植物。在弱光条件下没有观察到野生型植物和转基因植物之间的生长差异,但据报道,在更强的光照强度下,转基因植物显示出更长的主茎、增强的侧茎发育和加速的花发育。
3.PLATZ多肽
PLATZ蛋白质来自植物特异的DNA结合蛋白质家族。到目前为止,仅详细描述了一个成员(PLATZ1,Nagano等人,Nucl.Acids Res.29,4097-4105,2001)。PLATZ1与其他推定的PLATZ蛋白质之间的序列比较显示,存在具有保守的半胱氨酸和组氨酸残基的两个锌结合结构域。DNA结合活性需要锌的存在。PLATZ1显示出以非特异性方式与富含A/T的区域结合,并且能诱导GTP酶pra2和质体蓝素petE基因的表达(Nagano等人,2001)。虽然DNA结合蛋白质与DNA复制和基因表达的调节有关,但是还仍缺少对PLATZ蛋白质的作用的精确表征。
4.Glomalin多肽
最初,将Glomalin鉴定为由丛枝菌根真菌(arbuscular mycorrhizal)(如Glomus属物种)产生的大分子量糖蛋白。其分泌到环境中,并且推断其糖部分在螯合土壤中的铜和锌中发挥作用。Gadkar和Rillig(FEMSMicrobiol Lett.263,93-101,2006)显示,丛枝菌根真菌(Glomusintraradices)的glomalin是590个氨基酸的蛋白质,其具有3个氨基端糖基化位点和在羧基末端的一串GGM基序。基因组序列具有67、76和131bp长的3个内含子。该蛋白质与热休克蛋白60(hsp 60)同源;据报道,hsp60的植物同源物在使光合作用适应热胁迫中发挥作用,可能通过保护Rubisco活性酶免于热变性(Salvucci M.,E.,J Exp Bot.2008;59(7):1923-33)。然而,glomalin直向同源物在植物生物学中的精确作用仍有待阐明。
概述
1.eRF1多肽
目前令人惊讶地发现,调节编码eRF1多肽之核酸的表达产生相对于对照植物具有增强的产量相关性状,特别是增加的产量的植物。
根据一个实施方案,提供了相对于对照植物增强植物产量相关性状的方法,包括在植物中调节编码eRF1多肽之核酸的表达。
2.SCAMP样多肽
目前令人惊讶地发现,调节编码SCAMP样多肽之核酸的表达产生相对于对照植物具有增强的产量相关性状的植物。
根据一个实施方案,提供了相对于对照植物增强植物产量相关性状的方法,包括在植物中调节编码SCAMP样多肽之核酸的表达。
3.肌原纤蛋白多肽
目前令人惊讶地发现,调节编码肌原纤蛋白多肽之核酸在植物的质体中的表达产生相对于对照植物具有增强的产量相关性状的植物。
根据一个实施方案,提供了相对于对照植物增强产量相关性状的方法,包括调节编码肌原纤蛋白多肽之核酸在植物质体中的表达。
4.PLATZ多肽
目前令人惊讶地发现,调节编码PLATZ多肽之核酸的表达产生相对于对照植物具有增强的产量相关性状,特别是增加的产量的植物。
根据一个实施方案,提供了相对于对照植物改进植物产量相关性状的方法,包括在植物中调节编码PLATZ多肽之核酸的表达。
5.PLST样多肽
目前令人惊讶地发现,调节编码PLST样多肽之核酸的表达产生相对于对照植物具有增强的产量相关性状,特别是增加的产量的植物。
根据一个实施方案,提供了相对于对照植物增强植物产量相关性状的方法,包括在植物中调节编码PLST样多肽之核酸的表达。
6.Glomalin多肽
目前令人惊讶地发现,调节编码Glomalin多肽之核酸的表达产生相对于对照植物具有增强的产量相关性状,特别是增加的种子产量的植物。
根据一个实施方案,提供了相对于对照植物改进植物产量相关性状的方法,包括调节编码Glomalin多肽之核酸在植物中的表达。
定义
在整个本说明书中使用以下定义。
多肽/蛋白质
术语“多肽”和“蛋白质”在本文中可互换使用,指通过肽键连接在一起的处于任意长度的氨基酸聚合形式。
多核苷酸/核酸/核酸序列/核苷酸序列
术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”、“核酸分子”在本文中可互换使用并且指任意长度聚合的无分支形式的核苷酸,即核糖核苷酸或脱氧核糖核苷酸或这二者组合。
同源物
蛋白质的“同源物”包括这样的肽、寡肽、多肽、蛋白质及酶,它们相对于非修饰的所讨论蛋白质具有氨基酸替换、缺失和/或插入并且与其所源自的非修饰蛋白质具有相似生物学活性和功能活性。
缺失指从蛋白质中移除一个或多个氨基酸。
插入指一个或多个氨基酸残基在蛋白质中预定位点内的引入。插入可以包含氨基端融合和/或羧基端融合以及单个或多个氨基酸的序列内插入。通常,在氨基酸序列内部的插入会比氨基端融合或羧基端融合小,约1-10个残基的级别。氨基端或羧基端融合蛋白或融合肽的例子包括如酵母双杂交系统中所用转录激活物的结合结构域或激活结构域、噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶-标签、蛋白A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag·100表位、c-myc表位、-表位、lacZ、CMP(钙调蛋白结合肽)、HA表位、蛋白C表位和VSV表位。
替换指以具有相似特性(如相似疏水性、亲水性、抗原性、形成或破坏α-螺旋结构或β-折叠结构的倾向)的其它氨基酸替换蛋白质的氨基酸。氨基酸替换一般是单个残基的,不过可以是簇集性的,这取决于置于多肽的功能性约束,并且可以是1-10个氨基酸;插入通常会是约1-10个氨基酸残基级别。氨基酸替换优选地是保守性氨基酸替换。保守性替换表是本领域众所周知的(见例如Creighton(1984)Proteins.W.H.Freeman和Company(编著)和下表1)。
表1:保守性氨基酸替换的例子
残基 | 保守性替换 | 残基 | 保守性替换 |
Ala | Ser | Leu | Ile;Val |
Arg | Lys | Lys | Arg;Gln |
Asn | Gln;His | Met | Leu;Ile |
Asp | Glu | Phe | Met;Leu;Tyr |
Gln | Asn | Ser | Thr;Gly |
Cys | Ser | Thr | Ser;Val |
Glu | Asp | Trp | Tyr |
Gly | Pro | Tyr | Trp;Phe |
His | Asn;Gln | Val | Ile;Leu |
Ile | Leu,Val |
氨基酸替换、缺失和/或插入可以使用本领域众所周知的肽合成技术如固相肽合成法等或通过重组DNA操作而容易地进行。用于操作DNA序列以产生蛋白质的替换、插入或缺失变体的方法是本领域众所周知的。例如,用于在DNA中的预定位点处产生替换突变的技术是本领域技术人员众所周知的并且包括M13诱变法、T7-Gen体外诱变法(USB,Clevelaand,OH)、QuickChange位点定向诱变法(Stratagene,San Diego,CA)、PCR-介导的位点定向诱变或其它位点定向诱变法。
衍生物
“衍生物”包括这样的肽、寡肽、多肽,其中与天然存在形式的蛋白质(如目的蛋白)的氨基酸序列相比,它们包含以非天然存在的氨基酸残基对氨基酸的替换或非天然存在的氨基酸残基的添加。蛋白质的“衍生物”也包含这样的肽、寡肽、多肽,其中与多肽的天然存在形式的氨基酸序列相比,它们包含天然存在的经改变(糖基化、酰化、异戊二烯化、磷酸化、肉豆蔻酰化、硫酸化等)的氨基酸残基或非天然的经改变的氨基酸残基。与衍生物所来源的氨基酸序列相比,该衍生物可以也包含与所述氨基酸序列共价或非共价结合的一个或多个非氨基酸取代基或添加(例如报道分子或其它配体),如为促进检测该衍生物而结合的报道分子,和与天然存在的蛋白质的氨基酸序列相对比的非天然存在的氨基酸残基。此外,“衍生物”还包括天然发生形式蛋白质与标签肽(如FLAG、HIS6或硫氧还蛋白)的融合物(标签肽的综述参阅Terpe,Appl.Microbiol.Biotechnol.60,523-533,2003)。
直向同源物/旁系同源物
直向同源物和旁系同源物包含用来描述基因祖先关系的进化概念。旁系同源物是相同物种内起源于先祖基因复制的基因;直向同源物是来自不同生物的起源于物种形成的基因,并且也来源于共同的先祖基因。
结构域,基序/共有序列/特征序列
术语“结构域”指依据进化相关蛋白质的序列比对结果而在特定位置处保守的一组氨基酸。尽管在其它位置处的氨基酸可以在同源物之间变动,然而在特定位置处的高度保守的氨基酸指示在蛋白质的结构、稳定性或功能方面可能是必需的氨基酸。结构域因通过在蛋白质同源物家族的比对序列中的高保守程度而被鉴定,它们可以用作鉴定物以确定任意的所讨论多肽是否属于先前已鉴定的多肽家族。
术语“基序”或“共有序列”或“特征序列”指在进化相关蛋白质的序列中的短保守区。基序往往是结构域的高度保守部分,不过也可以仅包括结构域的部分,或可以位于保守结构域之外(若基序的全部氨基酸位于定义的结构域之外)。
存在用于鉴定结构域的专门数据库,例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic AcidsRes 30,242-244),InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318),Prosite(Bucher和Bairoch(1994),A generalized profile syntaxfor biomolecular sequences motifs and its function in automatic sequenceinterpretation.(In)ISMB-94;Proceedings 2nd International Conferenceon Intelligent Systems for Molecular Biology.Altman R.,Brutlag D.,KarpP.,Lathrop R.,Searls D.编著,第53-61页,AAAI Press,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或者Pfam(Bateman等,NucleicAcids Research 30(1):276-280(2002))。用于计算机分析蛋白质序列的一组工具可获得自ExPASy蛋白组服务器(Swiss Institute of Bioinformatics(Gasteiger等,ExPASy:the proteomics server for in-depth proteinknowledge and analysis,Nucleic Acids Res.31:3784-3788(2003))。还可以使用常规技术(如序列比对)来鉴定结构域或基序。
比对序列以进行比较的方法为本领域所众所周知,这些方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP利用Needleman和Wunsch((1970)J Mol Biol 48:443-453)的算法来寻找两序列间使匹配数最高并使空位数最少的全局比对(即在完整序列上)。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)在两序列间计算百分比序列同一性并进行相似性的统计学分析。用于进行BLAST分析的软件在国家生物技术信息中心(National Centre for Biotechnology Information(NCBI))向公众提供。可以使用例如默认配对比对参数的ClustalW多重序列比对算法(1.83版)和百分比评分法来容易地鉴定同源物。也可以使用MatGAT软件包(Campanella等,BMC Bioinformatics.2003 Jul 10;4:29.MatGAT:anapplication that generates similarity/identity matrices using protein orDNA sequence)中提供的一种方法确定全局的相似性和同一性百分比。本领域技术人员会意识到,可以进行少量手动编辑以优化保守性基序之间的比对。此外,还可以使用特定的结构域代替全长序列来鉴定同源物。序列同一性值可以是使用默认参数的上述程序在完整的核酸或氨基酸序列上或在所选择的结构域或保守的基序上测定的。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol147(1);195-7)。
交互BLAST
通常,这包括以查询序列(例如,利用实施例章节表A2、A3、A4、A5和A6中所列的任一序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST的首次BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)。然后比较首次和二次BLAST的结果。如果首次BLAST中的高排名命中来自查询序列来源的相同物种,然后反向BLAST理想地导致查询序列处于最高命中之列,则找到了旁系同源物;如果首次BLAST中高排名命中不来自查询序列来源的相同物种,且优选地在反向BLAST时导致查询序列在最高命中之列,则找到了直向同源物。
高排名的命中是那些E值低的命中。E值越低,分值越具有显著性(或者换句话说,偶然发现此命中的几率越低)。E值的计算是本领域众所周知的。除了E值之外,还对比较进行同一性百分比评分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在大家族的情况下可以使用ClustalW,继之以邻接树来辅助相关基因的聚类可视化,和鉴定直向同源物和旁系同源物。
杂交
如本文中所定义的术语“杂交”是其中基本上同源的互补核苷酸序列彼此退火的过程。杂交过程可以完全在溶液中进行,即两种互补性核酸均处于溶液中。杂交过程也可以在互补性核酸之一固定到基质如磁珠、琼脂糖(Sepharose)珠或任何其它树脂的情况下发生。杂交过程也可以在互补性核酸之一固定至固相支持体如硝酸纤维素膜或尼龙膜上或通过例如照相平版印刷术固定至例如硅酸玻璃支持物(后者称作核酸阵列或微阵列或称作核酸芯片)上的情况下进行。为使杂交发生,通常将核酸分子热变性或化学变性以使双链解链成为两条单链和/或去除来自单链核酸的发夹或其它二级结构。
术语“严格性”指在其中发生杂交的条件。杂交的严格性受条件如温度、盐浓度、离子强度和杂交缓冲液组成影响。通常,将低严格性条件选择为在确定的离子强度及pH时低于特定序列热解链温度(Tm)约30℃。中等严格性条件是此时温度低于Tm约20℃,高严格性条件是此时温度低于Tm约10℃。高严格性杂交条件一般用于分离与靶核酸序列具有高序列相似性的杂交序列。然而,核酸可以在序列上偏离并且因遗传密码子的简并性而依旧编码基本上相同的多肽。因而有时候可能需要中等严格性杂交条件来鉴定此类核酸分子。
Tm是在确定的离子强度及pH下50%的靶序列与完全匹配的探针杂交时的温度。Tm取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在较高温度下特异性地杂交。从低于Tm约16℃直至32℃获得最大杂交速率。一价阳离子在杂交溶液中的存在降低了两条核酸链间的静电排斥,因而促进杂交分子形成;这种作用对于高达0.4M的钠浓度是明显的(对于更高浓度,这种效应可以忽略)。甲酰胺降低DNA-DNA和DNA-RNA双链体的解链温度,每百分数甲酰胺降低0.6至0.7℃,并且添加50%甲酰胺允许在30至45℃进行杂交,虽然杂交速率会降低。碱基对错配降低了杂交速率及双链体的热稳定性。平均而言并且对于大的探针来说,每%碱基错配Tm下降约1℃。取决于杂交分子的类型,Tm可以使用下列等式计算:
1)DNA-DNA杂交分子(Meinkoth和Wahl,Anal.Biochem.,138:267-284,1984):
Tm=81.5℃+16.6xlog10[Na+]a+0.41x%[G/Cb]-500x[Lc]-1-0.61x%甲酰胺
2)DNA-RNA或RNA-RNA杂交分子:
Tm=79.8+18.5(log10[Na+]a)+0.58(%G/Cb)+11.8(%G/Cb)2-820/Lc
3)寡DNA或寡RNAd杂交分子:
对于<20个核苷酸:Tm=2(ln)
对于20-35个核苷酸:Tm=22+1.46(ln)
a或对于其它一价阳离子,但是仅在0.01-0.4M范围内是精确的。
b仅对于%GC在30%至75%范围内是精确的。
cL=双链体的长度(以碱基对计)。
doligo,寡核苷酸;ln,=引物的有效长度=2×(G/C数)+(A/T数)。
可以使用众多已知技术的任何一种来控制非特异性结合,如例如用含蛋白质的溶液封闭薄膜、添加异源性RNA、异源性DNA及SDS至杂交缓冲液并且用RNA酶处理。对于非同源性探针,一系列杂交可以通过改变以下条件之一进行:(i)逐渐降低退火温度(例如从68℃至42℃)或(ii)逐渐降低甲酰胺浓度(例如从50%至0%)。技术人员了解杂交期间可以加以改变和将维持或改变严格性条件的多种参数。
除杂交条件之外,杂交特异性一般还取决于杂交后洗涤的功能。为除去因非特异性杂交所致的背景,样品用稀释的盐溶液洗涤。此类洗涤的关键因素包括最终洗涤溶液的离子强度及温度:盐浓度越低并且洗涤温度越高,则洗涤的严格性越高。洗涤条件一般在杂交严格性上或低于杂交严格性而进行。阳性杂交产生至少两倍于背景信号的信号。通常,用于核酸杂交分析法或基因扩增检测方法的合适严格性条件如上所述。也可以选择更严格或更不严格的条件。技术人员了解洗涤期间可以加以改变和将维持或改变严格性条件的多种参数。
例如,用于长度大于50个核苷酸的DNA杂交分子的常见高严格性杂交条件包括在65℃于1×SSC中或在42℃于1×SSC和50%甲酰胺中杂交,随后在65℃于0.3×SSC中洗涤。用于长度大于50个核苷酸的DNA杂交分子的中等严格性杂交条件的例子包括在50℃于4×SSC中或在40℃于6×SSC和50%甲酰胺中杂交,随后在50℃于2×SSC中洗涤。杂交分子的长度是杂交核酸的预期长度。当序列已知的核酸杂交时,可以通过比对序列并鉴定本文中所述的保守区而确定杂交分子长度。1×SSC是0.15M NaCl和15mM柠檬酸钠;杂交溶液和洗涤溶液可以额外地包含5×Denhardt试剂、0.5-1.0%SDS、100μg/ml变性的片段化鲑精DNA、0.5%焦磷酸钠。
为了定义严格性水平的目的,可以参考Sambrook等(2001)MolecularCloning:a laboratory manual,第三版,Cold Spring Harbor LaboratoryPress,CSH,New York或参考Current Protocols in Molecular Biology,John Wiley & Sons,N.Y.(1989和每年更新版本)。
剪接变体
如本文中所用的术语“剪接变体”包含其中已经切除、替换、移位或添加所选内含子和/或外显子或其中内含子已经缩短或加长的核酸序列的变体。此类变体将是其中基本上保留了蛋白质的生物活性的一种变体;这可以通过选择性保留蛋白质的功能性片段而实现。此类剪接变体可以在自然界中找到或可以人工制造。用于预测和分离此类剪接变体的方法是本领域众所周知的(见例如Foissac和Schiex,(2005)BMC Bioinformatics.6:25)。
等位变体
等位基因或等位变体是给定基因的替代形式,位于相同染色体位置内。等位变体包含单核苷酸多态性(SNP)和小插入/缺失多态性(INDEL)。INDEL的尺寸通常小于100bp。SNP和INDEL形成在大部分生物的天然存在性多态性株系中序列变体的最大集合。
内源基因
本文中提及的“内源”基因不仅仅指如在植物中以其天然形式(即没有任何人类干预)存在的所讨论基因,还指处于分离形式随后(再)引入植物中的相同基因(或基本上同源的核酸/基因)(转基因)。例如,含有这种转基因的转基因植物可以遭遇转基因表达大幅降低和/或内源基因表达的大幅降低。分离的基因可从生物体分离,或可人工制造(例如通过化学合成)。
基因改组/定向进化
基因改组或定向进化的组成为:反复DNA改组,随后适当筛选和/或选择以产生编码具有修饰的生物学活性的蛋白质之核酸或其部分的变体(Castle等,(2004)Science 304(5674):1151-4;美国专利5,811,238和6,395,547)。
构建体
其它调节元件可包括转录及翻译增强子。本领域技术人员会了解适于在实施本发明中使用的终止子和增强子序列。如在定义部分所述,也可将内含子序列添加至5′非翻译区(UTR)或编码序列上,以增加在细胞质内积累的成熟信息的量。其它控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定元件。本领域技术人员会知道或可以容易地获得此类序列。
本发明的遗传构建体还可以包括在特定细胞类型中维持和/或复制需要的复制起点序列。一个例子是当需要将遗传构建体在细菌细胞中作为附加型遗传元件(例如质粒或粘粒分子)维持时。优选的复制起点包括但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸序列的转基因植物,使用标记基因(或报告基因)是有利的。因而,遗传构建体可以任选地包含可选择标记基因。可选择标记在本文“定义”部分中有更详细的描述。一旦不再需要,可以从转基因细胞中去除或切除标记基因。用于标记基因去除的技术是本领域已知的,有用的技术在上文定义部分中描述。
调节元件/控制序列/启动子
术语“调节元件”、“控制序列”和“启动子”均在本文中可互换使用,并且在广义上意指能够影响与之连接的序列表达的调节性核酸序列。术语“启动子”一般指位于基因转录起点上游并参与识别及结合RNA聚合酶和其它蛋白质,因而指导有效连接的核酸转录的核酸控制序列。前述术语包括从典型的真核基因组基因(包括对于精确转录启动所需的TATA盒,具有或没有CCAAT盒序列)中衍生的转录调节序列和应答发育刺激和/或外部刺激或以组织特异性方式改变基因表达的额外调节元件(如,上游激活序列、增强子和沉默子)。本术语还包括典型的原核基因的转录调节序列,在此情况下它可以包括-35盒序列和/或-10盒转录调节序列。术语“调节元件”也包含赋予、激活或增强核酸分子在细胞、组织或器官中表达的合成的融合分子或衍生物。
“植物启动子”包含介导编码序列区段在植物细胞中表达的调节元件。因此,植物启动子不一定是植物来源的,而是可以源自病毒或微生物,例如来自侵袭植物细胞的病毒。“植物启动子”也可以源自植物细胞,例如来自用待于本发明方法中表达及在本文中描述的核酸序列所转化的植物。这也适用于其它“植物”调节性信号,如“植物”终止子。用于本发明方法中的核苷酸序列上游的启动子可以由一个或多个核苷酸替换、插入和/或缺失而受到修饰,但不干扰启动子、开放阅读框(ORF)或3′调节区(如终止子)或远离ORF的其它3′调节区的功能性或活性。启动子的活性还有可能因修饰该启动子的序列或由更具活性的启动子、甚至来自异源生物的启动子彻底替换该启动子而增加。为在植物中表达,如上所述,核酸分子必须有效连接至或包含合适的启动子,其中所述的启动子在正确时间点上并以所需要的空间表达模式表达基因。
为了鉴定功能等价启动子,可以分析候选启动子的启动子强度和/或表达模式,例如通过将该启动子与报告基因有效连接并测定该报告基因在多种植物组织中的表达水平和模式。合适的公知报告基因包括例如β-葡糖醛酸糖苷酶或β-半乳糖苷酶。通过测量β-葡糖醛酸糖苷酶或β-半乳糖苷酶的酶活性来测定启动子活性。接着可以将启动子强度和/或表达模式与参考启动子(如用于本发明方法中的)进行比较。或者,可以通过定量mRNA水平或者将本发明方法中所用核酸的mRNA水平与持家基因(如18S rRNA)的mRNA水平进行比较来测定启动子强度,其中使用本领域众所周知的技术,如通过放射自显影的光密度测定分析进行的Northern印迹、定量实时PCR或RT-PCR(Heid等,1996 Genome Methods 6:986-994)。通常,“弱启动子”指驱动编码序列低水平表达的启动子。“低水平”指每个细胞中约1/10,000的转录物至约1/100,000的转录物至约1/500,0000的转录物的水平。相反,“强启动子”驱动编码序列高水平表达,或者每个细胞中约1/10的转录物至约1/100的转录物至约1/1000的转录物的水平。通常,“中等强度启动子”指此类启动子,其驱动编码序列以低于强启动子的水平表达,特别是在所有情况下以低于35S CaMV启动子控制时获得的水平表达。
有效连接
如本文中所用的术语“有效连接”指启动子序列与目的基因之间功能性地连接,以至于启动子序列能够启动目的基因转录。
组成型启动子
“组成型启动子”指在至少一种细胞、组织或器官中在其大多数(但不一定是全部)生长和发育阶段并在大多数环境条件下有转录活性的启动子。下表2a给出了组成型启动子的例子。
表2a:组成型启动子的例子
遍在启动子
遍在启动子在生物的基本上全部组织或细胞中有活性。
发育调节性启动子
发育调节性启动子在某个发育期期间或在经历发育变化的植物部分内有活性。
诱导型启动子
诱导型启动子在应答化学品(综述见Gatz 1997,Annu.Rev.PlantPhysiol.Plant Mol.Biol.,48:89-108)、环境刺激或物理刺激时具有受诱导或增加的转录启动,或可以是“胁迫诱导型”,即当植物暴露于多种胁迫条件时受到激活,或是“病原体诱导型”,即当植物暴露于多种病原体时受到激活。
器官特异性/组织特异性启动子
器官特异性或组织特异性启动子是能够优先在某些器官或组织如叶、根、种子组织等内启动转录的启动子。例如,“根特异性启动子”是在植物根中优势地具有转录活性的启动子,在植物的任何其它部分内基本上无活性,尽管在植物的这些其它部分内允许任何泄露表达。能够仅在某些细胞中启动转录的启动子在本文中称作“细胞特异性”。
根特异性启动子的例子列于下表2b中:
表2b:根特异性启动子的例子
种子特异性启动子主要在种子组织中有转录活性,但不一定仅在种子组织中有(泄漏表达的情况)。种子特异性启动子可在种子发育和/或萌发过程中有活性。种子特异性启动子可以是胚乳/糊粉/胚特异性的。种子特异性启动子的实例(胚乳/糊粉/胚特异性的)在下表2c至表2f中显示。种子特异性启动子的其它实例在Qing Qu和Takaiwa(Plant Biotechnol.J.2,113-125,2004)中给出,其公开内容整体并入本文作为参考。
表2c:种子特异性启动子的例子
表2d:胚乳特异性启动子的例子
表2e:胚特异性启动子的例子:
基因来源 | 参考文献 |
稻OSH1 | Sato等,Proc.Natl.Acad.Sci.USA,93:8117-8122,1996 |
KNOX | Postma-Haarsma等,Plant Mol.Biol.39:257-71,1999 |
PRO0151 | WO 2004/070039 |
PRO0175 | WO 2004/070039 |
PRO005 | WO 2004/070039 |
PRO0095 | WO 2004/070039 |
表2f:糊粉特异性启动子的例子:
如本文中所定义的绿色组织特异性启动子是主要在绿色组织中具有转录活性的启动子,在植物的任何其它部分内基本上无活性,尽管在植物的这些其它部分内允许任何泄露表达。
可以用来实施本发明方法的绿色组织特异性启动子的例子在下表2g中显示。
表2g:绿色组织特异性启动的例子
组织特异性启动子的另一个例子是分生组织特异性启动子,其主要在分生性组织中具有转录活性,在植物的任何其它部分内基本上无活性,尽管在植物的这些其它部分内允许任何泄露表达。可用于实施本发明方法的绿色分生组织特异性启动子的例子示于下列的表2h。
表2h:分生组织特异性启动子的例子
终止子
术语“终止子”包括这样的控制序列,其是在转录单位末端的DNA序列,发出对初级转录物进行3’加工并多聚腺苷化以及终止转录的信号。终止子可以来自天然基因、来自多种其它植物基因或来自T-DNA。待添加的终止子可以来自例如胭脂碱合酶或章鱼碱合酶基因,或者来自另一植物基因或较不优选地来自任何其它真核基因。
可选择标记(基因)/报告基因
“可选择标记”、“可选择标记基因”或“报告基因”包括向细胞赋予表型的任何基因,其中在所述的细胞内表达所述基因以促进鉴定和/或选择用本发明的核酸构建体所转染或转化的细胞。这些标记基因能够通过一系列不同原理鉴定核酸分子的成功转移。合适的标记可以选自赋予抗生素抗性或除草剂抗性、引入新代谢性状或允许目视选择的标记。可选择标记基因的例子包括赋予抗生素抗性的基因(如使新霉素和卡那霉素磷酸化的nptII或使潮霉素磷酸化的hpt或赋予对例如博来霉素、链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(Geneticin,G418)、壮观霉素或杀稻瘟素的抗性的基因)、赋予除草剂抗性的基因(例如提供抗性的bar;提供草甘膦抗性的aroA或gox或赋予对例如咪唑啉酮、膦丝菌素或磺脲类的抗性的基因)或提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA或利用木糖的木糖异构酶或抗营养标记如2-脱氧葡萄糖抗性)。视觉标记基因的表达导致形成颜色(例如β-葡糖醛酸糖苷酶、GUS或β-半乳糖苷酶与其有色底物例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白GFP及其衍生物)。这个名单仅代表少数的可能标记。技术人员熟悉此类标记。取决于生物和选择方法,优选不同的标记。
已知当核酸稳定或瞬时整合至植物细胞时,仅小部分的细胞摄取外来DNA并且根据需要将其整合至细胞基因组,这取决于所用表达载体和使用的转染技术。为鉴定并选择这些整合子,通常将编码可选择标记(如上文所述之一)的基因连同目的基因一起引入宿主细胞。这些标记可以例如在其中这些基因因例如常规方法所致的缺失而无功能的突变体中使用。此外,编码可选择标记的核酸分子可以引入宿主细胞中,与编码本发明多肽或本发明方法中所用多肽的序列在同一载体上,或在单独的载体上。已经用引入的核酸稳定转染的细胞可以例如通过选择进行鉴定(例如具有整合的可选择标记的细胞存活而其它细胞死亡)。
因为一旦已经成功引入了核酸,则转基因宿主细胞中就不再需要或不希望有标记基因,尤其抗生素抗性基因和除草剂抗性基因,因此用于引入核酸的本发明方法有利地使用能够去掉或切除这些标记基因的技术。一种如此方法称作共转化法。共转化法使用同时用于转化的两种载体,一种载体携带本发明的核酸而另一种载体携带标记基因。高比例的转化体接受,或在植物的情况下,包含(高达40%或更多的转化体)这两种载体。在用农杆菌转化的情况下,转化体通常仅接受载体的一部分,即侧翼有T-DNA的序列,它通常代表表达盒。标记基因随后可以通过进行杂交而从转化的植物中去掉。在另一种方法中,整合至转座子的标记基因用来与想要的核酸一起进行转化(称作Ac/Ds技术)。转化体可以与转座酶来源植物杂交或转化体与导致转座酶表达的核酸构建体瞬时或稳定地转化。在一些情况下(大约10%),转座子在已经成功发生转化时跳出宿主细胞的基因组并丢失。在其它更多情况下,转座子跳至不同位置。在这些情况下,标记基因必须通过进行杂交而去除。在微生物学中,开发了实现或促进检测这类事件的技术。又一个有利的方法依赖于已知的重组系统;此方法的优势在于不必通过杂交去除。该类型的最知名系统称作Cre/lox系统。Cre1是去掉位于loxP序列之间序列的重组酶。若标记基因整合于loxP序列之间,则在已经成功发生转化时,通过重组酶表达去除标记基因。其它重组系统是HIN/HIX、FLP/FRT和REP/STB系统(Tribble等,J.Biol.Chem.,275,2000:22255-22267;Velmurugan等,J.Cell Biol.,149,2000:553-566)。有可能将本发明核酸序列以位点特异性方式整合至植物基因组。这些方法自然也可以应用至微生物如酵母、真菌或细菌。
转基因的/转基因/重组
为本发明目的,“转基因的”、“转基因”或“重组”就例如核酸序列而言意指包含此核酸序列的表达盒、基因构建体或载体或用本发明的核酸序列、表达盒或载体转化的生物,所有那些构建均通过重组方法产生,其中
(a)编码用于本发明方法中的蛋白质的核酸序列,或
(b)与本发明核酸序列有效连接的遗传控制序列,例如启动子,或
(c)a)和b)
不处于其天然遗传环境中或已经通过重组方法修饰,修饰有可能采用例如替换、添加、缺失、倒位或插入一个或多个核苷酸残基的形式。天然遗传环境理解为意指来源植物中或存在于基因组文库中的天然基因组基因座或染色体基因座。在基因组文库的情况下,核酸序列的天然遗传环境优选地得到保留,至少部分地得以保留。该环境分布在核酸序列的至少一侧并且具有至少50bp,优选至少500bp,特别优选至少1000bp,最优选至少5000bp的序列长度。天然存在的表达盒-例如核酸序列的天然启动子与编码本发明方法中所用多肽的对应核酸序列的天然存在的组合,如上文所定义-在这种表达盒通过非天然的合成(“人工”)方法(如例如诱变处理)修饰后,变成转基因表达盒。合适方法例如在US 5,565,350或WO 00/15815中描述。
为本发明目的,转基因植物因此如上理解为意指本发明方法中所用的核酸不位于所述植物基因组中该核酸的天然基因座内,所述核酸有可能同源或异源地表达。然而如所提及,转基因还意指尽管本发明核酸或在本发明方法中所用核酸处于植物基因组中该核酸的天然位置内,然而其序列相对于天然序列而言已经受到修饰,和/或所述天然序列的调节序列已经受到修饰。转基因优选地理解为意指本发明核酸在基因组中的非天然基因座内表达,即发生核酸的同源表达或优选异源表达。在本文中提到了优选的转基因植物。
调节
术语“调节”就表达或基因表达而言意指这样的过程,其中表达水平与对照植物相比因所述基因的表达而改变,表达水平可以是增加或减少。原先未受调节的表达可以是结构RNA(rRNA、tRNA)或mRNA的任何类型表达,随后是翻译。术语“调节活性”应当意指本发明核酸序列或所编码蛋白质的表达的任何变化,这导致植物增加的产量和/或增加的生长。
表达
术语“表达”或“基因表达”指转录一个或多个特定基因或特定的遗传构建体。特别地,术语“表达”或“基因表达”指将一个或多个基因或遗传构建体转录成结构RNA(rRNA、tRNA)或mRNA,包括或者不包括后者随后翻译成蛋白质。该过程包括转录DNA和加工所得的mRNA产物。
增加的表达/过表达
如本文中所用的术语“增加的表达”或“过表达”意指对于原有野生型表达水平是额外的任何形式表达。
在本领域内详细记载了用于增加基因或基因产物表达的方法并且它们包括例如,由适宜启动子驱动的过表达、使用转录增强子或翻译增强子。可以在非异源形式的多核苷酸的适宜位置(一般是上游)内引入作为启动子或增强子元件的分离核酸,以便上调编码目的多肽的核酸的表达。例如,内源性启动子可以通过突变、缺失和/或置换而在体内改变(见Kmiec,US5,565,350;Zarling等,WO9322443),或可以将分离的启动子以相对于本发明基因的正确方向及距离引入植物细胞,以便控制基因表达。
如果期望表达多肽,一般期望在多核苷酸编码区的3’末端包含多腺苷酸化区。多腺苷酸化区可来自该天然基因,来自多种其它植物基因,或者来自T-DNA。待被加入的3’末端序列可来自例如胭脂碱合酶或章鱼碱合酶基因,或者来自另一植物基因,或者较不优选地来自任何其它真核基因。
内含子序列也可添加至5′非翻译区(UTR)或部分编码性序列的编码序列上,以增加在细胞质内积累的成熟信息的量。已经证实可剪接内含子在植物表达构建体和动物表达构建体中转录单位内的包含在mRNA水平及蛋白质水平上增加基因表达至多达1000倍(Buchman和Berg(1988)Mol.Cell biol.8:4395-4405;Callis等(1987)Gens Dev 1:1183-1200)。基因表达的此类内含子增强作用一般在位于转录单元5′端附近时最强烈。使用玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子是本领域已知的。对于一般信息,见:《玉米手册》,第116章,编者Freeling和Walbot,Springer,N.Y.(1994)。
降低的表达
本文中提及的“降低的表达”或者“降低或基本去除”的表达意指内源基因表达和/或多肽水平和/或多肽活性相对于对照植物的降低。与对照植物相比,降低或基本去除以递增优选顺序是至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%或95%、96%、97%、98%、99%或更多的降低。
为了降低或基本去除内源基因在植物中的表达,需要核酸序列的足够长度的基本上连续的核苷酸。为了开展基因沉默,这个长度可以是少至20、19、18、17、16、15、14、13、12、11、10个或更少的核苷酸,或者该长度可以多至整个基因(包括5’和/或3’UTR,部分或全体)。基本上连续的核苷酸片段可以来自编码目的蛋白质的核酸(靶基因)或来自能够编码目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸。优选地,基本上连续的核苷酸片段能够与靶基因(有义链或反义链)形成氢键,更优选地,基本上连续的核苷酸片段以递增优选顺序与靶基因(有义链或反义链)具有50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、100%的序列同一性。编码(功能性)多肽的核酸序列不是本文中所讨论用于降低或基本去除内源基因表达的多种方法所需的。
表达的这种降低或基本去除可以使用常规工具和技术完成。用于降低或基本去除内源基因表达的优选方法是通过在植物中引入和表达遗传构建体,将被间隔物(非编码DNA)分隔的核酸作为反向重复序列(部分地或完全地)克隆入此构建体中(在此情况下该核酸是从目的基因或从任何核酸中衍生的一段基本上连续的核苷酸,其中所述的任何核酸能够编码任何目的蛋白质之一的直向同源物、旁系同源物或同源物)。
在这样的优选方法中,通过RNA介导的沉默降低或基本去除内源基因表达,其中使用核酸或其部分的反向重复序列(在此情况下是从目的基因或从任何核酸中衍生的一段基本上连续的核苷酸片段,其中所述的任何核酸能够编码目的蛋白质的直向同源物、旁系同源物或同源物),优选能够形成发夹结构。反向重复序列克隆在含有控制序列的表达载体中。非编码DNA核酸序列(间隔物,例如基质结合区片段(MAR)、内含子、聚合接头等等)位于形成反向重复序列的两个反向核酸之间。在反向重复序列转录后,形成带有自身互补结构(部分或完全的)的嵌合RNA。这个双链RNA结构被称为发夹RNA(hpRNA)。hpRNA由植物加工成siRNA,其整合入RNA诱导的沉默复合物(RISC)中。RISC进一步切割mRNA转录本,由此大量减少将被翻译成多肽的mRNA转录本的数量。对于更多一般性细节见例如,Grierson等(1998)WO 98/53083;Waterhouse等(1999)WO99/53050)。
本发明方法的实施不依赖于在植物中引入和表达遗传构建体(核酸作为反向重复序列克隆至该构建体中),也可使用数个众所周知的“基因沉默”方法中的任何一个或多个达到相同效果。
用于减少内源基因表达的一个此类方法是RNA介导的基因表达沉默(下调)。在此情况下,沉默由植物中的双链RNA序列(dsRNA)引发,该双链RNA序列与内源靶基因基本相似。这个dsRNA由植物进一步加工成约20至约26个核苷酸,被称为短干扰RNA(siRNA)。siRNA整合入RNA诱导的沉默复合物(RISC)中,该复合物切割内源靶基因的mRNA转录本,由此大量减少将被翻译成多肽的mRNA转录本的数量。优选地,双链RNA序列对应于靶基因。
RNA沉默方法的另一个例子包括以有义方向引入核酸序列或其部分(在此情况下是从目的基因或从任何核酸中衍生的一段基本上连续的核苷酸片段,其中所述的任何核酸能够编码目的蛋白质的直向同源物、旁系同源物或同源物)至植物内。“有义方向”指与其mRNA转录本同源的DNA序列。因此引入植物的将至少是核酸序列的一个拷贝。附加的核酸序列将减少内源基因的表达,引起通常所说的共抑制现象。因为高转录本水平和共抑制的引发之间正相关,如果数个附加拷贝的核酸序列引入植物中,基因表达的减少将更显著。
RNA沉默方法的另一个例子包括使用反义核酸序列。“反义”核酸序列包含与编码蛋白质的“有义”核酸序列互补的核苷酸序列,也就是,与双链cDNA分子的编码链互补或与mRNA转录本序列互补。反义核酸序列优选与将被沉默的内源基因互补。互补性可位于基因的“编码区”和/或“非编码区”。术语“编码区”指含有翻译成氨基酸残基的密码子的核苷酸序列区。术语“非编码区”指位于编码区侧翼的5′和3′序列,其将被转录却不被翻译成氨基酸(也称为5′和3′非翻译区)。
反义核酸序列可根据Watson和Crick碱基配对的规则进行设计。反义核酸序列可以与整个核酸序列互补(在这种情况下,基本上连续的核苷酸片段可以来自目的基因,或来自能够编码目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸),也可以是寡核苷酸,其仅与核酸序列(包括mRNA 5’和3’UTR)的一部分是反义的。例如,反义寡核苷酸序列可以与编码多肽的mRNA转录本的翻译起始位点周围的区域互补。适合的反义寡核苷酸序列长度在本领域是已知的,可从约50、45、40、35、30、25、20、15或10核苷酸长度或更少起始。本发明的反义核酸序列可使用化学合成以及酶连接反应通过本领域已知的方法构建。例如,反义核酸序列(例如,反义寡核苷酸序列)可以使用天然存在的核苷酸或各种改进的核苷酸(为增加分子的生物稳定性或增加反义和有义核酸序列之间形成的双螺旋的物理稳定性而设计)进行化学合成,例如,可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。本领域众所周知可用于产生反义核酸序列的改进的核苷酸实例。已知的核苷酸改进包括甲基化、环化和‘帽’和一个或多个天然存在核苷酸用类似物如肌苷替换。核苷酸的其它改进是本领域众所周知的。
可使用表达载体生物学产生反义核酸序列,其中核酸序列以反义方向亚克隆进入该表达载体(即,转录自插入核酸的RNA与目的靶核酸是反义方向的)。优选地,植物中反义核酸序列通过稳定整合的核酸构建体(包含启动子、有效连接的反义寡核苷酸和终止子)产生。
本发明方法中用于沉默的核酸分子(无论引入植物或在原位产生)与mRNA转录本和/或编码多肽的基因组DNA杂交或结合,由此抑制蛋白质的表达,例如,通过抑制转录和/或翻译。杂交可以通过常规的核苷酸互补形成稳定的双螺旋,或例如,就结合至DNA双螺旋的反义核酸序列而言,通过双螺旋大沟中的特异性相互作用。反义核酸序列可通过转化或在特异组织位点直接注射引入植物中。备选地,可改进反义核酸序列以靶向被选细胞,随后全身性施用。例如,对于全身施用,可改进反义核酸序列,使它们与表达于被选细胞表面上的受体或抗原特异性结合,例如通过将反义核酸序列连接至与细胞表面受体或抗原结合的肽或抗体。也可使用本文所述的载体将反义核酸序列输送至细胞。
另一方面,反义核酸序列是一种a-异头物核酸序列。a-异头物核酸序列与互补的RNA形成特异性双链杂交,其中(与常见的b-单位相反)链相互之间平行(Gaultier等(1987)Nucl Ac Res 15:6625-6641)。反义核酸序列也可包含2′-o-甲基核糖核苷(Inoue等(1987)Nucl Ac Res 15,6131-6148)或嵌合的RNA-DNA类似物(Inoue等(1987)FEBS Lett.215,327-330)。
内源基因表达的降低或基本消除也可使用核酶实施。核酶是有核糖核酸酶活性的催化RNA分子,能切割单链的核酸序列,如mRNA,它们与切割的单链核酸序列具有互补区。因此,核酶(例如,锤头核酶(在Haselhoff和Gerlach(1988)Nature 334,585-591中描述)可用于催化切割编码多肽的mRNA转录本,由此基本上减少将要被翻译成多肽的mRNA转录本的数量。可以设计对核酸序列具有特异性的核酶(见例如:Cech等美国专利号4,987,071;和Cech等美国专利号5,116,742)。备选地,对应于核酸序列的mRNA转录本可用于从RNA分子库中选择具有特定核糖核酸酶活性的催化RNA(Bartel和Szostak(1993)Science 261,1411-1418)。使用核酶用于植物中基因沉默是本领域已知的。(例如,Atkins等(1994)WO 94/00012;Lenne等(1995)WO 95/03404;Lutziger等(2000)WO 00/00619;Prinsen等(1997)WO 97/13865和Scott等(1997)WO 97/38116)。
基因沉默也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如Angell和Baulcombe((1999)Plant J.20(3):357-62)、(Amplicon VIGSWO 98/36083)或Baulcombe(WO 99/15682)及其它人描述的策略而实现。
如果内源基因上有突变,和/或在随后引入植物中的分离的基因/核酸上有突变,也可以发生基因沉默。降低或基本上消除可由非功能性多肽引起。例如,多肽可结合至多种相互作用的蛋白质;因此一个或多个突变和/或截断可提供一种多肽,该多肽仍能结合至相互作用的蛋白质(如受体蛋白质),但不可显示其正常功能(如信号配体)。
基因沉默的另一种方法是通过靶向与基因调节区(例如启动子和/或增强子)互补的核酸序列以形成三重螺旋结构,该结构防止基因在靶细胞中转录。见Helene,C.,Anticancer Drug Res.6,569-84,1991;Helene等,Ann.N.Y.Acad.Sci.660,27-361992和Maher,L.J.Bioassays 14,807-15,1992。
其它方法,如使用针对内源性多肽的抗体以抑制此多肽在植物中的功能,或干扰所述多肽参与的信号途径,对于技术人员将是众所周知的。特别地,可预见人造分子可用于抑制靶多肽的生物学功能或用于干扰靶多肽参与的信号通路。
备选地,可以设立筛选程序以鉴定植物群体中基因的天然变体,该变体编码具有降低活性的多肽。此类天然变体也可用于例如实施同源重组。
人工和/或天然的微RNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源性miRNA是通常19-24个核苷酸长度的单链小RNA。它们的主要功能是调节基因表达和/或mRNA翻译。大多数植物微RNA(miRNA)与它们的靶序列具有完全或近乎完全的互补性。然而,有的天然靶标多达五个错配。它们通过Dicer家族双链特异性核糖核酸酶从更长的非编码RNA(带有特征性折回结构)加工。加工后,通过结合到其主要组分(Argonaute蛋白质)将它们整合入RNA诱导的沉默复合物(RISC)中。由于它们与细胞质中的靶核酸(主要是mRNA)进行碱基配对,MiRNA用作RISC的特异性组分。随后的调节事件包括靶mRNA切割和破坏和/或翻译抑制。因此,miRNA过表达的影响常常反映在靶基因减少的mRNA水平中。
通常21个核苷酸长度的人工微RNA(amiRNA)可以遗传改造以特异性地负调节单个或多个目的基因的基因表达。植物微RNA靶的选择的决定因素是本领域众所周知的。用于靶识别的经验参数已经确定并且可以用来辅助设计特定的amiRNA(Schwab等,Dev.Cell 8:517-527,2005)。用于设计并产生amiRNA及其前体的便利工具也是公众可获得的(Schwab等,Plant Cell 18:1121-1133,2006)。
为优化性能,用于降低内源基因在植物中表达的基因沉默技术需要使用来自单子叶植物的核酸序列以转化单子叶植物,和使用来自双子叶植物的核酸序列以转化双子叶植物。优选地,将来自任何给定植物物种的核酸序列引入同一个物种内。例如,将来自稻的核酸序列转化至稻植物。然而,并非绝对要求待引入的核酸序列起源于与该核酸序列将要引入的植物相同的植物物种。只要内源性靶基因与待引入的核酸之间存在相当大的同源性就足够了。
上文描述的是用于降低或基本去除内源基因在植物中表达的多种方法的例子。本领域技术人员会轻易地能够调整前述用于沉默的方法以至于例如通过利用合适启动子而实现在整株植物或在其部分中降低内源基因的表达。
转化
如本文中所提及的术语“引入”或“转化”包括将外源性多核苷酸转移至宿主细胞内,无论用于转化的方法是什么。能够后续克隆性增殖(无论通过器官发生或胚胎发生)的植物组织可以用本发明的遗传构建体转化并且可以从中再生整株植物。选择的具体组织将取决于可用于并且最适于正进行转化的具体物种的克隆性增殖系统。示例性组织靶包括叶盘、花粉、胚、子叶、下胚轴、大配子体、愈伤组织、已有的分生组织(例如顶端分生组织、腋芽和根分生组织)和诱导的分生组织(例如子叶分生组织和下胚轴分生组织)。多核苷酸可以瞬时或稳定地引入宿主细胞并且可以非整合地维持,例如作为质粒。或者,多核苷酸可以整合至宿主基因组内。产生的转化植物细胞随后可以用来以本领域技术人员已知的方式再生出转化植物。
外来基因转移至植物基因组内称作转化。植物物种的转化现在是相当常规的技术。有利地,几种转化方法中的任一方法可以用来将目的基因引入合适的祖先细胞。用于从植物组织或植物细胞中转化并再生出植物所述的方法可以用于瞬时转化或用于稳定转化。转化方法包括使用脂质体、电穿孔法、增加游离DNA摄入的化学品、DNA直接注射至植物、粒子枪轰击法、使用病毒或花粉的转化法和显微注射。转化方法可以选自用于原生质体的钙/聚乙二醇法(Krens,F.A.等,(1982)Nature 296,72-74;NegrutiuI等(1987)Plant Mol Biol 8:363-373);原生质体的电穿孔法(Shillito R.D.等(1985)Bio/Technol 3,1099-1102);对植物材料的显微注射(Crossway A等,(1986)Mol.Gen Genet 202:179-185);包被有DNA或RNA的粒子轰击法(Klein TM等,(1987)Nature 327:70)、(非整合性)病毒感染法等。转基因植物,包括转基因作物植物,优选地通过农杆菌介导的转化法产生。有利的转化方法是在植物中(in planta)的转化法。为此目的,例如有可能使农杆菌作用于植物种子或有可能用农杆菌接种植物的分生组织。根据本发明已经证明使转化的农杆菌混悬液作用于完整植物或至少作用于花原基是特别有利的。植物随后继续培育直至获得所处理植物的种子(Clough和Bent,Plant J.(1998)16,735-743)。用于农杆菌介导的稻转化的方法包括用于稻转化的公知方法,如在任一以下文献中描述的那些方法:欧洲专利申请EP 1198985 A1,Aldemita和Hodges(Planta 199:612-617,1996);Chan等(Plant Mol Biol 22(3):491-506,1993),Hiei等(Plant J 6(2):271-282,1994),其公开内容在本文中引入作为参考,如同完全给出那样。在玉米转化的情况下,优选的方法如Ishida等(Nat.Biotechnol 14(6):745-50,1996)或Frame等(Plant Physiol 129(1):13-22,2002)描述,其公开内容在本文中如充分所述那样引入作为参考。所述方法通过举例方式进一步由B.Jenes等,Techniques for Gene Transfer,在:Transgenic Plants,第1卷,Engineering and Utilization,编者S.D.Kung和R.Wu,AcademicPress(1993)128-143及在Potrykus Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991)205-225)中描述。待表达的核酸或构建体优选地克隆至适于转化根癌农杆菌(Agrobacterium tumefaciens)的载体中,例如pBin19(Bevan等,Nucl.Acids Res.12(1984)8711)。由这种载体转化的农杆菌随后可以按照已知方式用于转化植物,例如作为模型使用的植物,如拟南芥(拟南芥属于本发明的范围,不视为作物植物)或作物植物如,例如烟草植物,例如通过在农杆菌溶液中浸泡擦伤的叶或切碎的叶并随后将它们在合适的培养基内培育。植物通过根癌农杆菌的转化例如由和Willmitzer在Nucl.Acid Res.(1988)16,9877中描述或尤其从F.F.White,Vectors for GeneTransfer in Higher Plants;在Transgenic Plants,第1卷,Engineering andUtilization,编者S.D.Kung和R.Wu,Academic Press,1993,第15-38页中获知。
除了转化体细胞(其随后必须再生成完整植物)之外,还有可能转化植物分生组织的细胞及特别转化发育成配子的那些细胞。在这种情况下,转化的配子遵循天然的植物发育过程,产生转基因植物。因此,例如拟南芥种子用农杆菌处理并且从发育植物中获得种子,其中一定比例的所述植物受到转化并且因此是转基因的[Feldman,KA和Marks MD(1987)Mol GenGenet.208:274-289;Feldmann K(1992)。在:编者C Koncz,N-H Chua和J Shell,Methods in Arabidopsis Research.Word Scientific,Singapore,第274-289页]。替代性方法基于反复去掉花序并使莲座中心中的切除部位与转化的农杆菌孵育,因而转化的种子同样可以在较晚的时间点获得(Chang(1994)Plant J.5:551-558;Katavic(1994).Mol Gen Genet,245:363-370)。然而,尤其有效的方法是改进的真空渗入法,如“花浸染”法。在拟南芥真空渗入法的情况下,完整植物在减压下用农杆菌混悬液处理[Bechthold,N(1993).C R Acad Sci Paris Life Sci,316:1194-1199],而在“花浸染”法的情况下,正在发育的花组织与表面活性剂处理的农杆菌混悬液短暂孵育[Clough,SJ和Bent,AF(1998)The Plant J.16,735-743]。在两种情况下收获了一定比例的转基因种子,并且这些种子可以通过在如上所述的选择条件下培育而与非转基因种子区分。此外,质体的稳定转化是有利的,因为质体在大部分作物中以母体方式遗传,降低或消除了转基因经花粉流动风险。叶绿体基因组的转化一般通过已在Klaus等,2004[Nature Biotechnology 22(2),225-229]中示例性加以展示的方法实现。简而言之,待转化的序列连同可选择标记基因一起克隆至与叶绿体基因组同源的侧翼序列之间。这些同源的侧翼序列指导位点特异性整合至原质体系内。已经对众多不同植物物种描述了质体转化并且综述可以出自Bock(2001)在基础研究和植物生物技术中的转基因质体(Transgenicplastids in basic research and plant biotechnology).J Mol Biol.2001年9月21日;312(3):425-38或Maliga,P(2003)质体转化技术商业化进展(Progress towards commercialization of plastid transformationtechnology).Trends Biotechnol.21,20-28。进一步生物技术进展最近已经以无标记质体转化体的形式作了报道,所述无标记质体转化体可以通过瞬时共整合的标记基因产生(Klaus等,2004,Nature Biotechnology 22(2),225-229)。
通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与目的基因共转移的植物可表达基因编码,继之将转化的材料再生成整个植物。为选择转化的植物,通常将在转化过程中获得的植物材料置于选择性条件下,从而可将转化的植物与非转化植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长期之后,通过喷雾对其进行合适的选择。另一可能方案是使用合适的选择剂,将种子(适当时在灭菌之后)种在琼脂板上,从而仅转化的种子能够长成植物。备选地,针对转化的植物筛选可选择标记(如上文所述标记)的存在。
DNA转移和再生之后,还可评价推定转化的植物,例如用Southern分析,评价目的基因的存在、拷贝数和/或基因组构造。备选地或额外地,可用Northern和/或Western分析监测新引入的DNA的表达水平,这两种技术都是本领域普通技术人员所众所周知的。
产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例如,第一代(或T1)转化的植物可自交,选择纯合的第二代(或T2)转化体,而T2植物可进一步通过经典育种技术繁殖。产生的转化生物体可以有多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆的转化体(例如所有细胞经转化含有表达盒);转化和非转化组织的嫁接体(例如在植物中,转化的根状茎嫁接到非转化的接穗上)。
T-DNA激活标签化
T-DNA激活标签化(Hayashi等Science(1992)1350-1353)涉及在目的基因的基因组区域内或基因编码区上游或下游10kb处以如此结构插入T-DNA(通常含有启动子,也可以是翻译增强子或内含子),使得启动子指导被靶定基因的表达。通常,由靶定基因的天然启动子对所述靶定基因表达的调节作用遭到破坏并且该基因处在新引入的启动子控制下。启动子一般嵌入在T-DNA中。这种T-DNA随机地插入植物基因组,例如通过农杆菌感染,并导致在所插入T-DNA附近的基因的经修饰的表达。因靠近所引入启动子的基因的经修饰的表达,产生的转基因植物表现显性表型。
TILLING
术语“TILLING”是“基因组内定向诱导的局部损伤”的缩写,指用于产生和/或鉴定核酸的诱变技术,其中所述的核酸编码具有修饰的表达和/或活性的蛋白质。TILLING还允许选择携带此类突变变体的植物。这些突变变体可以显示在强度方面或在位置方面或在时间方面经修饰的表达(例如若突变影响启动子)。这些突变变体可以显示比由处于其天然形式的基因所显出活性更高的活性。TILLING将高密度诱变与高通量筛选方法组合。一般在TILLING中遵循的步骤是:(a)EMS诱变(Redei GP和KonczC(1992)在Methods in Arabidopsis Research,Koncz C,Chua NH,SchellJ编辑,Singapore,World Scientific Publishing Co,第16-82页;Feldmann等,(1994)在Meyerowitz EM,Somerville CR编辑,Arabidopsis.ColdSpring Harb或Laboratory Press,Cold Spring Harbor,NY,第137-172页;Lightner J和Caspar T(1998)在J Martinez-Zapater,J Salinas编者,Methods on Molecular Biology第82卷.Humana Press,Totowa,NJ,第91-104页);(b)个体的DNA制备和汇集;(c)PCR扩增目的区;(d)变性和退火以允许形成异源双链体;(e)DHPLC,其中将异源双链体在汇集物中的存在检测为色谱图之一额外峰;(f)鉴定突变个体;和(g)对突变PCR产物测序。用于TILLING的方法是本领域众所周知的(McCallum等,(2000)Nat Biotechnol 18:455-457;综述见Stemple(2004)Nat Rev Genet 5(2):145-50)。
同源重组
同源重组允许选择的核酸在基因组中于确定的所选择位置内引入。同源重组是在生物科学中常规地用于低等生物如酵母或苔藓剑叶藓(Physcomitrella)的标准技术。用于在植物中开展同源重组的方法已经不仅对模式植物(Offringa等,(1990)EMBO J 9(10):3077-84)而且对作物植物例如稻(Terada等,(2002)Nat Biotech 20(10):1030-4;Iida和Terada(2004)Curr Opin Biotech 15(2):132-8)进行了描述,并且不论何种目标生物,都存在一般可用的方法(Miller等,Nature Biotechnol.25,778-785,2007)。
产量相关性状
产量相关性状包括下述一项或多项:早期开花时间;产量、生物量、种子产量、早期萌发势、绿度指数、增加的生长速率、改进的农学性状(如改进的用水效率(WUE)、氮利用效率(NUE)等)。
产量
术语“产量”通常意指经济价值的可测量结果,一般与指定作物、与面积并与时间段有关。单个植物部分基于它们的数目、大小和/或重量而直接对产量有贡献,或实际产量是对于某作物而言一年内每平方米的产量,这通过总产量(包括收获的和评价的产量)除以种植的平方米数而确定。在本文中可互换使用的术语植物的“产量”和“植物产量”可以与该植物的营养体生物量如根和/或苗生物量、繁殖器官和/或繁殖体例如种子有关。
以玉米为例,产量增加可以表现为下列一种或多种指标:每平方米中已建立植物数的增加、每株植物穗数的增加、行数、每行粒数、粒重、千粒重、玉米穗长度/直径的增加、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其它。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每平方米植物数、每株植物穗(panicle)数、穗长度、每穗小穗数、每穗花(小花)数、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其它。在稻中,浸没耐受性也可以产生增加的产量。
早期开花时间
如本文中所用,具有“早期开花时间”的植物是比对照植物更早开始开花的植物。因此该术语指显示出更早开始开花的植物。植物的开花时间可以通过计数播种和第一个花序出现之间的天数(“开花时间”)评价。植物的“开花时间”可以例如使用如在WO 2007/093444中所述的方法测定。
早期萌发势
“早期萌发势”指活跃、健康、良好平衡的生长(特别是在植物生长早期期间),并可以因植物适合度增加而产生,其原因在于例如植物更好地适应其环境(即优化能源的使用和苗与根之间的分配)。具有早期萌发势的植物也显示增加的幼苗存活和更好的作物建立,这往往导致高度均匀的田块(作物整齐地生长,即大多数植物在基本上相同的时间上达到发育的各阶段)和往往更好及更高的产量。因而,早期萌发势可以通过测量多种因素如千粒重、萌发百分数、出苗百分数、幼苗生长、幼苗高度、根长度、根及苗生物量和众多其它因素而确定。
增加的生长速率
增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如发芽的速度、早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期之一或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许再播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其它稻植物,全部均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许再播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其它合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每平方米的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物而言在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其90%最大尺寸所花费的时间),等等。
胁迫抗性
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物暴露于其的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%、30%或25%,更优选小于20%或15%。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌、线虫和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于对照植物而具有增加的产量的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交叉(cross talk)”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。最佳生长下生长的植物(在非胁迫条件下生长)一般出产以递增优选顺序至少97%、95%、92%、90%、87%、85%、83%、80%、77%或75%的给定环境下这样植物的平均生产。平均生产可以收获和/或季节为基础进行计算。本领域技术人员清楚作物的平均产量生产。
营养缺乏可以由营养物(例如氮、磷和其它含磷化合物、钾、钙、镁、锰、铁或者硼以及其它)缺少引起。
术语盐胁迫不限于常见盐(NaCl),可以为以下一种或多种:NaCl、KCl、LiCl、MgCl2、CaCl2等。
增加/改进/增强
术语“增加”、“改进”或“增强”是可互换的并且应当在本申请含义上指与如本文中定义的对照植物相比至少3%、4%、5%、6%、7%、8%、9%或10%、优选至少15%或20%、更优选25%、30%、35%或40%更多的产量和/或生长。
种子产量
增加的种子产量本身可以表现为下列一种或多种指标:
a)种子生物量(种子总重量)增加,这可以基于单粒种子和/或每株植物和/或每平方米;
b)每株植物增加的花数;
c)增加的种子数和/或增加的饱满种子数;
d)增加的种子饱满率(其表述为饱满种子数除以种子总数的比率);
e)增加的收获指数,其表述为可收获部分(如种子)产量除以总生物量(即植物地上部分的生物量)的比率;和
f)增加的千粒重(TKW),其从计数的饱满种子数及其总重量外推而来。
增加的TKW可以因增加的种子大小和/或种子重量所致,并且也可以因胚和/或胚乳尺寸的增加所致。
种子产量的增加也可以表现为种子大小和/或种子体积的增加。此外,种子产量的增加本身也可以表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的增加。
绿度指数
如本文所用的“绿度指数”根据植物的数字图像计算。对于图像中属于植物目标的每一个像素,计算绿色值相对于红色值(在用于编码颜色的RGB模型中)之比。绿度指数表达为绿红比超过给定阈值的像素百分比。在正常生长条件下、在盐胁迫生长条件下、及在养分利用度下降的生长条件下,测量开花前末次成像时的植物绿度指数。相反,在干旱胁迫生长条件下,测量干旱后首次成像时的植物绿度指数。
生物量
如本文中所用的术语“生物量”意图指植物的总重量。在定义生物量的情况下,在植物的一个或多个部分的生物量之间可以进行区分,所述植物的一个或多个部分可以包括:
-地上(可收获)部分例如但不限于苗生物量、种子生物量、叶生物量等和/或
-地下(可收获)部分,例如但不限于根生物量等,和/或
-营养生物量例如根生物量、苗生物量等,和/或
-繁殖器官,和/或
-繁殖体例如种子。
标记辅助的育种
这种育种程序有时需要通过使用例如EMS诱变法对植物作诱变处理而引入等位基因变异;备选地,该程序可以从非故意引起的所谓“自然”起源的等位变体集合开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论序列的优选等位变体且其导致增加的产量的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温室中或田间监测生长性能。其它任选步骤包括将鉴定到有优选等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
探针在(遗传作图)中的用途
编码目的蛋白质的核酸用于遗传和物理作图,该基因仅需要具有至少15个核苷酸长度的核酸序列。这些核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹(SambrookJ,Fritsch EF和Maniatis T(1989)Molecular Cloning,A LaboratoryManual)可以用编码目的蛋白质的核酸序列来探测。产生的条带图谱随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算编码目的蛋白质的核酸在使用这个群体先前所获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改进方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、近等基因系和其它个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸序列探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.5:13-20),然而灵敏度的改进可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸序列扩增的方法可以使用所述核酸序列而实施。例子包括等位基因特异的扩增(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员众所周知的。在使用基于PCR遗传作图的方法中,可能必须鉴定在对应于当前核酸序列的整个区域内作图亲代间的DNA序列差异。然而,这对于作图法而言通常不是必需的。
植物
如本文中所用的术语“植物”包括整株植物、植物的祖先及后代和植物部分,包括种子、苗、茎、叶、根(包括块茎)、花和组织及器官,其中每种所提及对象包含目的基因/核酸。术语“植物”也包括植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样每种提及的对象包含目的基因/核酸。
特别用于本发明方法中的植物包括属于植物界(Viridiplantae)超家族的全部植物,尤其单子叶植物和双子叶植物,包括选自以下的饲用或饲料豆类、观赏植物、粮食作物、树或灌木:槭树属物种(Acer spp.)、猕猴桃属物种(Actinidia spp.)、秋葵属物种(Abelmoschus spp.)、剑麻(Agavesisalana)、冰草属物种(Agropyron spp.)、匍匐剪股颖(Agrostisstolonifera)、葱属物种(Allium spp.)、苋属物种(Amaranthus spp.)、欧洲海滨草(Ammophila arenaria)、凤梨(Ananas comosus)、番荔枝属物种(Annona spp.)、芹菜(Apium graveolens)、落花生属物种(Arachis spp.)、木波罗属物种(Artocarpus spp.)、石刁柏(Asparagus officinalis)、燕麦属物种(Avena spp.)(例如燕麦(Avena sativa)、野燕麦(Avena fatua)、比赞燕麦(Avena byzantina)、Avena fatua var.sativa、杂种燕麦(Avena hybrida))、阳桃(Averrhoa carambola)、箣竹属物种(Bambusa sp.)、冬瓜(Benincasahispida)、巴西栗(Bertholletia excelsea)、甜菜(Beta vulgaris)、芸苔属物种(Brassica spp.)(例如欧洲油菜(Brassica napus)、芜青物种(Brassica rapassp.)[芸苔(canola)、油菜(oilseed rape)、蔓青(turnip rape)])、Cadabafarinosa、茶(Camellia sinensis)、美人蕉(Canna indica)、大麻(Cannabissativa)、辣椒属物种(Capsicum spp.)、天麻苔草(Carex elata)、番木瓜(Caricapapaya)、大果假虎刺(Carissa macrocarpa)、山核桃属物种(Carya spp.)、红花(Carthamus tinctorius)、栗属物种(Castanea spp.)、美洲木棉(Ceibapentandra)、苦苣(Cichorium endivia)、樟属物种(Cinnamomum spp.)、西瓜(Citrullus lanatus)、柑桔属物种(Citrus spp.)、椰子属物种(Cocos spp.)、咖啡属物种(Coffea spp.)、芋头(Colocasia esculenta)、非洲梧桐属物种(Colaspp.)、黄麻属物种(Corchorus sp.)、芫荽(Coriandrum sativum)、榛属物种(Corylus spp.)、山楂属物种(Crataegus spp.)、番红花(Crocus sativus)、南瓜属物种(Cucurbita spp.)、香瓜属物种(Cucumis spp.)、菜蓟属物种(Cynaraspp.)、胡萝卜(Daucus carota)、山马蝗属物种(Desmodium spp.)、龙眼(Dimocarpus longan)、薯蓣属物种(Dioscorea spp.)、柿树属物种(Diospyrosspp.)、稗属物种(Echinochloa spp.)、油棕属(Elaeis)(例如油棕(Elaeisguineensis)、美洲油棕(Elaeis oleifera))、穇子(Eleusine coracana)、Eragrostistef、蔗茅属物种(Erianthus sp.)、枇杷(Eriobotrya japonica)、桉属物种(Eucalyptus sp.)、红仔果(Eugenia uniflora)、荞麦属物种(Fagopyrum spp.)、水青冈属物种(Fagus spp.)、苇状羊茅(Festuca arundinacea)、无花果(Ficuscarica)、金桔属物种(Fortunella spp.)、草莓属物种(Fragaria spp.)、银杏(Ginkgo biloba)、大豆属物种(Glycine spp.)(例如大豆(Glycine max)、大豆(Soja hispida)或大豆(Soja max))、陆地棉(Gossypium hirstum)、向日葵属物种(Helianthus spp.)(例如向日葵(Helianthus annuus))、长管萱草(Hemerocallis fulva)、木槿属物种(Hibiscus spp.)、大麦属物种(Hordeumspp.)(例如大麦(Hordeum vulgare))、甘薯(Ipomoea batatas)、核桃属物种(Juglans spp.)、莴苣(Lactuca sativa)、山黧豆属物种(Lathyrus spp.)、兵豆(Lens culinaris)、亚麻(Linum usitatissimum)、荔枝(Litchi chinensis)、百脉根属物种(Lotus spp.)、棱角丝瓜(Luffa acutangula)、羽扇豆属物种(Lupinus spp.)、Luzula sylvatica、番茄属物种(Lycopersicon spp.)(例如番茄(Lycopersicon esculentum)、Lycopersicon lycopersicum、Lycopersiconpyriforme)、硬皮豆属物种(Macrotyloma spp.)、苹果属物种(Malus spp.)、凹缘金虎尾(Malpighia emarginata)、牛油果(Mammea americana)、芒果(Mangifera indica)、木薯属物种(Manihot spp.)、人心果(Manilkarazapota)、紫苜蓿(Medicago sativa)、草木樨属物种(Melilotus spp.)、薄荷属物种(Mentha spp.)、芒(Miscanthus sinensis)、苦瓜属物种(Momordicaspp.)、黑桑(Morus nigra)、芭蕉属物种(Musa spp.)、烟草属物种(Nicotianaspp.)、木犀榄属物种(Olea spp.)、仙人掌属物种(Opuntia spp.)、鸟足豆属物种(Ornithopus spp.)、稻属物种(Oryza spp.)(例如稻、阔叶稻(Oryzalatifolia))、稷(Panicum miliaceum)、柳枝稷(Panicum virgatum)、鸡蛋果(Passiflora edulis)、欧防风(Pastinaca sativa)、狼尾草属物种(Pennisetumsp.)、鳄梨属物种(Persea spp.)、芹菜(Petroselinum crispum)、虉草(Phalarisarundinacea)、菜豆属物种(Phaseolus spp.)、猫尾草(Phleum pratense)、刺葵属物种(Phoenix spp.)、南方芦苇(Phragmites australis)、酸浆属物种(Physalis spp.)、松属物种(Pinus spp.)、阿月浑子(Pistacia vera)、豌豆属物种(Pisum spp.)、早熟禾属物种(Poa spp.)、杨属物种(Populus spp.)、牧豆草属物种(Prosopis spp.)、李属物种(Prunus spp.)、番石榴属物种(Psidiumspp.)、石榴(Punica granatum)、西洋梨(Pyrus communis)、栎属物种(Quercus spp.)、萝卜(Raphanus sativus)、波叶大黄(Rheumrhabarbarum)、茶藨子属物种(Ribes spp.)、蓖麻(Ricinus communis)、悬钩子属物种(Rubus spp.)、甘蔗属物种(Saccharum spp.)、柳属物种(Salixsp.)、接骨木属物种(Sambucus spp.)、黑麦(Secale cereale)、胡麻属物种(Sesamum spp.)、白芥属物种(Sinapis sp.)、茄属物种(Solanum spp.)(例如马铃薯(Solanum tuberosum)、红茄(Solanum integrifolium)或番茄(Solanum lycopersicum))、高粱(Sorghum bicolor)、菠菜属物种(Spinaciaspp.)、蒲桃属物种(Syzygium spp.)、万寿菊属物种(Tagetes spp.)、酸豆(Tamarindus indica)、可可树(Theobroma cacao)、车轴草属物种(Trifoliumspp.)、Tripsacum dactyloides、黑小麦物种(Triticale sp.)、Triticosecalerimpaui、小麦属物种(Triticum spp.)(例如普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、圆柱小麦(Triticum turgidum)、Triticumhybernum、马卡小麦(Triticum macha)、普通小麦(Triticum sativum)、Triticum monococcum或普通小麦(Triticum vulgare))、小金莲花(Tropaeolum minus)、金莲花(Tropaeolum majus)、越桔属物种(Vacciniumspp.)、野碗豆属物种(Vicia spp.)、豇豆属物种(Vigna spp.)、香堇(Violaodorata)、葡萄属物种(Vitis spp.)、玉蜀黍(Zea mays)、Zizania palustris、枣属物种(Ziziphus spp.)等等。
对照植物
选择合适的对照植物是实验设置的常规部分并且可以包括对应的野生型植物或无目的基因的对应植物。对照植物一般是与待评价植物属于相同的植物物种或甚至是相同的品种。对照植物也可以是待评价植物的失效合子。失效合子是通过分离丢失转基因的个体。如本文中所用的“对照植物”不仅指整株植物,还指植物部分,包括种子及种子部分。
发明详述
意想不到的是,现在发现调节编码eRF1多肽之核酸在植物中的表达产生相对于对照植物而言具有增强的产量相关性状的植物。根据第一个实施方案,本发明提供了在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码eRF1多肽之核酸的表达,和任选地选择具有增强的产量相关性状的植物。
本发明还提供了迄今未知的编码eRF1的核酸,以及eRF1多肽。
根据本发明另外的实施方案,从而提供了分离的核酸分子,选自:
(i)由以下核酸序列:具有SEQ ID NO:15的G.max_GM06MC33657_sm55b1032878;具有SEQ ID NO:17的H.vulgare_c64960768hv270303的任一表示的核酸;
(ii)由所述序列:具有SEQ ID NO:15的G.max_GM06MC33657_sm55b1032878;具有SEQ ID NO:17的H.vulgare_c64960768hv2703032598表示的核酸的互补序列;
(iii)编码由具有SEQ ID NO:16的G.max_GM06MC33657_sm55b1032878;具有SEQ ID NO:18的H.vulgare_c64960768hv270303的任一表示的多肽的核酸,优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQ ID NO:16和18的任一表示的多肽序列,并且还优选地赋予相对于对照植物而言增强的产量相关性状。
(iv)核酸,所述核酸以递增的优先顺序与表A1的任一核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi)编码eRF1多肽的核酸,所述eRF1多肽以递增的优先顺序与由SEQ ID NO:16和18的任一表示的氨基酸序列和表A1中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
根据本发明另外的实施方案,从而还提供了分离的多肽,选自:
(i)由SEQ ID NO:16和18的任一表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:16和18的任一表示的氨基酸序列和表A1中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
此外,意想不到的是,现在发现调节编码SCAMP样多肽之核酸在植物中的表达产生相对于对照植物而言具有增强的产量相关性状的植物。根据第一个实施方案,本发明提供了在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码SCAMP样多肽之核酸的表达,和任选地选择具有增强的产量相关性状的植物。
本发明还提供了迄今未知的编码SCAMP样的核酸,以及多肽。
根据本发明另外的实施方案,从而提供了分离的核酸分子,选自:(i)由SEQ ID NO:100、102、104、106、180、182、184、186、188、190和192的任一表示的核酸;
(ii)由(i)项SEQ ID NO:100、102、104、106、108、182、184、186、188、190和192的任一表示的核酸的互补序列;
(iii)编码由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的多肽的核酸;优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的多肽序列,并且另外优选地赋予相对于对照植物而言增强的产量相关性状。
(iv)核酸,所述核酸以递增的优先顺序与表A2的任一核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi)编码多肽的核酸,所述多肽以递增的优先顺序与由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的氨基酸序列和表A2中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
根据本发明另外的实施方案,从而还提供了分离的多肽,选自:
(i)由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的氨基酸序列和表A2中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
此外,意想不到的是,现在发现调节编码肌原纤蛋白多肽之核酸在植物质体中的表达产生相对于对照植物而言具有增强的产量相关性状的植物。根据第一个实施方案,本发明提供了在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物质体中编码肌原纤蛋白多肽之核酸的表达,和任选地选择具有增强的产量相关性状的植物。
根据本发明另外的实施方案,从而提供了分离的核酸分子,选自:
(i)由以下核酸序列的任一表示的核酸:具有SEQ ID NO:206的B.napus_BN06MC20042_4649927919975;具有SEQ ID NO:220的G.max_GM06MC 19234_5969470918873;
(ii)由所述序列:具有SEQ ID NO:206的B.napus_BN06MC20042_4649927919975;具有SEQ ID NO:220的G.max_GM06MC19234_5969470918873表示的核酸的互补序列;
(iii)编码由SEQ ID NO:207;SEQ ID NO:221的任一表示的多肽的核酸,优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQID NO:207和221的任一表示的多肽序列,并且还优选地赋予相对于对照植物而言增强的产量相关性状。
(iv)核酸,所述核酸以递增的优先顺序与表A3的任一核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且还优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi)编码肌原纤蛋白多肽的核酸,所述肌原纤蛋白多肽以递增的优先顺序与由SEQ ID NO:207和221的任一表示的氨基酸序列和表A3中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
根据本发明另外的实施方案,从而还提供了分离的多肽分子,选自:
(i)由SEQ ID NO:207和221的任一表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:207和221的任一表示的氨基酸序列和表A3中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
此外,意想不到的是,现在发现调节编码PLATZ多肽之核酸在植物中的表达产生相对于对照植物而言具有增强的产量相关性状的植物。根据第一个实施方案,本发明提供了在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码PLATZ多肽之核酸的表达,和任选地选择具有增强的产量相关性状的植物。
本发明还提供了迄今未知的编码PLATZ的核酸,以及PLATZ多肽。
根据本发明另外的实施方案,从而提供了分离的核酸分子,选自:
(i)由SEQ ID NO:354表示的核酸;
(ii)由SEQ ID NO:354表示的核酸的互补序列;
(iii)编码PLATZ多肽的核酸,所述PLATZ多肽以递增的优先顺序与由SEQ ID NO:355表示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性,并且以递增的优先顺序与在本文中所定义的基序的一个或多个具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性。
根据本发明另外的实施方案,从而还提供了分离的多肽分子,选自:
(i)由SEQ ID NO:355表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:355表示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性,并且以递增的优先顺序与在本文中所定义的基序的一个或多个具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
此外,意想不到的是,现在发现调节编码PLST样多肽之核酸在植物中的表达产生相对于对照植物而言具有增强的产量相关性状的植物。根据第一个实施方案,本发明提供了在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码PLST样多肽之核酸的表达,和任选地选择具有增强的产量相关性状的植物。
本发明还提供了迄今未知的编码PLST样的核酸,以及PLST样多肽。
根据本发明另外的实施方案,从而提供了分离的核酸分子,选自:(i)由以下核酸序列的任一表示的核酸:具有SEQ ID NO:414;SEQ ID NO:426;SEQ ID NO:428;SEQ ID NO:434;SEQ ID NO:438;
(ii)由所述具有SEQ ID NO:414;SEQ ID NO:426;SEQ ID NO:428;SEQ ID NO:434;SEQ ID NO:438的序列表示的核酸的互补序列;
(iii)编码由具有SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ ID NO:435;SEQ ID NO:439的任一表示的多肽的核酸,优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ ID NO:435;SEQ ID NO:439的任一表示的多肽序列,并且另外优选地赋予相对于对照植物而言增强的产量相关性状。
(iv)核酸,所述核酸以递增的优先顺序与表A5的任一核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi)编码PLST样多肽的核酸,所述PLST样多肽以递增的优先顺序与由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ ID NO:435;SEQ ID NO:439的任一表示的氨基酸序列和表A5中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地包含基序19至21和44至60和PF结构域,赋予相对于对照植物而言增强的产量相关性状。
根据本发明另外的实施方案,从而还提供了分离的多肽分子,选自:
(i)由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ IDNO:435;SEQ ID NO:439的任一表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ ID NO:435;SEQ ID NO:439的任一表示的氨基酸序列和表A5中的任一其他氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地包含基序19至21和44至60和PF结构域,赋予相对于对照植物而言增强的产量相关性状。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
此外,意想不到的是,现在发现调节编码Glomalin多肽之核酸在植物中的表达产生相对于对照植物而言具有增强的产量相关性状的植物。根据第一个实施方案,本发明提供了在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码Glomalin多肽之核酸的表达,和任选地选择具有增强的产量相关性状的植物。
本发明还提供了迄今未知的编码Glomalin的核酸,以及Glomalin多肽。
根据本发明另外的实施方案,从而提供了分离的核酸分子,选自:
(i)由SEQ ID NO:568、SEQ ID NO:569或SEQ ID NO:570之一表示的核酸;
(ii)由SEQ ID NO:568、SEQ ID NO:569或SEQ ID NO:570之一表示的核酸的互补序列;
(iii)编码Glomalin多肽的核酸,所述Glomalin多肽以递增的优先顺序与由SEQ ID NO:592、SEQ ID NO:593或SEQ ID NO:594之一表示的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且另外地或备选地包含一个或多个基序,所述基序以递增的优先顺序与基序31至43(SEQ ID NO:596至SEQ ID NO:608)之一比较具有两个、一个序列错配或者没有序列错配,并还优选地赋予相对于对照植物而言增强的产量相关性状。
(iv)核酸分子,所述核酸分子在高严格杂交条件下与(i)至(iii)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状。
根据本发明另外的实施方案,从而还提供了分离的多肽分子,选自:
(i)由SEQ ID NO:592、SEQ ID NO:593或SEQ ID NO:594之一表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:592、SEQ ID NO:593或SEQ ID NO:594之一表示的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且另外地或备选地包含一个或多个基序,所述基序以递增的优先顺序与基序41至43(SEQID NO:596至SEQ ID NO:608)之一比较具有两个、一个序列错配或者没有序列错配,并另外优选地赋予相对于对照植物而言增强的产量相关性状。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
用于调节(优选增加)编码eRF1多肽之核酸的表达的优选的方法是通过在植物中引入和表达编码eRF1多肽之核酸。用于调节(优选增加)编码SCAMP样多肽之核酸的表达的另一优选方法是通过在植物中引入和表达编码SCAMP样多肽之核酸。用于调节(优选增加)编码肌原纤蛋白多肽之核酸的表达的又另一优选方法是通过在植物中引入和表达编码肌原纤蛋白多肽之核酸。用于调节(优选增加)编码PLATZ多肽之核酸的表达的另一优选方法是通过在植物中引入和表达编码PLATZ多肽之核酸。用于调节(优选增加)编码PLST样多肽之核酸的表达的还另一优选方法是通过在植物中引入和表达编码PLST样多肽之核酸。用于调节(优选增加)编码Glomalin多肽之核酸的表达的另一优选方法是通过在植物中引入和表达编码Glomalin多肽之核酸。
在一个实施方案中,“用于本发明方法的蛋白质”指本文所定义的eRF1多肽。在另一实施方案中,“用于本发明方法的核酸”指能够编码此eRF1多肽的核酸。在这种实施方案中,待引入植物(因此可用于实施本发明方法)的核酸是编码现将描述的蛋白质类型的任何核酸,下文也称为“eRF1核酸”或“eRF1基因”。
如本文中所定义,“eRF1多肽”指包含至少3个共有结构域-eRF1结构域1、eRF1结构域2和eRF1结构域3(PFam登录号分别为PF03463、PF03464和PF03465)的任一多肽。
优选地,eRF1多肽的eRF1结构域1以递增的优先顺序与位于SEQ IDNO 2的氨基酸6和140之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
优选地,eRF1多肽的eRF1结构域2以递增的优先顺序与位于SEQ IDNO 2的氨基酸144和278之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
优选地,eRF1多肽的eRF1结构域3以递增的优先顺序与位于SEQ IDNO 2的氨基酸281和418之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
本发明另外优选的eRF1多肽包含一个或多个以下多肽:分别具有SEQID NO:73、74和75的GGQ、NIKS和[GA][IMLV]LR[YW]。
备选地,用于本发明方法的eRF1多肽包含一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
基序1:
FGTLSGNTREVLHKF[TS]VDLPKKHGRGGQSALRFARLRMEKRHNYVRK[TV]AE(SEQ ID NO:76);
基序2:
YN[KR]VPPNGLVLY[TC]GT[IV]VT[ED][DE]GKEKKV[TN]IDFEPF[KR]PIN[AT]SLYLCDNKFHTE(SEQ ID NO:77);
基序3:
ARGNGTSMISLI[MI]PP[RK]DQ[IV]SRVTKML[GA]DE[YF]GTASNIKSRVNR[QL]SVL[GS]AIT(SEQ ID NO:78)具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
本文中以括号指出的氨基酸表示可以由任一其他氨基酸取代。
基序1至3在任一eRF1多肽中通常可见。
在本发明另一优选的实施方案中,本发明的eRF1多肽可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
基序4:
F[TS]VDLPKKHGRGGQSALRFARLR[EM]EKRHNYVRKVAE[VL]A[VT]QNFITND[KR][PV]NV(SEQ ID NO:79);
基序5:
Y[NT][KR]VPPNGLV[VLI]YCG[TD][IV][ILM]T[ED][ED]GKE[KR]K[VM][NT]ID[FI]EPFKPINTSLYLCDNKFHTE(SEQ ID NO:80);
基序6:
ARGNGTSMISL[IV][IM]PPK[DG]Q[IV]S[RL]V[QA]KML[AT][DE]EYGTASNIKSRVNR[LQ]SVL[SG]AIT(SEQ ID NO:81)具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
基序4、5和6对应于非链形植物(non-Streptophyta)来源的eRF1多肽中代表保守蛋白质区域的共有序列。
更优选地,本发明的eRF1多肽可以包含任意一个或多个以下序列基序,所述序列基序以递增的优先顺序与任一以下基序:
基序7:
VDLPKKHGRGGQSALRFARLRMEKRHNYVRKTAELATQF[YF]INPATSQPNV(SEQ ID NO:82)
基序8:
YNKVPPNGLVLYTGTIVT[ED]DGKEKKVTIDFEPF[KR]PINASLYLCDNKFHTE(SEQ ID NO:83)
基序9:
TSMISLIMPPRDQ[VI]SRVTKMLGDE[FY]GTASNIKSRVNRQSVLGAITSAQQR(SEQ ID NO:84)具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
基序7、8和9对应于如下共有序列,所述共有序列代表拟南芥属于的链形植物簇的eRF1多肽中的保守蛋白质区域。
应当理解,本文所指的基序1、2、3、4、5、6、7、8和9代表在特定eRF1多肽中,优选在表A1的任一eRF1多肽中,更优选在SEQ ID NO:2中存在的同源基序的共有序列。本文中所定义的基序并不限于其各个序列,并且它们包括在任一eRF1中存在的同源基序。
鉴定与用于本发明方法的多肽中的基序1至9同源的基序的方法是本领域众所周知的。例如,可以使用算法例如Blast(Altschul等人(1990)J MolBiol 215:403-10),通过将它们的各个氨基酸序列比对而将多肽与基序比较,以鉴定具有类似序列的区域。
备选地,eRF1多肽的同源物以递增的优先顺序与由表A1的任一多肽,优选地由SEQ ID NO:2表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性,只要同源多肽包括如上所述的保守基序。整体序列同一性使用全局比对算法,如GAP程序(GCGWisconsin Package,Accelrys)中的Needleman Wunsch算法,优选用默认参数并优选使用成熟蛋白质的序列(即,不考虑分泌信号或转运肽)来进行确定。与整体序列同一性相比,当仅考虑保守结构域或基序时,序列同一性通常较高。对于局部比对,Smith-Waterman算法是特别有用的(SmithTF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
优选地,eRF1多肽的序列,当用于构建系统树(例如图1中描述的)时,与包含由SEQ ID NO:2表示的氨基酸序列的eRF1多肽的群聚簇。
在另一实施方案中,“用于本发明方法的蛋白质/多肽”指本文所定义的SCAMP样多肽。在另一实施方案中,“用于本发明方法的核酸”指能够编码此SCAMP样多肽的核酸。在此种实施方案中,待引入植物(因此可用于实施本发明方法)的核酸是编码现将描述的蛋白质类型的任何核酸,下文也称为“SCAMP样核酸”或“SCAMP样基因”。
如本文中所定义,“SCAMP样多肽”指包含SCAMP结构域(HMMPFam PF04144)的任一多肽。
优选地,SCAMP样多肽的SCAMP结构域以递增的优先顺序与表A2的任一多肽中存在的SCAMP结构域的氨基酸,优选与由位于SEQ ID NO:89的氨基酸91和265之间的序列表示的SCAMP结构域具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。
更优选地,除SCAMP结构域外,用于本发明方法的SCAMP样多肽具有一个或多个,优选至少4个或3个、或2个、或1个跨膜结构域区域(TMR)。
多肽中的跨膜结构域区域(TMR),以及鉴定它们的方法是本领域众所周知的。在实施例部分中另外提供了此类方法的实例。
更优选地,用于本发明方法的SCAMP样多肽的TMR以递增的优先顺序与在表A2的任一多肽中,优选SEQ ID NO:89中存在的TMR的一个或多个的氨基酸具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。
在SEQ ID NO:89中存在的TMR由以下序列表示:
氨基端 | 跨膜区 | 羧基端 | 长度 | SEQ ID NO: |
121 | AFTTLLGLVGCLLWNIVAVTVAW | 143 | 23 | 194 |
151 | IWLLSIIYFLAGVPGAYVLWYRP | 173 | 23 | 195 |
186 | FGAFFFFYVFHIAFCGFAAVAPP | 208 | 23 | 196 |
227 | TTNAAVGIMYFIGAGFFCIETLL | 249 | 23 | 197 |
氨基端和羧基端列表示SEQ ID NO:89中跨膜结构域的氨基酸坐标。
另外更优选地,用于本发明方法的SCAMP样多肽包含至少2、1、0、3、4或5个重复或者三肽NPF(SEQ ID NO:198)。该三肽与胞吞作用期间SCAMP蛋白质通过结合来招募EH蛋白质的生物学作用有关。SCAMP多肽中NPF三肽优选地以递增的优先顺序位于氨基端、羧基端,以及氨基端和羧基端二者。
一般地和甚至更优选地,本发明的SCAMP样多肽共有常见的结构域结构,其包含具有多个NPF重复的胞质氨基端结构域、4个高度保守的跨膜区(TMR)和短的胞质羧基端尾巴。
本发明优选的SCAMP样多肽的氨基端尾巴以递增的优先顺序与在表A2的任一多肽中存在的氨基端尾巴,优选SEQ ID NO:89的氨基端尾巴和由MARHDPNPFADEEINPFANHTSVPPASNSYLKPLPPEPYDRGATVDIPLDSGNDLRAKEMELQAKENELKRKEQELKRREDAIARTGVVIEEKNWPEFFPLIHHDIPNEIPIHLQKIQYV(SEQ ID NO:199)表示的氨基酸具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
本发明优选的SCAMP样多肽的羧基端尾巴以递增的优先顺序与在表A2的任一多肽中存在的羧基端尾巴,优选SEQ ID NO:89的羧基端尾巴和由NIWVIQQVYAYFRGSGKAAEMKREA TKSTLMRAL(SEQ ID NO:200)表示的氨基酸具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
一般地,多肽包含E肽。E肽指保守的氨基酸基序,其以递增的优先顺序与LWYRPLYRAFRTDSA(SEQ ID NO:201)或LWYRPLYNAMRTESA(SEQ ID NO:202)表示的氨基酸具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的整体序列同一性。
备选地,本发明的SCAMP样核酸是任一这样的核酸,所述核酸编码表A2的任一多肽的同源物,优选其直向同源物或旁系同源物。优选此类同源物具有等同的(或类似的)生物学功能,例如在细胞分离时(例如果实脱落和裂开期间)发生的内吞过程期间招募EH蛋白质。
备选地,用于本发明方法的SCAMP样蛋白质的同源物以递增的优先顺序与由表A2的任一多肽表示的氨基酸,优选地与SEQ ID NO:89具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的整体序列同一性。
整体序列同一性使用全局比对算法,如GAP程序(GCG WisconsinPackage,Accelrys)中的Needleman Wunsch算法,优选用默认参数并优选的使用成熟蛋白质的序列(即,不考虑分泌信号或转运肽)来进行确定。与整体序列同一性相比,当仅考虑保守结构域或基序时,序列同一性通常较高。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
在另一实施方案中,“用于本发明方法的蛋白质”指本文所定义的肌原纤蛋白多肽。在另一实施方案中,“用于本发明方法的核酸”指能够编码此肌原纤蛋白多肽的核酸。在此种实施方案中,待引入植物(因此可用于实施本发明方法)的核酸是编码现将描述的蛋白质类型的任何核酸,下文也称为“肌原纤蛋白核酸”或“肌原纤蛋白基因”。
如本文中所定义,“肌原纤蛋白多肽”指包含以下的任一多肽:
(i)由PFAM登录号PF04755表示的PAP肌原纤蛋白结构域;和
(ii)由KFECQNESRGGLVRNVIKWSVPRLLEEN
EGATLIVTARFSSVSARNIYLKFEEIGLQNINISDDLQAVIAPAILPRSFLSLQILQFIRSFKARVPVTSPERHSVGGLYYLSYLDKNMLLGRAVGGGGVFIFTRAHTL(SEQ ID NO:253)表示的羧基端结构域,其可以含有表示1至15个残基之间的0至5个之间的空位,或者结构域,其以递增的优先顺序与(SEQID NO:253)具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性;和任选地
(iii)在多肽的氨基端区域内的转运肽。
SEQ ID NO:253表示如出现在由SEQ ID NO:205表示的肌原纤蛋白中羧基端结构域的氨基酸序列。
根据本发明优选的特征,PAP肌原纤蛋白结构域由ENRKYELLNIIQDTQRGLVTTADQRSTIEEAMVVVEGFDAGKEIDLSKLDG TWQYTSAPDVLILFESAARLPFFQVGQIFQ(SEQ ID NO:252)表示,其可以含有表示1至15个残基之间的0至5个之间的空位,或者结构域,其以递增的优先顺序与SEQ ID NO:252具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性的结构域。SEQ ID NO:252表示PAP肌原纤蛋白结构域的氨基酸序列,其出现在由SEQ ID NO:205表示的肌原纤蛋白中。
肌原纤蛋白多肽的另外特征是存在一个或多个以下结构域:
结构域X:NIYLQF[EQ]E[IA]S[VL]Q[ND]INISE[EQ]LQAL[IL]APA[IL]LPRSFL[SN]LQILQ[FA][LI][RK][TS]F[KR]AQ[VI]P(SEQ ID NO:254);
结构域Y:YYL[ST]YLD[RN][ND]MLLGR[AS]VGGGGV(SEQID NO:255);
结构域Z:[PA][IL]DL[AS]KLDGTWRLQYTSA[SP]DV(SEQ ID NO:256);或以递增的优先顺序与结构域X、Y和Z的任意一个或多个具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性的结构域。
肌原纤蛋白通常以递增的优先顺序与由SEQ ID NO:205表示的氨基酸具有至少45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的整体序列同一性。整体序列同一性使用全局比对算法,如GAP程序(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选用默认参数并优选的使用成熟蛋白质的序列(即,不考虑分泌信号或转运肽)来进行确定。与整体序列同一性相比,当仅考虑保守结构域或基序时,序列同一性通常较高。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol147(1);195-7)。
优选地,当多肽序列用于构建系统树时,例如图6中描述的,与包含由SEQ ID NO:205表示的氨基酸序列的肌原纤蛋白多肽的群聚簇,而不与任何其他群聚簇。
在另一实施方案中,“用于本发明方法的蛋白质”指本文所定义的PLATZ多肽。在另一实施方案中,“用于本发明方法的核酸”指能够编码此PLATZ多肽的核酸。在此种实施方案中,待引入植物(因此可用于实施本发明方法)的核酸是编码现将描述的蛋白质类型的任何核酸,下文也称为“PLATZ核酸”或“PLATZ基因”。
如本文中所定义,“PLATZ多肽”指包含PLATZ结构域(Pfamaccession PF04640;InterPro accession IPR006734);并包含具有共有序列C-x(2)-H-x(11)-C-x(2)-C-x(4-5)-C-x(2)-C-x(3-7)-H-x(2)-H(SEQ ID NO:262)的氨基端锌结合区和具有在中心区共有序列C-x(2)-C-x(10-11)-C-x(3)-C(SEQID NO:263)的锌结合区的任一多肽,如在Nagano等人(2001)中所述。换言之,如在本文中所定义,“PLATZ多肽”指包含PLATZ结构域(Pfamaccession PF04640;InterPro accession IPR006734);并包含具有由任一以下序列:CxxHxxxxxxxxxxxCxxCxxxxCxxCxxxHxxH(SEQ ID NO:645);CxxHxxxxxxxxxxxCxxCxxxxCxxCxxxxHxxH(SEQ ID NO:646);CxxHxxxxxxxxxxxCxxCxxxxCxxCxxxxxHxxH(SEQ ID NO:647);CxxHxxxxxxxxxxxCxxCxxxxCxxCxxxxxxHxxH(SEQ ID NO:648);CxxHxxxxxxxxxxxCxxCxxxxCxxCxxxxxxxHxxH(SEQ ID NO:649);CxxHxxxxxxxxxxxCxxCxxxxxCxxCxxxHxxH(SEQ ID NO:650);CxxHxxxxxxxxxxxCxxCxxxxxCxxCxxxxHxxH(SEQ ID NO:651);CxxHxxxxxxxxxxxCxxCxxxxxCxxCxxxxxHxxH(SEQ ID NO:652);CxxHxxxxxxxxxxxCxxCxxxxxCxxCxxxxxxHxxH (SEQ ID NO:653);CxxHxxxxxxxxxxxCxxCxxxxxCxxCxxxxxxxHxxH(SEQ ID NO:654)给出的共有序列的氨基端锌结合区;和在中心区中具有共有序列CxxCxxxxxxxxxxCxxxC(SEQ ID NO:655)或CxxCxxxxxxxxxxx CxxxC(SEQ ID NO:656)的锌结合区的任一多肽,如在Nagano等人(2001)中所述。
优选地,用于本发明方法的PLATZ蛋白质包含一个或多个以下基序(由MEME定义;Bailey和Elkan,Proceedings of the Second InternationalConference on Intelligent Systems for Molecular Biology,第28-36页,AAAI Press,Menlo Park,California,1994,Bailey等人,Nucleic AcidsResearch,34,W369-W373,2006):
基序10(SEQ ID NO:264):[VI]QTY[TVI]INSA[KR]V[VI]FL[NK][QE]RPQ[SP]R
基序11(SEQ ID NO:265):HRSHR[LV][LI]Q[VI]RR[YS][VS]YHDV[VI]R[LV]x[DE][LI][QE]KL[IL]D[CI]
基序12(SEQ ID NO:266):[KR]NE[KC]N[IV]FCLDC
更优选地,PLATZ蛋白质包含一个或多个由MEME所定义的以下基序:
基序13(SEQ ID NO:267):HRSH[RP]LLQVRRYVYHDV[VI]RLEDL[EQ]KLIDCS
基序14(SEQ ID NO:268):FKG[SL]GN[SY]CT[TS]CDR[SI]LQEP[FY][HR][FHY]CS[LV][SG]CKV
基序15(SEQ ID NO:269):AWLE[AG]L[LY][TA][EDQ]KFFV[GA]C[SP]xHEx[AR][KR]KNEKN[IV][FC]C[LV]DC[CS][AT]SIC[PQ]HC。
最优选地,PLATZ蛋白质包含一个或多个如由MEME所定义的以下基序:
基序16(SEQ ID NO:270):RRYVYHDVVRLEDL[EQ]KLIDCS[NS]VQ[AS]YTINS[AS]KVVF[IL]KKRPQNRQFKG[SA]GN
基序17(SEQ ID NO:271):PAWLEALY[TA][QE]KFF[VA][GA]CS[YF]HE[HNT]AKKNEKN[IV]CCLDCC[TI]SICPHC[VL]P[SA]HR[FV]HR
基序18(SEQ ID NO:272):CTSCDRSLQEP[FY][IF]HCSL[GD]CKV[DE][FY][VI]L[KR][HQ][YK]KDLS[PA]YLR[PTR]C[KN][TS]L[QT]L[GS]PDF[FL]IP。
此外,优选地,PLATZ多肽以递增的优先顺序包含至少2个或者至少3个上述基序。
备选地或另外地,PLATZ蛋白质的同源物以递增的优先顺序与由SEQID NO:261表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性,只要同源蛋白质包括如上所述的一个或多个保守基序。整体序列同一性使用全局比对算法,如GAP程序(GCGWisconsin Package,Accelrys)中的Needleman Wunsch算法,优选用默认参数并优选的使用成熟蛋白质的序列(即,不考虑分泌信号或转运肽)来进行确定。与整体序列同一性相比,当仅考虑保守结构域或基序时,序列同一性通常较高。优选地,PLATZ多肽中的基序以递增的优先顺序与由SEQ ID NO:264至SEQ ID NO:272(基序10-18)表示的基序具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
优选地,当多肽序列用于构建系统树时,例如图12中描述的,与包含由SEQ ID NO:261表示的氨基酸序列的PLATZ-A多肽的群,更优选地与PLATZ-A1蛋白质,最优选地与PLATZ-A1-α蛋白质聚簇,而不与任何其他PLATZ蛋白质的群聚簇。
在另一实施方案中,“用于本发明方法的蛋白质”指本文所定义的PLST样多肽。在另一实施方案中,“用于本发明方法的核酸”指能够编码此PLST样多肽的核酸。在此种实施方案中,待引入植物(因此可用于实施本发明方法)的核酸是编码现将描述的蛋白质类型的任何核酸,下文也称为“PLST样核酸”或“PLST样基因”。
如本文中所定义,“PLST样多肽”指包含至少一个PLST样共有结构域(Pfam登录号PF02298)的任一多肽。
优选地,PLST样多肽的PLST样结构域以递增的优先顺序与位于SEQID NO 411的氨基酸38至124之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
备选地,用于本发明方法的PLST样多肽包含一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
基序19:[DH]SV[LI]QV[TS]KE[DA][YF][DK]SCNT[SK][NSD]P(SEQ ID NO:530);
基序20:[FHY]YF[IT]SGV[PK][GD][HN]C(SEQ ID NO:531);
基序21:Y[NT][QK]WA[ESK][KS]NRF[KQ][IV]GD[ST][LI][VL]F[KL]YP(SEQ ID NO:532);
基序44:[DHN][SND][VLM]xx[VL]xxxx[FYHN]xxCxxTx[NSD](SEQ ID NO :615);
基序45:[GD]xx[FY][FYI]x[SGC][GAIT](SEQ ID NO:616);并优选地位置3处所述x选自以下氨基酸:F、H、Y、V和A。
基序46:[GV][GDAE]xxxWx[VITLA]xxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQ IDNO:617);
基序47:[GV][GDAE]xxxWx[VITLA]xxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQID NO:618);
基序48:[GV][GDAE]xxxWx[VITLA]xxxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQID NO:619);
基序49:[GV][GDAE]xxxWx[VITLA]xxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQ ID NO:620);
基序50:[GV][GDAE]xxxWx[VITLA]xxxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQ ID NO:621);
基序51[GV][GDAE]xxxWx[VITLA]xxxxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQ ID NO:622);
基序52:[GV][GDAE]xxxWx[VITLA]xxxxxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQ ID NO:623);
基序53:[GV][GDAE]xxxxWx[VITLA]xxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQID NO:624);
基序54:[GV][GDAE]xxxxWx[VITLA]xxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQID NO:625);
基序55:[GV][GDAE]xxxxWx[VITLA]xxxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQ ID NO:626);
基序56:[GV][GDAE]xxxxWx[VITLA]xxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQ ID NO:627);
基序57:[GV][GDAE]xxxxWx[VITLA]xxxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQ ID NO:628);
基序58[GV][GDAE]xxxxWx[VITLA]xxxxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQ ID NO:629);
基序59[GV][GDAE]xxxxWx[VTLA]xxxxxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQ ID NO:630)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
备选地,或者此外组合地,在另一实施方案中,用于本发明方法的PLST样多肽包含序列基序,所述序列基序以递增的优先顺序与以下基序:
基序60:[FHY][YF][FY][TAI]S[GAD]xx[GD][HRN]C(SEQ ID NO:631)具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
这些基序是共有序列,并且在PLST样序列中并非总是相同的。应当注意,本文中方括号中标出的氨基酸代表特定位置的备选氨基酸。在本文给定序列中,“x”可以是任一不同的氨基酸。
在本发明另一优选的实施方案中,本发明的PLST样多肽可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
基序22:[DN]GN[TS][LVK][FV][KN][LF][DT]R[SP]GP[FY]YF[IT]SG[VA][KP][GD][HN]CEK[GN][QE]K(SEQ ID NO:533);
基序23:[YL]N[QK]WA[EK][KS][NH]RF[KQ][IV]GD[ST]L[LV]F[LK]Y[PD](SEQ ID NO:534);
基序24;[KQ]DSV[LI]QVTKE[DA]YKSCNT[SK][DSN]PI(SEQ ID NO:535);
基序61:
[DNT][GDE][NDKH][TS][LVKM][FVYI]x[LIF]xxxGx[FYHV][YF][FYI][ITVA]S[GAD]xxxxxC(SEQ ID NO:632);
基序62:
[DNT][GDE][NDKH][TS][LVKM][FVYI]x[LIF]xxxGx[FYHV][YF][FYI][ITVA]S[GAD]xxxxxxC(SEQ ID NO:633);
基序63:
[DNT][GDE][NDKH][TS][LVKM][FVYI]x[LIF]xxxGx[FYHV][YF][FYI][ITVA]S[GAD]xxxxC(SEQ ID NO:667);
基序64:
[NSDT]xW[ASPV]xxx[RSNT][FLV]x[VILT][GN]Dx[LIV]x[FLW]x[YF](SEQ ID NO:634);
基序65:S[VALM][LIM]x[VL]xxxx[YF]xxC[NTKD][SKTDG]xx[PAHY](SEQ ID NO:635)。
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
基序22、23和24,以及基序61至65对应于共有序列,其代表在包含PLST样、P_Class(拟南芥和毛果杨(P.trichocarpa)属于其)和NDL的群的多肽中保守的蛋白质区域。
最优选地,本发明的PLST样多肽可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
基序25:DSVI[QV]VT[EKA][EQ]S[YF][KN][SK]CNL[KST]DPIL[YF][MS]N[ND]GN[ST][LV]FN[LI][TD][RS]PGL[FY]YF[TI]SG[VA][PS]GHC[EQ][KR](SEQ ID NO:536);
基序26:P[PT]SA[DN]P[DQ][VL]YTKW[AS][KS][NS][HN][RN]FK[IL]GD[ST][LI]LFLYP(SEQ ID NO:537);
基序27:XVS[CS]Y[QE][YF]KVG[DG]LD[AGS]W(SEQ ID NO 538);
基序66:DS[VALM][LVIM][QVE][VL][STA]xxx[FY]xxC[NDQ]x[KST]xP[LVIQH][LATF][YFTKS][FSLM]x[ND][GE][NDK][ST]x[FYI]x[LIF][TDSE](SEQ ID NO:636);
基序67:[YF]xxW[APV][KSG]xxx[FLV][KART][LIV][GN]D[SAT][LI]xFxY(SEQ ID NO:6377);
基序68:[YF]x[VA]G[DAGE]xx[GAS]Wx[VAI]P(SEQ ID NO:638)。具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
基序25、26和27,以及基序66至68对应于共有序列,其代表在属于PLST样的多肽和拟南芥属于的P_Class群多肽中最保守的蛋白质区域。
在本发明最优选的实施方案中,本发明的PLST样多肽可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
基序28:HN[FL]K[IL]GDSLLFLYPPSQDSVIQVTA[QE][SAN][YF][KN]SC[ND]L[KS]DPILYMN[DN]GNSLFN[IL]T(SEQ ID NO:539);
基序29:GDFYFTSG[AVE]PGHC[EQ]K[SK]QKLH[IV](SEQ ID NO:540);
基序30:VSCYQYKVGDLD[AS]WGIPTSA[NK](SEQ ID NO:541);
基序69:
[FLV]x[LIV]GD[SA][LIV][LFW]FLY[PL]PS[QE]DS[LMAV][LIV]Q[VL][TA]x2[ASN][FY](SEQID NO:639);
基序70:C[NDQ]X[SKT][DNS]P[LVI][LAT]X[MFL]X[ND]GN[ST][LAV][NK][LFI][ST](SEQ IDNO:640);
基序71:Gxx[FHY][YF][FY][TAI]S[GAD]xxG[HR]Cx[KR]x[QS][KR][LAI](SEQ ID NO:641);
基序72:[YF][KQ]VG[DAGN]L[DQN][AS]W[GAN][VAI]P[TIPS](SEQ ID NO:642);
基序73:GD[SA][LIV][LFW]FLY[PL]PS[QE](SEQ ID NO:643);
基序74:LY[PL]PS[QE](SEQ ID NO:644)具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
应当理解,如本文中所述,由MEME(Timothy L.Bailey和CharlesElkan,“Fitting a mixture model by expectation maximization to discovermotifs in biopolymers”,Proceedings of the Second InternationalConference on Intelligent Systems for Molecular Biology,第28-36页,AAAIPress,Menlo Park,California,1994)测定的基序19、20、21、22、23、24、25、26、27、28、29和30表示在PLST样多肽中,优选地在表A5的PLST样多肽中,最优选地在SEQ ID NO:411中存在的基序的共有序列。本文中定义的基序并不限于其各个序列,并且它们包括在任一PLST样中显示的同源基序。
应当理解,如本文中所述,由MEME(Timothy L.Bailey和CharlesElkan,“Fitting a mixture model by expectation maximization to discovermotifs in biopolymers”,Proceedings of the Second InternationalConference on Intelligent Systems for Molecular Biology,第28-36页,AAAIPress,Menlo Park,California,1994)测定的基序44至74表示在PLST样多肽中,优选在表A5的PLST样多肽中,更优选在SEQ ID NO:411中存在的基序的共有序列。本文中定义的基序并不限于其各个序列,并且它们包括在任一PLST样中显示的同源基序。
鉴定与用于本发明方法的多肽中的基序19至30和/或基序44至74同源的基序的方法是本领域众所周知的。例如,可以使用算法例如Blast(Altschul等人(1990)J Mol Biol 215:403-10),通过将它们的各个氨基酸序列比对将多肽与基序比较,以鉴定具有类似序列的区域。
备选地,PLST样多肽的同源物以递增的优先顺序与由表A5的任一多肽,优选地由SEQ ID NO:411表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性,只要同源多肽包括如上所述的保守基序。整体序列同一性使用全局比对算法,如GAP程序(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选用默认参数并优选的使用成熟蛋白质的序列(即,不考虑分泌信号或转运肽)来进行确定。与整体序列同一性相比,当仅考虑保守结构域或基序时,序列同一性通常较高。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
优选地,PLST样多肽的序列,当用于构建系统树时,例如图15中描述的,与包含由SEQ ID NO:411表示的氨基酸序列的PLST样多肽的群聚簇。
在另一实施方案中,“用于本发明方法的蛋白质”指本文所定义的Glomalin多肽。在另一实施方案中,“用于本发明方法的核酸”指能够编码此Glomalin多肽的核酸。在此种实施方案中,待引入植物(因此可用于实施本发明方法)的核酸是编码现将描述的蛋白质类型的任何核酸,下文也称为“Glomalin核酸”或“Glomalin基因”。
如本文中所定义,“Glomalin多肽”指包含Cpn60_TCP1结构域(Pfamaccession PF00118)和另外包含基序31、32和33或者具有与基序31至33不多于2个错配的基序的任一热休克蛋白60(HSP60多肽)。
基序31(SEQ ID NO:596):DDT(I/V/L)(I/V)L(D/H)G(G/A/L)G(N/D/E)K(A/T/K/Q)X(I/L)(E/D)(E/D)其中X为任一氨基酸,优选地为I、A、S、G、L、Q、T之一。
基序32(SEQ ID NO:597):(T/A)(S/A/N/E)N(F/E/D)(D/G)(E/Q)(K/R)(V/I/R)GV(Q/E)
基序33(SEQ ID NO:598):(E/Q)X(N/D)X(N/S/D)(I/L/F/M)G(Y/F/C)DAA(K/R)(A/G/D)(E/K/T)Y(V/L)(D/H)M,其中位置2的X为任一氨基酸,优选地为A、T、S、D、E之一,位置4的X为任一氨基酸,优选地为L、P、T、C之一。
另外地或备选地,Glomalin多肽包含基序34至43的一个或多个。
基序34(SEQ ID NO:599):L(Q/R/K)GV(E/S/N)(Q/E/D)(V/L)A(D/E)AV(K/Q)VTMGPKGR(T/H/N)V(V/I)(I/L)EXS,其中X为任一氨基酸,优选地为Q、S、R、K、G之一,最优选地为Q。
基序35(SEQ ID NO:600):KDGVTVAK(A/S)(I/V)(E/S/KN)F
基序36(SEQ ID NO:601):(KQ)(N/S)(I/V)GA(S/E/D/N)LVK(S/Q)VA(S/N/E/D)(S/A)TN
基序37(SEQ ID NO:602):TT(C/A)AT(V/I)L(T/A)(R/K/Q)AI(F/L)XEGCK(S/A)V(A/S)AG(M/V)(N/S)AMDLR,其中X为任一氨基酸,优选地为V、A、T、S、I之一。
基序38(SEQ ID NO:603):TISANG
基片39(SEQ ID NO:604):GK(E/H/D)GVIT(V/I)XDG(K/N)T(L/M),其中X为任一氨基酸,优选地为S、A、Q、T、V之一。
基序40(SEQ ID NO:605):RGY(I/T)SPYF(V/I)T(N/D)
基序41(SEQ ID NO:606):PLLI(V/I)(A/S)ED(V/L/I)(E/D)
基序42(SEQ ID NO:607):K(A/S)PGFG(E/D)(N/S)R
基序43(SEQ ID NO:608,位于蛋白质序列的羧基端末端):GMGG
更优选地,Glomalin多肽以递增的优先顺序包含至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个或者全部13个基序。此外,glomalin优选地不具有分泌信号。
另外地或备选地备选地,Glomalin蛋白质的同源物以递增的优先顺序与由SEQ ID NO:546表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性,只要同源多肽包括如上所述的保守基序任一或多个。整体序列同一性使用全局比对算法,如GAP程序(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选用默认参数并优选的使用成熟蛋白质的序列(即,不考虑分泌信号或转运肽)来进行确定。与整体序列同一性相比,当仅考虑保守结构域或基序时,序列同一性通常较高。优选地,Glomalin多肽中的基序以递增的优先顺序与由SEQ ID NO:596至SEQ ID NO:608(基序31至43)表示的基序具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
优选地,多肽序列,当用于构建系统树时,例如图19中描述的,与包含由SEQ ID NO:546表示的氨基酸序列的Glomalin多肽的群聚簇,而不与其他任何群聚簇。
术语“结构域”、“特征序列”和“基序”在本文“定义”章节中定义。存在用于鉴定结构域的专门数据库,例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res30,242-244),InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318),Prosite(Bucher和Bairoch(1994),A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation.(In)ISMB-94;Proceedings 2nd International Conferenceon Intelligent Systems for Molecular Biology.Altman R.,Brutlag D.,KarpP.,Lathrop R.,Searls D.编著,第53-61页,AAAI Press,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)或者Pfam(Bateman等,NucleicAcids Research 30(1):276-280(2002))。用于计算机分析蛋白质序列的一组工具可获得自ExPASy蛋白组服务器(Swiss Institute of Bioinformatics(Gasteiger等,ExPASy:the proteomics server for in-depth proteinknowledge and analysis,Nucleic Acids Res.31:3784-3788(2003))。还可以使用常规技术(如序列比对)来鉴定结构域或基序。
关于PLATZ多肽,本文表A4中的PLATZ-A1-α多肽的比对示于图11中。这样的比对用于鉴定如本文定义的PLATZ多肽间最保守的结构域或者基序。一个这样的结构域是PLATZ结构域,在图10中以黑斜体标出。此类基序的实例是SEQ ID NO:264至SEQ ID NO:272,在图10中以各个基序号标记。
比对序列以进行比较的方法为本领域所众所周知,这些方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP利用Needleman和Wunsch((1970)J Mol Biol 48:443-453)的算法来寻找两序列间使匹配数最高并使空位数最少的全局比对(即在完整序列上)。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)在两序列间计算百分比序列同一性并进行相似性的统计学分析。用于进行BLAST分析的软件在美国国家生物技术信息中心(National Centre for Biotechnology Information(NCBI))向公众提供。可以使用例如默认配对比对参数的ClustalW多重序列比对算法(1.83版)和百分比评分法来容易地鉴定同源物。也可以使用MatGAT软件包(Campanella等,BMC Bioinformatics.2003 Jul 10;4:29.MatGAT:anapplication that generates similarity/identity matrices using protein orDNA sequence)中提供的一种方法确定全局的相似性和同一性百分比。本领域技术人员会意识到,可以进行少量手动编辑以优化保守性基序之间的比对。此外,还可以使用特定的结构域代替全长序列来鉴定同源物。序列同一性值可以是使用默认参数的上述程序在完整的核酸或氨基酸序列上或在所选择的结构域或保守的基序上测定的。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol147(1);195-7)。
关于PLATZ多肽,实施例3在表B3中描述了多种PLATZ多肽之间的同一性百分比,特别是SEQ ID NO:261(表示为Pt583639)与其他PLATZ-A1-α多肽之间的同一性百分比,其可以低至70%。通常,PLATZ-A1-α多肽的群内的同一性百分比为55%或者更高。
蛋白质亚细胞定位预测的工作是重要的并且已经进行了充分的研究。知晓蛋白质的定位有助于阐明其功能。用于蛋白质定位的实验方法涉及从免疫定位到使用绿色荧光蛋白(GFP)或者β-葡糖醛酸糖苷酶(GUS)的蛋白质标记的范围。与计算方法相比,尽管这些方法劳动量大,但是却是精确的。近来从数据库计算预测蛋白质定位取得了极大的进展。本领域技术人员众所周知的算法可获得自由瑞士信息学协会(Swiss Institute forBioinformatics)管理的ExPASy蛋白质组学工具,例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM以及其他。
关于PLATZ多肽、PLATZ蛋白质,作为DNA结合蛋白质,可能具有核定位。
此外,eRF1多肽(至少以其天然形态)通常具有调节花分生组织活性的作用。用于测量花分生组织活性的工具和技术是本领域众所周知的。
另外,如实施例部分所述,当根据本发明方法在稻中表达时,eRF1多肽产生具有增强的产量相关性状,特别是增加的种子产量以及生物量的植物。
此外,eRF1多肽可以显示出优选的亚细胞定位,通常为核、胞质、叶绿体或者线粒体的一种或多种。蛋白质亚细胞定位预测的工作是重要的并且已经进行了充分的研究。知晓蛋白质的定位有助于阐明其功能。用于蛋白质定位的实验方法涉及从免疫定位到使用绿色荧光蛋白(GFP)或者β-葡糖醛酸糖苷酶(GUS)的蛋白质标记的范围。与计算方法相比,尽管这些方法劳动量大,但是却是精确的。近来从数据库计算预测蛋白质定位取得了极大的进展。本领域技术人员熟知的算法可获得自由瑞士信息学协会(Swiss Institute for Bioinformatics)管理的ExPASy蛋白质组学工具,例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM以及其他。
此外,SCAMP样多肽(至少以其天然形态)通常具有EH蛋白质结合活性。用于测量EH蛋白质结合活性的工具和技术是本领域众所周知的。
另外,如实施例部分所述,当根据本发明方法在稻中表达时,SCAMP样多肽产生具有增强的产量相关性状的植物,特别是增加在氮缺乏生长条件下生长的植物的种子和/或生物量产量,如在实施例部分中所述的那些植物。
此外,SCAMP样多肽可以显示出优选的亚细胞定位,通常为核、胞质、叶绿体或者线粒体的一种或多种。蛋白质亚细胞定位预测的工作是重要的并且已经进行了充分的研究。知晓蛋白质的定位有助于阐明其功能。用于蛋白质定位的实验方法涉及从免疫定位到使用绿色荧光蛋白(GFP)或者β-葡糖醛酸糖苷酶(GUS)的蛋白质标记的范围。与计算方法相比,尽管这些方法劳动量大,但是却是精确的。近来从数据库计算预测蛋白质定位取得了极大的进展。本领域技术人员熟知的算法可获得自由瑞士信息学协会(Swiss Institute for Bioinformatics)管理的ExPASy蛋白质组学工具,例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM以及其他。优选地,本发明的SCAMP多肽与膜连接,优选与内质网的膜连接。
在本发明的另一优选的实施方案中,本发明的SCAMP多肽与膜连接。将多肽与膜连接(也称为将多肽锚定在膜上)或者增加细胞中多肽与膜连接的部分的方法是本领域众所周知的。例如,GPI(糖基-磷脂酰肌醇)(GPI)部分基序可以以递增的优先顺序与SCAMP多肽的氨基端、羧基端、中心部分连接(通常共价地连接)(Bertozzi等人,Biochemistry。2008年7月8日;47(27):6991-7000)。备选地,SCAMP多肽可以富含脯氨酸和/或丙氨酸残基。此类残基通常在细胞上被糖修饰,并随后隐蔽(sequester)在膜(主要是质膜)中(Kjellbom P,Snogerup L,C,Reuzeau C,McCabe PF,Pennell RI。Plant J.1997年11月;12(5):189-96)。
如实施例部分所述,当根据本发明方法在稻中表达时,肌原纤蛋白多肽产生具有增强的产量相关性状的植物。
肌原纤蛋白多肽通常在叶绿体中显示出优选的亚细胞定位。蛋白质亚细胞定位预测的工作是重要的并且已经进行了充分的研究。知晓蛋白质的定位有助于阐明其功能。用于蛋白质定位的实验方法涉及从免疫定位到使用绿色荧光蛋白(GFP)或者β-葡糖醛酸糖苷酶(GUS)的蛋白质标记的范围。与计算方法相比,尽管这些方法劳动量大,但是却是精确的。近来从数据库计算预测蛋白质定位取得了极大的进展。本领域技术人员熟知的算法可获得自由瑞士信息学协会(Swiss Institute for Bioinformatics)管理的ExPASy蛋白质组学工具,例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM以及其他。
此外,PLATZ多肽(至少以其天然形态)通常具有锌依赖的DNA结合活性。用于测量DNA结合活性的工具和技术是本领域众所周知的(参见例如Nagano等人,2001)。在实施例部分提供了另外的详细说明。
另外,如实施例部分所述,当根据本发明方法在稻中表达时,PLATZ多肽产生具有增强的产量相关性状的植物,特别是增加的种子产量,例如增加的种子总重量和/或增加的饱满率和/或增加的千粒重;和/或增加的收获指数;和/或增加的地上生物量(在本文中也称为areamax)和/或快速的早期发育等。
另外,如实施例部分所述,当根据本发明方法在稻中表达时,PLST样多肽产生具有增强的产量相关性状,特别是增加的种子产率以及生物量的植物。
此外,PLST样多肽可以显示出优选的亚细胞定位,通常为核、胞质、叶绿体或者线粒体的一种或多种。蛋白质亚细胞定位预测的工作是重要的并且已经进行了充分的研究。知晓蛋白质的定位有助于阐明其功能。用于蛋白质定位的实验方法涉及从免疫定位到使用绿色荧光蛋白(GFP)或者β-葡糖醛酸糖苷酶(GUS)的蛋白质标记的范围。与计算方法相比,尽管这些方法劳动量大,但是却是精确的。近来从数据库计算预测蛋白质定位取得了极大的进展。本领域技术人员熟知的算法可获得自由瑞士信息学协会(Swiss Institute for Bioinformatics)管理的ExPASy蛋白质组学工具,例如PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP、TMHMM以及其他。
此外,Glomalin多肽(至少以其天然形态)通常拯救温度敏感型突变株(Hemmingsen等人,Nature 333,330-334,1988,Salvucci,J.Exp.Bot.59,1923-1933,2008)。
另外,如实施例部分所述,当根据本发明方法在稻中表达时,Glomalin多肽产生具有增强的产量相关性状,特别是增加的收获指数的植物。
关于eRF1多肽,本发明通过用SEQ ID NO:1表示的核酸序列转化植物进行了示例,上述核酸序列编码SEQ ID NO:2的多肽序列。然而,本发明的实施不限于这些序列;本发明的方法可有利的通过使用本文定义的任何eRF1多肽编码核酸或eRF1多肽来实施。
编码eRF1多肽的核酸的实例在本文实施例章节表A1中给出。这样的核酸可用于实施本发明的方法。实施例章节表A1中给出的氨基酸序列为SEQ ID NO:2所示eRF1多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文所定义。可以通过进行所谓的交互blast检索容易地找到更多直向同源物和旁系同源物。通常,这包括以查询序列(例如,利用实施例章节表A1中所列的任一序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST的首次BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)。然后比较首次和二次BLAST的结果。如果首次BLAST中的高排名命中来自查询序列来源的相同物种,然后反向BLAST理想地导致查询序列处于最高命中之列,则找到了旁系同源物;如果首次BLAST中高排名命中不来自查询序列来源的相同物种,且优选地在反向BLAST时导致查询序列在最高命中之列,则找到了直向同源物。
关于SCAMP样多肽,本发明通过用SEQ ID NO:88表示的核酸序列转化植物进行了示例,上述核酸序列编码SEQ ID NO:89的多肽序列。然而,本发明的实施不限于这些序列;本发明的方法可有利的通过使用本文定义的任何SCAMP样编码核酸或SCAMP样多肽来实施。
编码SCAMP样多肽的核酸的实例在本文实施例章节表A2中给出。这样的核酸可用于实施本发明的方法。实施例章节表A2中给出的氨基酸序列为SEQ ID NO:89所示SCAMP样多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文所定义。可以通过进行所谓的交互blast检索容易地找到更多直向同源物和旁系同源物。通常,这包括以查询序列(例如,利用实施例章节表A2中所列的任一序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST的首次BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ ID NO:88或SEQ ID NO:89的情况下,二次BLAST将因此会针对拟南芥序列)。然后比较首次和二次BLAST的结果。如果首次BLAST中的高排名命中来自查询序列源自的相同物种,然后反向BLAST理想地导致查询序列处于最高命中之列,则找到了旁系同源物;如果首次BLAST中高排名命中不来自查询序列源自的相同物种,且优选地在反向BLAST时导致查询序列在最高命中之列,则找到了直向同源物。
关于肌原纤蛋白多肽,本发明通过用SEQ ID NO:204表示的核酸序列转化植物进行了示例,上述核酸序列编码SEQ ID NO:205的多肽序列。然而,本发明的实施不限于这些序列;本发明的方法可有利的通过使用本文定义的任何肌原纤蛋白编码核酸或肌原纤蛋白多肽来实施。
编码肌原纤蛋白多肽的核酸的实例在本文实施例章节表A3中给出。这样的核酸可用于实施本发明的方法。实施例章节表A3中给出的氨基酸序列为SEQ ID NO:205所示肌原纤蛋白多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文所定义。可以通过进行所谓的交互blast检索容易地找到更多直向同源物和旁系同源物。通常,这包括以查询序列(例如,利用实施例章节表A3中所列的任一序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST的首次BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ ID NO:204或SEQ ID NO:205的情况下,二次BLAST将因此会针对番茄序列)。然后比较首次和二次BLAST的结果。如果首次BLAST中的高排名命中来自查询序列源自的相同物种,然后反向BLAST理想地导致查询序列处于最高命中之列,则找到了旁系同源物;如果首次BLAST中高排名命中不来自查询序列源自的相同物种,且优选地在反向BLAST时导致查询序列在最高命中之列,则找到了直向同源物。
关于PLATZ多肽,本发明通过用SEQ ID NO:260表示的核酸序列转化植物进行了示例,上述核酸序列编码SEQ ID NO:261的多肽序列。然而,本发明的实施不限于这些序列;本发明的方法可有利的通过使用本文定义的任何PLATZ编码核酸或PLATZ多肽来实施。例如,在另一实施方案中,本发明通过用SEQ ID NO:356表示的核酸序列转化植物进行了示例,上述核酸序列编码SEQ ID NO:357的多肽序列。
编码PLATZ多肽的核酸的实例在本文实施例章节表A4中给出。这样的核酸可用于实施本发明的方法。实施例章节表A4中给出的氨基酸序列为SEQ ID NO:261所示PLATZ多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文所定义。可以通过进行所谓的交互blast检索容易地找到更多直向同源物和旁系同源物。通常,这包括以查询序列(例如,利用实施例章节表A4中所列的任一序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST的首次BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ ID NO:260或SEQ ID NO:261的情况下,二次BLAST将因此会针对杨树(poplar)序列)。然后比较首次和二次BLAST的结果。如果首次BLAST中的高排名命中来自查询序列源自的相同物种,然后反向BLAST理想地导致查询序列处于最高命中之列,则找到了旁系同源物;如果首次BLAST中高排名命中不来自查询序列源自的相同物种,且优选地在反向BLAST时导致查询序列在最高命中之列,则找到了直向同源物。
关于PLST样多肽,本发明通过用SEQ ID NO:410表示的核酸序列转化植物进行了示例,上述核酸序列编码SEQ ID NO:411的多肽序列。然而,本发明的实施不限于这些序列;本发明的方法可有利的通过使用本文定义的任何PLST样编码核酸或PLST样多肽来实施。
编码PLST样多肽的核酸的实例在本文实施例章节表A5中给出。这样的核酸可用于实施本发明的方法。实施例章节表A5中给出的氨基酸序列为SEQ ID NO:411所示PLST样多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文所定义。可以通过进行所谓的交互blast检索容易地找到更多直向同源物和旁系同源物。通常,这包括以查询序列(例如,利用实施例章节表A5中所列的任一序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST的首次BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)。然后比较首次和二次BLAST的结果。如果首次BLAST中的高排名命中来自查询序列源自的相同物种,然后反向BLAST理想地导致查询序列处于最高命中之列,则找到了旁系同源物;如果首次BLAST中高排名命中不来自查询序列源自的相同物种,且优选地在反向BLAST时导致查询序列在最高命中之列,则找到了直向同源物。
关于Glomalin多肽,本发明通过用SEQ ID NO:545表示的核酸序列转化植物进行了示例,上述核酸序列编码SEQ ID NO:546的多肽序列。然而,本发明的实施不限于这些序列;本发明的方法可有利的通过使用本文定义的任何Glomalin编码核酸或Glomalin多肽来实施。
编码Glomalin多肽的核酸的实例在本文实施例章节表A6中给出。这样的核酸可用于实施本发明的方法。实施例章节表A6中给出的氨基酸序列为SEQ ID NO:546所示Glomalin多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文所定义。可以通过进行如在定义部分中所述的所谓的交互blast检索容易地找到更多直向同源物和旁系同源物;其中在查询序列为SEQ ID NO:545或SEQ ID NO:546的情况下,二次BLAST(反向BLAST)会针对稻序列。
高排名的命中是那些E值低的命中。E值越低,分值越具有显著性(或者换句话说,偶然发现此命中的几率越低)。E值的计算是本领域众所周知的。除了E值之外,还对比较进行同一性百分比评分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在大家族的情况下可以使用ClustalW,继之以邻接树来辅助相关基因的聚类可视化,和鉴定直向同源物和旁系同源物。
核酸变体也可用于实施本发明的方法。这类核酸变体的例子包括编码实施例章节表A1至A6中给出的任一氨基酸序列的同源物和衍生物的核酸序列,其中术语“同源物”和“衍生物”如本文所定义。同样可用于本发明方法的有编码实施例章节表A1至A6中给出的任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物的核酸。用于本发明方法的同源物和衍生物与其源自的未修饰蛋白质具有基本上相同的生物活性和功能活性。在实施本发明方法中有用的其他变体是这样的变体,其中已经优化了密码子使用或者其中移除了miRNA靶向位点。
可用于实施本发明方法的其它核酸变体包括编码eRF1多肽或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸的部分,与编码eRF1多肽或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸杂交的核酸,编码eRF1多肽或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸的剪接变体,编码eRF1多肽或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸的等位变体,以及通过基因改组获得的eRF1多肽或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽编码核酸的变体。术语杂交序列、剪接变体、等位变体和基因改组如本文所述。
编码eRF1多肽或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸无需是全长核酸,因为本发明方法的实施不依赖于全长核酸序列的使用。根据本发明,提供了增强植物中产量相关性状的方法,包括在植物中引入和表达实施例章节表A1至A6中给出的任一核酸序列的部分、或者编码实施例章节表A1至A6中给出的任一氨基酸序列之直向同源物、旁系同源物或同源物的核酸的部分。
例如,可以通过对核酸进行一个或多个缺失来制备所述核酸的部分。部分可以以分离的形式使用,或者可将其与其它编码(或非编码)序列融合,以便例如产生组合了若干活性的蛋白质。当与其它编码序列融合时,经翻译后所产生的多肽可能比针对该蛋白质部分所预测到的要大。
关于eRF1多肽,可用于本发明方法的部分编码如本文所定义的eRF1多肽,并与实施例章节表A1中给出的氨基酸序列具有基本上相同的生物活性。优选部分是实施例章节表A1中给出的任一核酸的部分,或是编码实施例章节表A1中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的部分。优选该部分长度为至少500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350个连续核苷酸,所述连续核苷酸是实施例章节表A1中给出的任一核酸序列或者编码实施例章节表A1中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸。最优选该部分是核酸SEQ ID NO:1的一部分。优选该部分编码这样的氨基酸序列的片段,所述氨基酸序列当用于构建系统树(例如图1所示的系统发生树)时,与包含由SEQ ID NO:2表示的氨基酸序列的eRF1多肽的群聚簇,而非与其他群聚簇。
关于SCAMP样多肽,可用于本发明方法的部分编码如本文所定义的SCAMP样多肽,并与实施例章节表A2中给出的氨基酸序列具有基本上相同的生物活性。优选部分是实施例章节表A2中给出的任一核酸的部分,或是编码实施例章节表A2中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的部分。优选该部分长度为至少100、200、300、400、500、550、600、650、700、750、800、850、900、950、1000个连续核苷酸,所述连续核苷酸是实施例章节表A2中给出的任一核酸序列或者是编码实施例章节表A2中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸。最优选该部分是核酸SEQ ID NO:88的一部分。优选该部分编码这样的氨基酸序列的片段,所述氨基酸序列包含如本文中所定义的SCAMP结构域。
关于肌原纤蛋白多肽,可用于本发明方法的部分编码如本文所定义的肌原纤蛋白多肽,并与实施例章节表A3中给出的氨基酸序列具有基本上相同的生物活性。优选部分是实施例章节表A3中给出的任一核酸的部分,或是编码实施例章节表A3中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的部分。优选该部分长度为至少500、550、600、650、700、750、800、850、900、950、1000个连续核苷酸,所述连续核苷酸是实施例章节表A3中给出的任一核酸序列或者是编码实施例章节表A3中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸。最优选该部分是核酸SEQ ID NO:204的一部分。优选该部分编码这样的氨基酸序列的片段,所述氨基酸序列当用于构建系统树(例如图6所示的系统发生树)时,与包含由SEQ ID NO:205表示的氨基酸序列的肌原纤蛋白多肽的群聚簇,而非与其他群聚簇。
关于PLATZ多肽,可用于本发明方法的部分编码如本文所定义的PLATZ多肽,并与实施例章节表A4中给出的氨基酸序列具有基本上相同的生物活性。优选部分是实施例章节表A4中给出的任一核酸的部分,或是编码实施例章节表A4中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的部分。优选该部分长度为至少300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100个连续核苷酸,所述连续核苷酸是实施例章节表A4中给出的任一核酸序列或者是编码实施例章节表A4中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸。最优选该部分是核酸SEQ ID NO:260的一部分。优选该部分编码这样的氨基酸序列的片段,所述氨基酸序列包含PLATZ结构域和一个或多个如上所定义的基序,并且当用于构建系统树(例如图12所示的系统发生树)时,与包含由SEQ ID NO:261表示的氨基酸序列的PLATZ-A多肽的群,更优选地与PLATZ-A1蛋白质的群,最优选地与PLATZ-A1-α蛋白质的群聚簇,而非与其他PLATZ蛋白质的群聚簇。
关于PLST样多肽,可用于本发明方法的部分编码如本文所定义的PLST样多肽,并与实施例章节表A5中给出的氨基酸序列具有基本上相同的生物活性。优选部分是实施例章节表A5中给出的任一核酸的部分,或是编码实施例章节表A5中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的部分。优选该部分长度为至少100、150、200、250、300、350、400、450、500、550、600、650、700个连续核苷酸,所述连续核苷酸是实施例章节表A5中给出的任一核酸序列或者编码实施例章节表A5中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸。最优选该部分具有基序1至12的一个或多个和PF结构域,并且是核酸SEQ ID NO:410的一部分。优选该部分编码这样的氨基酸序列的片段,所述氨基酸序列当用于构建系统树(例如图19所示的系统发生树)时,与包含由SEQ ID NO:411表示的氨基酸序列的PLST样多肽的群聚簇,而非与其他群聚簇。
关于Glomalin多肽,可用于本发明方法的部分编码如本文所定义的Glomalin多肽,并与实施例章节表A6中给出的氨基酸序列具有基本上相同的生物活性。优选部分是实施例章节表A6中给出的任一核酸的部分,或是编码实施例章节表A6中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的部分。优选该部分长度为至少450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900个连续核苷酸,所述连续核苷酸是实施例章节表A6中给出的任一核酸序列或者是编码实施例章节表A6中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸。最优选该部分是核酸SEQ ID NO:545的一部分。优选该部分编码这样的氨基酸序列的片段,所述氨基酸序列包含Cpn60_TCP1结构域(Pfam accession PF00118),或者所述氨基酸序列当用于构建系统树(例如图19所示的系统发生树)时,与包含由SEQ ID NO:546表示的氨基酸序列的Glomalin多肽的群聚簇,而非与其他群聚簇。
可用于本发明方法中的另一种核酸变体是能够在降低的严格性条件下、优选在严格条件下与编码如本文中所定义的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸杂交,或与如本文中所定义的部分进行杂交的核酸。
根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物中引入并表达能够与实施例章节表A1至A6中给出的任何一种核酸杂交的核酸,或包括在植物中引入并表达这样的核酸,其能够与编码在实施例章节表A1至A6中给出的任一氨基酸序列之直向同源物、旁系同源物或同源物的核酸序列杂交。
关于eRF1多肽,可用于本发明方法的杂交序列编码如本文所定义的eRF1多肽,与实施例章节表A1中给出的氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与实施例章节表A1中给出的任一核酸的互补序列杂交、或与任一这些序列的部分杂交,其中部分如上文所定义,或者杂交序列能够与编码实施例章节表A1中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的互补序列杂交。最优选杂交序列能够与SEQ IDNO:1所示核酸的互补序列或其部分杂交。
优选地,杂交序列编码具有这样的氨基酸序列的多肽,所述氨基酸序列当全长用于构建系统树时,(例如图1所示的系统发生树)时,与包含由SEQ ID NO:2表示的氨基酸序列的eRF1多肽的群聚簇,而非与其他群聚簇。
关于SCAMP样多肽,可用于本发明方法的杂交序列编码如本文所定义的SCAMP样多肽,与实施例章节表A2中给出的氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与实施例章节表A2中给出的任一核酸的互补序列杂交、或与任一这些序列的部分杂交,其中部分如上文所定义,或者杂交序列能够与编码实施例章节表A2中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的互补序列杂交。最优选杂交序列能够与SEQ ID NO:88所示核酸的互补序列或其部分杂交。
优选杂交序列编码具有这样的氨基酸序列的多肽,所述氨基酸序列包含如本文中所定义的SCAMP结构域。
关于肌原纤蛋白多肽,可用于本发明方法的杂交序列编码如本文所定义的肌原纤蛋白多肽,与实施例章节表A3中给出的氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与实施例章节表A3中给出的任一核酸的互补序列杂交、或与任一这些序列的部分杂交,其中部分如上文所定义,或者杂交序列能够与编码实施例章节表A3中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的互补序列杂交。最优选杂交序列能够与SEQ ID NO:204所示核酸的互补序列或其部分杂交。
优选地,杂交序列编码具有这样的氨基酸序列的多肽,所述氨基酸序列当全长用于构建系统树时,(例如图6所示的系统发生树)时,与包含由SEQ ID NO:205表示的氨基酸序列的肌原纤蛋白多肽的群聚簇,而非与其他群聚簇。
关于PLATZ多肽,可用于本发明方法的杂交序列编码如本文所定义的PLATZ多肽,与实施例章节表A4中给出的氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与实施例章节表A4中给出的任一核酸的互补序列杂交、或与任一这些序列的部分杂交,其中部分如上文所定义,或者杂交序列能够与编码实施例章节表A4中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的互补序列杂交。最优选杂交序列能够与SEQ ID NO:260所示核酸的互补序列或其部分杂交。
优选地,杂交序列编码具有这样的氨基酸序列的多肽,所述氨基酸序列包含PLATZ结构域和一个或多个如上所定义的基序,并且当用于构建系统树(例如图12所示的系统发生树)时,与包含由SEQ ID NO:261表示的氨基酸序列的PLATZ-A多肽的群,更优选地与PLATZ-A1蛋白质的群,最优选地与PLATZ-A1-α蛋白质的群聚簇,而非与其他PLATZ蛋白质的群聚簇。
关于PLST样多肽,可用于本发明方法的杂交序列编码如本文所定义的PLST样多肽,与实施例章节表A5中给出的氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与实施例章节表A5中给出的任一核酸的互补序列杂交、或与任一这些序列的部分杂交,其中部分如上文所定义,或者杂交序列能够与编码实施例章节表A5中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的互补序列杂交。最优选杂交序列能够与SEQ ID NO:410所示核酸的互补序列或其部分杂交。
优选地,杂交序列编码具有这样的氨基酸序列的多肽,所述氨基酸序列当全长并用于构建系统树(例如图15所示的系统发生树)时,具有基序1至12的一个或多个和PF结构域,并与包含由SEQ ID NO:411表示的氨基酸序列的PLST样多肽的群聚簇,而非与其他群聚簇。
关于Glomalin多肽,可用于本发明方法的杂交序列编码如本文所定义的Glomalin多肽,与实施例章节表A6中给出的氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与实施例章节表A6中给出的任一核酸的互补序列杂交、或与任一这些序列的部分杂交,其中部分如上文所定义,或者杂交序列能够与编码实施例章节表A6中给出的任一氨基酸序列之直向同源物或旁系同源物的核酸的互补序列杂交。最优选杂交序列能够与SEQ ID NO:545所示核酸的互补序列或其部分杂交。优选的,杂交序列编码具有这样的氨基酸序列的多肽,所述氨基酸序列包含Cpn60_TCP1结构域(Pfam accession PF00118),或者当用于构建系统树时,(例如图19所示的系统发生树)时,与包含SEQ ID NO:546所示的氨基酸序列的Glomalin多肽的群聚簇,而非与其他群聚簇。
可用于本发明方法中的另一种核酸变体是编码如上文所定义的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的剪接变体,剪接变体如本文所定义。根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物中引入并表达在实施例章节表A1至A6中给出的任何一种核酸序列的剪接变体,或下述核酸的剪接变体,其中所述的核酸编码在实施例章节表A1至A6中给出的任一氨基酸序列之直向同源物、旁系同源物或同源物。
关于eRF1多肽,优选剪接变体是SEQ ID NO:1所示核酸的剪接变体,或编码SEQ ID NO:2之直向同源物或旁系同源物的核酸的剪接变体。优选地,由剪接变体编码的氨基酸序列,当用于构建系统树(例如图1所示的系统发生树)时,与包含SEQ ID NO:2所示的氨基酸序列的eRF1多肽的群聚簇,而非与其他群聚簇。
关于SCAMP样多肽,优选剪接变体是SEQ ID NO:88所示核酸的剪接变体,或编码SEQ ID NO:89之直向同源物或旁系同源物的核酸的剪接变体。优选地,由剪接变体编码的氨基酸序列包含如本文中所定义的SCAMP结构域。
关于肌原纤蛋白多肽,优选剪接变体是SEQ ID NO:204所示核酸的剪接变体,或编码SEQ ID NO:205之直向同源物或旁系同源物的核酸的剪接变体。优选地,由剪接变体编码的氨基酸序列,当用于构建系统树(例如图6所示的系统发生树)时,与包含SEQ ID NO:205所示的氨基酸序列的肌原纤蛋白多肽的群聚簇,而非与其他群聚簇。
关于PLATZ多肽,优选剪接变体是SEQ ID NO:260所示核酸的剪接变体,或编码SEQ ID NO:261之直向同源物或旁系同源物的核酸的剪接变体。优选地,由剪接变体编码的氨基酸序列包含PLATZ结构域和一个或多个如上所定义的基序,并且当用于构建系统树(例如图12所示的系统发生树)时,与包含由SEQ ID NO:261表示的氨基酸序列的PLATZ-A多肽的群,更优选地与PLATZ-A1蛋白质的群,最优选地与PLATZ-A1-α蛋白质的群聚簇,而非与其他PLATZ蛋白质的群聚簇。
关于PLST样多肽,优选剪接变体是SEQ ID NO:410所示核酸的剪接变体,或编码SEQ ID NO:411之直向同源物或旁系同源物的核酸的剪接变体。优选地,由剪接变体编码的氨基酸序列,当用于构建系统树(例如图15所示的系统发生树)时,具有基序19至30的一个或多个和PF结构域,并与包含SEQ ID NO:411所示的氨基酸序列的PLST样多肽的群聚簇,而非与其他群聚簇。
关于Glomalin多肽,优选剪接变体是SEQ ID NO:545所示核酸的剪接变体,或编码SEQ ID NO:546之直向同源物或旁系同源物的核酸的剪接变体。优选地,由剪接变体编码的氨基酸序列包含Cpn60_TCP1结构域(Pfam accession PF00118),或者当用于构建系统树(例如图19所示的系统发生树)时,与包含SEQ ID NO:546所示的氨基酸序列的Glomalin多肽的群聚簇,而非与其他群聚簇。
可用于本发明方法中的另一种核酸变体是编码如上文所定义的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸的等位变体,等位变体如本文所定义。
根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物中引入并表达在实施例章节表A1至A6中给出的任何一种核酸的等位变体,或包括在植物中引入并表达下述核酸的等位变体,其中所述的核酸编码在实施例章节表A1至A6中给出的任一氨基酸序列之直向同源物、旁系同源物或同源物。
关于eRF1多肽,可用于本发明方法的等位变体编码的多肽与SEQ IDNO:2的eRF1样多肽及实施例章节表A1中所示任一氨基酸具有基本上相同的生物活性。等位变体天然存在,并且这些天然等位基因的使用包含于本发明的方法中。优选地,等位变体为SEQ ID NO:1的等位变体,或编码SEQ ID NO:2之直向同源物或旁系同源物的核酸的等位变体。优选地,由等位变体编码的氨基酸序列,当用于构建系统树(例如图1所示的系统发生树)时,与包含SEQ ID NO:2所示的氨基酸序列的eRF1多肽的群聚簇,而非与其他群聚簇。
关于SCAMP样多肽,可用于本发明方法的等位变体编码的多肽与SEQ ID NO:89的SCAMP样多肽及实施例章节表A2中所示任一氨基酸具有基本上相同的生物活性。等位变体天然存在,并且这些天然等位基因的使用包含于本发明的方法中。优选地,等位变体为SEQ ID NO:88的等位变体,或编码SEQ ID NO:89之直向同源物或旁系同源物的核酸的等位变体。优选地,由等位变体编码的氨基酸序列包含如本文中所定义的SCAMP结构域。
关于肌原纤蛋白多肽,可用于本发明方法的等位变体编码的多肽与SEQ ID NO:205的肌原纤蛋白多肽及实施例章节表A3中所示任一氨基酸具有基本上相同的生物活性。等位变体天然存在,并且这些天然等位基因的使用包含于本发明的方法中。优选地,等位变体为SEQ ID NO:204的等位变体,或编码SEQ ID NO:205之直向同源物或旁系同源物的核酸的等位变体。优选地,由等位变体编码的氨基酸序列,当用于构建系统树(例如图6所示的系统发生树)时,与包含SEQ ID NO:205所示的氨基酸序列的肌原纤蛋白多肽聚簇,而非与其他群聚簇。
关于PLATZ多肽,可用于本发明方法的等位变体编码的多肽与SEQID NO:261的PLATZ多肽及实施例章节表A4中所示任一氨基酸具有基本上相同的生物活性。等位变体天然存在,并且这些天然等位基因的使用包含于本发明的方法中。优选地,等位变体为SEQ ID NO:260的等位变体,或编码SEQ ID NO:261之直向同源物或旁系同源物的核酸的等位变体。优选地,由等位变体编码的氨基酸序列包含PLATZ结构域和一个或多个如上所定义的基序,并且当用于构建系统树(例如图12所示的系统发生树)时,与包含由SEQ ID NO:261表示的氨基酸序列的PLATZ-A多肽的群,更优选地与PLATZ-A1蛋白质的群,最优选地与PLATZ-A1-α蛋白质的群聚簇,而非与其他PLATZ蛋白质的群聚簇。
关于PLST样多肽,可用于本发明方法的等位变体编码的多肽与SEQID NO:411的PLST样多肽及实施例章节表A5中所示任一氨基酸具有基本上相同的生物活性。等位变体天然存在,并且这些天然等位基因的使用包含于本发明的方法中。优选地,等位变体为SEQ ID NO:410的等位变体,或编码SEQ ID NO:411之直向同源物或旁系同源物的核酸的等位变体。优选地,由等位变体编码的氨基酸序列,当用于构建系统树(例如图14所示的系统发生树)时,具有基序19至30的一个或多个和PF结构域,并与包含SEQ ID NO:411所示的氨基酸序列的PLST样多肽聚簇,而非与其他群聚簇。
关于Glomalin多肽,可用于本发明方法的等位变体编码的多肽与SEQID NO:546的Glomalin多肽及实施例章节表A6中所示任一氨基酸具有基本上相同的生物活性。等位变体天然存在,并且这些天然等位基因的使用包含于本发明的方法中。优选地,等位变体为SEQ ID NO:545的等位变体,或编码SEQ ID NO:546之直向同源物或旁系同源物的核酸的等位变体。优选地,由等位变体编码的氨基酸序列包含Cpn60_TCP1结构域(Pfamaccession PF00118),或者当用于构建系统树(例如图19所示的系统发生树)时,与包含SEQ ID NO:546所示的氨基酸序列的Glomalin多肽的群聚簇,而非与其他群聚簇。
基因改组或定向进化也可用于产生上文所定义的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的编码核酸的变体;其中术语“基因改组”如本文所定义。
根据本发明,提供了在植物中增强产量相关性状的方法,包括在植物中引入和表达实施例章节表A1至A6中给出的任一核酸序列的变体,或者包括在植物中引入和表达编码实施例章节表A1至A6中给出的任一氨基酸序列之直向同源物、旁系同源物或同源物的核酸的变体,其中所述变体核酸通过基因改组获得。
关于eRF1多肽,优选通过基因改组获得的变体核酸编码下述氨基酸序列,所述氨基酸序列当用于构建系统树(例如图1所示的系统发生树)时,与包含SEQ ID NO:2所示的氨基酸序列的eRF1多肽的群聚簇,而非与其他群聚簇。
关于SCAMP样多肽,优选通过基因改组获得的变体核酸编码下述氨基酸序列,所述氨基酸序列包含如本文中所定义的SCAMP结构域。
关于肌原纤蛋白多肽,优选通过基因改组获得的变体核酸编码下述氨基酸序列,所述氨基酸序列当用于构建系统树(例如图6所示的系统发生树)时,与包含SEQ ID NO:205所示的氨基酸序列的肌原纤蛋白多肽的群聚簇,而非与其他群聚簇。
关于PLATZ多肽,优选通过基因改组获得的变体核酸编码下述氨基酸序列,所述氨基酸序列包含PLATZ结构域和一个或多个如上所定义的基序,并且当用于构建系统树(例如图12所示的系统发生树)时,与包含由SEQ ID NO:261表示的氨基酸序列的PLATZ-A多肽的群,更优选地与PLATZ-A1蛋白质的群,最优选地与PLATZ-A1-α蛋白质的群聚簇,而非与其他PLATZ蛋白质的群聚簇。
关于PLST样多肽,优选通过基因改组获得的变体核酸编码下述氨基酸序列,所述氨基酸序列当用于构建系统树(例如图15所示的系统发生树)时,与包含SEQ ID NO:411所示的氨基酸序列的PLST样多肽的群聚簇,而非与其他群聚簇。
关于Glomalin多肽,优选通过基因改组获得的变体核酸编码下述氨基酸序列,所述氨基酸序列包含Cpn60_TCP1结构域(Pfam accessionPF00118),或者当用于构建系统树(例如图19所示的系统发生树)时,与包含SEQ ID NO:546所示的氨基酸序列的Glomalin多肽的群聚簇,而非与其他群聚簇。
此外,还可利用定点诱变获得核酸变体。若干方法可用来实现定点诱变,最常见的是基于PCR的方法(Current Protocols in Molecular Biology.Wiley编辑)。
编码eRF1多肽的核酸可以来自任何天然或人工来源。可以通过有目的的人工操作对其进行修饰,使之不同于其在组合物和/或基因组环境中的天然形式。优选eRF1多肽编码核酸来自植物,还优选来自单子叶植物,更优选来自禾本科,最优选该核酸来自稻。
编码SCAMP样多肽的核酸可以来自任何天然或人工来源。可以通过有目的的人工操作对其进行修饰,使之不同于其在组合物和/或基因组环境中的天然形式。优选SCAMP样多肽编码核酸来自植物,还优选来自双子叶植物,更优选来自十字花科,最优选该核酸来自拟南芥。
可以将任一前述肌原纤蛋白多肽序列靶向质体。优选的质体是叶绿体。用于靶向质体的方法是本领域众所周知的,并且包括但不限于使用转运肽。下表3显示了适合用于任一肌原纤蛋白多肽靶向质体的转运肽的实例。肌原纤蛋白多肽可以不以其天然形式靶向质体或者可以靶向不同的质体。此外,肌原纤蛋白可以通过不同的转运肽(例如,其天然转运肽)以其天然形式靶向质体。
表3:用于靶向氨基酸到质体的转运肽序列的实例
编码肌原纤蛋白多肽的核酸可以来自任何天然或人工来源。可以通过有目的的人工操作对其进行修饰,使之不同于其在组合物和/或基因组环境中的天然形式。优选肌原纤蛋白多肽编码核酸来自植物,还优选来自双子叶植物,更优选来自茄科(Solanaceae),另外优选地,该核酸来自番茄属(Lycopersicon),还优选地来自番茄属物种,最优选核酸来自番茄。
编码PLATZ多肽的核酸可以来自任何天然或人工来源。可以通过有目的的人工操作对其进行修饰,使之不同于其在组合物和/或基因组环境中的天然形式。优选PLATZ多肽编码核酸来自植物,还优选来自双子叶植物,更优选来自杨柳科(Salicaceae),最优选核酸来自杨属物种(Populussp)。
编码PLST样多肽的核酸可以来自任何天然或人工来源。可以通过有目的的人工操作对其进行修饰,使之不同于其在组合物和/或基因组环境中的天然形式。优选PLST样多肽编码核酸来自植物,还优选来自双子叶植物,更优选来自杨柳科,最优选核酸来自毛果杨(Populus trichocarpa)。
编码Glomalin多肽的核酸可以来自任何天然或人工来源。可以通过有目的的人工操作对其进行修饰,使之不同于其在组合物和/或基因组环境中的天然形式。优选Glomalin多肽编码核酸来自植物,还优选来自单子叶植物,更优选来自禾本科,最优选核酸来自稻。
本发明方法的实施产生具有增强的产量相关性状的植物。尤其本发明方法的实施产生相对于对照植物而具有增加的产量、尤其增加的种子产量的植物。在本文中的“定义”部分中更详细地描述了术语“产量”和“种子产量”。
在本文中对增强的产量相关性状的提及意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获)部分和/或地下(可收获)部分。尤其,此类可收获部分是生物量和/或种子,并且本发明方法的实施产生相对于对照植物的种子产量而具有增加的生物量和/或增加的种子产量的植物。
以玉米为例,产量增加可以表现为下列一种或多种指标:每平方米中已建立植物数的增加、每株植物穗数的增加、行数、每行粒数、粒重、千粒重、穗长度/直径的增加、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100的值)及其它。
以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每平方米植物数、每株植物穗数、每穗小穗数、每穗花(小花)数(其表示为饱满种子数与原穗数的比率)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100的值)、千粒重的增加及其它。
本发明提供了增加植物相对于对照植物的产量、特别是生物量和/或种子产量的方法,所述方法包括调节植物和/或植物质体中如本文所定义的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的编码核酸的表达。
由于本发明的转基因植物具有增加的产量特性和/或产量,因而相对于对照植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。
增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如发芽的速度、早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期之一或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许再播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其它稻植物,全部均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许再播种不同植物物种的种子(例如播种并收获玉米植物,随后例如任选播种并收获大豆、马铃薯或任何其它合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每平方米的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物而言在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其90%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生相对于对照植物而具有增加的生长速率的植物。因而根据本发明,提供增加植物生长速率的方法,所述方法包括调节如本文中所定义的编码eRF1多肽的核酸在植物中的表达。
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物暴露于其的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%、30%或25%,更优选小于20%或15%。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌、线虫和昆虫引起的那些胁迫。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。如本文中所用的术语非胁迫,包括如本文中所定义,植物暴露的偶尔或每天的轻微胁迫,但是不包括严重胁迫。
尤其,本发明的方法可以在非胁迫条件下或者轻微干旱的条件下实施以产生相对于对照植物而言具有增加的产量特性的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐浓度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交叉对话(cross talk)”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐浓度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。最佳生长下生长的植物(在非胁迫条件下生长)一般出产以递增优选顺序至少97%、95%、92%、90%、87%、85%、83%、80%、77%或75%的给定环境下这样植物的平均生产。平均生产可以收获和/或季节为基础进行计算。本领域技术人员清楚作物的平均产量生产。
实施本发明方法产生在非胁迫条件下或者轻微干旱的条件下相对于在相当条件下培育的对照植物而言具有增加的产量特性和/或产量的植物。因此,根据本发明,提供了增加在非胁迫条件下或者轻微干旱的条件下培育的植物的产量的方法,所述方法包括在植物中和/或植物质体中调节编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸的表达。
实施本发明方法产生在营养缺乏条件下,特别是氮缺乏条件下相对于在相当条件下培育的对照植物而言具有增加的产量特性的植物。因此,根据本发明,提供了增加在营养缺乏条件件下培育的植物的产量的方法,该方法包括在植物中调节编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLST样多肽、或Glomalin多肽的核酸的表达。营养缺乏可以由营养物(例如氮、磷和其它含磷化合物、钾、钙、镁、锰、铁或者硼以及其它)缺少引起。
对于PLATZ多肽,实施本发明方法产生在营养缺乏条件下,特别是氮缺乏条件下相对于在相当条件下培育的对照植物而言具有增加的产量的植物。由于养分利用效率对植物产量和产品质量有显著影响,因此在田间倾倒了大量肥料来优化植物生长和质量。植物的生产力一般受限于三种主要养分:磷、钾和氮,在植物生长的这三者中,氮通常是植物生长的限速元素。因此,植物生长所需的主要营养元素是氮(N)。这是可见于活细胞中的多种重要化合物的组分,所述化合物包括氨基酸、蛋白质(酶)、核酸和叶绿素。植物干物质的1.5%至2%以及总植物蛋白质的约16%是氮。因此,氮的利用度是作物植物生长和生产的主要限制因素(Frink等(1999)ProcNatl Acad Sci USA 96(4):1175-1180),并也对蛋白质积累和氨基酸组成有重大影响。因此,在氮有限条件下培养时具有增加的产量相关性状的作物植物是很有意义的。因此,根据本发明,提供了增加在营养缺乏条件下培育的植物的产量的方法,该方法包括在植物中调节编码PLATZ多肽的核酸的表达。营养缺乏可以由营养物(例如氮、磷和其它含磷化合物、钾、钙、镁、锰、铁或者硼以及其它)缺少引起。
实施本发明方法产生在盐胁迫下相对于在相当条件下培育的对照植物而言具有增加的产量特性的植物。因此,根据本发明,提供了增加在盐胁迫条件下培育的植物的产量的方法,该方法包括在植物中调节编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸的表达。术语盐胁迫不限于常见盐(NaCl),而是可以为由以下一种或多种引起的任何胁迫:NaCl、KCl、LiCl、MgCl2、CaCl2等。
本发明包括可由根据本发明的方法获得的植物或其部分(包括种子)。所述植物或其部分包含编码如上文所定义的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸转基因。
本发明还提供遗传构建体和载体,以利于在植物中引入和/或表达编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸。可以将遗传构建体插入适于转化进入植物并适于在转化的细胞中表达目的基因的载体中,该载体可以是可商购的载体。本发明还提供了如本文所定义的遗传构建体在本发明方法中的用途。
更具体地,本发明提供这样的构建体,其含有:
(a)编码如上文所定义的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸;
(b)一个或多个能够驱动(a)中核酸序列表达的控制序列;和任选的
(c)转录终止序列。
优选地,编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸是如上文所定义的。术语“控制序列”和“终止序列”是如本文所定义的。
可以使用含有任何上述核酸的载体转化植物。技术人员充分知晓载体中必须存在的遗传元件,以便成功进行转化、选择并繁殖含目的序列的宿主细胞。将目的序列有效连接于一个或多个控制序列(至少连接于启动子)。
有利地,任何类型的启动子,不论天然的或合成的,均可用于驱动核酸序列的表达,但是优选启动子是植物来源的。组成型启动子在方法中是特别有用的。优选组成型启动子也是中等强度的遍在组成型启动子。多种启动子类型的定义参见本文的“定义”部分。对于eRF1多肽和/或PLST样多肽,也在本发明中有用的是根特异性启动子。
对于Glomalin多肽,有利地,任何类型的启动子,不论天然的或合成的,均可用于驱动核酸序列的表达,但是优选启动子是植物来源的。多种启动子类型的定义参见本文的“定义”部分。根特异性启动子在方法中是特别有用的。优选根特异性启动子是RCc3启动子(Plant Mol Biol.1995年1月;27(2):237-48),更优选RCc3启动子来自稻,还优选RCc3启动子是由与SEQ ID NO:611基本相似的核酸序列所表示的,最优选组成型启动子如SEQ ID NO:611所示。也可以用于执行本发明方法的其他根特异性启动子的实例见如上“定义”部分表2b中所示。
组成型启动子在本发明方法中也是有用的;优选组成型启动子也是中等强度的遍在组成型启动子,例如GOS2启动子,更优选来自稻的GOS2启动子。还优选组成型启动子是由与SEQ ID NO:612基本相似的核酸序列所表示的,最优选组成型启动子如SEQ ID NO:612所示。组成型启动子的其它实例见本文“定义”部分。
关于eRF1多肽,应该明白,本发明的适用范围不限于SEQ ID NO:1所示eRF1多肽的编码核酸,本发明的适用范围也不限于由组成型启动子驱动时或者由根特异性启动子驱动时编码eRF1多肽的核酸的表达。
组成型启动子优选是中等强度的启动子,更优选的选自植物来源的启动子,例如GOS2启动子,更优选来自稻的GOS2启动子。还优选组成型启动子是由与SEQ ID NO:85基本相似的核酸序列所表示的,最优选组成型启动子如SEQ ID NO:85所示。组成型启动子的其它实例见本文“定义”部分。
任选地,可在引入植物的构建体中使用一个或多个终止子序列。优选的,构建体包括包含GOS2启动子(与SEQ ID NO:85基本相似)和编码eRF1多肽的核酸的表达盒。
关于SCAMP样多肽,应该明白,本发明的适用范围不限于SEQ IDNO:88所示SCAMP样多肽的编码核酸,本发明的适用范围也不限于由组成型启动子驱动时编码SCAMP样多肽的核酸的表达。
组成型启动子优选是中等强度的启动子,更优选的选自植物来源的启动子,例如GOS2启动子,更优选来自稻的GOS2启动子。还优选组成型启动子是由与SEQ ID NO:203基本相似的核酸序列所表示的,最优选组成型启动子如SEQ ID NO:203所示。组成型启动子的其它实例见本文“定义”部分。
任选地,可在引入植物的构建体中使用一个或多个终止子序列。优选的,构建体包括包含GOS2启动子(与SEQ ID NO:203基本相似)和编码SCAMP样多肽的核酸的表达盒。
关于肌原纤蛋白多肽,应该明白,本发明的适用范围不限于SEQ IDNO:204所示肌原纤蛋白多肽的编码核酸,本发明的适用范围也不限于由组成型启动子驱动时编码肌原纤蛋白多肽的核酸的表达。
组成型启动子优选是中等强度的启动子,更优选的选自植物来源的启动子,例如GOS2启动子,更优选来自稻的GOS2启动子。还优选组成型启动子是由与SEQ ID NO:257基本相似的核酸序列所表示的,最优选组成型启动子如SEQ ID NO:257所示。组成型启动子的其它实例见本文“定义”部分。
任选地,可在引入植物的构建体中使用一个或多个终止子序列。优选的,构建体包括包含GOS2启动子(与SEQ ID NO:257基本相似)和编码肌原纤蛋白多肽的核酸的表达盒。
关于PLATZ多肽,应该明白,本发明的适用范围不限于SEQ ID NO:260所示PLATZ多肽的编码核酸,本发明的适用范围也不限于由组成型启动子驱动时编码PLATZ多肽的核酸的表达。
组成型启动子优选选自植物来源的启动子,例如GOS2启动子,更优选来自稻的GOS2启动子。还优选组成型启动子是由与SEQ ID NO:273基本相似的核酸序列所表示的,最优选组成型启动子如SEQ ID NO:273所示。组成型启动子的其它实例见本文“定义”部分。
任选地,可在引入植物的构建体中使用一个或多个终止子序列。优选的,构建体包括包含GOS2启动子(与SEQ ID NO:273基本相似)和编码PLATZ多肽的核酸的表达盒。
关于PLST样多肽,应该明白,本发明的适用范围不限于SEQ ID NO:410所示PLST样多肽的编码核酸,本发明的适用范围也不限于由组成型启动子驱动时编码PLST样多肽的核酸的表达。
组成型启动子优选是中等强度的启动子,更优选的选自植物来源的启动子,例如GOS2启动子,更优选来自稻的GOS2启动子。还优选组成型启动子是由与SEQ ID NO:542基本相似的核酸序列所表示的,最优选组成型启动子如SEQ ID NO:542所示。组成型启动子的其它实例见本文“定义”部分。
任选地,可在引入植物的构建体中使用一个或多个终止子序列。优选的,构建体包括包含GOS2启动子(与SEQ ID NO:542基本相似)和编码PLST样多肽的核酸的表达盒。
关于Glomalin多肽,应该明白,本发明的适用范围不限于SEQ ID NO:545所示Glomalin多肽的编码核酸,本发明的适用范围也不限于由根特异性启动子驱动时或者由组成型启动子驱动时编码Glomalin多肽的核酸的表达。
任选地,可在引入植物的构建体中使用一个或多个终止子序列。优选的,构建体包括包含RCc3启动子(与SEQ ID NO:611基本相似)和编码Glomalin多肽的核酸的表达盒。
根据本发明优选的特征,调节的表达是增加的表达。在本领域内详细记载了用于增加核酸或基因或者基因产物表达的方法,并且在定义部分提供了实例。
其它调节元件可包括转录及翻译增强子。本领域技术人员会了解适于在实施本发明中使用的终止子和增强子序列。如在定义部分所述,也可将内含子序列添加至5′非翻译区(UTR)或编码序列上,以增加在细胞质内积累的成熟信息的量。其它控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定元件。本领域技术人员会知道或可以容易地获得此类序列。
本发明的遗传构建体还可以包括在特定细胞类型中维持和/或复制需要的复制起点序列。一个例子是当需要将遗传构建体在细菌细胞中作为附加型遗传元件(例如质粒或粘粒分子)维持时。优选的复制起点包括但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸序列的转基因植物,使用标记基因(或报告基因)是有利的。因而,遗传构建体可以任选地包含可选择标记基因。可选择标记在本文“定义”部分中有更详细的描述。一旦不再需要,可以从转基因细胞中去除或切除标记基因。用于标记基因去除的技术是本领域已知的,有用的技术在上文“定义”部分中描述。
本发明还提供产生与对照植物相比具有增强的产量相关性状的转基因植物的方法,其包括在植物和/或植物质体中引入和表达编码上文所定义的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的任何核酸。
更具体地,本发明提供了产生具有增强的产量相关性状(特别是增加的种子产量以及生物量)的转基因植物的方法,所述方法包括:
(i)向植物或植物细胞中引入和表达eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
(i)的核酸可以是任何能编码如本文所定义的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸。
可以将核酸直接引入植物细胞或植物本身(包括引入植物的组织、器官或任何其它部分)。根据本发明优选的特征,优选通过转化将核酸引入植物。术语“转化”在本文“定义”部分有更详细的说明。
遗传修饰的植物细胞能够通过技术人员熟悉的所有方法再生。合适的方法可见于上述S.D.Kung和R.Wu、Potrykus或者和Willmitzer的出版物。
通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与目的基因共转移的植物可表达基因编码,继之将转化的材料再生成整个植物。为选择转化的植物,通常将在转化过程中获得的植物材料置于选择性条件下,从而可将转化的植物与非转化植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长期之后,通过喷雾对其进行合适的选择。另一可能方案是使用合适的选择剂,将种子(适当时在灭菌之后)种在含有合适选择剂琼脂板上,从而仅转化的种子能够长成植物。备选地,针对转化的植物筛选可选择标记(如上文所述标记)的存在。
DNA转移和再生之后,还可评价推定转化的植物,例如用Southern分析,评价目的基因的存在、拷贝数和/或基因组构造。备选地或另外地,可用Northern和/或Western分析监测新引入的DNA的表达水平,这两种技术都是本领域普通技术人员所熟知的。
产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例如,第一代(或T1)转化的植物可自交,选择纯合的第二代(或T2)转化体,而T2植物可进一步通过经典育种技术繁殖。产生的转化生物体可以有多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆的转化体(例如所有细胞经转化含有表达盒);转化和非转化组织的嫁接体(例如在植物中,转化的根状茎嫁接到非转化的接穗上)。
本发明显然延及由本文所述任何方法产生的任何植物细胞或植物,以及所有的植物部分及其繁殖体。本发明还延及由任何上述方法产生的原代转化或转染的细胞、组织、器官或整个植物的后代,唯一的要求是所述后代呈现出与在本发明方法中亲本产生的基因型和/或表型特征相同的基因型和/或表型特征。
本发明也包括含有分离的编码如上文所定义的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸的宿主细胞。根据本发明优选的宿主细胞是植物细胞。对于用于本发明方法的核酸或载体、表达盒或构建体或载体,其宿主植物原则上有利地为能够合成在本发明方法中使用的多肽的所有植物。
本发明方法有利地适用于任何植物。特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤其是单子叶植物和双子叶植物,包括饲用或饲料豆类、观赏植物、粮食作物、树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的例子包括大豆、向日葵、芸苔、苜蓿、油菜(rapeseed)、亚麻子、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的例子包括甘蔗。更优选地,植物是谷物。谷物的例子包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦(emmer)、德国小麦(spelt)、黑麦属、一粒系小麦(einkorn)、teff、蜀黍(milo)和燕麦。
本发明也延及植物的可收获部分,该植物可收获部分包含编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的重组核酸,这样的可收获部分包括,但不限于种子、叶、果实、花、茎、根、根茎、块茎和鳞茎。本发明进一步涉及来自、优选直接来自该植物的可收获部分的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
根据本发明优选的特征,调节的表达是增加的表达。在本领域内详细记载了用于增加核酸或基因或者基因产物表达的方法,并且在定义部分提供了实例。
如上所述,用于调节编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸表达的优选方法是通过在植物中引入并表达编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸;然而实施该方法的效果(也就是增强产量相关性状)也可使用其它已知技术来实现,包括但不限于T-DNA激活标签、TILLING、同源重组。在定义部分提供了这些技术的描述。
本发明也包括编码如本文中所述的eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸的用途和这些eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的用途,用于增强植物中的任何前述的产量相关性状。
编码本文中所述eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸、或者eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽本身可以用于育种程序中,其中鉴定到可以与eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽编码基因遗传连锁的DNA标记。所述核酸/基因或eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽本身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来选择具有本发明方法中如上文所定义的增强的产量相关性状的植物。
编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的基因/核酸的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物作诱变处理而引入等位基因变异;备选地,该程序可以从非故意引起的所谓“自然”起源的等位变体集合开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论序列的优选等位变体且其导致增加的产量性状的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温室中或田间监测生长性能。其它任选步骤包括将鉴定到有优选等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸序列也可以用作探针以便对基因进行遗传作图和物理作图,所述探针作为所述基因的一部分,及用作与那些基因关联的性状的标记。此类信息可以用于植物育种中,以便开发具有想要表型的株系。编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸序列来探测。产生的条带图谱随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸序列可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算编码eRF1多肽、或SCAMP样多肽、或肌原纤蛋白多肽、或PLATZ多肽、或PLST样多肽、或Glomalin多肽的核酸在使用这个群体先前所获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改进方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、近等基因系和其它个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸序列探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.5:13-20),然而灵敏度的改进可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸序列扩增的方法可以使用所述核酸序列而实施。例子包括等位基因特异的扩增(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员众所周知的。在使用基于PCR遗传作图的方法中,可能必须鉴定在对应于当前核酸序列的整个区域内作图亲代间的DNA序列差异。然而,这对于作图法而言通常不是必需的。
本发明方法产生具有如前文所述的增强的产量相关性状的植物。这些性状也可以与其它经济有利的性状组合,如其它的产量增强性状、对其它非生物胁迫和生物胁迫的耐性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
项目
1.eRF1多肽
在一个方面,本发明的特征在于一个或多个以下项目:
1.用于在植物中相对于对照植物增强产量相关性状的方法,包括调节编码eRF1多肽的核酸在植物中的表达,其中所述多肽包含至少3个共有结构域,eRF1结构域1、eRF1结构域2和eRF1结构域3(Pfam登录号分别为PF03463、PF03464和PF03465)。
2.项目1的方法,其中eRF1多肽的eRF1结构域1以递增的优先顺序与位于SEQ ID NO 2的氨基酸6至140之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
3.项目1的方法,其中eRF1多肽的eRF1结构域2以递增的优先顺序与位于SEQ ID NO 2的氨基酸144至278之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
4.项目1的方法,其中eRF1多肽的eRF1结构域3以递增的优先顺序与位于SEQ ID NO 2的氨基酸281至418之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
5.项目1-4的任一项的方法,其中本发明的eRF1多肽包含一个或多个以下肽:分别具有SEQ ID NO:73、74和75的GGQ、NIKS和[GA][IMLV]LR[YW]。
6.项目1的方法,其中所述eRF1多肽还可以包含序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序1:FGTLSGNTREVLHKF[TS]VDLPKKHGRGGQSALRFARLRMEKRHNYVRK[TV]AE(SEQ ID NO:76),
(ii)基序2:YN[KR]VPPNGLVLY[TC]GT[IV]VT[ED][DE]GKEKKV[TN]IDFEPF[KR]PIN[AT]SLYLCDNKFHTE(SEQ ID NO:77),
(iii)基序3:ARGNGTSMISLI[MI]PP[RK]DQ[IV]SRVTKML[GA]DE[YF]GTASNI KSRVNR[QL]SVL[GS]AIT(SEQ ID NO:78)具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
7.项目1-6的任一项的方法,其中所述eRF1多肽还可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序4:[TS]VDLPKKHGRGGQSALRFARLR[EM]EKRHNYVRKVAE[VL]A[VT]QNFITND[KR][PV]NV(SEQ ID NO:79),
(ii)基序5:Y[NT][KR]VPPNGLV[VLI]YCG[TD][IV][ILM]T[ED][ED]GKE[KR]K[VM][NT]ID[FI]EPFKPINTSLYLCDNKFHTE(SEQ ID NO:80),
(iii)基序6:ARGNGTSMISL[IV][IM]PPK[DG]Q[IV]S[RL]V[QA]KML[AT][DE]EYGTASNIKSRVNR[LQ]SVL[SG]AIT(SEQ ID NO:81)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
8.项目6-7的任一项的方法,其中所述eRF1多肽还可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序7:VDLPKKHGRGGQSALRFARLRMEKRHNYVRKTAELATQF[YF]INPATSQPNV(SEQ ID NO:82),
(ii)基序8:YNKVPPNGLVLYTGTIVT[ED]DGKEKKVTIDFEPF[KR]PINASLYLCDNKFHTE(SEQ ID NO:83),
(iii)基序9:TSMISLIMPPRDQ[VI]SRVTKMLGDE[FY]GTASNIKSRVNRQSVLGAITSAQQR(SEQ ID NO:84)具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
9.项目1-8的任一项的方法,其中eRF1多肽的同源物以递增的优先顺序与由表A1的任一多肽,优选地由SEQ ID NO:2表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性。
10.项目1-9的任一项的方法,其中所述受调控的表达通过在植物中引入和表达如前述项目任一项所述的eRF1多肽之编码核酸而实现。
11.项目1-10的任一项的方法,其中所述编码eRF1多肽之核酸编码表A1中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
12.项目1-11的任一项的方法,其中所述核酸序列编码表A1给出的任一蛋白质的直向同源物或旁系同源物。
13.任一前述项目的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
14.项目1-13的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
15.项目1-14的任一项的方法,其中所述增强的产量相关性状是在干旱胁迫、盐胁迫或氮缺乏条件下获得的。
16.项目10-12的任一项的方法,其中所述核酸与组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子有效连接。
17.项目1-16的任一项的方法,其中所述eRF1多肽之编码核酸是植物来源的,优选来自双子叶植物,进一步优选来自十字花科,更优选来自拟南芥属,最优选来自拟南芥。
18.通过项目1-17的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码eRF1多肽的重组核酸。
19.构建体,包含:
(i)编码如项目1-9定义的eRF1多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
20.项目19的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
21.项目19或20的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
22.用项目19或20的构建体转化的植物、植物部分或植物细胞。
23.用于生产相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如项目1-9定义的eRF1多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
24.相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如项目1-9定义的eRF1多肽之编码核酸受调控的表达。
25.项目18、22或24的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
26.项目25的植物的可收获部分,其中所述可收获部分优选是苗生物量和/或种子。
27.来自项目25的植物和/或项目26的植物的可收获部分的产物。
28.eRF1多肽之编码核酸在相对于对照植物,在植物中增加产量,特别是增加的种子产量和/或苗生物量的用途。
29.分离的核酸分子,选自:
(i)由以下核酸序列的任一表示的核酸:具有SEQ ID NO:15的G.max_GM06MC33657_sm55b1032878;具有SEQ ID NO:17的H.vulgare_c64960768hv2703032598;
(ii)由所述序列表示的核酸的互补序列:所述序列具有SEQ ID NO:15的G.max_GM06MC33657_sm55b1032878;具有SEQ ID NO:17的H.vulgare_c64960768hv2703032598;
(iii)编码由SEQ ID NO:16;SEQ ID NO:18的任一表示的多肽的核酸,优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQID NO:16和18的任一表示的多肽序列,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(iv)核酸,所述核酸以递增的优先顺序与表A1的任一核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状;
(vi)编码eRF1多肽的核酸,所述eRF1多肽以递增的优先顺序与由SEQ ID NO:16和18的任一表示的氨基酸序列和表A1中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
30.本发明另外的实施方案,从而还提供了分离的多肽,选自:
(i)由SEQ ID NO:16和18的任一表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:16和18的任一表示的氨基酸序列和表A1中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
2.SCAMP样多肽
在另一方面,本发明的特征在于一个或多个以下项目:
1.用于在植物中相对于对照植物增强产量相关性状的方法,包括调节编码SCAMP样多肽的核酸在植物中的表达,其中所述SCAMP样多肽包含SCAMP结构域。
2.项目1的方法,其中所述SCAMP结构域以递增的优先顺序与表A2的任一多肽中存在的SCAMP结构域的氨基酸,优选地与位于SEQ IDNO 89的氨基酸91至265之间的序列表示的SCAMP结构域具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。
3.项目1或2的方法,其中所述受调控的表达通过在植物中引入和表达SCAMP样多肽之编码核酸而实现。
4.项目1-3的任一项的方法,其中所述编码SCAMP样多肽之核酸编码表A2中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
5.项目1-4的任一项的方法,其中所述核酸序列编码表A2给出的任一蛋白质的直向同源物或旁系同源物。
6.任一前述项目的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
7.项目1-6的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
8.项目1-6的任一项的方法,其中所述增强的产量相关性状是在干旱胁迫、盐胁迫或氮缺乏条件下获得的。
9.项目3-8的任一项的方法,其中所述核酸与组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子有效连接。
10.项目1-9的任一项的方法,其中所述LBD多肽之编码核酸是植物来源的,优选来自双子叶植物,进一步优选来自十字花科,更优选来自拟南芥属,最优选来自拟南芥。
11.通过项目1-10的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码SCAMP样多肽的重组核酸。
12.构建体,包含:
(i)编码如项目1或2定义的SCAMP样多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
13.项目12的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
14.项目12或13的构建体在用于制造相对于对照植物具有增加的产量,特别是增加生物量和/或增加的种子产量的植物的方法中的用途。
15.用项目12或13的构建体转化的植物、植物部分或植物细胞。
16.用于生产相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如项目1或2定义的SCAMP样多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
17.相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如项目1或2定义的SCAMP样多肽之编码核酸受调控的表达。
18.项目11、15或17的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
19.项目18的植物的可收获部分,其中所述可收获部分优选是苗生物量和/或种子。
20.来自项目18的植物和/或项目19的植物的可收获部分的产物。
21.SCAMP样多肽之编码核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量和/或苗生物量的用途。
22.分离的核酸分子,选自:
(i)由SEQ ID NO:100、102、104、106、180、182、184、186、188、190和192的任一表示的核酸;
(ii)由(i)项SEQ ID NO:100、102、104、106、180、182、184、186、188、190和192的任一表示的核酸的互补序列;
(iii)编码由SEQ ID NO:101、103、105、107、109、183、185、187、189、191和193的任一表示的多肽的核酸;优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的多肽序列,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(iv)核酸,所述核酸以递增的优先顺序与表A2的任一核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi)编码多肽的核酸,所述多肽以递增的优先顺序与由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的氨基酸序列和表A2中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
23.分离的多肽,选自
(i)由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的氨基酸序列和表A2中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
3.肌原纤蛋白多肽
在另一方面,本发明的特征在于一个或多个以下项目:
1.用于在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码肌原纤蛋白多肽之核酸的表达,所述肌原纤蛋白多肽包括:
(i)由PFAM登录号PF04755表示的PAP肌原纤蛋白结构域;和
(ii)由KFECQNESRGGLVRNVIKWSVPRLLE
ENEGATLIVTARFSSVSARNIYLKFEEIGLQNINISDDLQAVIAPAILPRSFLSLQILQFIRSFKARVPVTSPERHSVGGLYYLSYLDKNMLLGRAVGGGGVFIFTRAHTL(SEQ ID NO:253)表示的羧基端结构域,其可以含有表示1至15个之间的残基的0至5个之间的空位,或者以递增的优先顺序与(SEQ ID NO:253)具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性的结构域;和任选地
(iii)在多肽的氨基端区域内的转运肽。
2.项目1的方法,其中所述PAP肌原纤蛋白结构域由ENRKYELLNIIQDTQRGLVTTADQRSTIEEAMVVVEGFDAGKEIDLSKLDGTWQYTSAPDVLILFESAARLPFFQVGQIFQ SEQ ID NO:252表示,其可以含有表示1至15个之间的残基的0至5个之间的空位,或者以递增的优先顺序与SEQID NO:252具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性的结构域。
3.项目1或2的方法,其中所述肌原纤蛋白多肽包含以下结构域的一个或多个:
结构域X:NIYLQF[EQ]E[IA]S[VL]Q[ND]INISE[EQ]LQAL[IL]APA[IL]LPRSFL[SN]LQILQ[FA][LI][RK][TS]F[KR]AQ[VI]P;
结构域Y:YYL[ST]YLD[RN][ND]MLLGR[AS]VGGGGV;
结构域Z:[PA][IL]DL[AS]KLDGTWRLQYTSA[SP]DV;或
以递增的优先顺序与结构域X、Y和Z的任意一个或多个具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性的结构域。
4.项目1-3的任一项的方法,其中所述受调控的表达通过在植物中引入和表达肌原纤蛋白多肽之编码核酸而实现。
5.项目1-4的任一项的方法,其中所述编码肌原纤蛋白多肽之核酸编码表A3中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
6.项目1-5的任一项的方法,其中所述核酸序列编码表A3给出的任一蛋白质的直向同源物或旁系同源物。
7.任一前述项目的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选的种子产量。
8.项目1-7的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
9.项目4-8的任一项的方法,其中所述核酸与组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子有效连接。
10.项目1-9的任一项的方法,其中所述肌原纤蛋白多肽之编码核酸是植物来源的,优选来自双子叶植物,更优选来自茄科(Solanaceae),还优选该核酸来自番茄属(Lycopersicon),进一步优选地来自番茄属物种,最优选核酸来自番茄。
11.通过项目1-10的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码肌原纤蛋白多肽的重组核酸。
12.构建体,包含:
(i)编码如项目1-3定义的肌原纤蛋白多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
13.项目12的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
14.项目12或13的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的种子产量的植物的方法中的用途。
15.用项目12或13的构建体转化的植物、植物部分或植物细胞。
16.用于生产相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如项目1-3定义的肌原纤蛋白多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
17.相对于对照植物,具有增加的产量,特别是增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如项目1-3定义的肌原纤蛋白多肽之编码核酸受调控的表达。
18.项目11、15或17的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
19.项目18的植物的可收获部分,其中所述可收获部分优选是种子。
20.来自项目18的植物和/或项目19的植物的可收获部分的产物。
21.肌原纤蛋白多肽之编码核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量的用途。
22.分离的核酸分子,选自:
(i)由以下核酸序列的任一表示的核酸:具有SEQ ID NO:206的B.napus_BN06MC20042_4649927919975;具有SEQ ID NO:220的G.max_GM06MC19234_5969470918873;
(ii)由所述序列表示的核酸的互补序列:所述序列具有SEQ ID NO:206的B.napus_BN06MC20042_4649927919975;具有SEQ ID NO:220的G.max_GM06MC19234_5969470918873;
(iii)编码由SEQ ID NO:207;SEQ ID NO:221的任一表示的多肽的核酸,优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQID NO:207和221的任一表示的多肽序列,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(iv)核酸,所述核酸以递增的优先顺序与表A3的任一核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状;
(vi)编码肌原纤蛋白多肽的核酸,所述肌原纤蛋白多肽以递增的优先顺序与由SEQ ID NO:207和221的任一表示的氨基酸序列和表A3中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
23.根据本发明另外的实施方案,从而还提供了分离的多肽分子,选自:
(i)由SEQ ID NO:207和221的任一表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:207和221的任一表示的氨基酸序列和表A3中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
4.PLATZ多肽
在另一方面,本发明的特征在于一个或多个以下项目:
1.用于在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码PLATZ多肽之核酸的表达,其中所述PLATZ多肽包含PLATZ结构域。
2.项目1的方法,其中所述PLATZ多肽包含基序10至18(SEQ IDNO:264至SEQ ID NO:272)的一个或多个。
3.项目1或2的任一项的方法,其中所述受调控的表达通过在植物中引入和表达PLATZ多肽之编码核酸而实现。
4.项目1-3的任一项的方法,其中所述编码PLATZ多肽之核酸编码表A4中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
5.项目1-4的任一项的方法,其中所述核酸序列编码表A4给出的任一蛋白质的直向同源物或旁系同源物。
6.任一前述项目的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
7.项目1-6的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
8.项目3-7的任一项的方法,其中所述核酸与组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子有效连接。
9.项目1-8的任一项的方法,其中所述PLATZ多肽之编码核酸是植物来源的,优选来自双子叶植物,进一步优选来自杨柳科,最优选地来自杨属。
10.通过项目1-9的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码PLATZ多肽的重组核酸。
11.构建体,包含:
(i)编码如项目1或2定义的PLATZ多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
12.项目11的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
13.项目11或12的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
14.用项目11或12的构建体转化的植物、植物部分或植物细胞。
15.用于生产相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如项目1或2定义的PLATZ多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
16.相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如项目1或2定义的PLATZ多肽之编码核酸受调控的表达。
17.项目10、14或16的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
18.项目17的植物的可收获部分,其中所述可收获部分优选是苗生物量和/或种子。
19.来自项目17的植物和/或项目18的植物的可收获部分的产物。
20.PLATZ多肽之编码核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量和/或苗生物量的用途。
21.分离的核酸分子,选自:
(i)由SEQ ID NO:354表示的核酸;
(ii)由SEQ ID NO:354表示的核酸的互补序列;
(iii)编码PLATZ多肽的核酸,所述PLATZ多肽以递增的优先顺序与由SEQ ID NO:355表示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性,并且以递增的优先顺序与在上文所定义的基序的一个或多个具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性。
22.分离的多肽,选自:
(i)由SEQ ID NO:355表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:355表示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性,并且以递增的优先顺序与在上文所定义的基序的一个或多个具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
5.PLST样多肽
在另一方面,本发明的特征在于一个或多个以下项目:
1.用于在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码PLST样多肽之核酸的表达,其中所述PLST样多肽至少包含PLST共有结构域(PFam登录号PF02298)。
2.项目1的方法,其中PLST样多肽的PLST结构域以递增的优先顺序与位于SEQ ID NO 411的氨基酸38至124之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
3.项目1或2的任一项的方法,其中所述PLST样多肽可以包含序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序19:[DH]SV[LI]QV[TS]KE[DA][YF][DK]SCNT[SK][NSD]P(SEQ ID NO:530)
(ii)基序20:[FHY]YF[IT]SGV[PK][GD][HN]C(SEQ ID NO:531)
(iii)基序21:Y[NT][QK]WA[ESK][KS]NRF[KQ][IV]GD[ST][LI][VL]F[KL]YP(SEQ IDNO:532)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
4.项目1至3的任一项的方法,其中所述PLST样多肽可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序22:[DN]GN[TS][LVK][FV][KN][LF][DT]R[SP]GP[FY]YF[IT]SG[VA][KP][GD][HN]CEK[GN][QE]K(SEQ ID NO:533)
(ii)基序23:[YL]N[QK]WA[EK][KS][NH]RF[KQ][IV]GD[ST]L[LV]F[LK]Y[PD](SEQID NO:534)
(iii)基序24:[KQ]DSV[LI]QVTKE[DA]YKSCNT[SK][DSN]PI(SEQ ID NO:535)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
5.项目1至4的任一项的方法,其中所述PLST样多肽可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序25:DSVI[QV]VT[EKA][EQ]S[YF][KN][SK]CNL[KST]DPIL[YF][MS]N[ND]GN[ST][LV]FN[LI][TD][RS]PGL[FY]YF[TI]SG[VA][PS]GHC[EQ][KR](SEQ ID NO:536)
(ii)基序26:P[PT]SA[DN]P[DQ][VL]YTKW[AS][KS][NS][HN][RN]FK[IL]GD[ST][LI]LFLYP(SEQ ID NO:537)
(iii)基序27:XVS[CS]Y[QE][YF]KVG[DG]LD[AGS]W(SEQ ID NO:538)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
6.项目1至5的任一项的方法,其中所述PLST样多肽可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序28:HN[FL]K[IL]GDSLLFLYPPSQDSVIQVTA[QE][SAN][YF][KN]SC[ND]L[KS]DPILYMN[DN]GNSLFN[IL]T(SEQ ID NO:539)
(ii)基序29:GDFYFTSG[AVE]PGHC[EQ]K[SK]QKLH[IV](SEQ ID NO:540)
(iii)基序30:VSCYQYKVGDLD[AS]WGIPTSA[NK](SEQ ID NO:541)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
7.项目1至6的任一项的方法,其中PLST样多肽的同源物以递增的优先顺序与由表A5的任一多肽,优选地由SEQ ID NO:411表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性。
8.项目1-7的任一项的方法,其中所述受调控的表达通过在植物中引入和表达如任一前述项目的PLST样多肽之编码核酸而实现。
9.项目1-8的任一项的方法,其中所述编码PLST样多肽之核酸编码表A5中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
10.项目1-9的任一项的方法,其中所述核酸序列编码表A5给出的任一蛋白质的直向同源物或旁系同源物。
11.任一前述项目的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的种子产量。
12.项目1-11的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
13.项目1-11的任一项的方法,其中所述增强的产量相关性状是在干旱胁迫、盐胁迫或氮缺乏条件下获得的。
14.项目8-10的任一项的方法,其中所述核酸与组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子有效连接。
15.项目1-14的任一项的方法,其中所述PLST样多肽之编码核酸是植物来源的。
16.项目15的方法,其中所述PLST样多肽之编码核酸来自双子叶植物,进一步优选来自杨柳科,最优选核酸来自毛果杨。
17.通过项目1-16的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码PLST样多肽的重组核酸。
18.构建体,包含:
(i)编码如项目1-7定义的PLST样多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
19.项目18的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
20.项目18或19的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的种子产量的植物的方法中的用途。
21.用项目18或19的构建体转化的植物、植物部分或植物细胞。
22.用于生产相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如项目1-7定义的PLST样多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
23.相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如项目1-7定义的PLST样多肽之编码核酸受调控的表达。
24.项目17、21或23的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
25.项目24的植物的可收获部分,其中所述可收获部分优选是种子。
26.来自项目24的植物和/或项目25的植物的可收获部分的产物。
27.PLST样多肽之编码核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量的用途。
28.分离的核酸分子,选自:
(i)由SEQ ID NO:414;SEQ ID NO:426;SEQ ID NO:428;SEQ IDNO:434;SEQ ID NO:438表示的核酸;
(ii)由SEQ ID NO:414;SEQ ID NO:426;SEQ ID NO:428;SEQ IDNO:434;SEQ ID NO:438表示的核酸的互补序列;
(iii)编码由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ ID NO:435;SEQ ID NO:439的任一表示的PLST样多肽的核酸,优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ ID NO:435;SEQ ID NO:439的任一表示的多肽序列,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(iv)核酸,所述核酸以递增的优先顺序与表A5的任一核酸序列具有至少50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,96%,97%,98%,99%或更多的序列同一性,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi)编码PLST样多肽的核酸,所述PLST样多肽以递增的优先顺序与由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ ID NO:435;SEQ ID NO:439的任一表示的氨基酸序列和表A5中的任一其它氨基酸序列具有至少50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,96%,97%,98%,99%或更多的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
29.根据本发明另外的实施方案,从而还提供了分离的多肽分子,选自:.
(i)由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ IDNO:435;SEQ ID NO:439表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与SEQ ID NO:Y表示的氨基酸序列具有至少50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,96%,97%,98%,99%或更多的序列同一性,以及以递增的优先顺序与SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ ID NO:435;SEQ ID NO:439具有至少50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,96%,97%,98%,99%或更多的序列同一性。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
6.Glomalin多肽
在另一方面,本发明的特征在于一个或多个以下项目:
1.用于在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码Glomalin多肽之核酸的表达,其中所述Glomalin多肽包含Cpn60_TCP1结构域。
2.项目1的方法,其中所述Glomalin多肽包含基序31至43(SEQ IDNO:596至SEQ ID NO:608)的一个或多个。
3.项目1或2的方法,其中所述受调控的表达通过在植物中引入和表达Glomalin多肽之编码核酸而实现。
4.项目1-3的任一项的方法,其中所述编码Glomalin多肽之核酸编码表A6中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
5.项目1-4的任一项的方法,其中所述核酸序列编码表A6给出的任一蛋白质的直向同源物或旁系同源物。
6.任一前述项目的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的种子产量。
7.项目1-6的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
8.项目3-7的任一项的方法,其中所述核酸与根特异性启动子,优选RCc3启动子,最优选来自稻的RCc3启动子有效连接。
9.项目1-8的任一项的方法,其中所述Glomalin多肽之编码核酸是植物来源的,优选来自双子叶植物,进一步优选来自禾本科,更优选来自稻属,最优选来自稻。
10.通过项目1-9的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码Glomalin多肽的重组核酸。
11.构建体,包含:
(i)编码如项目1或2定义的Glomalin多肽的核酸;
(ii)能够驱动(a)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
12.项目11的构建体,其中所述控制序列之一是组成型启动子,优选RCc3启动子,最优选来自稻的RCc3启动子。
13.项目11或12的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的种子产量的植物的方法中的用途。
14.用项目11或12的构建体转化的植物、植物部分或植物细胞。
15.用于生产相对于对照植物具有增加的产量,特别是增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如项目1或2定义的Glomalin多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
16.相对于对照植物,具有增加的产量,特别是增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如项目1或2定义的Glomalin多肽之编码核酸受调控的表达。
17.项目10、14或16的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
18.项目17的植物的可收获部分,其中所述可收获部分优选是种子。
19.来自项目18的植物和/或项目18的植物的可收获部分的产物。
20.Glomalin多肽之编码核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量的用途。
附图说明
现将参考以下附图描述本发明,其中:
图1表示不同簇的选择的eRF1蛋白质的系统发生树:显示了链形植物来源和非链形植物来源的蛋白质。SPT=链形植物,CHL=绿藻门(chlorophyta),STR=原生藻菌原生藻菌(Stramenopile),BAC=细菌,FUNGI=真菌,HUM=人类,PROT=原生动物。使用MAFFT(Katoh和Toh(2008)Briefings in Bioinformatics 9:286-298)进行比对。使用QuickTree(Howe等人(2002),Bioinformatics 18(11):1546-7),100次自引重复计算邻接树。使用Dendroscope(Huson等人(2007),BMCBioinformatics 8(1):460)绘制环形系统发生图。显示了主要分支的100次自引重复的置信度。用圆圈标出了主要分支的位置。
图2表示用于增加在稻GOS2启动子(pGOS2)控制下的eRF1编码核酸在稻中表达的二元载体。
图3表示SCAMP多肽的多重比对。
图4表示用于增加在稻GOS2启动子(pGOS2)控制下的SCAMP样编码核酸在稻中表达的二元载体。
图5显示用AlignX(来自Vector NTI 10.3,Invitrogen Corporation)多重序列比对实施的肌原纤蛋白多肽序列的多重比对。将保守的PAP肌原纤蛋白PF04755在共有序列下标记为X。将保守的羧基端结构域在共有序列下也标记为X。
图6显示使用在来自Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法构建的肌原纤蛋白多肽的系统发生树。
图7来自Ytterberg等人,2006(Plant Physiology,2006年3月,第140卷,第984-997页)显示质体球(PG)及其蛋白质组的可能构造(proposedorganization)(A)和功能作用(B)的图解。PG由单层脂质和隐蔽的不同亲水小分子如醌类和生育酚类组成。结构蛋白(肌原纤蛋白)和酶连接于或者嵌入单层中,但蛋白质缺少跨膜结构域(A)。PG功能整合(Integration)在质体代谢(B)中。
图8表示由MEME算法测定的3个保守结构域X、Y和Z的序列标识(sequence logos)。序列标识是氨基酸多重序列比对的图标形式,其由符号的堆栈(stack)组成,序列中的每一位置为一个堆栈。堆栈的总高度表示该位置处的序列保守性,而堆栈内符号的高度表示每一氨基酸或核酸在该位置处的相对频率。
图9表示用于增加在稻GOS2启动子(pGOS2)控制下的肌原纤蛋白编码核酸在稻中表达的二元载体。
图10表示SEQ ID NO:261的结构域结构,标出了保守基序10至18和PLATZ结构域(黑体斜体)。
图11表示使用用于慢比对(slow alignment)默认设置的ClustalW的多种PLATZ-A1-α多肽的多重比对。
图12显示PLATZ多肽的系统发生树,使用MAFFT(Katoh和Toh(2008)Briefings in Bioinformatics 9:286-298)进行比对。使用QuickTree(Howe等人(2002),Bioinformatics 18(11):1546-7),100次自引重复计算邻接树。使用Dendroscope(Huson等人(2007),BMC Bioinformatics 8(1):460)绘制环形系统发生图。显示了主要分支的100次自引重复后的置信度。用圆圈标出了主要分支的位置。在进化支PLATZ-A1-α中,SEQ ID NO:261表示为P.trichocarpa_583639。
图13表示用于增加在稻GOS2启动子(pGOS2)控制下的PLATZ编码核酸在稻中表达的二元载体。
图14表示SEQ ID NO 411,标出了PF 02298结构域和基序19至30.
图15表示针对不同簇的选择的PLST样蛋白质的系统发生树:P-class=质体蓝素样,NDL=结瘤素样,Z=其他,PLST=PLST群。使用MAFFT(Katoh和Toh(2008)Briefings in Bioinformatics 9:286-298)进行比对。使用QuickTree(Howe等人(2002),Bioinformatics 18(11):1546-7),100次自引重复计算邻接树。使用Dendroscope(Huson等人(2007),BMC Bioinformatics 8(1):460)绘制环形系统发生图。显示了主要分支的100次自引重复后的置信度。用圆圈标出了主要分支的位置。
图16表示用于增加在稻GOS2启动子(pGOS2)控制下的PLST样编码核酸在稻中表达的二元载体。
图17表示SEQ ID NO:546的结构域结构,标出了保守基序31至43,并以黑体显示了Cpn60_TCP1结构域。
图18表示多种Glomalin多肽的多重比对。星号表示多种蛋白质序列之间相同的氨基酸,冒号表示高度保守的氨基酸替换,和圆点表示较不保守的氨基酸替换;在其他位置上不存在序列保守性。当使用保守氨基酸时,这些比对可以用于定义另外的基序。
图19显示Glomalin多肽的系统发生树。来自杨树的序列XM_002297581表示外类群(outgroup)。其他序列表示Glomalin序列的簇。
图20表示用于增加在稻RCc3启动子(pRC3)控制下的Glomalin编码核酸在稻中表达的二元载体。
实施例
现将参考以下仅用于说明的实施例来描述本发明。以下实施例不旨在限定本发明的范围。
DNA操作:除非另有说明,根据(Sambrook(2001)Molecular Cloning:a laboratory manual,第三版,Cold Spring Harbor Laboratory Press,CSH,New York)或Ausubel等(1994),Current Protocols in MolecularBiology,Current Protocols第1卷和第2卷中所述标准方案进行重组DNA技术。用于植物分子工作的标准材料和方法描述于BIOS ScientificPublications Ltd(UK)和Blackwell Scientific Publications(UK)出版的由R.D.D Croy编著的Plant Molecular Biology Labfax(1993)中。
实施例1:鉴定与本发明方法中使用的核酸序列相关的序列。
使用数据库序列检索工具,如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402)在美国国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中所维护的那些序列内鉴定到与eRF1序列相关的序列(全长cDNA、EST或基因组)。该程序用来通过核酸序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区域。例如,在本发明中使用的核酸所编码的多肽用于TBLASTN算法,采用默认设置并关闭忽略低复杂度序列的过滤。分析的结果通过配对性比较显示,并根据概率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较还通过同一性百分数进行记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在一些例子中,可以调整缺省参数以修改检索的严格性。例如可以提高E值以显示较低严格性的匹配。这样,可以鉴定短的近似精确的匹配。
1.1 eRF1多肽
表A1提供了与SEQ ID NO:1和SEQ ID NO:2相关的核酸和多肽序列的列表。
表A1:eRF1核酸和多肽的实例:
在一些情况下,相关序列已经由研究协会例如基因组研究协会(TheInstitute for Genomic Research,TIGR;以TA开头)暂时组装并对公众公开。还可以使用真核基因直向同源物(Eukaryotic Gene Orthologs,EGO)数据库鉴定这类相关序列,用目的核酸或多肽序列进行关键词搜索或通过使用BLAST算法进行。在其他一些情况下,针对具体的生物已经创建了具体的核酸序列数据库,例如由联合基因组协会(Joint Genome Institute)创建的那些。另外,使用专利数据库允许鉴定新的核酸和多肽序列。
1.2 SCAMP样多肽
表A2提供了与SEQ ID NO:88和SEQ ID NO:89相关的核酸和多肽序列的列表。
表A2:SCAMP样核酸和多肽的实例:
在一些情况下,相关序列已经由研究协会例如基因组研究协会(TIGR;以TA开头)暂时组装并对公众公开。还可以使用真核基因直向同源物(EGO)数据库鉴定这类相关序列,用目的核酸或多肽序列进行关键词搜索或通过使用BLAST算法进行。在其他一些情况下,针对具体的生物已经创建了具体的核酸序列数据库,例如由联合基因组协会创建的那些。另外,使用专利数据库允许鉴定新的核酸和多肽序列。
1.3.肌原纤蛋白多肽
表A3提供了与SEQ ID NO:204和SEQ ID NO:205相关的核酸和多肽序列的列表。
表A3:肌原纤蛋白核酸和多肽的实例:
可以将研究协会例如基因组研究协会(TIGR;以TA开头)、真核基因直向同源物(EGO)数据库和联合基因组协会的数据库用于鉴定另外的肌原纤蛋白序列,用目的核酸或多肽序列进行关键词搜索或通过使用BLAST算法进行。
1.4.PLATZ多肽
表A4提供了与SEQ ID NO:260和SEQ ID NO:261相关的核酸和多肽序列的列表。
表A4:PLATZ核酸和多肽的实例:
在一些情况下,相关序列已经由研究协会例如基因组研究协会(TIGR;以TA开头)暂时组装并对公众公开。还可以使用真核基因直向同源物(EGO)数据库鉴定这类相关序列,用目的核酸或多肽序列进行关键词搜索或通过使用BLAST算法进行。在其他一些情况下,针对具体的生物已经创建了具体的核酸序列数据库,例如由联合基因组协会(Joint GenomeInstitute)创建的那些。另外,使用专利数据库允许鉴定新的核酸和多肽序列。
1.5.PLST样多肽
表A5提供了与SEQ ID NO:410和SEQ ID NO:411相关的核酸和多肽序列的列表。
表A5:PLST样核酸和多肽的实例:
在一些情况下,相关序列已经由研究协会例如基因组研究协会(TIGR;以TA开头)暂时组装并对公众公开。还可以使用真核基因直向同源物(EGO)数据库鉴定这类相关序列,用目的核酸或多肽序列进行关键词搜索或通过使用BLAST算法进行。在其他一些情况下,针对具体的生物已经创建了具体的核酸序列数据库,例如由联合基因组协会(Joint GenomeInstitute)创建的那些。另外,使用专利数据库允许鉴定新的核酸和多肽序列。
1.6.Glomalin多肽
表A6提供了与SEQ ID NO:545和SEQ ID NO:546相关的核酸和多肽序列的列表。
表A6:Glomalin核酸和多肽的实例:
在一些情况下,相关序列已经由研究协会例如基因组研究协会(TIGR;以TA开头)暂时组装并对公众公开。还可以使用真核基因直向同源物(EGO)数据库鉴定这类相关序列,用目的核酸或多肽序列进行关键词搜索或通过使用BLAST算法进行。在其他一些情况下,针对具体的生物已经创建了具体的核酸序列数据库,例如由联合基因组协会(Joint GenomeInstitute)创建的那些。另外,使用专利数据库允许鉴定新的核酸和多肽序列。
实施例2:与本发明方法中使用的多肽序列相关的序列比对
2.1 eRF1多肽
使用逐步比对的ClustalW 2.0算法(Thompson等人(1997)NucleicAcids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res31:3497-3500)实施多肽序列的比对,采用标准设定(慢比对,相似矩阵:Gonnet或Blosum 62(如果比对多肽),空位开放罚分10,空位延伸罚分0.2。
使用在来自Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法构建eRF1多肽的系统发生树(图1)。
2.2.SCAMP样多肽
使用逐步比对的ClustalW 1.8算法(Thompson等人(1997)NucleicAcids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res31:3497-3500)实施多肽序列的比对,采用标准设定:空位开放罚分10,空位延伸罚分0.2。进行少量人工编辑以进一步优化比对。SCAMP样多肽比对在图3中。
2.3.肌原纤蛋白多肽
采用标准设定,使用来自Vector NTI(Invitrogen)的AlignX程序实施多肽序列的比对。进行少量人工编辑以进一步优化比对。肌原纤蛋白多肽比对在图5中。
使用在来自Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法构建肌原纤蛋白多肽的系统发生树(图6)。
2.4.PLATZ多肽
使用逐步比对的ClustalW 2.0算法(Thompson等人(1997)NucleicAcids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res31:3497-3500)实施多肽序列的比对,采用标准设定(慢比对,相似矩阵:Gonnet,空位开放罚分10,空位延伸罚分0.2。进行少量人工编辑以进一步优化比对。PLATZ多肽比对在图11中。
该比对可以用于测定约5至10个氨基酸长度的保守特征序列。优选地使用蛋白质的保守区,由星号(相同残基)、冒号(高保守替换)和圆点(保守替换)指出该保守区。
使用MAFFT(Katoh和Toh(2008)Briefings in Bioinformatics 9:286-298)构建PLATZ多肽的系统发生树(图12)。使用QuickTree(Howe等人(2002),Bioinformatics 18(11):1546-7),100次自引重复计算邻接树。使用Dendroscope(Huson等人(2007),BMC Bioinformatics 8(1):460)绘制环形系统发生图。显示了主要分支的100次自引重复后的置信度。
2.5.PLST样多肽
使用逐步比对的ClustalW 2.0算法(Thompson等人(1997)NucleicAcids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res31:3497-3500)实施多肽序列的比对,采用标准设定(慢比对,相似矩阵:Gonnet或Blosum 62(如果比对多肽),空位开放罚分10,空位延伸罚分0.2。
用在来自Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法构建PLST样多肽的系统发生树(图15)。
2.6.Glomalin多肽
使用逐步比对的ClustalW 2.0算法(Thompson等人(1997)NucleicAcids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res31:3497-3500)实施多肽序列的比对,采用标准设定(慢比对,相似矩阵:Gonnet,空位开放罚分10,空位延伸罚分0.2。进行少量人工编辑以进一步优化比对。Glomalin多肽比对在图18中。
用在来自Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法构建Glomalin多肽的系统发生树(图19)。
实施例3:计算在用于实施本发明方法的多肽序列之间的全局百分比同一性
3.1.eRF1多肽
使用本领域可获得的方法之一MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application that generatessimilarity/identity matrices using protein or DNA sequences.CampanellaJJ,Bitincka L,Smalley J;软件由Ledion Bitincka提供)确定用于实施本发明方法的全长多肽序列之间全局相似性百分数和同一性百分数。MatGAT软件为DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预比对。该程序使用Myers和Miller全局比对算法(空位开放罚分12和空位延伸罚分2)执行一系列逐对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。
比较中所用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
多肽序列全长上的全局相似性和同一性软件分析结果在表B1中显示。同一性百分数以黑体在对角线之上给出并且相似性百分数在对角线之下给出(正常字体)。
在实施本发明方法中有用的eRF1多肽序列之间的百分比同一性可低至与SEQ ID NO:2相比为49%的氨基酸同一性。
3.2.SCAMP样多肽
使用本领域可获得的方法之一MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:an application thatgenerates similarity/identity matrices using protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka提供)确定用于实施本发明方法的全长多肽序列之间全局相似性百分数和同一性百分数。MatGAT软件为DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预比对。该程序使用Myers和Miller全局比对算法(空位开放罚分12和空位延伸罚分2)执行一系列逐对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。
比较中通常所用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
3.3.肌原纤蛋白多肽
使用MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application that generates similarity/identitymatrices using protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka提供)确定用于实施本发明方法的全长多肽序列之间全局相似性百分数和同一性百分数。MatGAT软件为DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预比对。该程序使用Myers和Miller全局比对算法(空位开放罚分12和空位延伸罚分2)执行一系列逐对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。
比较中所用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
多肽序列全长上的全局相似性和同一性软件分析结果在表B2中显示。同一性百分数在对角线之上给出并且相似性百分数在对角线之下给出。
还可以制作关于特定结构域例如在PAP肌原纤蛋白结构域上或者在羧基端结构域上的局部比对,或者在特定结构域之间的同一性/相似性百分数的数据的MATGAT表格。
3.4.PLATZ多肽
使用本领域可获得的方法之一MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application thatgenerates similarity/identity matrices using protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka提供)确定用于实施本发明方法的全长多肽序列之间全局相似性百分数和同一性百分数。MatGAT软件为DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预比对。该程序使用Myers和Miller全局比对算法(空位开放罚分12和空位延伸罚分2)执行一系列逐对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。
比较中所用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
多肽序列全长上的全局相似性和同一性软件分析结果在表B3中显示。同一性百分数以黑体在对角线之上给出并且相似性百分数在对角线之下给出(正常字体)。
在实施本发明方法中有用的PLATZ-A1-α多肽序列之间的百分比同一性可低至与SEQ ID NO:261相比为65%的氨基酸同一性。
3.5.PLST样多肽
使用本领域可获得的方法之一MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:an application thatgenerates similarity/identity matrices using protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka提供)确定用于实施本发明方法的全长多肽序列之间全局相似性百分数和同一性百分数。MatGAT软件为DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预比对。该程序使用Myers和Miller全局比对算法(空位开放罚分12和空位延伸罚分2)执行一系列逐对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。
比较中所用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
多肽序列全长上的全局相似性和同一性软件分析结果在表B4中显示。同一性百分数以黑体在对角线之上给出并且相似性百分数在对角线之下给出(正常字体)。
在实施本发明方法中有用的PLST样多肽序列之间的百分比同一性可低至与SEQ ID NO:411相比为49%的氨基酸同一性。
3.6.Glomalin多肽
使用本领域可获得的方法之一MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:an application thatgenerates similarity/identity matrices using protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka提供)确定用于实施本发明方法的全长多肽序列之间全局相似性百分数和同一性百分数。MatGAT软件为DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预比对。该程序使用Myers和Miller全局比对算法(空位开放罚分12和空位延伸罚分2)执行一系列逐对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。
比较中所用的参数是:
评分矩阵:Blosum62;第一空位:12;延伸空位:2
多肽序列全长上的全局相似性和同一性软件分析结果在表B中显示。同一性百分数以黑体在对角线之上给出并且相似性百分数在对角线之下给出(正常字体)。
在实施本发明方法中有用的Glomalin多肽序列之间的序列同一性(以%表示)与SEQ ID NO:546相比一般高于50%。
实施例4:鉴定用于实施本发明方法的多肽序列中包含的结构域
4.1.eRF1多肽
蛋白质家族、结构域和位点集成资源(Integrated Resouce ofProtein Families,domain and Site,InterPro)数据库是基于文本和序列进行检索的通常所用特征序列数据库的集成界面。InterPro数据库组合了这些数据库,所述的数据库使用不同方法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质特征序列。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的,多重序列比对和隐藏的马尔可夫模型(hidden Markov models)的大集合。Pfam由大不列颠联合王国的Sanger研究所的服务器所维护。Interpro由大不列颠联合王国的欧洲生物信息研究所维护。
如SEQ ID NO:2所表示的多肽序列的InterPro扫描结果在表C1中示出。
表C1:SEQ ID NO:2所示多肽序列的InterPro扫描结果(主要登录号)。
4.2.SCAMP样多肽
Pfam是覆盖许多常见蛋白质结构域和家族的,多重序列比对和隐藏的马尔可夫模型的大集合。Pfam由大不列颠联合王国的Sanger研究所的服务器上维护。
如SEQ ID NO:89所表示的多肽序列的保守HMM Pfam结构域的Pfam扫描结果在表C2中示出。
表C2:SEQ ID NO:89所示多肽序列的InterPro扫描结果(主要登录号)
4.3.肌原纤蛋白多肽
蛋白质家族、结构域和位点集成资源(Integrated Resouce ofProtein Families,domain and Site,InterPro)数据库是基于文本和序列进行检索的通常所用特征序列数据库的集成界面。InterPro数据库组合了这些数据库,所述的数据库使用不同方法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质特征序列。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的,多重序列比对和隐藏的马尔可夫模型(hidden Markov models)的大集合。Pfam由大不列颠联合王国的Sanger研究所的服务器上维护。Interpro由大不列颠联合王国的欧洲生物信息研究所维护。
如SEQ ID NO:205所表示的多肽序列的InterPro扫描结果在表C3中示出。
表C3:SEQ ID NO:205所示多肽序列的InterPro扫描结果(主要登录号)
4.4.PLATZ多肽
蛋白质家族、结构域和位点集成资源(Integrated Resouce ofProtein Families,domain and Site,InterPro)数据库是基于文本和序列进行检索的通常所用特征序列数据库的集成界面。InterPro数据库组合了这些数据库,所述的数据库使用不同方法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质特征序列。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的,多重序列比对和隐藏的马尔可夫模型(hidden Markov models)的大集合。Pfam由大不列颠联合王国的Sanger研究所的服务器上维护。Interpro由大不列颠联合王国的欧洲生物信息研究所维护。
如SEQ ID NO:261所表示的多肽序列的InterPro扫描结果在表C4中示出。
表C4:SEQ ID NO:261所示多肽序列的InterPro扫描结果(主要登录号)
4.5.PLST样多肽
蛋白质家族、结构域和位点集成资源(Integrated Resouce ofProtein Families,domain and Site,InterPro)数据库是基于文本和序列进行检索的通常所用特征序列数据库的集成界面。InterPro数据库组合了这些数据库,所述的数据库使用不同方法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质特征序列。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的,多重序列比对和隐藏的马尔可夫模型(hidden Markov models)的大集合。Pfam由大不列颠联合王国的Sanger研究所的服务器上维护。Interpro由大不列颠联合王国的欧洲生物信息研究所维护。
如SEQ ID NO:411所表示的多肽序列的InterPro扫描结果在表C5中示出。
表C5:SEQ ID NO:411所示多肽序列的InterPro扫描结果(主要登录号)
4.6.Glomalin多肽
蛋白质家族、结构域和位点集成资源(Integrated Resouce ofProtein Families,domain and Site,InterPro)数据库是基于文本和序列进行检索的通常所用特征序列数据库的集成界面。InterPro数据库组合了这些数据库,所述的数据库使用不同方法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质特征序列。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的,多重序列比对和隐藏的马尔可夫模型(hidden Markov models)的大集合。Pfam由大不列颠联合王国的Sanger研究所的服务器上维护。Interpro由大不列颠联合王国的欧洲生物信息研究所维护。
如SEQ ID NO:546所表示的多肽序列的InterPro扫描结果在表C6中示出。
表C6:SEQ ID NO:546所示多肽序列的InterPro扫描结果(主要登录号)。
此外,SEQ ID NO:546具有3个N-糖基化位点(Prosite PS00001):110-NATN-113,113-NDTA-116和432-NATK-435。
实施例5:用于实施本发明方法的多肽序列的拓扑学预测
5.1.eRF1多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于经预测存在的任何N端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所依据的评分并不是真正的概率,并且它们未必加起来等于一。然而,具有最高评分的位置根据TargetP是最有可能的,并且评分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)范围从1至5,其中1表示最强预测。TargetP在丹麦技术大学(Technical University of Denmark)的服务器上维护。
对于预测含有N端前序列的序列,也可以预测潜在的切割位点。
选择了众多参数,如生物群(非植物或植物)、临界设置(cutoff set)(无、临界的预定义设置或临界的用户指定设置)和对切割位点预测的计算(是或否)。
众多其它算法可以用来执行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学分子生物科学研究所(Institute forMolecular Bioscience,University of Queensland,Brisbane,Australia)的服务器上维护的蛋白质Prowler亚细胞定位预测程序(Protein ProwlerSubcellular Localisation Predictor)第1.2版;
·在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学(University ofAlberta,Edmonton,Alberta,Canada)的服务器上维护的PENCEProteome Analyst PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM;
·PSORT(URL:psort.org)。
·PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.2.SCAMP样多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于经预测存在的任何N端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所依据的评分并不是真正的概率,并且它们未必加起来等于一。然而,具有最高评分的位置根据TargetP是最有可能的,并且评分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)范围从1至5,其中1表示最强预测。TargetP在丹麦技术大学的服务器上维护。
对于预测含有N端前序列的序列,也可以预测潜在的切割位点。
众多其它算法可以用来执行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学分子生物科学研究所的服务器上维护的蛋白质Prowler亚细胞定位预测程序第1.2版;
·在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE Proteome Analyst PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM;
·PSORT(URL:psort.org)。
·PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.3.肌原纤蛋白多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于经预测存在的任何N端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所依据的评分并不是真正的概率,并且它们未必加起来等于一。然而,具有最高评分的位置根据TargetP是最有可能的,并且评分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)范围从1至5,其中1表示最强预测。TargetP在丹麦技术大学的服务器上维护。
对于预测含有N端前序列的序列,也可以预测潜在的切割位点。选择了众多参数,如生物群(非植物或植物)、临界设置(cutoff set)(无、临界的预定义设置或临界的用户指定设置)和对切割位点预测的计算(是或否)。
众多其它算法可以用来执行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学分子生物科学研究所的服务器上维护的蛋白质Prowler亚细胞定位预测程序第1.2版;
·在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE Proteome Analyst PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM;
·PSORT(URL:psort.org)。
·PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.4.PLATZ多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于经预测存在的任何N端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所依据的评分并不是真正的概率,并且它们未必加起来等于一。然而,具有最高评分的位置根据TargetP是最有可能的,并且评分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)范围从1至5,其中1表示最强预测。TargetP在丹麦技术大学的服务器上维护。
对于预测含有N端前序列的序列,也可以预测潜在的切割位点。
选择了众多参数,如生物群(非植物或植物)、临界设置(cutoff set)(无、临界的预定义设置或临界的用户指定设置)和对切割位点预测的计算(是或否)。
如SEQ ID NO:261所表示的多肽序列的TargetP 1.1分析的结果在表D1中显示。已经选择“植物”生物群,未定义临界值并且需要转运肽的预测长度。SEQ ID NO:261所示多肽序列的亚细胞定位预测可以是在细胞质或者细胞核,没有预测到转运肽。
表D1:SEQ ID NO:261所示多肽序列的TargetP 1.1分析。缩写:Len,长度;cTP,叶绿体转运肽;mTP,线粒体转运肽,SP,分泌途径信号肽,其他,其他亚细胞靶向,Loc,预测的定位;RC,可靠性类别;TPlen,预测的转运肽长度。
众多其它算法可以用来执行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学分子生物科学研究所的服务器上维护的蛋白质Prowler亚细胞定位预测程序第1.2版;
·在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE Proteome Analyst PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM;
·PSORT(URL:psort.org)。
·PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.5.PLST样多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于经预测存在的任何N端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所依据的评分并不是真正的概率,并且它们未必加起来等于一。然而,具有最高评分的位置根据TargetP是最有可能的,并且评分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)范围从1至5,其中1表示最强预测。TargetP在丹麦技术大学的服务器上维护。
对于预测含有N端前序列的序列,也可以预测潜在的切割位点。
TargetP 1.1预测结果
查询序列数:1
包括了切割位点预测。
使用PLANT网络(PLANT network)。
选择了众多参数,如生物群(非植物或植物)、临界设置(cutoff set)(无、临界的预定义设置或临界的用户指定设置)和对切割位点预测的计算(是或否)。
众多其它算法可以用来执行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学分子生物科学研究所的服务器上维护的蛋白质Prowler亚细胞定位预测程序第1.2版;
·在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE Proteome Analyst PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM;
·PSORT(URL:psort.org)。
·PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.6.Glomalin多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于经预测存在的任何N端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所依据的评分并不是真正的概率,并且它们未必加起来等于一。然而,具有最高评分的位置根据TargetP是最有可能的,并且评分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)范围从1至5,其中1表示最强预测。TargetP在丹麦技术大学的服务器上维护。
对于预测含有N端前序列的序列,也可以预测潜在的切割位点。
选择了众多参数,如生物群(非植物或植物)、临界设置(cutoff set)(无、临界的预定义设置或临界的用户指定设置)和对切割位点预测的计算(是或否)。
如SEQ ID NO:546所表示的多肽序列的TargetP 1.1分析的结果在表D2中显示。已经选择“植物”生物群,未定义临界值并且需要转运肽的预测长度。SEQ ID NO:546所示多肽序列的亚细胞定位最可能是在线粒体(其与来自PSORT的结果一致),但也可能在叶绿体。
表D2:SEQ ID NO:546所示多肽序列的TargetP 1.1分析。缩写:Len,长度;cTP,叶绿体转运肽;mTP,线粒体转运肽,SP,分泌途径信号肽,其他,其他亚细胞靶向,Loc,预测的定位;RC,可靠性类别;TPlen,预测的转运肽长度。
众多其它算法可以用来执行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学分子生物科学研究所的服务器上维护的蛋白质Prowler亚细胞定位预测程序第1.2版;
·在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE Proteome Analyst PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM;
·PSORT(URL:psort.org)。
·PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
实施例6:与用于实施本发明方法的多肽序列相关的测定
6.1.PLATZ多肽
PLATZ蛋白质结合DNA的测定描述于Nagano等人(2001)中。简言之,在含2μg的聚(dI-dC)-聚(dI-dC)、牛血清白蛋白(500μg/μl)和竞争剂DNA的结合缓冲液(20μl)中,使用来源于豌豆pra2转录起始位点下游-734至-667区域的[γ-32P]ATP标记探针实施标准的电泳迁移率变动分析(EMSA)。使用重组产生并随后纯化的PLATZ蛋白质,蛋白质-DNA复合物通过用32P标记的探针在25℃温育该混合物20分钟形成。在4℃,在5%的聚丙烯酰胺Tris-硼酸盐/EDTA凝胶中进行电泳。干燥后,将凝胶进行放射自显影。PLATZ蛋白质结合DNA需要锌离子可以通过添加0-5mM浓度的1,10-邻二氮杂菲得到测试。
实施例7:用于本发明方法的核酸序列的克隆
7.1.eRF1多肽
通过PCR,使用定制的稻幼苗cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,英国)作为模板,扩增在本发明方法中使用的核酸序列。在标准条件中使用Hifi Taq DNA聚合酶,使用在50μl PCR混合物中的200ng模板实施PCR。
使用的引物为:prm09556(fw)(SEQ ID NO:86;正义,起始密码子为黑体):5’- ggacaagtttgtacaaaaaagcaggcttaaacaatgggagacaaaaacgatgac-3’和prm09557(rev)(SEQ ID NO:87;反义,互补的):5’-ggggaccactttgtacaagaaagctgggttttgattgattgtca ttccga-3’,其包含用于Gateway重组的AttB位点。并使用标准方法纯化扩增的PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,peRF1。质粒pDONR201作为技术的部分从Invitrogen购买。
含有SEQ ID NO:1的进入克隆随后在LR反应中与一种用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物可选择标记;可筛选标记表达盒;和意图与已经克隆于所述进入克隆内的目的核酸序列用于LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:85)位于这种Gateway盒的上游。
LR重组步骤之后,获得的表达载体pGOS2::eRF1(图2)根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
7.2.SCAMP样多肽
通过PCR,使用定制的拟南芥幼苗cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,英国)作为模板,扩增在本发明方法中使用的核酸序列。在标准条件中使用Hifi Taq DNA聚合酶,使用在50μl PCR混合物中的200ng模板实施PCR。使用的引物为:prm13820(SEQ IDNO:657;正义):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggcacgacacgatccta-3’和prm13821(SEQ ID NO:658;反义,互补的):5’-ggggaccactttgtacaagaaagctgggttgatttcttcatagtgcacgc-3’,其包含用于Gateway重组的AttB位点。并使用标准方法纯化扩增的PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,pSCAMP。质粒pDONR201作为技术的部分从Invitrogen购买。
含有SEQ ID NO:88的进入克隆随后在LR反应中与一种用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物可选择标记;可筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:203)位于这种Gateway盒的上游。
LR重组步骤之后,获得的表达载体pGOS2::SCAMP-LIKE(图4)根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
通过PCR,使用定制的拟南芥幼苗cDNA文库作为模板,扩增在本发明方法中使用的另外的核酸序列。在标准条件中使用Hifi Taq DNA聚合酶,使用在50μl PCR混合物中的200ng模板实施PCR。使用的引物为:prm13818(SEQ ID NO:659;正义):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgaatcgccaccacgat-3’和prm13819(SEQ ID NO:660;反义,互补的):5’-ggggaccactttgtacaagaaagctgggttctccttttcacttgtttccc-3’,其包含用于Gateway重组的AttB位点。并使用标准方法纯化扩增的PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,pSCAMP。质粒pDONR201作为技术的部分从Invitrogen购买。
含有SEQ ID NO:663的进入克隆随后在LR反应中与一种用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物可选择标记;可筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:203)位于这种Gateway盒的上游。
LR重组步骤之后,获得的表达载体pGOS2::SCAMP-LIKEx根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
通过PCR,使用定制的拟南芥幼苗cDNA文库作为模板,扩增在本发明方法中使用的另一核酸序列。在标准条件中使用Hifi Taq DNA聚合酶,使用在50μl PCR混合物中的200ng模板实施PCR。使用的引物为:prm13816(SEQ ID NO:661;正义):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggctaatcgttatgatcca-3’和prm13817(SEQ ID NO:662;反义,互补的):5’-ggggaccactttgtacaagaaagctgggtcaaggagaactctca aacagc-3’,其包含用于Gateway重组的AttB位点。并使用标准方法纯化扩增的PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,pSCAMP。质粒pDONR201作为技术的部分从Invitrogen购买。
含有SEQ ID NO:665的进入克隆随后在LR反应中与一种用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物可选择标记;可筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:203)位于这种Gateway盒的上游。
LR重组步骤之后,获得的表达载体pGOS2::SCAMP-LIKEy根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
7.3.肌原纤蛋白多肽
通过PCR,使用番茄(番茄(Solanum lycopersicum))cDNA文库作为模板,扩增在本发明方法中使用的核酸序列。在标准条件中使用Hifi Taq DNA聚合酶,使用在50μl PCR混合物中的200ng模板实施PCR。使用的引物为:prm10420(SEQ ID NO:258;正义,起始密码子为黑体):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgatttcagcaggtttcg-3’和prm10421(SEQ ID NO:259;反义,互补的):5’-ggggaccactttgtacaagaaagctgggtggctggttag caaataagagt-3’,其包含用于Gateway重组的AttB位点。并使用标准方法纯化扩增的PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,pfibrillin。质粒pDONR201作为技术的部分从Invitrogen购买。
含有SEQ ID NO:204的进入克隆随后在LR反应中与一种用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物可选择标记;可筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:257)位于这种Gateway盒的上游。
LR重组步骤之后,获得的表达载体pGOS2::fibrillin(图9)根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
7.4.PLATZ多肽
实施例A
在该实施例中,通过PCR,使用定制的杨属物种幼苗cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,英国)作为模板,扩增在本发明方法中使用的核酸序列。在标准条件中使用Hifi Taq DNA聚合酶,使用在50μl PCR混合物中的200ng模板实施PCR。使用的引物为:prm13426(SEQ ID NO:274;正义,起始密码子为黑体):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgggaactcaaaagcctgcat-3’和prm13427(SEQ ID NO:275;反义,互补的):5’-ggggaccactttgtacaagaaagctgggtttttcctaacataaaggagatcgatga-3’,其包含用于Gateway重组的AttB位点。并使用标准方法纯化扩增的PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,pPLATZ。质粒pDONR201作为技术的部分从Invitrogen购买。
含有SEQ ID NO:260的进入克隆随后在LR反应中与一种用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物可选择标记;可筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于LR体内重组的Gateway盒。用于组成型表达的稻GOS2启动子(SEQ ID NO:273)位于这种Gateway盒的上游。
LR重组步骤之后,获得的表达载体pGOS2::PLATZ(图13)根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
实施例B
在另一实施例中,通过PCR,使用定制的拟南芥幼苗cDNA文库作为模板,扩增另一个核酸序列。在标准条件中使用Hifi Taq DNA聚合酶,使用在50μl PCR混合物中的200ng模板实施PCR。使用的引物为:prm17901(SEQ ID NO:613;正义):ggggacaagtttgtacaaaaaagca ggcttaaacaatggttagagaaggtgaagaa-3’和prm17902(SEQ ID NO:614;反义,互补的):5’-ggggaccactttgtacaagaaagctgggttatgatttttgcctatggtta-3’,其包含用于Gateway重组的AttB位点。使用标准方法纯化扩增的PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的另一个“进入克隆”,pPLATZAt。质粒pDONR201作为技术的部分从Invitrogen购买。
含有SEQ ID NO:356的进入克隆随后在LR反应中与一种用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物可选择标记;可筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于LR体内重组的Gateway盒。用于组成型表达的稻GOS2启动子(SEQ ID NO:273)位于这种Gateway盒的上游。
LR重组步骤之后,获得的表达载体pGOS2::PLATZAt根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
7.5.PLST样多肽
通过PCR,使用定制的杨属物种幼苗cDNA文库(在pCMV Sport6.0中;Invitrogen,Paisley,英国)作为模板,扩增在本发明方法中使用的核酸序列。在标准条件中使用Hifi Taq DNA聚合酶,使用在50μlPCR混合物中的200ng模板实施PCR。
使用的引物为prm13192(fw)(SEQ ID NO:543;正义,起始密码子为黑体):5’-ggggacaagtttgtacaaaaa agcaggcttaaacaatggtcaatcttagaagtcct-3’和prm13193(rev)(SEQ ID NO:544;反义,互补的):5’-ggggaccactttgtacaagaaagctgggtctcatctgggttcttg taata-3’,其包含用于Gateway重组的AttB位点。使用标准方法纯化扩增的PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,pPLST-like。质粒pDONR201作为技术的部分从Invitrogen购买。
含有SEQ ID NO:410的进入克隆随后在LR反应中与一种用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物可选择标记;可筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:542)位于这种Gateway盒的上游。
LR重组步骤之后,获得的表达载体pGOS2::PLST-like(图2)根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
7.6.Glomalin多肽
通过PCR,使用定制的稻幼苗cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,英国)作为模板,扩增核酸序列。在标准条件中使用Hifi Taq DNA聚合酶,使用在50μl PCR混合物中的200ng模板实施PCR。使用的引物为:prm13455(SEQ ID NO:609;正义,起始密码子为黑体):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgtaccgcgcggc-3’和prm13456(SEQ ID NO:610;反义,互补的):5’-ggggaccactttgtacaagaaagctgggtttagtaatccattccac ccat-3’,其包含用于Gateway重组的AttB位点。并使用标准方法纯化扩增的PCR片段。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,pGlomalin。质粒pDONR201作为技术的部分从Invitrogen购买。
含有SEQ ID NO:545的进入克隆随后在LR反应中与一种用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物可选择标记;可筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于LR体内重组的Gateway盒。用于根特异表达的稻RCc3启动子(SEQ ID NO:611)位于这种Gateway盒的上游。
LR重组步骤之后,获得的表达载体pRCc3::Glomalin(图19)根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
实施例8:植物转化
稻转化
含有表达载体的农杆菌用来转化稻植物。将稻的日本栽培品种Nipponbare的成熟干燥种子脱壳。通过在70%乙醇中孵育一分钟,随后在0.2%HgCl2中30分钟,随后用无菌蒸馏水洗涤6次15分钟而实施消毒。消毒的种子随后在含有2,4-D的培养基(俞伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将胚胎发生的,来自小盾片的愈伤组织切下并在同一种培养基上增殖。2周后,愈伤组织通过在同一种培养基上继代培养另外2周而繁殖或增殖。胚发生性愈伤组织片在新鲜培养基上继代培养3日,之后共培育(以增强细胞分裂活性)。
含有表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后将细菌收集并重悬在液体共培育培养基中至密度(OD600)约1。将混悬液随后转移至培养皿并将愈伤组织在该混悬液内浸泡15分钟。愈伤组织随后在滤纸上吸干并转移至固化的共培育培养基上并且在黑暗中于25℃孵育3日。共培育的愈伤组织在黑暗中于28℃在选择剂存在下于含有2,4-D的培养基上培育4周。在此时段期间,形成迅速生长的抗性愈伤组织岛。在这种材料转移至再生培养基并在光照下培育后,胚发生潜力释放并且苗在随后4至5周发育。将苗从愈伤组织中切下并且在含有生长素的培养基上培育2至3周,将苗从所述的培养基上转移至土壤。硬化的苗在高湿度和短日照下于温室中培育。
对一个构建体而言产生约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室。在定量PCR分析以验证T-DNA插入物的拷贝数后,仅保留表现选择剂耐受性的单拷贝转基因植物用于收获T1种子。种子随后在移植后3至5月收获。本方法以超过50%的比率产生单一基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
实施例9:其他作物的转化
玉米转化
玉米(玉蜀黍)的转化根据Ishida等(1996.Nature Biotech 14(6):745-50)描述方法的改进方法进行。在玉米中的转化是基因型依赖的并且仅特定的基因型可适用于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂种是用于转化的供体材料的良好来源,但是其它基因型也可以成功地使用。在授粉后(DAP)大约11日从玉米植物中收获玉米穗,此时不成熟胚的长度是大约1至1.2mm。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而回收。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择标记)。培养板在25℃于光照下培养2-3周,或直至苗发育。将绿色苗从每个胚转移至玉米生根培养基并在25℃培养2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
小麦转化
小麦的转化用Ishida等(1996)Nature Biotech 14(6):745-50描述的方法进行。通常在转化中使用(可从墨西哥CIMMYT获得的)栽培品种Bobwhite。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而回收。在与农杆菌孵育后,胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择标记)。培养平板在25℃于光照下培养2-3周,或直至苗发育。将绿色苗从每个胚转移至生根培养基并在25℃培养2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
大豆转化
根据对Texas A&M美国专利5,164,310中所述方法的改进方法转化大豆。几个商业大豆品种对于通过这种方法的转化是可行的。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。从7日龄幼苗中切下下胚轴、胚根和一片子叶。进一步培育上胚轴和余下的子叶以发育腋生节。将这些腋生节切下并与含有表达载体的根癌农杆菌孵育。在共培育处理之后,将外植体洗涤并转移至选择培养基。将再生的苗切下并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝T-DNA插入物的植物中产生T1种子。
油菜/芸苔转化
使用5-6日龄幼苗的子叶柄和下胚轴作为用于组织培育的外植体并且根据Babic等(1998,Plant Cell Rep 17:183-188)转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,但是也可以使用其它品种。对芸苔种子作表面消毒以便体外播种。从体外幼苗中切下具有附着子叶的子叶柄外植体,并通过叶柄外植体的切口端浸入细菌混悬液而接种(含有表达载体的)农杆菌。外植体随后在含有3mg/l BAP、3%蔗糖、0.7%植物琼脂(Phytagar)的MSBAP-3培养基上在23℃,16小时光照下培养2天。在与农杆菌共培育2日后,将叶柄外植体转移至含有的3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上持续7日,并且随后在含头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗具有5-10mm长度时,将苗切下并转移至苗伸长培养基(含0.5mg/l BAP的MSBAP-0.5)。将长度大约2cm的苗转移至用于根诱导的生根培养基(MS0)。将生根的苗移植至温室的土壤中。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
苜蓿转化
紫苜蓿(Medicago sativa)的再生性克隆使用(McKersie等,1999Plant Physiol 119:839-847)的方法加以转化。苜蓿的再生和转化是基因型依赖性的并且因而需要再生植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(AgricultureCanada)或如Brown DCW与A Atanassov(1985.Plant Cell Tissue OrganCulture 4:111-112)描述的任何其它商业苜蓿品种。备选地,RA3品种(威斯康星大学(University of Wisconsin))已经被选择用于组织培养中(Walker等,1978 Am J Bot 65:654-659)。将叶柄外植体与含有表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999 Plant Physiol119:839-847)或LBA4404的过夜培养物共培育。外植体在黑暗中在含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3天。外植体在半强度(half-strength)Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并平板接种在不含乙酰丁香酮而含有合适选择剂和合适抗生素以抑止农杆菌生长的相同SH诱导培养基上。在数周后,将体细胞胚转移至不含生长调节剂、不含抗生素而含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在半强度Murashige-Skoog培养基上萌发。将生根的幼苗移植至花盆内并且在温室中培育。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
棉花转化
根据US 5,159,135中所述的方法使用根癌农杆菌转化棉花。将棉花种子在3%次氯酸钠溶液中表面灭菌20分钟,并以含有500μg/ml头孢噻肟的蒸馏水洗涤。接着将种子转移至含有50μg/ml苯菌灵的SH培养基中进行萌发。取下4至6日龄幼苗的下胚轴,剪成0.5cm的片并置于0.8%琼脂上。用农杆菌悬液(约108个细胞/ml,从转化有目的基因和适当选择标记的过夜培养物稀释而成)接种下胚轴外植体。室温光照3天后,将组织转移至固体培养基(1.6g/l Gelrite),其带有包含B5维生素的Murashige和Skoog盐(Gamborg等,Exp.Cell Res.50:151-158(1968)),0.1mg/l 2,4-D,0.1mg/l 6-糠胺嘌呤和750μg/ml MgCL2,并含有50至100μg/ml头孢噻肟和400-500μg/ml羧苄青霉素以杀死残余细菌。2至3个月(每4至6周继代培养)后分离单个细胞系,并在选择培养基上进一步培养进行组织扩增(30℃,16小时光周期)。接着在非选择培养基上将转化组织再培养2至3个月,以产生体细胞胚。将至少4mm长的表观健康的胚转移至管中,其中含有细蛭石中的SH培养基,并补充有0.1mg/l吲哚乙酸、6糠胺嘌呤和赤霉酸。以16小时光周期在30℃下培养胚,并将2至3叶期的小植株转移至含有蛭石和养分的盆中。植物变硬并接着移至温室中进一步培养。
实施例10:表型评价方法
10.1评价设置
产生大约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室用于生长和收获T1种子。留下T1后代对转基因的存在/不存在以3∶1比例分离的6个事件。对于这些事件中的每一事件,通过监测目视标记表达而选择含有转基因的大约10株T1幼苗(杂合子和纯合子)和缺少转基因的大约10株T1幼苗(失效合子)。转基因植物和对应的失效合子在随机位置上并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃以及相对湿度70%。定期给生长于非胁迫条件下的植物浇水,以确保水和养分不受限制,从而满足植物完成生长和发育的需要。
4个T1事件在T2世代中按照如用于T1世代的相同评价方法作进一步评价,但每个事件采用更多的个体。使植物从播种期直至成熟期通过数字成像箱数次。在每一时间点上,对每株植物从至少6个不同角度拍摄数字图像(2048×1536像素,1600万颜色)。
干旱筛选
在正常培养条件下在盆土中培养来自T2种子的植物,直至到达抽穗阶段。接着将其转移至停止浇水的“干旱”部分。在随机选择的盆中插入湿度探测器,以检测土壤含水量(SWC)。当SWC降至一定阈值之下时,自动对植物持续再浇水直至再次达到正常水平。接着将植物再转移至正常条件。其余培养(植物成熟、种子收获)与不在非生物胁迫条件下培育的植物相同。如正常条件下培养所详细描述的那样记录生长和收获参数。
氮使用效能筛选
在除营养液以外均为正常的条件下在盆土中培养来自T2种子的稻植物。从移植到成熟均使用特定的营养液对盆浇水,其中含有降低的氮(N)含量,通常降低7至8倍。其余培养(植物成熟、种子收获)与不在非生物胁迫条件下培育的植物相同。如正常条件下培养所详细描述的那样记录生长和收获参数。
盐胁迫筛选
在由椰子纤维和argex(3∶1比例)构成的基质上培养植物。在将小植株移植到温室后的前两周使用正常营养液。前两周之后,向营养液中加入25mM盐(NaCl),直至收获植物。随后测量种子相关参数。
10.2统计分析:F检验
使用双因子ANOVA(方差分析)作为统计模型用于植物表型特征的整体评价。对用本发明基因转化的全部事件的全部植物的所有测量参数实施F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整体作用(又称作全局基因作用)。用于真实全局基因作用的显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值标示基因作用,意味着不仅仅基因的存在或位置才造成表型上的差异。
当实施的是具有相互重叠事件的两个实验时,对此进行组合分析。这可用来检验两次实验效果的一致性,如果一致,可积累两个实验的证据以提高结论的置信度。所用的方法是混合模型法,考虑了数据的多级结构(即实验-事件-分离子)。通过比较似然比检验与卡方分布获得P值。
10.3测量的参数
生物量相关的参数测量
从播种期直至成熟期,使植物通过数字成像箱数次。在每一时间点上,对每株植物从至少6个不同角度拍摄数字图像(2048×1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数在来自植物地上部分的数字图像上区别于背景的像素的总数而测定。该值对在相同时间点上从不同角度拍摄的画面进行平均化并且通过校正转化成以平方毫米表达的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是在植物已经达到其最大叶生物量的时间点上所测量的面积。早期萌发势是萌发后3周的植物(幼苗)地上部分面积。根生物量的增加被表述为总根生物量(测量为植物寿命中观察到的根的最大的生物量)的增加;或者表述为根/苗指数(测量为根和苗活性生长期中根质量和苗质量的比例)的提高。
根生物量可以使用如在WO 2006/029987中公开的方法测定。
早期萌发势是涉及植物发育时间的参数。早期萌发势通过计数在来自植物地上部分的区别于背景的像素的总数而测定。该值对在相同时间点上从不同角度拍摄的画面进行平均化并且通过校正转化成以平方毫米表达的物理表面值。以下描述的结果是针对萌发后三周的植物。
植物的“开花时间”可以使用如在WO 2007/093444中公开的方法测定。
种子相关参数的测量
将成熟的原穗(primary panicle)收获、计数、装袋、加条形码标记并且随后在干燥箱内在37℃干燥3日。随后将穗脱粒并且收集及计数全部种子。使用吹气装置分开饱满粒(husk)与空粒。弃去空粒并再次对剩余部分计数。饱满粒在分析天平上称重。饱满种子数通过计数分离步骤后保留下来的饱满粒数而确定。种子总产量通过称量从植物中收获的全部饱满粒而测量。每株植物种子总数通过计数从植物中收获的粒数而测量。根据计数的饱满种子数及其总重量外推得出千粒重(TKW)。收获指数(HI)在本发明中定义为种子总产量和地上面积(mm2)之间的比值再乘以因子106。每个穗的花总数在本发明中定义为种子总数与成熟的原穗数之间的比率。种子饱满率在本发明中定义为饱满种子数占种子(或小花)总数的比例(以a%表示)。
实施例11:转基因植物的表型评价结果
11.1.eRF1多肽
在非胁迫条件下,表达包含SEQ ID NO:1中最长开放阅读框的核酸的T2代植物中转基因稻植物的评估结果显示如下。
在非胁迫条件下评估转基因稻植物的结果显示如下(表E1)。观察到地上生物量(AreaMax)、出苗萌发势(EmerVigor)、每株植物产量(totalwgseeds)、每株植物的种子总数(nrtotalseed)、在第一次清除(flush)中的穗数(firstpan)、植物的饱满种子数(nrfilledseed)、收获指数(为totalwgseeds/AreaMax,harvestindex)至少5%的增加至超过5%的增加。
表E1:非胁迫条件
表E1:非胁迫
条件
参数 | 整体 |
AreaMax | 11.3 |
EmerVigor | 20.0 |
totalwgseeds | 14.6 |
nrtotalseed | 12.2 |
firstpan | 11.4 |
nrfilledseed | 14.6 |
对于每一参数,显示了整体百分比,只要其达到p≤0:05并大于5%阈值。
11.2.SCAMP样多肽
在稻GOS2启动子的控制下并在氮使用效能筛选条件下培养、表达包含SEQ ID NO:88的最长开放阅读框的核酸的T1代转基因稻植物的评估结果显示如下(表E2A)。关于转基因植物产生的详细内容参见前面的实施例。
对于地上生物量(AreaMax)、根生物量(RootMax)、萌发势(Emervigor,早期萌发势)、总种子产量(totalwgseeds)、饱满种子数(nrfilledseed)、饱满率、每株植物的种子总数(nrtotalseed)、收获指数(harvestindex)和原穗数(firstpan),与对照植物比较,观察到至少5%的增加至超过5%的增加。
表E2A:
在稻GOS2启动子的控制下并在氮使用效能筛选条件下培养的、表达包含SEQ ID NO:663的最长开放阅读框的核酸的T1代转基因稻植物的评估结果显示如下。关于转基因植物产生的详细内容参见前面的实施例。
对于3个株系开花前的绿度(GNbfFlow)、对于2个株系重力产量最大值(Gravity Yield Max)(GravityYMax),与对照植物比较,观察到了至少5%的增加。此外,在至少一个株系中对于饱满率、千粒重(TKW)、饱满种子数(nrfilledseed)、每穗的花(flowerperpan)和植物的最大高度,即植物的最高端,我们观察到了至少5%的增加。
在稻GOS2启动子的控制下并在氮使用效能筛选条件下培养的表达包含SEQ ID NO:665的最长开放阅读框的核酸的T1代转基因稻植物的评估结果显示如下(表E2B)。关于转基因植物产生的详细内容参见前面的实施例。
对于地上生物量(Rootbiomass(RootMax))、总种子产量(totalwgseeds)、收获指数(harvestindex)、千粒重(TKW)和饱满种子数(nrfilledseed),与对照植物比较,观察到至少5%的增加至超过5%的增加。
表E2B:
11.3.肌原纤蛋白多肽
在下表中显示的每一参数给出了具有p<0.05的p值的整体百分比差异。与对照植物(对应于无义纯合子)比较,评价的结果显示出总种子重量、种子饱满率、收获指数和饱满种子数的增加。
表E3:T1代
参数 | 整体 |
总种子重量 | 17.9% |
饱满率 | 9.6% |
收获指数 | 10.5% |
饱满种子数 | 15.1% |
表E4:T2代
参数 | 整体 |
总种子重量 | 12.3% |
饱满率 | 8.5% |
收获指数 | 9.8% |
饱满种子数 | 9.8% |
11.4.PLATZ多肽
实施例A
在非胁迫条件下,表达SEQ ID NO:260(参见上文7.4部分-实施例A)的PLATZ核酸的T1代转基因稻植物的评价结果显示如下。对于地上生物量(AreaMax)和根生物量(RootThickMax)、总种子重量(totalwgseeds)、收获指数、千粒重(TKW)观察到了增加(表E5A)。
表E5A:转基因稻植物的数据概述;对于每一参数,显示了相对于对照植物的整体百分比增加,对于每一参数,p值≤0.05。
参数 | 整体增加 |
AreaMax | 12.6 |
totalwgseeds | 19.8 |
harvestindex | 7.6 |
TKW | 17.9 |
RootThickMax | 5.9 |
实施例B
在非胁迫条件下,表达SEQ ID NO:356(参见上文7.4部分-实施例B)的PLATZ核酸的T1代植物中转基因稻植物的评价结果显示如下。观察到了产量相关参数的增加,例如饱满种子与总种子数比例的增加(fillrate)和增加的千粒重(TKW)。转基因植物与对照植物比较还表现出更快的早期发育(表E5B)。后面的参数在表E5B中由AreaEmer显示,并以百分比表示植物产生30%的终生物量需要的时间与植物产生90%的终生物量需要的时间之间的比率。
表E5B:转基因稻植物的数据概述;对于每一参数,显示了相对于对照植物的整体百分比增加,对于每一参数,p值≤0.05。
参数 | 整体增加 |
Fillrate | 5.7% |
TKW | 3.5% |
AreaEmer | 5.3% |
此外,在非生物胁迫例如干旱胁迫、营养胁迫、盐胁迫条件下培养的表达PLATZ蛋白质的植物显示出改进的产量相关性状,包括增加的生物量,例如地上和/或地下生物量的增加;增加的如在定义部分中定义的种子产量;改善的早期萌发势的一种或多种。
11.5.PLST样多肽
在非胁迫条件下,表达包含SEQ ID NO:410中最长开放阅读框的核酸的T2代转基因稻植物的评价结果显示如下。
在干旱条件下评价表达SEQ ID NO:411所示的PLST样多肽的转基因稻植物的结果显示如下(表E6)。观察到总种子重量(totalwgseeds)、饱满种子与总种子数的比率(fillrate)、收获指数(totalwgseeds/AreaMax)(harvestindex)和饱满种子数(nrfilledseed)大于5%的增加。
表E6:在干旱胁迫条件下培养的转基因稻植物的数据概述;显示了整体增加,并且对于每一参数,p值≤0.05。
参数 | 整体 |
totalwgseeds | 19.2 |
fillrate | 27.2 |
harvestindex | 21.6 |
nrfilledseed | 17.1 |
11.6.Glomalin多肽
在根特异性RCc3启动子的控制下,表达Glomalin基因的转基因稻植物具有增加的种子产量,尤其是增加的千粒重(整体增加2.8%,p值为0.035)。6株株系中的3株还具有增加的收获指数。
Claims (145)
1.用于在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码PLATZ多肽之核酸的表达,其中所述PLATZ多肽包含PLATZ结构域。
2.权利要求1的方法,其中所述PLATZ多肽包含基序10至18(SEQID NO:264至SEQ ID NO:272)的一个或多个。
3.权利要求1或2的方法,其中所述受调控的表达通过在植物中引入和表达PLATZ多肽之编码核酸而实现。
4.权利要求1-3的任一项的方法,其中所述编码PLATZ多肽之核酸编码表A4中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
5.权利要求1-4的任一项的方法,其中所述核酸序列编码表A4给出的任一蛋白质的直向同源物或旁系同源物。
6.权利要求1-5的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
7.权利要求1-6的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
8.权利要求3-7的任一项的方法,其中所述核酸与组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子有效连接。
9.权利要求1-8的任一项的方法,其中所述PLATZ多肽之编码核酸是植物来源的,优选来自双子叶植物,进一步优选来自杨柳科(Salicaceae),最优选地来自杨属(Populus)。
10.通过权利要求1-9的任一项方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码PLATZ多肽的重组核酸。
11.构建体,包含:
(i)编码如权利要求1或2定义的PLATZ多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
12.权利要求11的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
13.权利要求11或12的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
14.用权利要求11或12的构建体转化的植物、植物部分或植物细胞。
15.用于生产相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如权利要求1或2定义的PLATZ多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
16.相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如权利要求1或2定义的PLATZ多肽之编码核酸受调控的表达。
17.权利要求10、14或16的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
18.权利要求17的植物的可收获部分,其中所述可收获部分优选是苗生物量和/或种子。
19.来自权利要求17的植物和/或权利要求92的植物的可收获部分的产物。
20.PLATZ多肽之编码核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量和/或苗生物量的用途。
21.分离的核酸分子,选自:
(i)由SEQ ID NO:354表示的核酸;
(ii)由SEQ ID NO:354表示的核酸的互补序列;
(iii)编码PLATZ多肽的核酸,所述PLATZ多肽以递增的优先顺序与由SEQ ID NO:355表示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性,并且以递增的优先顺序与在上文所定义的基序的一个或多个具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性。
22.分离的多肽,选自:
(i)由SEQ ID NO:355表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:355表示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性,并且以递增的优先顺序与上文所定义的基序的一个或多个具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
23.用于在植物中相对于对照植物增强产量相关性状的方法,包括调节编码eRF1多肽的核酸在植物中的表达,其中所述多肽包含至少3个共有结构域,eRF1结构域1、eRF1结构域2和eRF1结构域3,其分别具有Pfam登录号PF03463、PF03464和PF03465。
24.权利要求23的方法,其中eRF1多肽的eRF1结构域1以递增的优先顺序与位于SEQ ID NO 2的氨基酸6至140之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
25.权利要求23的方法,其中eRF1多肽的eRF1结构域2以递增的优先顺序与位于SEQ ID NO 2的氨基酸144至278之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
26.权利要求23的方法,其中eRF1多肽的eRF1结构域3以递增的优先顺序与位于SEQ ID NO 2的氨基酸281至418之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
27.权利要求23-26的任一项的方法,其中本发明的eRF1多肽包含一个或多个以下肽:分别具有SEQ ID NO:73、74和75的GGQ、NIKS和[GA][IMLV]LR[YW]。
28.权利要求23的方法,其中所述eRF1多肽还可以包含序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序1:FGTLSGNTREVLHKF[TS]VDLPKKHGRGGQSALRFARLRMEKRHNYVRK[TV]AE(SEQ ID NO:76),
(ii)基序2:YN[KR]VPPNGLVLY[TC]GT[IV]VT[ED][DE]GKEKKV[TN]IDFEPF[KR]PIN[AT]SLYLCDNKFHTE(SEQ ID NO:77),
(iii)基序3:ARGNGTSMISLI[MI]PP[RK]DQ[IV]SRVTKML[GA]DE[YF]GTASNI KSRVNR[QL]SVL[GS]AIT(SEQ ID NO:78)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
29.权利要求23-28的任一项的方法,其中所述eRF1多肽还可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序4:[TS]VDLPKKHGRGGQSALRFARLR[EM]EKRHNYVRKVAE[VL]A[VT]QNFITND[KR][PV]NV(SEQ ID NO:79),
(ii)基序5:Y[NT][KR]VPPNGLV[VLI]YCG[TD][IV][ILM]T[ED][ED]GKE[KR]K[VM][NT]ID[FI]EPFKPINTSLYLCDNKFHTE(SEQ ID NO:80),
(iii)基序6:ARGNGTSM ISL[IV][IM]PPK[DG]Q[IV]S[RL]V[QA]KM L[AT][DE]EYGTASNIKSRVNR[LQ]SVL[SG]AIT(SEQ ID NO:81)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
30.权利要求28-29的任一项的方法,其中所述eRF1多肽还可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序7:VDLPKKHGRGGQSALRFARLRMEKRHNYVRKTAELATQF[YF]INPATSQPNV(SEQ ID NO:82),
(ii)基序8:YNKVPPNGLVLYTGTIVT[ED]DGKEKKVTIDFEPF[KR]PINASLYLCDNKFHTE(SEQ ID NO:83),
(iii)基序9:TSMISLIMPPRDQ[VI]SRVTKMLGDE[FY]GTASNIKSRVNRQSVLGAITSAQQR(SEQ ID NO:84)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
31.权利要求23-30的任一项的方法,其中eRF1多肽的同源物以递增的优先顺序与由表A1的任一多肽,优选地由SEQ ID NO:2表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性。
32.权利要求23-31的任一项的方法,其中所述受调控的表达通过在植物中引入和表达任一前述权利要求所定义的eRF1多肽之编码核酸而实现。
33.权利要求23-32的任一项的方法,其中所述编码eRF1多肽之核酸编码表A1中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
34.权利要求23-33的任一项的方法,其中所述核酸序列编码表A1给出的任一蛋白质的直向同源物或旁系同源物。
35.任一前述权利要求的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
36.权利要求23-35的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
37.权利要求23-36的任一项的方法,其中所述增强的产量相关性状是在干旱胁迫、盐胁迫或氮缺乏条件下获得的。
38.权利要求32-34的任一项的方法,其中所述核酸与组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子有效连接。
39.权利要求23-38的任一项的方法,其中所述eRF1多肽之编码核酸是植物来源的,优选来自双子叶植物,进一步优选来自十字花科,更优选来自拟南芥属(Arabidopsis),最优选来自拟南芥(Arabidopsisthaliana)。
40.通过权利要求23-39的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码eRF1多肽的重组核酸。
41.构建体,包含:
(i)编码如权利要求23-31定义的eRF1多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
42.权利要求41的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
43.权利要求41或42的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
44.用权利要求41或42的构建体转化的植物、植物部分或植物细胞。
45.用于生产相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如权利要求23-31定义的eRF1多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
46.相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如权利要求23-31定义的eRF1多肽之编码核酸受调控的表达。
47.权利要求40、44或46的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
48.权利要求47的植物的可收获部分,其中所述可收获部分优选是苗生物量和/或种子。
49.来自权利要求47的植物和/或权利要求48的植物的可收获部分的产物。
50.eRF1多肽之编码核酸相对于对照植物,在植物中增加产量性状,特别是增加种子产量和/或苗生物量的用途。
51.分离的核酸分子,选自:
(i)由以下核酸序列的任一表示的核酸:具有SEQ ID NO:15的G.max_GM06MC33657_sm55b1032878;具有SEQ ID NO:17的H.vulgare_c64960768hv2703032598;
(ii)由下述序列表示的核酸的互补序列:所述序列具有SEQ ID NO:15的G.max_GM06MC33657_sm55b1032878;具有SEQ ID NO:17的H.vulgare_c64960768hv2703032598;
(iii)编码由SEQ ID NO:16;SEQ ID NO:18的任一表示的多肽的核酸,优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQ ID NO:16和18的任一表示的多肽序列,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(iv)核酸,所述核酸以递增的优先顺序与表A1的任一核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状;
(vi)编码eRF1多肽的核酸,所述eRF1多肽以递增的优先顺序与由SEQ ID NO:16和18的任一表示的氨基酸序列和表A1中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
52.本发明另外的实施方案,从而还提供了分离的多肽,选自:
(i)由SEQ ID NO:16和18的任一表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:16和18的任一表示的氨基酸序列和表A1中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
53.用于在植物中相对于对照植物增强产量相关性状的方法,包括调节编码SCAMP样多肽的核酸在植物中的表达,其中所述SCAMP样多肽包含SCAMP结构域。
54.权利要求53的方法,其中所述SCAMP结构域以递增的优先顺序与表A2的任一多肽中存在的SCAMP结构域的氨基酸,优选地与位于SEQ ID NO 89的氨基酸91至265之间的序列表示的SCAMP结构域具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。
55.权利要求53或54的方法,其中所述受调控的表达通过在植物中引入和表达SCAMP样多肽之编码核酸而实现。
56.权利要求53-55的任一项的方法,其中所述编码SCAMP样多肽之核酸编码表A2中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
57.权利要求53-56的任一项的方法,其中所述核酸序列编码表A2给出的任一蛋白质的直向同源物或旁系同源物。
58.权利要求53-57的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
59.权利要求53-58的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
60.权利要求53-58的任一项的方法,其中所述增强的产量相关性状是在干旱胁迫、盐胁迫或氮缺乏条件下获得的。
61.权利要求55-60的任一项的方法,其中所述核酸与组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子有效连接。
62.权利要求53-61的任一项的方法,其中所述LBD多肽之编码核酸是植物来源的,优选来自双子叶植物,进一步优选来自十字花科,更优选来自拟南芥属,最优选来自拟南芥。
63.通过权利要求53-62的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码SCAMP样多肽的重组核酸。
64.构建体,包含:
(i)编码如权利要求53或54定义的SCAMP样多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
65.权利要求64的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
66.权利要求64或65的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
67.用权利要求64或65的构建体转化的植物、植物部分或植物细胞。
68.用于生产相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如权利要求53或54定义的SCAMP样多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
69.相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如权利要求53或54定义的SCAMP样多肽之编码核酸受调控的表达。
70.权利要求63、67或69的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
71.权利要求70的植物的可收获部分,其中所述可收获部分优选是苗生物量和/或种子。
72.来自权利要求70的植物和/或权利要求71的植物的可收获部分的产物。
73.SCAMP样多肽之编码核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量和/或苗生物量的用途。
74.分离的核酸分子,选自:
(i)由SEQ ID NO:100、102、104、106、180、182、184、186、188、190和192的任一表示的核酸;
(ii)由(i)项SEQ ID NO:100、102、104、106、180、182、184、186、188、190和192的任一表示的核酸的互补序列;
(iii)编码由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的多肽的核酸;优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的多肽序列,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(iv)核酸,所述核酸以递增的优先顺序与表A2的任一核酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi)编码多肽的核酸,所述多肽以递增的优先顺序与由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的氨基酸序列和表A2中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
75.分离的多肽,选自
(i)由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与由SEQ ID NO:101、103、105、107、181、183、185、187、189、191和193的任一表示的氨基酸序列和表A2中的任一其它氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
76.用于在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码肌原纤蛋白多肽之核酸的表达,所述肌原纤蛋白多肽包括:
(i)由PFAM登录号PF04755表示的PAP肌原纤蛋白结构域;和
(ii)由KFECQNESRGGLVRNVIKWSVPRLLEENEGATLIVTARFSSVSARNIYLKFEEIGLQNINISDDLQAVIAPAILPRSFLSLQILQFIRSFKARVPVTSPERHSVGGLYYLSYLDKNMLLGRAVGGGGVFIFTRAHTL(SEQ ID NO:253)表示的羧基端结构域,其可以含有表示1至15个之间的残基的0至5个之间的空位,或者以递增的优先顺序与(SEQ IDNO:253)具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性的结构域;和任选地
(iii)在多肽的氨基端区域内的转运肽。
77.权利要求76的方法,其中所述PAP肌原纤蛋白结构域由ENRKYELLNIIQDTQRGLVTTADQRSTIEEAMVVVEGFDAGKEIDLSKLDGTWQYTSAPDVLILFESAARLPFFQVGQIFQ(SEQ ID NO:252)表示,其可以含有表示1至15个之间的残基的0至5个之间的空位,或者以递增的优先顺序与SEQ ID NO:252具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性的结构域。
78.权利要求76或77的方法,其中所述肌原纤蛋白多肽包含一个或多个以下结构域的一个或多个:
-结构域X:NIYLQF[EQ]E[IA]S[VL]Q[ND]INISE[EQ]LQAL[IL]APA[IL]LPRSFL[SN]LQILQ[FA][LI][RK][TS]F[KR]AQ[VI]P;
-结构域Y:YYL[ST]YLD[RN][ND]MLLGR[AS]VGGGGV;
-结构域Z:[PA][IL]DL[AS]KLDGTWRLQYTSA[SP]DV;或
-以递增的优先顺序与结构域X、Y和Z的任意一个或多个具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性的结构域。
79.权利要求76-78的任一项的方法,其中所述受调控的表达通过在植物中引入和表达肌原纤蛋白多肽之编码核酸而实现。
80.权利要求76-79的任一项的方法,其中所述编码肌原纤蛋白多肽之核酸编码表A3中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
81.权利要求76-80的任一项的方法,其中所述核酸序列编码表A3给出的任一蛋白质直向同源物或旁系同源物。
82.权利要求76-81的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选的种子产量。
83.权利要求76-82的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
84.权利要求79-83的任一项的方法,其中所述核酸与组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子有效连接。
85.权利要求76-84的任一项的方法,其中所述肌原纤蛋白多肽之编码核酸是植物来源的,优选来自双子叶植物,更优选来自茄科(Solanaceae),另外优选地,该核酸来自番茄属(Lycopersicon),还优选地来自番茄属物种,最优选核酸来自番茄。
86.通过权利要求76-85的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码肌原纤蛋白多肽的重组核酸。
87.构建体,包含:
(i)编码如权利要求76-78任一项定义的肌原纤蛋白多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
88.权利要求87的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
89.权利要求87或88的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的种子产量的植物的方法中的用途。
90.用权利要求87或88的构建体转化的植物、植物部分或植物细胞。
91.用于生产相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如权利要求76-78任一项定义的肌原纤蛋白多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
92.相对于对照植物,具有增加的产量,特别是增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如权利要求76-78任一项定义的肌原纤蛋白多肽之编码核酸受调控的表达。
93.权利要求86、90或92的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
94.权利要求93的植物的可收获部分,其中所述可收获部分优选是种子。
95.来自权利要求93的植物和/或权利要求94的植物的可收获部分的产物。
96.肌原纤蛋白多肽之编码核酸在相对于对照植物,增加产量,特别是增加种子产量的用途。
97.用于在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码PLST样多肽之核酸的表达,其中所述PLST样多肽至少包含PFam登录号为PF02298的PLST共有结构域。
98.权利要求97的方法,其中PLST样多肽的PLST样结构域以递增的优先顺序与位于SEQ ID NO 411的氨基酸38至124之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
99.权利要求97或98的任一项的方法,其中所述PLST样多肽可以包含序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序19:[DH]SV[LI]QV[TS]KE[DA][YF][DK]SCNT[SK][NSD]P(SEQ ID NO:530);
(ii)基序20:[FHY]YF[IT]SGV[PK][GD][HN]C(SEQ ID NO:531);
(iii)基序21:Y[NT][QK]WA[ESK][KS]NRF[KQ][IV]GD[ST][LI][VL]F[KL]YP(SEQ ID NO:532)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
100.权利要求97至99的任一项的方法,其中所述PLST样多肽可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序22:[DN]GN[TS][LVK][FV][KN][LF][DT]R[SP]GP[FY]YF[IT]SG[VA][KP][GD][HN]CEK[GN][QE]K(SEQ ID NO:533);
(ii)基序23:[YL]N[QK]WA[EK][KS][NH]RF[KQ][IV]GD[ST]L[LV]F[LK]Y[PD](SEQ IDNO:534);
(iii)基序24:[KQ]DSV[LI]QVTKE[DA]YKSCNT[SK][DSN]PI(SEQ ID NO:535)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
101.权利要求97至100的任一项的方法,其中所述PLST样多肽可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序25:DSVI[QV]VT[EKA][EQ]S[YF][KN][SK]CNL[KST]DPIL[YF][MS]N[ND]GN[ST][LV]FN[LI][TD][RS]PGL[FY]YF[TI]SG[VA][PS]GHC[EQ][KR](SEQ ID NO:536)
(ii)基序26:P[PT]SA[DN]P[DQ][VL]YTKW[AS][KS][NS][HN][RN]FK[IL]GD[ST][LI]LFLYP(SEQ ID NO:537)
(iii)基序27:XVS[CS]Y[QE][YF]KVG[DG]LD[AGS]W(SEQ ID NO:538)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
102.权利要求97至101的任一项的方法,其中所述PLST样多肽可以包含任意一个或多个序列基序,所述序列基序以递增的优先顺序与任一以下基序:
(i)基序28:HN[FL]K[IL]GDSLLFLYPPSQDSVIQVTA[QE][SAN][YF][KN]SC[ND]L[KS]DPILYMN[DN]GNSLFN[IL]T(SEQ ID NO:539)
(ii)基序29:GDFYFTSG[AVE]PGHC[EQ]K[SK]QKLH[IV](SEQ ID NO:540)
(iii)基序30:VSCYQYKVGDLD[AS]WGIPTSA[NK](SEQ ID NO:541)
具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或者更多的序列同一性。
103.权利要求97至102的任一项的方法,其中PLST样多肽的同源物以递增的优先顺序与由表A5的任一多肽,优选地由SEQ ID NO:411表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的整体序列同一性。
104.权利要求97-103的任一项的方法,其中所述受调控的表达通过在植物中引入和表达任一项前述权利要求定义的PLST样多肽之编码核酸而实现。
105.权利要求97-104的任一项的方法,其中所述编码PLST样多肽之核酸编码表A5中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
106.权利要求97-105的任一项的方法,其中所述核酸序列编码表A5给出的任一蛋白质的直向同源物或旁系同源物。
107.权利要求97-106的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的种子产量。
108.权利要求97-107的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
109.权利要求97-107的任一项的方法,其中所述增强的产量相关性状是在干旱胁迫、盐胁迫或氮缺乏条件下获得的。
110.权利要求104-106的任一项的方法,其中所述核酸与组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子有效连接。
111.权利要求97-110的任一项的方法,其中所述PLST样多肽之编码核酸是植物来源的。
112.权利要求111的方法,其中所述PLST样多肽之编码核酸来自双子叶植物,进一步优选来自杨柳科,最优选核酸来自毛果杨。
113.通过权利要求97-112的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码PLST样多肽的重组核酸。
114.构建体,包含:
(i)编码如权利要求97-103定义的PLST样多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
115.权利要求114的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
116.权利要求114或115的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的种子产量的植物的方法中的用途。
117.用权利要求114或115的构建体转化的植物、植物部分或植物细胞。
118.用于生产相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如权利要求97-103定义的PLST样多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
119.相对于对照植物,具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如权利要求97-103定义的PLST样多肽之编码核酸受调控的表达。
120.权利要求113、117或119的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
121.权利要求120的植物的可收获部分,其中所述可收获部分优选是种子。
122.来自权利要求120的植物和/或权利要求121的植物的可收获部分的产物。
123.PLST样多肽之编码核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量的用途。
124.分离的核酸分子,选自:
(i)由SEQ ID NO:414;SEQ ID NO:426;SEQ ID NO:428;SEQ IDNO:434;SEQ ID NO:438表示的核酸;
(ii)由SEQ ID NO:414;SEQ ID NO:426;SEQ ID NO:428;SEQID NO:434;SEQ ID NO:438表示的核酸的互补序列;
(iii)编码由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ ID NO:435;SEQ ID NO:439的任一表示的PLST样多肽的核酸,优选地,由于遗传密码的简并性,所述分离的核酸可以衍生自由SEQ IDNO:的任一表示的多肽序列,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(iv)核酸,所述核酸以递增的优先顺序与表A5的任一核酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性,并且另外优选地赋予相对于对照植物而言增强的产量相关性状;
(v)核酸分子,所述核酸分子在严格杂交条件下与(i)至(iv)项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi)编码PLST样多肽的核酸,所述PLST样多肽以递增的优先顺序与由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ IDNO:435;SEQ ID NO:439的任一表示的氨基酸序列和表A5中的任一其它氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性,并且优选地赋予相对于对照植物而言增强的产量相关性状。
125.根据本发明另外的实施方案,从而还提供了分离的多肽分子,选自:
(i)由SEQ ID NO:415;SEQ ID NO:427;SEQ ID NO:429;SEQ IDNO:435;SEQ ID NO:439表示的氨基酸序列;
(ii)氨基酸序列,所述氨基酸序列以递增的优先顺序与SEQ ID NO:Y表示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性,并且以递增的优先顺序与SEQ ID NO:415;SEQ ID NO:427;SEQID NO:429;SEQ ID NO:435;SEQ ID NO:439具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多的序列同一性。
(iii)上述(i)或(ii)项中给出的任一氨基酸序列的衍生物。
126.用于在植物中相对于对照植物而言增强产量相关性状的方法,包括调节植物中编码Glomalin多肽之核酸的表达,其中所述Glomalin多肽包含Cpn60_TCP1结构域。
127.权利要求126的方法,其中所述Glomalin多肽包含基序31至43(SEQ ID NO:596至SEQ ID NO:608)的一个或多个。
128.权利要求126或127的方法,其中所述受调控的表达通过在植物中引入和表达Glomalin多肽之编码核酸而实现。
129.权利要求126-128的任一项的方法,其中所述编码Glomalin多肽之核酸编码表A6中列举的任一蛋白质,或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
130.权利要求126-129的任一项的方法,其中所述核酸序列编码表A6给出的任一蛋白质的直向同源物或旁系同源物。
131.权利要求126-130的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的种子产量。
132.权利要求126-131的任一项的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
133.权利要求128-132的任一项的方法,其中所述核酸与根特异性启动子,优选RCc3启动子,最优选来自稻的RCc3启动子有效连接。
134.权利要求126-133的任一项的方法,其中所述Glomalin多肽之编码核酸是植物来源的,优选来自双子叶植物,进一步优选来自禾本科(Poaceae),更优选来自稻属,最优选来自稻。
135.通过权利要求126-134的任一项方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码Glomalin多肽的重组核酸。
136.构建体,包含:
(i)编码如权利要求126或127定义的Glomalin多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选的
(iii)转录终止序列。
137.权利要求136的构建体,其中所述控制序列之一是组成型启动子,优选RCc3启动子,最优选来自稻的RCc3启动子。
138.权利要求136或137的构建体在用于制造相对于对照植物具有增加的产量,特别是增加的种子产量的植物的方法中的用途。
139.用权利要求136或137的构建体转化的植物、植物部分或植物细胞。
140.用于生产相对于对照植物具有增加的产量,特别是增加的种子产量的转基因植物的方法,包括:
(i)在植物中引入和表达如权利要求126或127定义的Glomalin多肽之编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
141.相对于对照植物,具有增加的产量,特别是增加的种子产量的转基因植物或者源自所述转基因植物的转基因植物细胞,获得自如权利要求126或127定义的Glomalin多肽之编码核酸受调控的表达。
142.权利要求135、139或141的转基因植物,或源自它的转基因植物细胞,其中所述植物是作物植物或单子叶或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、野小麦、德国小麦、黑麦属、一粒系小麦、teff、蜀黍和燕麦。
143.权利要求142的植物的可收获部分,其中所述可收获部分优选是种子。
144.来自权利要求142的植物和/或权利要求143的植物的可收获部分的产物。
145.Glomalin多肽之编码核酸在相对于对照植物,在植物中增加产量,特别是增加种子产量的用途。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510155059.2A CN104762316A (zh) | 2009-06-19 | 2010-06-10 | 具有增强的产量相关性状的植物和用于产生该植物的方法 |
Applications Claiming Priority (25)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP09163257.0 | 2009-06-19 | ||
EP09163277.8 | 2009-06-19 | ||
EP09163277 | 2009-06-19 | ||
EP09163257 | 2009-06-19 | ||
EP09163287.7 | 2009-06-19 | ||
EP09163287 | 2009-06-19 | ||
US22338909P | 2009-07-07 | 2009-07-07 | |
US22342909P | 2009-07-07 | 2009-07-07 | |
US22343109P | 2009-07-07 | 2009-07-07 | |
US61/223389 | 2009-07-07 | ||
US61/223429 | 2009-07-07 | ||
US61/223431 | 2009-07-07 | ||
US22630709P | 2009-07-17 | 2009-07-17 | |
EP09165779 | 2009-07-17 | ||
US61/226307 | 2009-07-17 | ||
EP09165779.1 | 2009-07-17 | ||
US22744809P | 2009-07-22 | 2009-07-22 | |
EP09166083 | 2009-07-22 | ||
EP09166083.7 | 2009-07-22 | ||
US61/227448 | 2009-07-22 | ||
US22780309P | 2009-07-23 | 2009-07-23 | |
US61/227803 | 2009-07-23 | ||
EP09166200 | 2009-07-23 | ||
EP09166200.7 | 2009-07-23 | ||
PCT/EP2010/058129 WO2011006717A2 (en) | 2009-06-19 | 2010-06-10 | Plants having enhanced yield-related traits and a method for making the same |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510155059.2A Division CN104762316A (zh) | 2009-06-19 | 2010-06-10 | 具有增强的产量相关性状的植物和用于产生该植物的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102656270A true CN102656270A (zh) | 2012-09-05 |
CN102656270B CN102656270B (zh) | 2015-05-13 |
Family
ID=43449877
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510155059.2A Pending CN104762316A (zh) | 2009-06-19 | 2010-06-10 | 具有增强的产量相关性状的植物和用于产生该植物的方法 |
CN201080036577.8A Expired - Fee Related CN102656270B (zh) | 2009-06-19 | 2010-06-10 | 具有增强的产量相关性状的植物和用于产生该植物的方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510155059.2A Pending CN104762316A (zh) | 2009-06-19 | 2010-06-10 | 具有增强的产量相关性状的植物和用于产生该植物的方法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US9683023B2 (zh) |
EP (2) | EP2443240A2 (zh) |
CN (2) | CN104762316A (zh) |
AR (1) | AR079398A1 (zh) |
AU (1) | AU2010272805A1 (zh) |
BR (1) | BRPI1011353A2 (zh) |
CA (1) | CA2764732A1 (zh) |
EA (1) | EA201270035A1 (zh) |
MX (1) | MX2011013544A (zh) |
WO (1) | WO2011006717A2 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109422803A (zh) * | 2017-08-31 | 2019-03-05 | 中国科学院上海生命科学研究院 | 调节植物粒形、千粒重及穗粒数的基因及其应用 |
CN110777150A (zh) * | 2018-07-25 | 2020-02-11 | 中国科学院遗传与发育生物学研究所 | 蛋白GmPLATZ在调控植物种子产量中的应用 |
CN114478730A (zh) * | 2022-02-28 | 2022-05-13 | 安徽农业大学 | 小麦TaVQ14蛋白及其编码基因与应用 |
CN114480418A (zh) * | 2022-01-24 | 2022-05-13 | 上海交通大学 | 温敏雄性不育基因hsp60-3b及其应用和育性恢复的方法 |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8367881B2 (en) | 2011-05-09 | 2013-02-05 | Cool Planet Biofuels, Inc. | Method for biomass fractioning by enhancing biomass thermal conductivity |
US10696603B2 (en) | 2011-06-06 | 2020-06-30 | Carbon Technology Holdings, LLC | Mineral solubilizing microorganism infused biochars |
US8317891B1 (en) | 2011-06-06 | 2012-11-27 | Cool Planet Biofuels, Inc. | Method for enhancing soil growth using bio-char |
US10173937B2 (en) | 2011-06-06 | 2019-01-08 | Cool Planet Energy Systems, Inc. | Biochar as a microbial carrier |
US10322389B2 (en) | 2014-10-01 | 2019-06-18 | Cool Planet Energy Systems, Inc. | Biochar aggregate particles |
US10118870B2 (en) | 2011-06-06 | 2018-11-06 | Cool Planet Energy Systems, Inc. | Additive infused biochar |
US11214528B2 (en) | 2011-06-06 | 2022-01-04 | Carbon Technology Holdings, LLC | Treated biochar for use in water treatment systems |
US9216916B2 (en) | 2013-10-25 | 2015-12-22 | Cool Planet Energy Systems, Inc. | System and method for purifying process water produced from biomass conversion to fuels |
US8568493B2 (en) | 2011-07-25 | 2013-10-29 | Cool Planet Energy Systems, Inc. | Method for producing negative carbon fuel |
US9809502B2 (en) | 2011-06-06 | 2017-11-07 | Cool Planet Energy Systems, Inc. | Enhanced Biochar |
US10392313B2 (en) | 2011-06-06 | 2019-08-27 | Cool Planet Energy Systems, Inc. | Method for application of biochar in turf grass and landscaping environments |
US10252951B2 (en) | 2011-06-06 | 2019-04-09 | Cool Planet Energy Systems, Inc. | Biochars and biochar treatment processes |
US10640429B2 (en) | 2011-06-06 | 2020-05-05 | Cool Planet Energy System, Inc. | Methods for application of biochar |
US9980912B2 (en) | 2014-10-01 | 2018-05-29 | Cool Planet Energy Systems, Inc. | Biochars for use with animals |
US11279662B2 (en) | 2011-06-06 | 2022-03-22 | Carbon Technology Holdings, LLC | Method for application of biochar in turf grass and landscaping environments |
US9493379B2 (en) | 2011-07-25 | 2016-11-15 | Cool Planet Energy Systems, Inc. | Method for the bioactivation of biochar for use as a soil amendment |
US10233129B2 (en) | 2011-06-06 | 2019-03-19 | Cool Planet Energy Systems, Inc. | Methods for application of biochar |
US10550044B2 (en) | 2011-06-06 | 2020-02-04 | Cool Planet Energy Systems, Inc. | Biochar coated seeds |
US10059634B2 (en) | 2011-06-06 | 2018-08-28 | Cool Planet Energy Systems, Inc. | Biochar suspended solution |
BR112014012871B1 (pt) | 2011-11-28 | 2021-03-23 | Evogene Ltd. | Método para aumento da eficiência no uso de nitrogênio, produção, biomassa, taxa de crescimento, vigor, e/ou tolerância à deficiência de nitrogênio de uma planta, e, construto de ácido nucleico isolado |
US11053171B2 (en) | 2014-10-01 | 2021-07-06 | Carbon Technology Holdings, LLC | Biochars for use with animals |
WO2016054431A1 (en) | 2014-10-01 | 2016-04-07 | Cool Planet Energy Systems, Inc. | Biochars and biochar treatment processes |
US10870608B1 (en) | 2014-10-01 | 2020-12-22 | Carbon Technology Holdings, LLC | Biochar encased in a biodegradable material |
US11097241B2 (en) | 2014-10-01 | 2021-08-24 | Talipot Cool Extract (Ip), Llc | Biochars, biochar extracts and biochar extracts having soluble signaling compounds and method for capturing material extracted from biochar |
US10472297B2 (en) | 2014-10-01 | 2019-11-12 | Cool Planet Energy System, Inc. | Biochars for use in composting |
US11426350B1 (en) | 2014-10-01 | 2022-08-30 | Carbon Technology Holdings, LLC | Reducing the environmental impact of farming using biochar |
MX2020006266A (es) | 2017-12-15 | 2021-01-20 | Talipot Cool Extract Ip Llc | Biocarbones y extractos de biocarbón que tienen compuestos de señalización solubles y método de captura de material extracto de biocarbón. |
WO2020257882A1 (en) * | 2019-06-28 | 2020-12-30 | Commonwealth Scientific And Industrial Research Organisation | Controlling plant flowering |
CN112734186B (zh) * | 2020-12-30 | 2023-10-13 | 中南大学 | 列车车厢空气微生物污染实时评估方法、系统及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040031072A1 (en) * | 1999-05-06 | 2004-02-12 | La Rosa Thomas J. | Soy nucleic acid molecules and other molecules associated with transcription plants and uses thereof for plant improvement |
WO2004031349A2 (en) * | 2002-09-18 | 2004-04-15 | Mendel Biotechnology, Inc. | Polynucleotides and polypeptides in plants |
WO2009056566A2 (en) * | 2007-10-29 | 2009-05-07 | Basf Plant Science Gmbh | Plants having enhanced yield-related traits and a method for making the same |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4987071A (en) | 1986-12-03 | 1991-01-22 | University Patents, Inc. | RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods |
US5004863B2 (en) | 1986-12-03 | 2000-10-17 | Agracetus | Genetic engineering of cotton plants and lines |
US5116742A (en) | 1986-12-03 | 1992-05-26 | University Patents, Inc. | RNA ribozyme restriction endoribonucleases and methods |
AU3756889A (en) | 1988-06-01 | 1990-01-05 | The Texas A & M University System | Method for transforming plants via the shoot apex |
WO1993022443A1 (en) | 1992-04-24 | 1993-11-11 | Sri International | In vivo homologous sequence targeting in eukaryotic cells |
NZ253963A (en) | 1992-06-29 | 1997-08-22 | Gene Shears Pty Ltd | Nucleic acid molecule capable of blocking or interfering with viral replication and its use in transforming plant and animal life forms |
WO1995003404A1 (en) | 1993-07-22 | 1995-02-02 | Gene Shears Pty Limited | Dna virus ribozymes |
EP0733059B1 (en) | 1993-12-09 | 2000-09-13 | Thomas Jefferson University | Compounds and methods for site-directed mutations in eukaryotic cells |
US6395547B1 (en) | 1994-02-17 | 2002-05-28 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
JPH11513256A (ja) | 1995-10-06 | 1999-11-16 | プラント ジエネテイツク システムズ エヌ.ブイ | 種子粉砕 |
GB9607517D0 (en) | 1996-04-11 | 1996-06-12 | Gene Shears Pty Ltd | The use of DNA Sequences |
GB9703146D0 (en) | 1997-02-14 | 1997-04-02 | Innes John Centre Innov Ltd | Methods and means for gene silencing in transgenic plants |
GB9710475D0 (en) | 1997-05-21 | 1997-07-16 | Zeneca Ltd | Gene silencing |
GB9720148D0 (en) | 1997-09-22 | 1997-11-26 | Innes John Centre Innov Ltd | Gene silencing materials and methods |
WO1999053050A1 (en) | 1998-04-08 | 1999-10-21 | Commonwealth Scientific And Industrial Research Organisation | Methods and means for obtaining modified phenotypes |
CN1268749C (zh) | 1998-06-26 | 2006-08-09 | 爱阿华州立大学研究机构 | 用于改变植物中酶和乙酰辅酶a水平的材料和方法 |
US6555732B1 (en) | 1998-09-14 | 2003-04-29 | Pioneer Hi-Bred International, Inc. | Rac-like genes and methods of use |
US20070011783A1 (en) | 1999-05-06 | 2007-01-11 | Jingdong Liu | Nucleic acid molecules and other molecules associated with plants and uses thereof for plant improvement |
US20090087878A9 (en) | 1999-05-06 | 2009-04-02 | La Rosa Thomas J | Nucleic acid molecules associated with plants |
EP1198985B1 (en) | 1999-07-22 | 2010-09-08 | National Institute Of Agrobiological Sciences | Method for superrapid transformation of monocotyledon |
US20110131679A2 (en) | 2000-04-19 | 2011-06-02 | Thomas La Rosa | Rice Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement |
US20040216190A1 (en) | 2003-04-28 | 2004-10-28 | Kovalic David K. | Nucleic acid molecules and other molecules associated with plants and uses thereof for plant improvement |
US7989676B2 (en) | 2006-08-31 | 2011-08-02 | Ceres, Inc. | Nucleotide sequences and corresponding polypeptides conferring modulated plant characteristics |
CA2579804C (en) | 2004-09-16 | 2013-12-10 | Cropdesign N.V. | Root evaluation |
EP1820391A1 (en) | 2006-02-17 | 2007-08-22 | CropDesign N.V. | Method and apparatus to determine the start of flowering in plants |
EP2078090A2 (en) | 2007-06-29 | 2009-07-15 | BASF Plant Science GmbH | Plants having enhanced yield-related traits and a method for making the same |
-
2010
- 2010-06-10 CN CN201510155059.2A patent/CN104762316A/zh active Pending
- 2010-06-10 MX MX2011013544A patent/MX2011013544A/es not_active Application Discontinuation
- 2010-06-10 EP EP10725102A patent/EP2443240A2/en not_active Withdrawn
- 2010-06-10 WO PCT/EP2010/058129 patent/WO2011006717A2/en active Application Filing
- 2010-06-10 US US13/378,832 patent/US9683023B2/en not_active Expired - Fee Related
- 2010-06-10 EP EP15159237.5A patent/EP2955229A1/en not_active Withdrawn
- 2010-06-10 AU AU2010272805A patent/AU2010272805A1/en not_active Abandoned
- 2010-06-10 BR BRPI1011353A patent/BRPI1011353A2/pt not_active IP Right Cessation
- 2010-06-10 CN CN201080036577.8A patent/CN102656270B/zh not_active Expired - Fee Related
- 2010-06-10 CA CA2764732A patent/CA2764732A1/en not_active Abandoned
- 2010-06-10 EA EA201270035A patent/EA201270035A1/ru unknown
- 2010-06-22 AR ARP100102200A patent/AR079398A1/es unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040031072A1 (en) * | 1999-05-06 | 2004-02-12 | La Rosa Thomas J. | Soy nucleic acid molecules and other molecules associated with transcription plants and uses thereof for plant improvement |
WO2004031349A2 (en) * | 2002-09-18 | 2004-04-15 | Mendel Biotechnology, Inc. | Polynucleotides and polypeptides in plants |
WO2009056566A2 (en) * | 2007-10-29 | 2009-05-07 | Basf Plant Science Gmbh | Plants having enhanced yield-related traits and a method for making the same |
Non-Patent Citations (2)
Title |
---|
TUSKAN, G.A., 等: "predicted protein [Populus trichocarpa]", 《NCIB REFERENCE SEQUENCE:XP_002331005.1》 * |
YUKIO NAGANO, 等: "A novel class of plant-specific zinc-dependent DNA-binding protein that binds to A/T-rich DNA sequence", 《NUCLEIC ACIDS RESEARCH》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109422803A (zh) * | 2017-08-31 | 2019-03-05 | 中国科学院上海生命科学研究院 | 调节植物粒形、千粒重及穗粒数的基因及其应用 |
CN109422803B (zh) * | 2017-08-31 | 2021-11-30 | 中国科学院分子植物科学卓越创新中心 | 调节植物粒形、千粒重及穗粒数的基因及其应用 |
CN110777150A (zh) * | 2018-07-25 | 2020-02-11 | 中国科学院遗传与发育生物学研究所 | 蛋白GmPLATZ在调控植物种子产量中的应用 |
CN110777150B (zh) * | 2018-07-25 | 2021-08-10 | 中国科学院遗传与发育生物学研究所 | 蛋白GmPLATZ在调控植物种子产量中的应用 |
CN114480418A (zh) * | 2022-01-24 | 2022-05-13 | 上海交通大学 | 温敏雄性不育基因hsp60-3b及其应用和育性恢复的方法 |
CN114480418B (zh) * | 2022-01-24 | 2023-08-25 | 上海交通大学 | 温敏雄性不育基因hsp60-3b及其应用和育性恢复的方法 |
CN114478730A (zh) * | 2022-02-28 | 2022-05-13 | 安徽农业大学 | 小麦TaVQ14蛋白及其编码基因与应用 |
CN114478730B (zh) * | 2022-02-28 | 2024-01-12 | 安徽农业大学 | 小麦TaVQ14蛋白及其编码基因与应用 |
Also Published As
Publication number | Publication date |
---|---|
US9683023B2 (en) | 2017-06-20 |
CA2764732A1 (en) | 2011-01-20 |
CN102656270B (zh) | 2015-05-13 |
AU2010272805A2 (en) | 2013-09-26 |
EP2443240A2 (en) | 2012-04-25 |
AR079398A1 (es) | 2012-01-25 |
EP2955229A1 (en) | 2015-12-16 |
CN104762316A (zh) | 2015-07-08 |
EA201270035A1 (ru) | 2012-09-28 |
WO2011006717A3 (en) | 2012-05-10 |
AU2010272805A1 (en) | 2012-01-19 |
BRPI1011353A2 (pt) | 2017-05-23 |
US20120144532A1 (en) | 2012-06-07 |
MX2011013544A (es) | 2012-02-21 |
WO2011006717A2 (en) | 2011-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102656270B (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
RU2503721C2 (ru) | Растения, имеющие усиленные признаки, связанные с урожайностью, и способ их получения | |
CN101965405B (zh) | 具有增强的产量相关性状的植物和用于制备该植物的方法 | |
CN102365366A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN102459614A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN102666858A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN102186877A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN102676575A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN102686604A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN103249836A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN102459613A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN102066568A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
EP2173884A2 (en) | Plants having increased yield-related traits and a method for making the same | |
CN102131934A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN102686605A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN102099480A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN102648282A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN102803291A (zh) | 具有增强的产量相关性状和/或增强的非生物胁迫耐受性的植物和制备其的方法 | |
CN102317312A (zh) | 具有增强的产量相关性状和/或非生物胁迫耐受性的植物和用于制备此类植物的方法 | |
CN102257142A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN102300991A (zh) | 具有增强的非生物胁迫耐受性和/或增强的产量相关性状的植物及其制备方法 | |
CN102482333A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN102272309A (zh) | 具有增强的非生物胁迫耐受性和/或增强的产量相关性状的植物及其制备方法 | |
CN103154254A (zh) | 具有增强的产量相关性状的植物和产生该植物的方法 | |
CN103068992A (zh) | 具有增强的产量相关性状的植物和用于制备该植物的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150513 Termination date: 20170610 |
|
CF01 | Termination of patent right due to non-payment of annual fee |