CN102027120A - 具有增强的产量相关性状的植物和用于制备该植物的方法 - Google Patents
具有增强的产量相关性状的植物和用于制备该植物的方法 Download PDFInfo
- Publication number
- CN102027120A CN102027120A CN2008801047845A CN200880104784A CN102027120A CN 102027120 A CN102027120 A CN 102027120A CN 2008801047845 A CN2008801047845 A CN 2008801047845A CN 200880104784 A CN200880104784 A CN 200880104784A CN 102027120 A CN102027120 A CN 102027120A
- Authority
- CN
- China
- Prior art keywords
- plant
- nucleic acid
- polypeptide
- sequence
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 451
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 328
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 301
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 301
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 248
- 229920001184 polypeptide Polymers 0.000 claims abstract description 215
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 215
- 230000014509 gene expression Effects 0.000 claims abstract description 153
- 241000196324 Embryophyta Species 0.000 claims description 830
- 108090000623 proteins and genes Proteins 0.000 claims description 325
- 125000003729 nucleotide group Chemical group 0.000 claims description 302
- 239000002773 nucleotide Substances 0.000 claims description 298
- 230000002596 correlated effect Effects 0.000 claims description 149
- 102000004169 proteins and genes Human genes 0.000 claims description 116
- 238000010010 raising Methods 0.000 claims description 110
- 230000012010 growth Effects 0.000 claims description 99
- 230000008676 import Effects 0.000 claims description 76
- 238000004519 manufacturing process Methods 0.000 claims description 76
- 230000001105 regulatory effect Effects 0.000 claims description 74
- 230000009261 transgenic effect Effects 0.000 claims description 65
- 240000007594 Oryza sativa Species 0.000 claims description 56
- 235000007164 Oryza sativa Nutrition 0.000 claims description 45
- 235000009566 rice Nutrition 0.000 claims description 45
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 42
- 235000013311 vegetables Nutrition 0.000 claims description 41
- 239000002028 Biomass Substances 0.000 claims description 32
- 230000001276 controlling effect Effects 0.000 claims description 26
- 230000015784 hyperosmotic salinity response Effects 0.000 claims description 21
- 240000005979 Hordeum vulgare Species 0.000 claims description 20
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 20
- 244000038559 crop plants Species 0.000 claims description 20
- 235000013339 cereals Nutrition 0.000 claims description 16
- 230000008635 plant growth Effects 0.000 claims description 16
- 241000219194 Arabidopsis Species 0.000 claims description 15
- 244000075850 Avena orientalis Species 0.000 claims description 15
- 235000021307 Triticum Nutrition 0.000 claims description 15
- 240000008042 Zea mays Species 0.000 claims description 15
- 241001233957 eudicotyledons Species 0.000 claims description 15
- 102000004190 Enzymes Human genes 0.000 claims description 14
- 108090000790 Enzymes Proteins 0.000 claims description 14
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 14
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 14
- 235000005822 corn Nutrition 0.000 claims description 14
- 101150104463 GOS2 gene Proteins 0.000 claims description 12
- 244000046109 Sorghum vulgare var. nervosum Species 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 11
- 241000219193 Brassicaceae Species 0.000 claims description 10
- 244000062793 Sorghum vulgare Species 0.000 claims description 10
- 235000019713 millet Nutrition 0.000 claims description 10
- 238000007899 nucleic acid hybridization Methods 0.000 claims description 10
- 241000209510 Liliopsida Species 0.000 claims description 9
- 235000019714 Triticale Nutrition 0.000 claims description 9
- 241000219195 Arabidopsis thaliana Species 0.000 claims description 8
- 108010078791 Carrier Proteins Proteins 0.000 claims description 8
- 108010075202 UDP-glucose 4-epimerase Proteins 0.000 claims description 8
- 102100021436 UDP-glucose 4-epimerase Human genes 0.000 claims description 8
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 claims description 8
- 230000005030 transcription termination Effects 0.000 claims description 8
- 241000228158 x Triticosecale Species 0.000 claims description 8
- 238000012258 culturing Methods 0.000 claims description 7
- 241000209056 Secale Species 0.000 claims description 5
- 241000209140 Triticum Species 0.000 claims description 4
- 240000000359 Triticum dicoccon Species 0.000 claims description 4
- 235000001468 Triticum dicoccon Nutrition 0.000 claims description 4
- 240000000581 Triticum monococcum Species 0.000 claims description 4
- 239000003630 growth substance Substances 0.000 claims description 4
- 108090001066 Racemases and epimerases Proteins 0.000 claims description 2
- 230000001965 increasing effect Effects 0.000 abstract description 22
- 230000002708 enhancing effect Effects 0.000 abstract description 10
- 102400001175 Unique cartilage matrix-associated protein C-terminal fragment Human genes 0.000 description 167
- 210000004027 cell Anatomy 0.000 description 123
- 239000000523 sample Substances 0.000 description 110
- 235000018102 proteins Nutrition 0.000 description 102
- 238000009396 hybridization Methods 0.000 description 66
- 230000035882 stress Effects 0.000 description 52
- 108020004414 DNA Proteins 0.000 description 48
- 238000006243 chemical reaction Methods 0.000 description 47
- 230000000694 effects Effects 0.000 description 46
- 230000002068 genetic effect Effects 0.000 description 46
- 239000003550 marker Substances 0.000 description 41
- 125000003275 alpha amino acid group Chemical group 0.000 description 40
- 210000001519 tissue Anatomy 0.000 description 39
- 238000005516 engineering process Methods 0.000 description 36
- 230000036579 abiotic stress Effects 0.000 description 33
- 230000008859 change Effects 0.000 description 33
- 229940024606 amino acid Drugs 0.000 description 30
- 235000001014 amino acid Nutrition 0.000 description 30
- 150000001413 amino acids Chemical class 0.000 description 30
- 238000013507 mapping Methods 0.000 description 30
- 235000002639 sodium chloride Nutrition 0.000 description 29
- 238000009395 breeding Methods 0.000 description 27
- 230000001488 breeding effect Effects 0.000 description 27
- 238000003306 harvesting Methods 0.000 description 27
- 238000005728 strengthening Methods 0.000 description 27
- 241000894007 species Species 0.000 description 26
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 25
- 230000000692 anti-sense effect Effects 0.000 description 24
- 108020004999 messenger RNA Proteins 0.000 description 24
- 150000003839 salts Chemical class 0.000 description 22
- 210000000056 organ Anatomy 0.000 description 21
- 230000008521 reorganization Effects 0.000 description 21
- 230000001131 transforming effect Effects 0.000 description 21
- 230000036542 oxidative stress Effects 0.000 description 20
- 244000098338 Triticum aestivum Species 0.000 description 18
- 230000006870 function Effects 0.000 description 18
- 230000006872 improvement Effects 0.000 description 18
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 18
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 18
- 230000004071 biological effect Effects 0.000 description 15
- 229940088598 enzyme Drugs 0.000 description 14
- 235000010469 Glycine max Nutrition 0.000 description 13
- 244000068988 Glycine max Species 0.000 description 13
- 239000002253 acid Substances 0.000 description 13
- 230000009467 reduction Effects 0.000 description 13
- 230000002103 transcriptional effect Effects 0.000 description 13
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 12
- 235000007319 Avena orientalis Nutrition 0.000 description 12
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 12
- 230000000875 corresponding effect Effects 0.000 description 12
- 238000013461 design Methods 0.000 description 12
- 230000008723 osmotic stress Effects 0.000 description 12
- 102000040430 polynucleotide Human genes 0.000 description 12
- 108091033319 polynucleotide Proteins 0.000 description 12
- 239000002157 polynucleotide Substances 0.000 description 12
- 241000589158 Agrobacterium Species 0.000 description 11
- -1 Tag100 epi-position Proteins 0.000 description 11
- 230000008641 drought stress Effects 0.000 description 11
- 239000012634 fragment Substances 0.000 description 11
- 230000001939 inductive effect Effects 0.000 description 11
- 230000035764 nutrition Effects 0.000 description 11
- 235000016709 nutrition Nutrition 0.000 description 11
- 239000000047 product Substances 0.000 description 11
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 10
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 10
- 244000061176 Nicotiana tabacum Species 0.000 description 10
- 240000003768 Solanum lycopersicum Species 0.000 description 10
- 230000000295 complement effect Effects 0.000 description 10
- 230000008034 disappearance Effects 0.000 description 10
- 150000002500 ions Chemical class 0.000 description 10
- 238000011160 research Methods 0.000 description 10
- 230000002441 reversible effect Effects 0.000 description 10
- 230000009466 transformation Effects 0.000 description 10
- 108010027344 Basic Helix-Loop-Helix Transcription Factors Proteins 0.000 description 9
- 102000018720 Basic Helix-Loop-Helix Transcription Factors Human genes 0.000 description 9
- 238000002105 Southern blotting Methods 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 9
- 230000027455 binding Effects 0.000 description 9
- 239000003623 enhancer Substances 0.000 description 9
- 230000030279 gene silencing Effects 0.000 description 9
- 231100000350 mutagenesis Toxicity 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 230000010076 replication Effects 0.000 description 9
- 108091092562 ribozyme Proteins 0.000 description 9
- 238000012225 targeting induced local lesions in genomes Methods 0.000 description 9
- 235000007558 Avena sp Nutrition 0.000 description 8
- 102000000849 HMGB Proteins Human genes 0.000 description 8
- 108010001860 HMGB Proteins Proteins 0.000 description 8
- 108700001094 Plant Genes Proteins 0.000 description 8
- 108700008625 Reporter Genes Proteins 0.000 description 8
- 235000002595 Solanum tuberosum Nutrition 0.000 description 8
- 244000061456 Solanum tuberosum Species 0.000 description 8
- 125000000539 amino acid group Chemical group 0.000 description 8
- 150000001720 carbohydrates Chemical class 0.000 description 8
- 235000014633 carbohydrates Nutrition 0.000 description 8
- 239000003795 chemical substances by application Substances 0.000 description 8
- 238000002744 homologous recombination Methods 0.000 description 8
- 230000006801 homologous recombination Effects 0.000 description 8
- 230000000442 meristematic effect Effects 0.000 description 8
- 238000002703 mutagenesis Methods 0.000 description 8
- 230000002018 overexpression Effects 0.000 description 8
- 210000002706 plastid Anatomy 0.000 description 8
- 238000012216 screening Methods 0.000 description 8
- 239000000243 solution Substances 0.000 description 8
- 238000013519 translation Methods 0.000 description 8
- 101000636214 Arabidopsis thaliana Transcription factor MYC2 Proteins 0.000 description 7
- 108090000994 Catalytic RNA Proteins 0.000 description 7
- 102000053642 Catalytic RNA Human genes 0.000 description 7
- 241000208818 Helianthus Species 0.000 description 7
- 241000282414 Homo sapiens Species 0.000 description 7
- 101710089395 Oleosin Proteins 0.000 description 7
- 241000219793 Trifolium Species 0.000 description 7
- HSCJRCZFDFQWRP-ABVWGUQPSA-N UDP-alpha-D-galactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-ABVWGUQPSA-N 0.000 description 7
- HSCJRCZFDFQWRP-UHFFFAOYSA-N Uridindiphosphoglukose Natural products OC1C(O)C(O)C(CO)OC1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-UHFFFAOYSA-N 0.000 description 7
- 150000007513 acids Chemical class 0.000 description 7
- 238000013459 approach Methods 0.000 description 7
- 238000003780 insertion Methods 0.000 description 7
- 230000037431 insertion Effects 0.000 description 7
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Natural products C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 7
- 231100000219 mutagenic Toxicity 0.000 description 7
- 230000003505 mutagenic effect Effects 0.000 description 7
- 229910052757 nitrogen Inorganic materials 0.000 description 7
- 239000003921 oil Substances 0.000 description 7
- 235000019198 oils Nutrition 0.000 description 7
- 239000011780 sodium chloride Substances 0.000 description 7
- 239000002689 soil Substances 0.000 description 7
- 238000011282 treatment Methods 0.000 description 7
- 108700028369 Alleles Proteins 0.000 description 6
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 6
- 235000003222 Helianthus annuus Nutrition 0.000 description 6
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 6
- 108700011259 MicroRNAs Proteins 0.000 description 6
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 6
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 6
- 102000040945 Transcription factor Human genes 0.000 description 6
- 108091023040 Transcription factor Proteins 0.000 description 6
- 241000700605 Viruses Species 0.000 description 6
- 230000004913 activation Effects 0.000 description 6
- 230000003321 amplification Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 231100000045 chemical toxicity Toxicity 0.000 description 6
- 230000007812 deficiency Effects 0.000 description 6
- 230000002349 favourable effect Effects 0.000 description 6
- 230000004927 fusion Effects 0.000 description 6
- 238000012226 gene silencing method Methods 0.000 description 6
- 230000001976 improved effect Effects 0.000 description 6
- 238000002372 labelling Methods 0.000 description 6
- 210000001161 mammalian embryo Anatomy 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 239000002679 microRNA Substances 0.000 description 6
- 238000012544 monitoring process Methods 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- 238000003499 nucleic acid array Methods 0.000 description 6
- 230000000050 nutritive effect Effects 0.000 description 6
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 6
- 238000002741 site-directed mutagenesis Methods 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 5
- 108091035707 Consensus sequence Proteins 0.000 description 5
- 244000127993 Elaeis melanococca Species 0.000 description 5
- 108020004459 Small interfering RNA Proteins 0.000 description 5
- 235000019519 canola oil Nutrition 0.000 description 5
- 239000000828 canola oil Substances 0.000 description 5
- 230000006378 damage Effects 0.000 description 5
- 230000006353 environmental stress Effects 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 230000008014 freezing Effects 0.000 description 5
- 238000007710 freezing Methods 0.000 description 5
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Chemical compound O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 239000002245 particle Substances 0.000 description 5
- 230000001717 pathogenic effect Effects 0.000 description 5
- 230000006798 recombination Effects 0.000 description 5
- 238000005215 recombination Methods 0.000 description 5
- 238000009331 sowing Methods 0.000 description 5
- 235000000346 sugar Nutrition 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 238000005406 washing Methods 0.000 description 5
- 108091026821 Artificial microRNA Proteins 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 4
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 4
- 244000025254 Cannabis sativa Species 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- 235000001950 Elaeis guineensis Nutrition 0.000 description 4
- 241000233866 Fungi Species 0.000 description 4
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 244000299507 Gossypium hirsutum Species 0.000 description 4
- 241000238631 Hexapoda Species 0.000 description 4
- 240000006240 Linum usitatissimum Species 0.000 description 4
- 108091092724 Noncoding DNA Proteins 0.000 description 4
- 238000000636 Northern blotting Methods 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 108700026244 Open Reading Frames Proteins 0.000 description 4
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 4
- 235000007238 Secale cereale Nutrition 0.000 description 4
- 244000082988 Secale cereale Species 0.000 description 4
- CWHJIJJSDGEHNS-MYLFLSLOSA-N Senegenin Chemical compound C1[C@H](O)[C@H](O)[C@@](C)(C(O)=O)[C@@H]2CC[C@@]3(C)C(CC[C@]4(CCC(C[C@H]44)(C)C)C(O)=O)=C4[C@@H](CCl)C[C@@H]3[C@]21C CWHJIJJSDGEHNS-MYLFLSLOSA-N 0.000 description 4
- 241000208292 Solanaceae Species 0.000 description 4
- 229920002472 Starch Polymers 0.000 description 4
- 108091036066 Three prime untranslated region Proteins 0.000 description 4
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- 229960005305 adenosine Drugs 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000011575 calcium Substances 0.000 description 4
- 229910052791 calcium Inorganic materials 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 238000006471 dimerization reaction Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 235000013399 edible fruits Nutrition 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- KWGKDLIKAYFUFQ-UHFFFAOYSA-M lithium chloride Chemical compound [Li+].[Cl-] KWGKDLIKAYFUFQ-UHFFFAOYSA-M 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 244000005700 microbiome Species 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 230000035479 physiological effects, processes and functions Effects 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 230000005855 radiation Effects 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 230000008929 regeneration Effects 0.000 description 4
- 238000011069 regeneration method Methods 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 238000002864 sequence alignment Methods 0.000 description 4
- 230000003584 silencer Effects 0.000 description 4
- 239000004055 small Interfering RNA Substances 0.000 description 4
- 235000019698 starch Nutrition 0.000 description 4
- 239000008107 starch Substances 0.000 description 4
- 239000009871 tenuigenin Substances 0.000 description 4
- 239000005418 vegetable material Substances 0.000 description 4
- 229920001817 Agar Polymers 0.000 description 3
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 3
- ZOXJGFHDIHLPTG-UHFFFAOYSA-N Boron Chemical compound [B] ZOXJGFHDIHLPTG-UHFFFAOYSA-N 0.000 description 3
- 240000002791 Brassica napus Species 0.000 description 3
- 241001237259 Campanella <basidiomycete fungus> Species 0.000 description 3
- 241001070941 Castanea Species 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 108020004635 Complementary DNA Proteins 0.000 description 3
- 229920000742 Cotton Polymers 0.000 description 3
- 244000140063 Eragrostis abyssinica Species 0.000 description 3
- 235000014966 Eragrostis abyssinica Nutrition 0.000 description 3
- 102000053187 Glucuronidase Human genes 0.000 description 3
- 108010060309 Glucuronidase Proteins 0.000 description 3
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 3
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 3
- 235000003228 Lactuca sativa Nutrition 0.000 description 3
- 240000008415 Lactuca sativa Species 0.000 description 3
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 3
- 235000004431 Linum usitatissimum Nutrition 0.000 description 3
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 102000015636 Oligopeptides Human genes 0.000 description 3
- 108010038807 Oligopeptides Proteins 0.000 description 3
- 241000219000 Populus Species 0.000 description 3
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 3
- 240000000111 Saccharum officinarum Species 0.000 description 3
- 235000007201 Saccharum officinarum Nutrition 0.000 description 3
- 240000006394 Sorghum bicolor Species 0.000 description 3
- 101710172711 Structural protein Proteins 0.000 description 3
- 235000002041 Triticum macha Nutrition 0.000 description 3
- 244000102426 Triticum macha Species 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 230000002411 adverse Effects 0.000 description 3
- 239000008272 agar Substances 0.000 description 3
- 230000032683 aging Effects 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 229940088710 antibiotic agent Drugs 0.000 description 3
- 239000003963 antioxidant agent Substances 0.000 description 3
- 230000003078 antioxidant effect Effects 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 108010005774 beta-Galactosidase Proteins 0.000 description 3
- 229910052796 boron Inorganic materials 0.000 description 3
- 229910052793 cadmium Inorganic materials 0.000 description 3
- BDOSMKKIYDKNTQ-UHFFFAOYSA-N cadmium atom Chemical compound [Cd] BDOSMKKIYDKNTQ-UHFFFAOYSA-N 0.000 description 3
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 230000010001 cellular homeostasis Effects 0.000 description 3
- 230000036755 cellular response Effects 0.000 description 3
- 230000005754 cellular signaling Effects 0.000 description 3
- 239000004927 clay Substances 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 239000003925 fat Substances 0.000 description 3
- 238000012239 gene modification Methods 0.000 description 3
- 238000012252 genetic analysis Methods 0.000 description 3
- 230000005017 genetic modification Effects 0.000 description 3
- 235000013617 genetically modified food Nutrition 0.000 description 3
- 230000001771 impaired effect Effects 0.000 description 3
- 238000007901 in situ hybridization Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 229910052742 iron Inorganic materials 0.000 description 3
- 238000003973 irrigation Methods 0.000 description 3
- 230000002262 irrigation Effects 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 239000011777 magnesium Substances 0.000 description 3
- 229910052749 magnesium Inorganic materials 0.000 description 3
- WPBNNNQJVZRUHP-UHFFFAOYSA-L manganese(2+);methyl n-[[2-(methoxycarbonylcarbamothioylamino)phenyl]carbamothioyl]carbamate;n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[S-]C(=S)NCCNC([S-])=S.COC(=O)NC(=S)NC1=CC=CC=C1NC(=S)NC(=O)OC WPBNNNQJVZRUHP-UHFFFAOYSA-L 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 230000004060 metabolic process Effects 0.000 description 3
- 238000002887 multiple sequence alignment Methods 0.000 description 3
- FIKAKWIAUPDISJ-UHFFFAOYSA-L paraquat dichloride Chemical compound [Cl-].[Cl-].C1=C[N+](C)=CC=C1C1=CC=[N+](C)C=C1 FIKAKWIAUPDISJ-UHFFFAOYSA-L 0.000 description 3
- 239000000575 pesticide Substances 0.000 description 3
- 150000003016 phosphoric acids Chemical class 0.000 description 3
- 230000026731 phosphorylation Effects 0.000 description 3
- 238000006366 phosphorylation reaction Methods 0.000 description 3
- 238000003976 plant breeding Methods 0.000 description 3
- 239000011591 potassium Substances 0.000 description 3
- 229910052700 potassium Inorganic materials 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000004850 protein–protein interaction Effects 0.000 description 3
- 238000004153 renaturation Methods 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 230000019491 signal transduction Effects 0.000 description 3
- 230000000638 stimulation Effects 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- 241001075517 Abelmoschus Species 0.000 description 2
- 241000208140 Acer Species 0.000 description 2
- 241000219068 Actinidia Species 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 244000198134 Agave sisalana Species 0.000 description 2
- 235000011624 Agave sisalana Nutrition 0.000 description 2
- 241000209136 Agropyron Species 0.000 description 2
- 241000234282 Allium Species 0.000 description 2
- 102000002572 Alpha-Globulins Human genes 0.000 description 2
- 108010068307 Alpha-Globulins Proteins 0.000 description 2
- 241000219318 Amaranthus Species 0.000 description 2
- 244000296825 Amygdalus nana Species 0.000 description 2
- 244000099147 Ananas comosus Species 0.000 description 2
- 235000007119 Ananas comosus Nutrition 0.000 description 2
- 240000007087 Apium graveolens Species 0.000 description 2
- 244000018217 Artocarpus elasticus Species 0.000 description 2
- 235000010082 Averrhoa carambola Nutrition 0.000 description 2
- 240000006063 Averrhoa carambola Species 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 244000036905 Benincasa cerifera Species 0.000 description 2
- 235000011274 Benincasa cerifera Nutrition 0.000 description 2
- 235000012284 Bertholletia excelsa Nutrition 0.000 description 2
- 241000335053 Beta vulgaris Species 0.000 description 2
- 235000011293 Brassica napus Nutrition 0.000 description 2
- 235000006008 Brassica napus var napus Nutrition 0.000 description 2
- 240000008100 Brassica rapa Species 0.000 description 2
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 2
- 240000008574 Capsicum frutescens Species 0.000 description 2
- 235000009467 Carica papaya Nutrition 0.000 description 2
- 240000006432 Carica papaya Species 0.000 description 2
- 240000004927 Carissa macrocarpa Species 0.000 description 2
- 235000001479 Carissa macrocarpa Nutrition 0.000 description 2
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 2
- 244000020518 Carthamus tinctorius Species 0.000 description 2
- 235000014036 Castanea Nutrition 0.000 description 2
- 244000146553 Ceiba pentandra Species 0.000 description 2
- 235000003301 Ceiba pentandra Nutrition 0.000 description 2
- 108700031407 Chloroplast Genes Proteins 0.000 description 2
- 244000241235 Citrullus lanatus Species 0.000 description 2
- 241000207199 Citrus Species 0.000 description 2
- 241000723377 Coffea Species 0.000 description 2
- 244000205754 Colocasia esculenta Species 0.000 description 2
- 235000006481 Colocasia esculenta Nutrition 0.000 description 2
- 235000002787 Coriandrum sativum Nutrition 0.000 description 2
- 244000018436 Coriandrum sativum Species 0.000 description 2
- 244000024469 Cucumis prophetarum Species 0.000 description 2
- 241000219122 Cucurbita Species 0.000 description 2
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 2
- 240000001008 Dimocarpus longan Species 0.000 description 2
- 244000281702 Dioscorea villosa Species 0.000 description 2
- 241000723267 Diospyros Species 0.000 description 2
- 241000192043 Echinochloa Species 0.000 description 2
- 244000078127 Eleusine coracana Species 0.000 description 2
- 235000009008 Eriobotrya japonica Nutrition 0.000 description 2
- 244000061508 Eriobotrya japonica Species 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- 235000000235 Euphoria longan Nutrition 0.000 description 2
- 240000008620 Fagopyrum esculentum Species 0.000 description 2
- 241001070947 Fagus Species 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 241000220223 Fragaria Species 0.000 description 2
- QGWNDRXFNXRZMB-UUOKFMHZSA-K GDP(3-) Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O QGWNDRXFNXRZMB-UUOKFMHZSA-K 0.000 description 2
- 101150026259 GRP gene Proteins 0.000 description 2
- 235000008100 Ginkgo biloba Nutrition 0.000 description 2
- 244000194101 Ginkgo biloba Species 0.000 description 2
- 108010068370 Glutens Proteins 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 235000002941 Hemerocallis fulva Nutrition 0.000 description 2
- 240000009206 Hemerocallis fulva Species 0.000 description 2
- 244000284380 Hibiscus rosa sinensis Species 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- 241000209219 Hordeum Species 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- 244000017020 Ipomoea batatas Species 0.000 description 2
- 235000002678 Ipomoea batatas Nutrition 0.000 description 2
- MFGOTAHWOBKNNU-XMHGGMMESA-N Isodigeranyl Chemical group CC(C)=CCC\C(C)=C\CC(C)(C=C)CCC=C(C)C MFGOTAHWOBKNNU-XMHGGMMESA-N 0.000 description 2
- MFGOTAHWOBKNNU-FQEVSTJZSA-N Isodigeranyl Natural products CC(=CCCC(=CC[C@](C)(CCC=C(C)C)C=C)C)C MFGOTAHWOBKNNU-FQEVSTJZSA-N 0.000 description 2
- 241000758789 Juglans Species 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- 241000219729 Lathyrus Species 0.000 description 2
- 240000004322 Lens culinaris Species 0.000 description 2
- 235000010666 Lens esculenta Nutrition 0.000 description 2
- 241000219745 Lupinus Species 0.000 description 2
- 241001300479 Macroptilium Species 0.000 description 2
- 241000220225 Malus Species 0.000 description 2
- 235000014826 Mangifera indica Nutrition 0.000 description 2
- 240000007228 Mangifera indica Species 0.000 description 2
- 240000003183 Manihot esculenta Species 0.000 description 2
- 244000061354 Manilkara achras Species 0.000 description 2
- 241000218984 Momordica Species 0.000 description 2
- 240000000249 Morus alba Species 0.000 description 2
- 235000008708 Morus alba Nutrition 0.000 description 2
- 241000234295 Musa Species 0.000 description 2
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 2
- 241000244206 Nematoda Species 0.000 description 2
- 241000208125 Nicotiana Species 0.000 description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 2
- 241000795633 Olea <sea slug> Species 0.000 description 2
- 240000001439 Opuntia Species 0.000 description 2
- 241000209094 Oryza Species 0.000 description 2
- 241001520808 Panicum virgatum Species 0.000 description 2
- 244000288157 Passiflora edulis Species 0.000 description 2
- 240000004370 Pastinaca sativa Species 0.000 description 2
- 241000219833 Phaseolus Species 0.000 description 2
- 241000746983 Phleum pratense Species 0.000 description 2
- 235000014676 Phragmites communis Nutrition 0.000 description 2
- 244000064622 Physalis edulis Species 0.000 description 2
- 235000003447 Pistacia vera Nutrition 0.000 description 2
- 240000006711 Pistacia vera Species 0.000 description 2
- 241000219843 Pisum Species 0.000 description 2
- 241001494501 Prosopis <angiosperm> Species 0.000 description 2
- 241000508269 Psidium Species 0.000 description 2
- 244000294611 Punica granatum Species 0.000 description 2
- 235000014360 Punica granatum Nutrition 0.000 description 2
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 2
- 240000001987 Pyrus communis Species 0.000 description 2
- 235000014443 Pyrus communis Nutrition 0.000 description 2
- 241000219492 Quercus Species 0.000 description 2
- 244000088415 Raphanus sativus Species 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 244000299790 Rheum rhabarbarum Species 0.000 description 2
- 235000009411 Rheum rhabarbarum Nutrition 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 240000000528 Ricinus communis Species 0.000 description 2
- 235000004443 Ricinus communis Nutrition 0.000 description 2
- 241001092459 Rubus Species 0.000 description 2
- 241000209051 Saccharum Species 0.000 description 2
- 241000208829 Sambucus Species 0.000 description 2
- 108091081021 Sense strand Proteins 0.000 description 2
- 229920002684 Sepharose Polymers 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 2
- 244000045719 Syzygium Species 0.000 description 2
- 241000736851 Tagetes Species 0.000 description 2
- 240000004584 Tamarindus indica Species 0.000 description 2
- 235000004298 Tamarindus indica Nutrition 0.000 description 2
- 244000269722 Thea sinensis Species 0.000 description 2
- 244000299461 Theobroma cacao Species 0.000 description 2
- 235000009470 Theobroma cacao Nutrition 0.000 description 2
- 235000009430 Thespesia populnea Nutrition 0.000 description 2
- 108700019146 Transgenes Proteins 0.000 description 2
- 102000008579 Transposases Human genes 0.000 description 2
- 108010020764 Transposases Proteins 0.000 description 2
- 244000082267 Tripsacum dactyloides Species 0.000 description 2
- 235000007218 Tripsacum dactyloides Nutrition 0.000 description 2
- 235000007264 Triticum durum Nutrition 0.000 description 2
- 235000004240 Triticum spelta Nutrition 0.000 description 2
- 241000209143 Triticum turgidum subsp. durum Species 0.000 description 2
- 241001530121 Trollius Species 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- 239000006035 Tryptophane Substances 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 241000219977 Vigna Species 0.000 description 2
- 240000009038 Viola odorata Species 0.000 description 2
- 235000013487 Viola odorata Nutrition 0.000 description 2
- 241000219095 Vitis Species 0.000 description 2
- 241001247821 Ziziphus Species 0.000 description 2
- DZBUGLKDJFMEHC-UHFFFAOYSA-N acridine Chemical compound C1=CC=CC2=CC3=CC=CC=C3N=C21 DZBUGLKDJFMEHC-UHFFFAOYSA-N 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 230000003570 biosynthesizing effect Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 229930182830 galactose Natural products 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 230000009368 gene silencing by RNA Effects 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 230000035784 germination Effects 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- QGWNDRXFNXRZMB-UHFFFAOYSA-N guanidine diphosphate Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O QGWNDRXFNXRZMB-UHFFFAOYSA-N 0.000 description 2
- 230000002363 herbicidal effect Effects 0.000 description 2
- 239000004009 herbicide Substances 0.000 description 2
- 239000000833 heterodimer Substances 0.000 description 2
- 239000000710 homodimer Substances 0.000 description 2
- 238000003898 horticulture Methods 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 230000008595 infiltration Effects 0.000 description 2
- 238000001764 infiltration Methods 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 229950006238 nadide Drugs 0.000 description 2
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 2
- 108010058731 nopaline synthase Proteins 0.000 description 2
- 239000002853 nucleic acid probe Substances 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 230000008117 seed development Effects 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 230000009182 swimming Effects 0.000 description 2
- 229960004799 tryptophan Drugs 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- JLIDBLDQVAYHNE-YKALOCIXSA-N (+)-Abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\[C@@]1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-YKALOCIXSA-N 0.000 description 1
- COEXAQSTZUWMRI-STQMWFEESA-N (2s)-1-[2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound C([C@H](N)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 COEXAQSTZUWMRI-STQMWFEESA-N 0.000 description 1
- VRYALKFFQXWPIH-PBXRRBTRSA-N (3r,4s,5r)-3,4,5,6-tetrahydroxyhexanal Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)CC=O VRYALKFFQXWPIH-PBXRRBTRSA-N 0.000 description 1
- NWXMGUDVXFXRIG-WESIUVDSSA-N (4s,4as,5as,6s,12ar)-4-(dimethylamino)-1,6,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4,4a,5,5a-tetrahydrotetracene-2-carboxamide Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(=O)C(C(N)=O)=C(O)[C@@]4(O)C(=O)C3=C(O)C2=C1O NWXMGUDVXFXRIG-WESIUVDSSA-N 0.000 description 1
- 108020004463 18S ribosomal RNA Proteins 0.000 description 1
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical compound O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 1
- HVCOBJNICQPDBP-UHFFFAOYSA-N 3-[3-[3,5-dihydroxy-6-methyl-4-(3,4,5-trihydroxy-6-methyloxan-2-yl)oxyoxan-2-yl]oxydecanoyloxy]decanoic acid;hydrate Chemical class O.OC1C(OC(CC(=O)OC(CCCCCCC)CC(O)=O)CCCCCCC)OC(C)C(O)C1OC1C(O)C(O)C(O)C(C)O1 HVCOBJNICQPDBP-UHFFFAOYSA-N 0.000 description 1
- OPIFSICVWOWJMJ-AEOCFKNESA-N 5-bromo-4-chloro-3-indolyl beta-D-galactoside Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1OC1=CNC2=CC=C(Br)C(Cl)=C12 OPIFSICVWOWJMJ-AEOCFKNESA-N 0.000 description 1
- WFPZSXYXPSUOPY-ROYWQJLOSA-N ADP alpha-D-glucoside Chemical compound C([C@H]1O[C@H]([C@@H]([C@@H]1O)O)N1C=2N=CN=C(C=2N=C1)N)OP(O)(=O)OP(O)(=O)O[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O WFPZSXYXPSUOPY-ROYWQJLOSA-N 0.000 description 1
- WFPZSXYXPSUOPY-UHFFFAOYSA-N ADP-mannose Natural products C1=NC=2C(N)=NC=NC=2N1C(C(C1O)O)OC1COP(O)(=O)OP(O)(=O)OC1OC(CO)C(O)C(O)C1O WFPZSXYXPSUOPY-UHFFFAOYSA-N 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- XTWYTFMLZFPYCI-UHFFFAOYSA-N Adenosine diphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O XTWYTFMLZFPYCI-UHFFFAOYSA-N 0.000 description 1
- 241000743339 Agrostis Species 0.000 description 1
- 240000007241 Agrostis stolonifera Species 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- 102100036475 Alanine aminotransferase 1 Human genes 0.000 description 1
- 108010082126 Alanine transaminase Proteins 0.000 description 1
- 101710153593 Albumin A Proteins 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 241001677738 Aleuron Species 0.000 description 1
- 241000380131 Ammophila arenaria Species 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 235000003840 Amygdalus nana Nutrition 0.000 description 1
- 235000007755 Annona Nutrition 0.000 description 1
- 235000011518 Annona purpurea Nutrition 0.000 description 1
- 240000006199 Annona purpurea Species 0.000 description 1
- 101710117679 Anthocyanidin 3-O-glucosyltransferase Proteins 0.000 description 1
- 235000002764 Apium graveolens Nutrition 0.000 description 1
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 description 1
- 241001605719 Appias drusilla Species 0.000 description 1
- 235000010591 Appio Nutrition 0.000 description 1
- 108010037365 Arabidopsis Proteins Proteins 0.000 description 1
- 108700004966 Arabidopsis STO Proteins 0.000 description 1
- 101000903721 Arabidopsis thaliana B-box zinc finger protein 24 Proteins 0.000 description 1
- 101100459259 Arabidopsis thaliana MYC2 gene Proteins 0.000 description 1
- 101100478627 Arabidopsis thaliana S-ACP-DES2 gene Proteins 0.000 description 1
- 235000003911 Arachis Nutrition 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- 241000239290 Araneae Species 0.000 description 1
- 241001167018 Aroa Species 0.000 description 1
- 108090000328 Arrestin Proteins 0.000 description 1
- 102000003916 Arrestin Human genes 0.000 description 1
- 235000005340 Asparagus officinalis Nutrition 0.000 description 1
- 206010003694 Atrophy Diseases 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 235000005781 Avena Nutrition 0.000 description 1
- 235000009393 Avena byzantina Nutrition 0.000 description 1
- 235000007320 Avena fatua Nutrition 0.000 description 1
- 241000209764 Avena fatua Species 0.000 description 1
- 235000018410 Avena fatua var sativa Nutrition 0.000 description 1
- 240000000372 Avena hybrida Species 0.000 description 1
- 235000009123 Avena hybrida Nutrition 0.000 description 1
- 235000016068 Berberis vulgaris Nutrition 0.000 description 1
- 241000219164 Bertholletia Species 0.000 description 1
- 244000205479 Bertholletia excelsa Species 0.000 description 1
- 235000021533 Beta vulgaris Nutrition 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 235000004480 Bombax malabaricum Nutrition 0.000 description 1
- 235000011331 Brassica Nutrition 0.000 description 1
- 241000219198 Brassica Species 0.000 description 1
- 235000005637 Brassica campestris Nutrition 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 240000000385 Brassica napus var. napus Species 0.000 description 1
- 235000011292 Brassica rapa Nutrition 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 235000004936 Bromus mango Nutrition 0.000 description 1
- 235000008635 Cadaba farinosa Nutrition 0.000 description 1
- 241000628166 Cadaba farinosa Species 0.000 description 1
- 101100126625 Caenorhabditis elegans itr-1 gene Proteins 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 244000292211 Canna coccinea Species 0.000 description 1
- 235000005273 Canna coccinea Nutrition 0.000 description 1
- 241000684239 Canna x generalis Species 0.000 description 1
- 235000008697 Cannabis sativa Nutrition 0.000 description 1
- 235000012766 Cannabis sativa ssp. sativa var. sativa Nutrition 0.000 description 1
- 235000012765 Cannabis sativa ssp. sativa var. spontanea Nutrition 0.000 description 1
- 235000002566 Capsicum Nutrition 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241000973255 Carex elata Species 0.000 description 1
- 241000723418 Carya Species 0.000 description 1
- 241000701489 Cauliflower mosaic virus Species 0.000 description 1
- 108010001857 Cell Surface Receptors Proteins 0.000 description 1
- 241001148660 Cenchrus sp. Species 0.000 description 1
- 108091092236 Chimeric RNA Proteins 0.000 description 1
- 240000006740 Cichorium endivia Species 0.000 description 1
- 235000018536 Cichorium endivia Nutrition 0.000 description 1
- 241000723347 Cinnamomum Species 0.000 description 1
- 235000009831 Citrullus lanatus Nutrition 0.000 description 1
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 description 1
- 244000175448 Citrus madurensis Species 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- 241000737241 Cocos Species 0.000 description 1
- 244000060011 Cocos nucifera Species 0.000 description 1
- 108091033380 Coding strand Proteins 0.000 description 1
- 241000020428 Colea Species 0.000 description 1
- 108020004394 Complementary RNA Proteins 0.000 description 1
- 235000010203 Corchorus Nutrition 0.000 description 1
- 241000332384 Corchorus Species 0.000 description 1
- 235000007706 Corchorus sp Nutrition 0.000 description 1
- 241000723382 Corylus Species 0.000 description 1
- 235000014493 Crataegus Nutrition 0.000 description 1
- 241001092040 Crataegus Species 0.000 description 1
- 240000000171 Crataegus monogyna Species 0.000 description 1
- 235000015655 Crocus sativus Nutrition 0.000 description 1
- 244000124209 Crocus sativus Species 0.000 description 1
- 235000010071 Cucumis prophetarum Nutrition 0.000 description 1
- 244000304337 Cuminum cyminum Species 0.000 description 1
- 102000001493 Cyclophilins Human genes 0.000 description 1
- 108010068682 Cyclophilins Proteins 0.000 description 1
- 235000003198 Cynara Nutrition 0.000 description 1
- 241000208947 Cynara Species 0.000 description 1
- 244000019459 Cynara cardunculus Species 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 1
- 241000522190 Desmodium Species 0.000 description 1
- 102000040623 Dicer family Human genes 0.000 description 1
- 108091070648 Dicer family Proteins 0.000 description 1
- 241001163054 Dichelachne Species 0.000 description 1
- 108010006731 Dimethylallyltranstransferase Proteins 0.000 description 1
- 102000005454 Dimethylallyltranstransferase Human genes 0.000 description 1
- 235000000525 Dimocarpus longan Nutrition 0.000 description 1
- 235000005903 Dioscorea Nutrition 0.000 description 1
- 235000000504 Dioscorea villosa Nutrition 0.000 description 1
- 235000011511 Diospyros Nutrition 0.000 description 1
- 241000512897 Elaeis Species 0.000 description 1
- 235000001942 Elaeis Nutrition 0.000 description 1
- 235000018060 Elaeis melanococca Nutrition 0.000 description 1
- 235000007349 Eleusine coracana Nutrition 0.000 description 1
- 235000013499 Eleusine coracana subsp coracana Nutrition 0.000 description 1
- 101100491986 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) aromA gene Proteins 0.000 description 1
- 101000933461 Escherichia coli (strain K12) Beta-glucuronidase Proteins 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 244000004281 Eucalyptus maculata Species 0.000 description 1
- 244000080545 Eucalyptus sp Species 0.000 description 1
- 235000006914 Eucalyptus sp Nutrition 0.000 description 1
- 235000013420 Eugenia uniflora Nutrition 0.000 description 1
- 240000003813 Eugenia uniflora Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 235000009419 Fagopyrum esculentum Nutrition 0.000 description 1
- 241000234643 Festuca arundinacea Species 0.000 description 1
- 235000008730 Ficus carica Nutrition 0.000 description 1
- 244000025361 Ficus carica Species 0.000 description 1
- 241001412224 Firmiana Species 0.000 description 1
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 1
- 235000017317 Fortunella Nutrition 0.000 description 1
- 101150038242 GAL10 gene Proteins 0.000 description 1
- 102100024637 Galectin-10 Human genes 0.000 description 1
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 1
- 229930182566 Gentamicin Natural products 0.000 description 1
- 235000011201 Ginkgo Nutrition 0.000 description 1
- TWHDOEYLXXQYOZ-FXQIFTODSA-N Gln-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N TWHDOEYLXXQYOZ-FXQIFTODSA-N 0.000 description 1
- SDSMVVSHLAAOJL-UKJIMTQDSA-N Gln-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N SDSMVVSHLAAOJL-UKJIMTQDSA-N 0.000 description 1
- PBFGQTGPSKWHJA-QEJZJMRPSA-N Glu-Asp-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O PBFGQTGPSKWHJA-QEJZJMRPSA-N 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 102000051366 Glycosyltransferases Human genes 0.000 description 1
- 108700023372 Glycosyltransferases Proteins 0.000 description 1
- 239000005562 Glyphosate Substances 0.000 description 1
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- 235000009438 Gossypium Nutrition 0.000 description 1
- 235000009429 Gossypium barbadense Nutrition 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 101150105462 HIS6 gene Proteins 0.000 description 1
- 108090001102 Hammerhead ribozyme Proteins 0.000 description 1
- 244000020551 Helianthus annuus Species 0.000 description 1
- 235000005206 Hibiscus Nutrition 0.000 description 1
- 235000007185 Hibiscus lunariifolius Nutrition 0.000 description 1
- RNAYRCNHRYEBTH-IHRRRGAJSA-N His-Met-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RNAYRCNHRYEBTH-IHRRRGAJSA-N 0.000 description 1
- 101001130308 Homo sapiens Ras-related protein Rab-21 Proteins 0.000 description 1
- 101000836261 Homo sapiens U4/U6.U5 tri-snRNP-associated protein 2 Proteins 0.000 description 1
- 101150053510 ITR1 gene Proteins 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- 102100027050 Inorganic pyrophosphatase Human genes 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 235000013757 Juglans Nutrition 0.000 description 1
- 101100288095 Klebsiella pneumoniae neo gene Proteins 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 101710094902 Legumin Proteins 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 1
- 235000018780 Luffa acutangula Nutrition 0.000 description 1
- 244000280244 Luffa acutangula Species 0.000 description 1
- 241000605547 Luzula sylvatica Species 0.000 description 1
- 241000227653 Lycopersicon Species 0.000 description 1
- 235000002262 Lycopersicon Nutrition 0.000 description 1
- 244000276497 Lycopersicon esculentum Species 0.000 description 1
- 241000219816 Macrotyloma Species 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- 235000014791 Malpighia coccigera Nutrition 0.000 description 1
- 244000007729 Malpighia coccigera Species 0.000 description 1
- 240000003394 Malpighia glabra Species 0.000 description 1
- 235000014837 Malpighia glabra Nutrition 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- 235000000889 Mammea americana Nutrition 0.000 description 1
- 240000005984 Mammea americana Species 0.000 description 1
- 235000011339 Manilkara zapota Nutrition 0.000 description 1
- 235000000088 Maracuja Nutrition 0.000 description 1
- 240000004658 Medicago sativa Species 0.000 description 1
- 235000010624 Medicago sativa Nutrition 0.000 description 1
- 241000213996 Melilotus Species 0.000 description 1
- 244000050427 Melilotus officinalis subsp suaveolens Species 0.000 description 1
- 241001072983 Mentha Species 0.000 description 1
- 241000878006 Miscanthus sinensis Species 0.000 description 1
- 235000009815 Momordica Nutrition 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- BAWFJGJZGIEFAR-NNYOXOHSSA-N NAD zwitterion Chemical compound NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 BAWFJGJZGIEFAR-NNYOXOHSSA-N 0.000 description 1
- BAWFJGJZGIEFAR-NNYOXOHSSA-O NAD(+) Chemical compound NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 BAWFJGJZGIEFAR-NNYOXOHSSA-O 0.000 description 1
- 241001230286 Narenga Species 0.000 description 1
- 240000002853 Nelumbo nucifera Species 0.000 description 1
- 244000183278 Nephelium litchi Species 0.000 description 1
- 235000015742 Nephelium litchi Nutrition 0.000 description 1
- 101100329389 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cre-1 gene Proteins 0.000 description 1
- 101100395023 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) his-7 gene Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 240000001516 Oryza latifolia Species 0.000 description 1
- 108700023764 Oryza sativa OSH1 Proteins 0.000 description 1
- 108700025855 Oryza sativa oleosin Proteins 0.000 description 1
- 101100058316 Oryza sativa subsp. japonica BHLH6 gene Proteins 0.000 description 1
- 101100235056 Oryza sativa subsp. japonica LEA14 gene Proteins 0.000 description 1
- 101710160107 Outer membrane protein A Proteins 0.000 description 1
- 108090000417 Oxygenases Proteins 0.000 description 1
- 102000004020 Oxygenases Human genes 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 240000008114 Panicum miliaceum Species 0.000 description 1
- 235000007199 Panicum miliaceum Nutrition 0.000 description 1
- 235000000370 Passiflora edulis Nutrition 0.000 description 1
- 235000002769 Pastinaca sativa Nutrition 0.000 description 1
- 241000209046 Pennisetum Species 0.000 description 1
- 241000218196 Persea Species 0.000 description 1
- 240000009164 Petroselinum crispum Species 0.000 description 1
- 235000002770 Petroselinum crispum Nutrition 0.000 description 1
- 244000062780 Petroselinum sativum Species 0.000 description 1
- 241000745991 Phalaris Species 0.000 description 1
- 244000081757 Phalaris arundinacea Species 0.000 description 1
- RVRRHFPCEOVRKQ-KKUMJFAQSA-N Phe-His-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVRRHFPCEOVRKQ-KKUMJFAQSA-N 0.000 description 1
- 241000233805 Phoenix Species 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- 244000273256 Phragmites communis Species 0.000 description 1
- 241000195888 Physcomitrella Species 0.000 description 1
- 241000218602 Pinus <genus> Species 0.000 description 1
- 244000292693 Poa annua Species 0.000 description 1
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 1
- 101710083689 Probable capsid protein Proteins 0.000 description 1
- 235000011432 Prunus Nutrition 0.000 description 1
- 102000020146 Rab21 Human genes 0.000 description 1
- 235000019057 Raphanus caudatus Nutrition 0.000 description 1
- 235000011380 Raphanus sativus Nutrition 0.000 description 1
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108700005075 Regulator Genes Proteins 0.000 description 1
- 235000011483 Ribes Nutrition 0.000 description 1
- 241000220483 Ribes Species 0.000 description 1
- 244000281247 Ribes rubrum Species 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 102000004389 Ribonucleoproteins Human genes 0.000 description 1
- 108010081734 Ribonucleoproteins Proteins 0.000 description 1
- 102000002278 Ribosomal Proteins Human genes 0.000 description 1
- 108010000605 Ribosomal Proteins Proteins 0.000 description 1
- 101150038966 SAD2 gene Proteins 0.000 description 1
- 241000124033 Salix Species 0.000 description 1
- 241000921305 Salix sp. Species 0.000 description 1
- 101000994877 Schizosaccharomyces pombe (strain 972 / ATCC 24843) Putative inorganic pyrophosphatase C3A12.02 Proteins 0.000 description 1
- 241000228160 Secale cereale x Triticum aestivum Species 0.000 description 1
- 241000125165 Selinum Species 0.000 description 1
- 235000009367 Sesamum alatum Nutrition 0.000 description 1
- 240000000452 Sesamum alatum Species 0.000 description 1
- 235000003434 Sesamum indicum Nutrition 0.000 description 1
- 241000220261 Sinapis Species 0.000 description 1
- 241000543826 Sinobambusa Species 0.000 description 1
- 235000002634 Solanum Nutrition 0.000 description 1
- 241000207763 Solanum Species 0.000 description 1
- 244000244100 Solanum integrifolium Species 0.000 description 1
- 235000000099 Solanum integrifolium Nutrition 0.000 description 1
- 235000002597 Solanum melongena Nutrition 0.000 description 1
- 244000061458 Solanum melongena Species 0.000 description 1
- 235000006745 Sonchus oleraceus Nutrition 0.000 description 1
- 244000113428 Sonchus oleraceus Species 0.000 description 1
- 235000007230 Sorghum bicolor Nutrition 0.000 description 1
- 241000219315 Spinacia Species 0.000 description 1
- 244000300264 Spinacia oleracea Species 0.000 description 1
- 235000009184 Spondias indica Nutrition 0.000 description 1
- 235000012096 Syzygium samarangense Nutrition 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 235000012308 Tagetes Nutrition 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 108700007696 Tetrahydrofolate Dehydrogenase Proteins 0.000 description 1
- 235000006468 Thea sinensis Nutrition 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 244000237996 Thuarea involuta Species 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 101000983538 Triticum aestivum Casparian strip membrane protein 1 Proteins 0.000 description 1
- 235000007247 Triticum turgidum Nutrition 0.000 description 1
- 240000002805 Triticum turgidum Species 0.000 description 1
- 235000004424 Tropaeolum majus Nutrition 0.000 description 1
- 240000001260 Tropaeolum majus Species 0.000 description 1
- 235000018946 Tropaeolum minus Nutrition 0.000 description 1
- 240000008573 Tropaeolum minus Species 0.000 description 1
- CRHFOYCJGVJPLE-AVGNSLFASA-N Tyr-Gln-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CRHFOYCJGVJPLE-AVGNSLFASA-N 0.000 description 1
- 102100027243 U4/U6.U5 tri-snRNP-associated protein 2 Human genes 0.000 description 1
- HSCJRCZFDFQWRP-JZMIEXBBSA-N UDP-alpha-D-glucose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-JZMIEXBBSA-N 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 235000013419 Uniola paniculata Nutrition 0.000 description 1
- 241000736767 Vaccinium Species 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- 241000219873 Vicia Species 0.000 description 1
- 244000105017 Vicia sativa Species 0.000 description 1
- 241000405217 Viola <butterfly> Species 0.000 description 1
- 241001464837 Viridiplantae Species 0.000 description 1
- 235000018936 Vitellaria paradoxa Nutrition 0.000 description 1
- 235000009392 Vitis Nutrition 0.000 description 1
- 241000307523 Xenostegia media Species 0.000 description 1
- 108700040099 Xylose isomerases Proteins 0.000 description 1
- 241000209149 Zea Species 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 229920002494 Zein Polymers 0.000 description 1
- 241001478412 Zizania palustris Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 244000193174 agave Species 0.000 description 1
- 101150099105 alien gene Proteins 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- PMMURAAUARKVCB-UHFFFAOYSA-N alpha-D-ara-dHexp Natural products OCC1OC(O)CC(O)C1O PMMURAAUARKVCB-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-PQMKYFCFSA-N alpha-D-mannose Chemical compound OC[C@H]1O[C@H](O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-PQMKYFCFSA-N 0.000 description 1
- SRBFZHDQGSBBOR-LECHCGJUSA-N alpha-D-xylose Chemical compound O[C@@H]1CO[C@H](O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-LECHCGJUSA-N 0.000 description 1
- 125000000266 alpha-aminoacyl group Chemical group 0.000 description 1
- VREFGVBLTWBCJP-UHFFFAOYSA-N alprazolam Chemical compound C12=CC(Cl)=CC=C2N2C(C)=NN=C2CN=C1C1=CC=CC=C1 VREFGVBLTWBCJP-UHFFFAOYSA-N 0.000 description 1
- KLOHDWPABZXLGI-YWUHCJSESA-M ampicillin sodium Chemical compound [Na+].C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C([O-])=O)(C)C)=CC=CC=C1 KLOHDWPABZXLGI-YWUHCJSESA-M 0.000 description 1
- 235000019728 animal nutrition Nutrition 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 229940041181 antineoplastic drug Drugs 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 239000001387 apium graveolens Substances 0.000 description 1
- 238000009305 arable farming Methods 0.000 description 1
- 101150037081 aroA gene Proteins 0.000 description 1
- 230000037444 atrophy Effects 0.000 description 1
- 238000000211 autoradiogram Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 239000002551 biofuel Substances 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- 229930189065 blasticidin Natural products 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 235000009120 camo Nutrition 0.000 description 1
- 239000001390 capsicum minimum Substances 0.000 description 1
- 230000023852 carbohydrate metabolic process Effects 0.000 description 1
- 235000021256 carbohydrate metabolism Nutrition 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000036978 cell physiology Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 235000005607 chanvre indien Nutrition 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000001407 cinnamomum spp. Substances 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 239000012297 crystallization seed Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000008260 defense mechanism Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000010217 densitometric analysis Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 235000019621 digestibility Nutrition 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 235000004879 dioscorea Nutrition 0.000 description 1
- NEKNNCABDXGBEN-UHFFFAOYSA-L disodium;4-(4-chloro-2-methylphenoxy)butanoate;4-(2,4-dichlorophenoxy)butanoate Chemical compound [Na+].[Na+].CC1=CC(Cl)=CC=C1OCCCC([O-])=O.[O-]C(=O)CCCOC1=CC=C(Cl)C=C1Cl NEKNNCABDXGBEN-UHFFFAOYSA-L 0.000 description 1
- 238000005553 drilling Methods 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 235000008995 european elder Nutrition 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 235000004426 flaxseed Nutrition 0.000 description 1
- 235000013312 flour Nutrition 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- 101150016518 for gene Proteins 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000000799 fusogenic effect Effects 0.000 description 1
- 244000037671 genetically modified crops Species 0.000 description 1
- 229960002518 gentamicin Drugs 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 101150091511 glb-1 gene Proteins 0.000 description 1
- 229930182478 glucoside Chemical class 0.000 description 1
- 150000008131 glucosides Chemical class 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- 235000021312 gluten Nutrition 0.000 description 1
- 125000003147 glycosyl group Chemical group 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 1
- 229940097068 glyphosate Drugs 0.000 description 1
- 230000009643 growth defect Effects 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 239000011487 hemp Substances 0.000 description 1
- 150000002402 hexoses Chemical class 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- YQYJSBFKSSDGFO-FWAVGLHBSA-N hygromycin A Chemical compound O[C@H]1[C@H](O)[C@H](C(=O)C)O[C@@H]1Oc1ccc(\C=C(/C)C(=O)N[C@@H]2[C@@H]([C@H]3OCO[C@H]3[C@@H](O)[C@@H]2O)O)cc1O YQYJSBFKSSDGFO-FWAVGLHBSA-N 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 239000013067 intermediate product Substances 0.000 description 1
- 229940065638 intron a Drugs 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 230000006122 isoprenylation Effects 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 235000005739 manihot Nutrition 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 235000013622 meat product Nutrition 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 102000006240 membrane receptors Human genes 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- VYQNWZOUAUKGHI-UHFFFAOYSA-N monobenzone Chemical compound C1=CC(O)=CC=C1OCC1=CC=CC=C1 VYQNWZOUAUKGHI-UHFFFAOYSA-N 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 235000006286 nutrient intake Nutrition 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 229940049547 paraxin Drugs 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 235000011197 perejil Nutrition 0.000 description 1
- 238000000206 photolithography Methods 0.000 description 1
- 239000001739 pinus spp. Substances 0.000 description 1
- 230000001863 plant nutrition Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 235000014774 prunus Nutrition 0.000 description 1
- 238000000197 pyrolysis Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 101710139639 rRNA methyltransferase Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000452 restraining effect Effects 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 210000000614 rib Anatomy 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 210000004708 ribosome subunit Anatomy 0.000 description 1
- 230000021749 root development Effects 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- QTENRWWVYAAPBI-YCRXJPFRSA-N streptomycin sulfate Chemical compound OS(O)(=O)=O.OS(O)(=O)=O.OS(O)(=O)=O.CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](N=C(N)N)[C@H](O)[C@@H](N=C(N)N)[C@H](O)[C@H]1O.CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](N=C(N)N)[C@H](O)[C@@H](N=C(N)N)[C@H](O)[C@H]1O QTENRWWVYAAPBI-YCRXJPFRSA-N 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000019635 sulfation Effects 0.000 description 1
- 238000005670 sulfation reaction Methods 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- UMGDCJDMYOKAJW-UHFFFAOYSA-N thiourea Chemical compound NC(N)=S UMGDCJDMYOKAJW-UHFFFAOYSA-N 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 229910000406 trisodium phosphate Inorganic materials 0.000 description 1
- 235000019801 trisodium phosphate Nutrition 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 235000018322 upland cotton Nutrition 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
- 229960003487 xylose Drugs 0.000 description 1
- 238000001086 yeast two-hybrid system Methods 0.000 description 1
- 229910052727 yttrium Inorganic materials 0.000 description 1
- 239000005019 zein Substances 0.000 description 1
- 229940093612 zein Drugs 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Abstract
本发明一般涉及分子生物学领域并且涉及增强多种经济上重要的植物中的产量相关性状的方法。更具体地,本发明涉及通过在植物中调节编码产量增加多肽的核酸的表达来在植物中增强产量相关性状的方法。本发明还涉及具有核酸调节的表达的植物,所述核酸编码产量增加多肽,所述植物相对于对照植物具有增强的产量相关性状。
Description
本发明总体上涉及分子生物学领域并且涉及通过调节核酸在植物中的表达增强多种植物产量相关性状的方法,所述核酸编码选自下述的产量增加多肽:
-bHLH6样(碱性螺旋-环-螺旋6样)蛋白质;
-GRP(生长调节蛋白质),其中所述GRP选自:
-RrmJ/FtsJ核糖体RNA甲基转移酶多肽(RrmJ/FtsJ多肽)
-碱性-螺旋-环-螺旋4(bHLH4)多肽
-异戊烯基转移酶(IPT)多肽
-STO(盐耐受性,Salt Tolerance)蛋白质
-UGE(UDP-葡萄糖4-差向异构酶(UDP-Glucose 4-Epimerase)或UDP-Gal 4-差向异构酶(UDP-Gal 4-Epimerase))多肽。
本发明还涉及具有调节的核酸表达的植物,所述核酸编码产量增加多肽,所述植物相对于对应的野生型植物或其他对照植物而言具有增强的产量相关。本发明还提供了用于本发明方法中的构建体。
持续增长的世界人口和农业用可耕地供应萎缩刺激了有关提高农业效率的研究。常规的作物及园艺学改良手段利用选择育种技术以鉴定具有受欢迎特征的植物。但是,此类选择育种技术具有几个缺陷,即这些技术一般耗费很多劳动并且产生这样的植物,其经常含有异源的遗传组分,其可能不总是导致从亲代植物中传递的受欢迎性状。分子生物学进展已经允许人类改良动物及植物的种质。植物的遗传工程使得可以分离和操作遗传物质(一般处于DNA或RNA形式)并且随后导入该遗传物质至植物中。此类技术具有产生具备多种经济学、农学或园艺学改良性状的作物或植物的能力。
具有特殊经济意义的性状是提高的产量。产量通常定义为来自作物的经济价值的可测量结果。该结果可以就数量和/或品质方面进行定义。产量直接取决于几个因素,例如器官的数目和大小、植物构造(例如枝的数目)、种子产生、叶衰老等。根发育、养分摄入量、胁迫耐受性和早期萌发势(earlyvigor)也可以是决定产量的重要因素。优化前述因素因而可以对提高作物产量有贡献。
种子产量是特别重要的性状,因为许多植物的种子对人与动物营养是重要的。作物如玉米、稻、小麦、卡诺拉油菜和大豆占超过一半的人类总热量摄入,无论通过直接消费种子本身或通过消费基于加工的种子而产生的肉产品。作物也是糖、油及工业加工中所用许多类型代谢物的来源。种子含有胚(新枝条和新根的起源)和胚乳(萌发期间及籽苗早期生长期间用于胚生长的营养来源)。种子发育涉及多种基因并且需要代谢物从根、叶和茎转移至正在生长的种子中。胚乳尤其同化糖类、油和蛋白质的代谢前体并且将它们合成为贮藏大分子以灌满籽粒。
另一感兴趣的性状是植物的开花时间。植物的生存期可以被按阶段被分为例如萌发、营养生长、繁殖生长和变老。开花时间是在播种和繁殖生长开始之间经过的时间。其是植物生命中的关键时期,决定了营养生长向繁殖生长的转变,在一些植物中这与变老的起始同时。在许多植物中,这是其中枝条顶端分生组织停止产生叶并且开始产生花的时间点,这对于形态具有重要作用,影响例如植物形成的器官的数量以及整体大小和形状。开花时间还影响植物中的其他产量相关性状。通常早期开花品种显示较少的分支或分蘖,因此较少的丛状分支。此类性状对于农民而言是有利的,例如简化了作物的管理。另一方面,延迟的开花可能导致植物具有更多的营养器官,例如更多的叶,这在许多作物中是希望的性状,特别是在其中收获营养器官的作物中,例如莴苣中。植物的营养和繁殖阶段的相对持续时间直接影响了其种子产量。在一些植物中,开花时间的控制为用于避免胁迫例如干旱的不利影响的机制。开花时间还可以影响作物的质量性状,例如饲料作物中的草(herbage)的质量,其中开花延迟可以导致更高的可消化性。开花时间影响培养季节的长度。作物开花时间的改变可以导致扩展培养的地理区域的可能性并且因此增加培养的栽培面积。还可以导致植物更加适应给定环境中的农业,例如早期开花可以允许在作物的建立可能被低温不利影响的区域中晚种植,或者可能允许早收获以避免季节末尾的生物和非生物压力,因此产生了作物产量的增加。因此控制开花时间的能力是农业领域中许多工业应用的重要因素。
对于许多作物的另一个重要性状是早期萌发势。改进早期萌发势是现代稻育种计划在温带和热带稻品种上的重要目标。长根在水栽稻中对于正确土壤固定是重要的。在稻直接播种至被淹没田地的情况下,以及在植物必须从水中迅速出苗的情况下,较长的枝条与萌发势相关。在实施条播(drill-seeding)的情况下,较长的中胚轴和胚芽鞘对于良好出幼苗是重要的。将早期萌发势人工改造到植物内的能力将在农业中是极其重要的。例如,不良的早期萌发势已经限制了基于玉米带种质(Corn Belt germplasm)在欧洲大西洋地区引种玉米(Zea mayes L.)杂种。
又一个重要性状是改进的非生物胁迫耐受性。非生物胁迫是世界范围作物损失的主要原因,对于大多数主要作物植物而言降低平均产量超过50%(Wang等、Planta(2003)218:1-14)。非生物胁迫可以由干旱、盐度、极端温度、化学毒性、来自59348:营养物(常量元素和微量元素)的过量或缺乏、辐射和氧化胁迫引起。提高植物对非生物胁迫耐受性的能力将在世界范围对农民而言是巨大经济优势并且会允许在不利条件期间及在作物栽培否则是不可能的陆地上栽培作物。
作物产量因而可以通过优化前述因素之一而提高。
取决于最终用途,对某些产量性状的改良可能优先于其它产量性状。例如对于应用如饲料或木材生产或生物燃料资源而言,增加植物营养体部分可能是希望的,而对于应用如面粉、淀粉或油生产而言,种子参数的提高可能是特别希望的。即便在种子参数当中,某些参数可以更优先于其它参数,这取决于应用。多种机制可以对提高种子产量有贡献,无论形式为增加的种子大小或是提高的种子数目。
提高植物中产量(种子产量和/或生物量)的一种方法可以是通过调节植物的内在生长机制如细胞周期或参与植物生长或参与防御机制的多种信号传导途径。
现在发现可以通过调节核酸在植物中的表达来在植物中增强多种产量相关性状,所述核酸编码选自下述的产量增加多肽:
-bHLH6样(碱性-螺旋-环-螺旋6样)蛋白质;
-GRP(生长调节蛋白质),其中所述GRP选自:
-RrmJ/FtsJ核糖体RNA甲基转移酶多肽(RrmJ/FtsJ多肽)
-碱性-螺旋-环-螺旋4(bHLH4)多肽
-异戊烯基转移酶(IPT)多肽
-STO(盐耐受性,Salt Tolerance)蛋白质
-UGE(UDP-葡萄糖4-差向异构酶或UDP-Gal 4-差向异构酶)多肽。
背景
bHLH6样(碱性螺旋-环-螺旋6样)蛋白质
转录因子通常定义为显示序列特异性DNA结合作用并且能够激活和/或阻遏转录的蛋白质。碱性螺旋-环-螺旋转录因子家族是最大的转录因子家族之一,已经在拟南芥(Arabidopsis thaliana)中表征(Toledo-Ortiz等人,Plant Cell 15,1749-1770,2003;Bailey等人,Plant Cell 15,2497-2501,2003)和已经在稻中表征(Li等Plant Physiol.141,1167-1184,2006)。bHLH转录因子家族的区别性特征是存在由大约60个氨基酸构成的二分(bipartite)结构域。这种二分结构域由与共有的六核苷酸E框相结合的DNA结合碱性区域和在该碱性结构域羧基末端存在的两个α-螺旋构成,其中所述的两个α-螺旋由可变环区隔开。这两个α-螺旋促进二聚化,允许不同家族成员之间形成同二聚体和异二聚体。尽管bHLH结构域是进化保守的,然而除这个结构域之外,进化枝之间存在很少序列相似性。基于bHLH结构域的序列,Li等人(2006)将稻和拟南芥属(Arabidopsis)bHLH转录因子分成22个亚家族。
AtbHLH6(AtMYC2)是68kDa MYC-相关的转录激活子,具有bHLH型DNA-结合结构域(Abe等人,Plant Cell 9,1859-1868,1997)。其通过脱水胁迫并且被用脱落酸(ABA)处理时被诱导。AtMYC2识别rd22基因的启动子的MYC识别位点,所述rd22基因是在启动子中无ABRE-元件的ABA响应蛋白质。过量表达AtMYC2的植物具有对ABA更高的敏感性,具有增强的ABA诱导的基因表达,而插入突变体显示相反(降低的ABA敏感性和减少的ABA诱导的基因表达);此外,AtMYC2过量表达的植物对于渗透胁迫更有抗性(Abe等人,Plant Ceoll 15,63-78,2003)。过量表达AtMYC2的植物被报道与野生型植物相比不显示形态改变,而且叶中的细胞形状也不受影响。此外,显示AtMYC2参与病原体和创伤应答,色氨酸和色氨酸衍生的二级代谢以及对百草枯类(Methyl viologen)(Paraquat)的耐受性(Dombrecht等人,Plant Cell 19,2225-2245,2007)。
STO(盐耐受性)蛋白质
STO蛋白质,即盐耐受性蛋白质,首先从拟南芥(Arabidopsis thaliana)中在针对基因的筛选中被鉴定出来,所述基因在酵母中阻抑calcienurin突变体中的缺陷性盐应答(Lippuner等人1996)。通过表达拟南芥属STO在植物中赋予盐耐受性的方法已经在之前被公开(US5,859,337;Nagaoka和Takano 2003,J.Exp.Bot.54,391-396)。
结构上STO通过存在被称为B框(B-box)结构域的众所周知的结构域而被表征,所述结构域中CX2CX16CX2C结构是保守的。B框结构域是古细菌、原核和真核起源的蛋白质中存在的非种系选择性结构域。其主要在转录因子、核糖核蛋白和原癌蛋白质中发现。STO中的B框结构域在结构上类似于在拟南芥蛋白质CONSTANS中发现的结构域,所述CONSTANS是在开花时间的阻遏中涉及的转录因子。但是,STO和CONSTAN属于不同的蛋白质家族,其中CONSTANS由植物特异性保守的结构域的存在而表征,即除B框外的所谓的CCT框,而在蛋白质的STO家族中仅存在B框(Griffiths等人2003,Plant Phys,131,1855-1867;Lagercrants等人2000Mol.Biol.Evol.17,1499-1507)。
已经使用功能突变体的得失来进一步研究拟南芥属中的STO的生物学功能(Indorf等人2007,Plant J.51(4):563-74.)。从这些研究中报道的数据显示了STO在光信号传导中的作用,其中提及STO可以作用为植物光敏素和蓝光信号传导的负调节子。这些研究涉及理解STO在盐胁迫和光应答中的作用。
UGE(UDP-葡萄糖4-差向异构酶或UDP-Gal 4-差向异构酶)多肽
在植物中的碳水化合物的生物合成需要特异性的糖基转移酶,其作用于被激活的糖,通常是尿苷(UDP)、腺苷或鸟苷二磷酸己糖和戊糖。通过核苷酸糖互变酶在其糖基部分修饰核苷酸糖,以产生不同的糖类,所述糖类是摄入游离糖类的中间产物,所述游离糖类释放自营养或贮存碳水化合物和其他来源的降解。一种最佳表征的核苷酸糖互变酶是UGE(EC.5.1.3.2,根据IUBMB-International Union of Biochemistry andMolecular Biology-Enzyme Nomenclature)。
UGE(UDP-葡萄糖4-差向异构酶或UDP-Gal 4-差向异构酶)(EC.5.1.3.2)催化了UDP-葡萄糖和UDP-半乳糖的互变。辅因子NAD+/NADH(氧化型/还原型烟酰胺腺嘌呤二核苷酸-NicotinamideAdenine Dinucleotide-oxidized/reduced-)的不同浓度可以产生反应的差异性刺激。X-射线晶体学和其他研究表明UGE是二聚的,尽管在某些实验条件下也已经报道了活性单体和更高的聚合物(Thoden等人2005J.Biol.Chem 280,21900-21907)。
UGE对于UDP-Gal(多种不同的碳水化合物,糖脂类和糖苷类的生物合成的前体)的从头生物合成很重要。UGE也是半乳糖至中央代谢的分解代谢摄入所需的,因此UGE缺乏加剧了植物中(Dormann和Benning,1998;Plant J.13,641-652)和酵母中的半乳糖毒性,其还导致不同形式的人半乳糖血症。
UGE酶在微生物以及高等生物的基因组中被编码。在模式植物拟南芥中,已经鉴定了编码UGE同种型的5种不同的旁系同源基因。稻和杨基因组编码至少7种预测的UGE同种型。
已经在生物研究中以及通过表征功能突变体的得失而在拟南芥中得到了UGE同种型的酶促性质和遗传作用。所有5种拟南芥属UGE在类似的温度(30-40C)和pH(PH7-PH9)范围中是有酶促活性的。在UGE同种型之间可以形成同二聚体和异二聚体。这5种同种型在体内有功能并且可以补偿酵母GAL10突变体(缺乏UGE功能)的功能损失。后者反映了微生物和高等植物的UGE之间的UGE酶促活性的功能保守性(Barber等人2006;JBC 281,17276-17285)。在拟南芥属种,5种编码UGE的旁系同源基因在根中优先表达。UGE功能的突变或损失通常导致营养器官的一般性生长缺陷,并且花更小且为异常形状。令人惊讶地,花的数量和位置没有被改变,尽管报道了不育(Rosti等人2007;The Plant Cell 19,1565-1579)。根据UGE活性,改变了这些突变体中细胞壁半乳糖含量。专利US,6,9922,36公开了来自植物的UGE基因并且教导了在植物表达它们以允许在植物中碳水化合物代谢改变的方法。
概述
令人惊讶地,发现调节核酸表达提供了相对于对照植物具有增强的产量相关性状的植物,所述核酸编码产量增加多肽,所述多肽选自:
-bHLH6样(碱性螺旋-环-螺旋6样)蛋白质;
-GRP(生长调节蛋白质),其中所述GRP选自:
-RrmJ/FtsJ核糖体RNA甲基转移酶多肽(RrmJ/FtsJ多肽)
-碱性-螺旋-环-螺旋4(bHLH4)多肽
-异戊烯基转移酶(IPT)多肽
-STO(盐耐受性,Salt Tolerance)蛋白质
-UGE(UDP-葡萄糖4-差向异构酶或UDP-Gal 4-差向异构酶)多肽。
根据一个实施方案,提供了相对于对照植物增强植物产量相关性状的方法,所述方法包括在植物中调节编码bHLH6-样多肽的核酸的表达。增强的产量相关性状包含增加的提高的产量和提高的出苗萌发势(emergencevigour)。
根据一个实施方案,提供了相对于对照植物增强植物产量相关性状的方法,所述方法包括在植物中调节编码GRP多肽的核酸序列的表达,其中所述GRP多肽为RrmJ/FtsJ核糖体RNA甲基转移酶多肽(RrmJ/FtsJ多肽)。增强的产量相关性状包括提高的种子产量、提高的饱满种子数、提高的种子饱满率和提高的收获指数。
根据一个实施方案,提供了相对于对照植物增强植物产量相关性状的方法,所述方法包括在植物中调节(优选增加)编码GRP多肽的核酸序列的表达,其中所述GRP多肽为碱性-螺旋-环-螺旋4(bHLH4)多肽。增强的产量相关性状优选为增强的种子产量相关性状,包括一种或多种:提高的早期萌发势、提高的绿度指数、提高的每株植物的总种子产量、提高的饱满种子数、提高的种子饱满率、提高的以及提高的收获指数。
根据一个实施方案,提供了相对于对照植物增强植物产量相关性状的方法,所述方法包括在植物中调节(优选增加)编码GRP多肽的核酸序列的表达,其中所述GRP多肽为异戊烯基转移酶(IPT)多肽。增强的产量相关性状为一种或多种:提高的每株植物的总种子产量、提高的饱满种子数、提高的种子总数以及提高的收获指数。
根据一个实施方案,提供了相对于对照植物增强植物产量相关性状,特别是提高早期萌发势以及改变开花时间,特别是缩短开花时间的方法,所述方法包括调节在植物中编码STO多肽的核酸的表达。
根据一个实施方案,提供了相对于对照植物增强植物的产量相关性状,特别是提高产量的方法,所述方法包括在植物中调节编码UGE多肽的核酸的表达。
定义
改良和/或增强和/或改良的和/或增强的植物产量相关性状的术语在本文中使用,包括改良和/或增强和/或改良的和/或增强的植物生长特征。
多肽/蛋白质
术语“多肽”和“蛋白质”在本文中可相互交换地使用并且指由肽键连接起来的任意长度聚合物形式的氨基酸。
多核苷酸/核酸/核酸序列/核苷酸序列
术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”、“核酸分子”在本文中可相互交换地使用并且指任意长度的聚合非分支形式的核苷酸,即核糖核苷酸或脱氧核糖核苷酸或这二者的组合。
对照植物
选择合适的对照植物是实验设计的例行部分并且可以包括相应的野生型植物或无目的基因的相应植物。对照植物一般是相同的植物物种或甚至是与待评估植物相同的品种。对照植物也可以是待评估植物的失效合子。失效合子是因分离而丢失转基因的个体。如本文中所用的“对照植物”不仅指完整植物,也指植物部分,包括种子和种子部分。
同源物
蛋白质的“同源物”包括这样的肽、寡肽、多肽、蛋白质和酶,它们相对于非修饰的所讨论蛋白质具有氨基酸替换、缺失和/或插入并且与从中衍生它们的非修饰蛋白质具有相似的生物学活性和功能活性。
缺失指从蛋白质中移除一个或多个氨基酸。
插入指一个或多个氨基酸残基被导入蛋白质中的预定位点。插入可以包含氨基端融合和/或羧基端融合以及序列内插入单个或多个氨基酸。通常,在氨基酸序列内部的插入物比氨基端融合物或羧基端融合物小约1至10个残基级别。氨基端或羧基端融合蛋白或融合肽的例子包括如酵母双杂交系统中所用的转录激活物的结合结构域或激活结构域、噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶-标签、蛋白A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag·100表位、c-myc表位、-表位、lacZ、CMP(钙调蛋白结合肽)、HA表位、蛋白C表位和VSV表位。
替换指以具有相似特性(如相似的疏水性、亲水性、抗原性、形成或破坏α-螺旋结构或β-折叠结构的倾向性)的其他氨基酸替代蛋白质的氨基酸。氨基酸替换一般是单个残基的,不过根据给予多肽的功能性约束条件,可以是簇集的;插入通常是约1至10个氨基酸残基级别。氨基酸替换优选地是保守性氨基酸替换。保守性替换表是本领域熟知的(见例如Creighton(1984)Proteins.W.H.Freeman and Company(编著)和下表1)。
表1:保守性氨基酸替换的例子
残基 | 保守性替换 | 残基 | 保守性替换 |
Ala | Ser | Leu | Ile;Val |
Arg | Lys | Lys | Arg;Gln |
Asn | Gln;His | Met | Leu;Ile |
Asp | Glu | Phe | Met;Leu;Tyr |
Gln | Asn | Ser | Thr;Gly |
Cys | Ser | Thr | Ser;Val |
Glu | Asp | Trp | Tyr |
Gly | Pro | Tyr | Trp;Phe |
His | Asn;Gln | Val | Ile;Leu |
Ile | Leu,Val |
氨基酸替换、缺失和/或插入可以使用本领域熟知的肽合成技术如固相肽合成法等或通过重组DNA操作轻易地进行。用于操作DNA序列以产生蛋白质的替换、插入或缺失变体的方法是本领域熟知的。例如,用于在DNA的预定位点处产生替换突变的技术是本领域技术人员熟知的并且包括M13诱变法、T7-Gen体外诱变法(USB,Cleveland,OH)、QuickChange位点定向诱变法(Stratagene,San Diego,CA)、PCR介导的位点定向诱变或其他位点定向诱变法。
衍生物
“衍生物”包括这样的肽、寡肽、多肽,其中与天然存在形式蛋白质(如目的蛋白)的氨基酸序列相比较,它们包含非天然存在的氨基酸残基对氨基酸的替换或非天然存在的氨基酸残基的添加。蛋白质的“衍生物”也包括这样的肽、寡肽、多肽,其中与所述多肽的天然存在形式的氨基酸序列相比,它们包含天然存在的改变(糖基化、酰化、异戊二烯化、磷酸化、肉豆蔻酰化、硫酸化等)的氨基酸残基或非天然存在的改变的氨基酸残基。与从中衍生出衍生物的氨基酸序列相比较,该衍生物可以也包含与所述氨基酸序列共价或非共价结合的一个或多个非氨基酸取代基或添加物(例如报道分子或其他配体),如所结合旨在促进检测该衍生物的报道分子,和相对于天然存在的蛋白质的氨基酸序列而言,包含非天然存在的氨基酸残基。此外,“衍生物”也包括天然存在形式蛋白质与标签肽如FLAG、HIS6或硫氧还蛋白(对于标签肽的综述,见Terpe,Appl.Microbiol.Biotechnol.60,523-533,2003)的融合物。
直向同源物/旁系同源物
直向同源物和旁系同源物包括用来描述基因祖先关系的进化概念。旁系同源物是相同物种内因祖先基因复制而起源的基因;直向同源物是来自不同生物的因物种形成而起源的基因,并且也衍生于共同的祖先基因。
结构域
术语“结构域”指在进化相关性蛋白质的序列比对结果上的特定位置处保守的一组氨基酸。尽管在其他位置处的氨基酸可以在同源物之间不同,然而在特定位置处高度保守的氨基酸指示了很可能在蛋白质结构、稳定性或功能方面是必需的氨基酸。结构域因其在蛋白质同源物家族的比对序列中高保守程度而鉴定,故它们可以作为鉴定物用来确定所讨论的任意多肽是否属于先前已鉴定的多肽家族。
基序/共有序列/标签
术语“基序”或“共有序列”或“标签”指在进化相关蛋白质的序列中短的保守区域。基序往往是结构域的高度保守部分,不过也可以仅包括该结构域的部分,或可以位于保守结构域之外(若基序的全部氨基酸位于定义的结构域之外)。
杂交
如本文中所定义的术语“杂交”是其中基本上同源的互补核苷酸序列相互复性的过程。杂交过程可以完全在溶液中进行,即两种互补核酸均处于溶液中。杂交过程也可以用固定至基质如磁珠、琼脂糖凝胶(Sepharose)珠或任何其他树脂的互补核酸之一进行。杂交过程也可以用固定至固体支持物如硝酸纤维素膜或尼龙膜上或通过例如照相平版印刷术固定至例如硅玻璃支持物(后者称作核酸阵列或微阵列或称作核酸芯片)的互补核酸之一进行。为使杂交发生,核酸分子通常被热变性或化学变性,以使双链解链成两条单链和/或去除来自单链核酸的发夹或其他二级结构。
术语“严格性”指杂交发生的条件。杂交的严格性受诸条件如温度、盐浓度、离子强度和杂交缓冲液组成的影响。通常,低严格条件选择为在定义的离子强度和pH处,低于特定序列的热解链温度(Tm)约30℃。中等严格条件是当所述温度低于Tm 20℃时,并且高严格条件是当所述温度低于Tm 10℃时。高严格杂交条件一般用于分离与靶核酸序列具有高序列相似性的杂交序列。但是,核酸可以在序列上偏离且依旧编码基本上相同的多肽,原因是遗传密码的简并性。因而,有时候可能需要中等严格杂交条件以鉴定此类核酸分子。
Tm是在定义的离子强度和pH处的下述温度,其中50%的靶序列在所述温度与完全匹配的探针杂交。Tm取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在更高温度上特异性地杂交。最大杂交速率在低于Tm约16℃直至32℃上获得。杂交溶液中一价阳离子的存在降低了两条核酸链之间的静电排斥作用,因而促进杂交体形成;这种作用对于直到0.4M的钠浓度是显而易见的(对于更高的浓度而言,可以忽略这种作用)。甲酰胺降低了DNA-DNA和DNA-RNA双链体的解链温度,每百分数的甲酰胺降低0.6至0.7℃,且添加50%甲酰胺允许在30至45℃杂交,尽管杂交速率将降低。碱基对错配降低了杂交速率和双链体的热稳定性。平均而言和对于大探针而言,Tm下降约1℃/每%碱基错配。根据杂交体的类型,Tm可以使用以下等式计算:
1)DNA-DNA杂交体(Meinkoth和Wahl,Anal.Biochem.,138:267-284,1984):
Tm=81.5℃+16.6×log10[Na+]a+0.41×%[G/Cb]-500×Lc]-1-0.61×%甲酰胺
2)DNA-RNA杂交体或RNA-RNA杂交体:
Tm=79.8+18.5(log10[Na+]a)+0.58(%G/Cb)+11.8(%G/Cb)2-820/Lc
3)寡DNA杂交体或寡RNAd杂交体:
对少于20个核苷酸而言:Tm=2(ln)
对20-35个核苷酸而言:Tm=22+1.46(ln)
a或者用于其他一价阳离子,但是仅在0.01-0.4M范围内是精确的。
b仅对于在30%-75%范围内的%GC是精确的。
cL=双链体的碱基对长度。
dOligo,寡核苷酸;ln,=引物的有效长度=2×(G/C数)+(A/T数)。
可以使用许多已知技术中任意一种技术控制非特异性结合,例如将膜以含有蛋白质的溶液封闭、添加异源RNA、异源DNA和SDS至杂交缓冲液,并且用RNA酶处理。对于非同源性探针,可以通过变换以下条件之一:(i)渐进地降低复性温度(例如从68℃至42℃)或(ii)渐进地降低甲酰胺浓度(例如从50%至0%)进行一系列杂交。技术人员了解可以在杂交期间变更并且将维持或改变所述严格条件的多个参数。
除了杂交条件之外,杂交特异性一般还取决于杂交后洗涤的功能。为除去因非特异性杂交引起的背景,样品用稀释的盐溶液洗涤。此类洗涤的关键因素包括最终洗涤溶液的离子强度和温度:盐浓度越低且洗涤温度越高,则洗涤的严格性越高。洗涤条件一般在杂交严格性处或低于所述杂交严格性而进行。阳性杂交产生至少两倍于背景信号的信号。通常,用于核酸杂交测定法或基因扩增检测方法的适宜严格条件如上所述。也可以选择严格性更高或更低的条件。技术人员了解可以在洗涤期间变更并且将维持或改变所述严格条件的多个参数。
例如,用于长度大于50个核苷酸的DNA杂交体的典型高严格杂交条件包括在65℃于1×SSC中或在42℃于1×SSC和50%甲酰胺中杂交,随后在65℃于0.3×SSC中洗涤。用于长度大于50个核苷酸的DNA杂交体的中等严格杂交条件的例子包括在50℃于4×SSC或在40℃于6×SSC和50%甲酰胺中杂交,随后在50℃于2×SSC中洗涤。杂交体的长度是杂交核酸的预期长度。当序列已知的核酸杂交时,可以通过比对序列并鉴定本文中所述的保守区而确定杂交体长度。1×SSC是0.15M NaCl和15mM柠檬酸钠;杂交溶液和洗涤溶液可以额外地包括5×Denhardt试剂、0.5-1.0%SDS、100μg/ml变性的片段化鲑精DNA、0.5%焦磷酸钠。
出于定义严格性的水平的目的,可以参考Sambrook等(2001)Molecular Cloning:a laboratory manual,第三版Cold Spring HarborLaboratory Press,CSH,New York或参考Current Protocols in MolecularBiology,John Wiley&Sons,N.Y.(1989和年度更新版)。
剪接变体
如本文中所用的术语“剪接变体”包括其中已经切除、替换、置换或添加所选内含子和/或外显子或其中已经缩短或加长内含子的核酸序列的变体。此类变体将是其中基本上保留蛋白质的生物学活性的一类变体;这可以通过选择性地保留蛋白质的功能性片段实现。此类剪接变体可以在自然界中找到或可以人工制备。用于预测和分离此类剪接变体的方法是本领域熟知的(见例如Foissac和Schiex,BMC Bioinformatics.2005;6:25)。
等位变体
等位基因或等位变体是给定基因位于相同染色体位置处的备选形式。等位变体包含单核苷酸多态性(SNP)和小型插入/缺失多态性(INDEL)。INDEL的大小通常小于100bp。SNP和INDEL形成大部分生物的天然存在多态性株系中的序列变体的最大集合。
基因改组/定向进化
基因改组或定向进化由反复DNA改组,随后适当筛选和/或选择以产生编码具有改良生物学活性的蛋白质的核酸或其部分的变体而组成(Castle等人(2004)Science 304(5674):1151-4;美国专利5,811,238和6,395,547)。
调节元件/调控序列/启动子
术语“调节元件”、“调控序列”和“启动子”均在本文中可相互交换地使用并且在广泛含义上意指能够实现与它们相连接的序列表达的调节性核酸序列。术语“启动子”一般指位于基因转录起点上游并参与识别和结合RNA聚合酶和其他蛋白质,因而指导有效连接的核酸转录的核酸调控序列。前述术语包括从经典真核基因组基因(包括对于精确转录启动所需的TATA盒,具有或没有CCAAT盒序列)衍生的转录调节序列和应答发育性刺激和/或外部刺激或以组织特异性方式而改变基因表达的其它调节元件(即上游激活序列、增强子和沉默子)。本术语还包括经典原核基因的转录调节序列,在此情况下它可以包括一个-35框序列和/或一个-10框转录调节序列。术语“调节元件”也包含赋予、激活或增强核酸分子在细胞、组织或器官中表达的人工融合分子或衍生物。
“植物启动子”包含介导植物细胞中编码序列节段表达的调节元件。因此,植物启动子不需要是植物来源的,而可以源自病毒或微生物,例如来自侵袭植物细胞的病毒。“植物启动子”也可以源自植物细胞,例如来自用在本发明方法中待表达并在本文中描述的核酸序列转化的植物。这也适用于其他“植物”调节信号,如“植物”终止子。在本发明方法中有用的核苷酸序列上游的启动子可以通过一个或多个核苷酸替换、插入和/或缺失进行修饰,但不影响启动子、可读框(ORF)或3’调节区如终止子或远离ORF存在的其他3’调节区的功能性或活性。还有可能的是:所述启动子的活性因其序列的修饰或被更活跃的启动子、甚至来自异源生物的启动子彻底替代而提高。为了在植物中表达,如上所述,核酸分子必须有效地连接至或包含在正确的时间点并以所需空间表达模式表达基因的合适启动子。
鉴定功能性等价启动子,候选启动子的启动子强度和/或表达模式可以例如通过将此启动子有效地与报道基因连接并分析该报道基因在植物多种组织中的表达水平和模式进行分析。熟知的合适报道基因包括例如β-葡糖醛酸酶或β-半乳糖苷酶。启动子活性通过测量β-葡糖醛酸酶或β-半乳糖苷酶的酶活性进行分析。启动子强度和/或表达模式随后可以与参考启动子(如在本发明方法中使用的一种启动子)的启动子强度和/或表达模式比较。备选地,启动子强度可以使用本领域已知方法如RNA印迹法及放射自显影图的密度计分析法、定量实时PCR或RT-PCR(Heid等,1996GenomeMethods 6:986-994),通过量化mRNA水平或通过将本发明方法中所用核酸的mRNA水平与持家基因(如18S rRNA)的mRNA水平比较进行分析。通常“弱启动子”意指驱动编码序列在低水平表达的启动子。“低水平”意指在每个细胞约1/10,000转录物至约1/100,000转录物、至约1/500,0000转录物的水平上。相反,“强启动子”驱动编码序列在高水平、或在每个细胞约1/10转录物至约1/100转录物、至约1/1,000转录物上表达。强启动子的例子是CaMV 35S启动子。
有效地连接
如本文中所用的术语“有效地连接”指启动子序列与目的基因之间的功能性连接,从而该启动子序列能够起动该目的基因转录。
组成型启动子
“组成型启动子”指在生长和发育的大部分期间而无需在全部期间和在大多数环境条件下,在至少一种细胞、组织或器官中有转录活性的启动子。下表2a给出组成型启动子的例子。
表2a:组成型启动子的例子
基因来源 | 参考文献 |
肌动蛋白 | McElroy等人,Plant Cell,2:163-171,1990 |
HMGP | WO 2004/070039 |
CAMV 35S | Odell等人,Nature,313:810-812,1985 |
CaMV 19S | Nilsson等人,Physiol.Plant.100:456-462,1997 |
GOS2 | de Pater等人,Plant J Nov;2(6):837-44,1992,WO 2004/065596 |
遍在蛋白 | Christensen等人,Plant Mol.Biol.18:675-689,1992 |
稻亲环蛋白 | Buchholz等人,Plant Mol Biol.25(5):837-43,1994 |
玉米H3组蛋白 | Lepetit等人,Mol.Gen.Genet.231:276-285,1992 |
苜蓿H3组蛋白 | Wu等人Plant Mol.Biol.11:641-649,1988 |
肌动蛋白2 | An等人,Plant J.10(1);107-121,1996 |
34S FMV | Sanger等人,Plant.Mol.Biol.,14,1990:433-443 |
核酮糖二磷酸羧化酶-加 | US 4,962,028 |
氧酶小亚基 | |
OCS | Leisner(1988)Proc Natl Acad Sci USA 85(5):2553 |
SAD1 | Jain等人,Crop Science,39(6),1999:1696 |
SAD2 | Jain等人,Crop Science,39(6),1999:1696 |
nos | Shaw等人(1984)Nucleic Acids Res.12(20):7831-7846 |
V-ATP酶 | WO 01/14572 |
超级启动子 | WO 95/14098 |
G框蛋白质 | WO 94/12015 |
遍在启动子
遍在启动子基本上在生物的全部组织或细胞中有活性。
发育调节型启动子
发育调节型启动子在某些发育阶段期间或在经历发育变化的植物的部分中有活性。
诱导型启动子
诱导型启动子在应答化学刺激(综述见Gatz 1997,Annu.Rev.PlantPhysiol.Plant Mol.Biol.,48:89-108)、环境刺激或物理刺激时具有诱导型或提高的转录启动作用,或可以是“胁迫诱导的”,即当植物暴露于多种胁迫条件时被激活,或是“病原体诱导的”,即当植物暴露于多种病原体时被激活。
器官特异性/组织特异性启动子
器官特异性或组织特异性启动子是能够偏好性地在某些器官或组织如叶、根、种子组织等中启动转录的启动子。例如,“根特异性启动子”是这样的启动子,该启动子优势地在植物根中具有转录活性,基本上在植物的任何其他部分中无活性,尽管在该植物其他这些部分中仍允许任意泄露表达。能够仅在某些细胞中启动转录的启动子在本文中称作“细胞特异性的”。
种子特异性启动子是能够优势地在种子组织中有转录活性的启动子,但实际上并非必需排他性地在种子组织中有转录活性(在泄露表达的情况下)。种子特异性启动子可以在种子发育期间和/或萌发期间有活性。自59392:种子特异性启动子的例子在Qing Qu和Takaiwa(Plant Biotechnol。J.2,113-125,2004)中给出。
来自59348:
例如,种子特异性启动子可以驱动在一个或多个种子组织例如胚乳、糊粉、胚中的表达。种子特异性启动子的例子示于下文表2b中。种子特异性启动子的其他例子在Qing Qu和Takaiwa(Plant Biotechnol.J.2,113-125,2004)中给出,所述文献的公开内容如完整所述那样通过引用方式并入本文。
表2b:种子特异性启动子的例子
基因来源 | 参考文献 |
种子特异性基因 | Simon等人,Plant Mol.Biol.5:191,1985; |
Scofield等人,J.Biol.Chem.262:12202,1987.; | |
Baszczynski等人,Plant Mol.Biol.14:633,1990. | |
巴西坚果(Brazil Nut)白蛋白 | Pearson等人,Plant Mol.Biol.18:235-245,1992. |
豆球蛋白 | Ellis等人,Plant Mol.Biol.10:203-214,1988. |
谷蛋白(稻) | Takaiwa等人,Mol.Gen.Genet.208:15-22,1986; |
Takaiwa等人,FEBS Letts.221:43-47,1987. | |
玉米醇溶蛋白 | Matzke等人Plant Mol Biol,14(3):323-32 1990 |
NapA | Stalberg等人,Planta 199:515-519,1996. |
小麦LMW和HMW麦谷蛋白-1 | Mol Gen Genet 216:81-90,1989;NAR 17:461-2,1989 |
小麦SPA | Albani等人,Plant Cell,9:171-184,1997 |
小麦α、β、γ-麦醇溶蛋白 | EMBO J.3:1409-15,1984 |
大麦Itr1启动子 | Diaz等人(1995)Mol Gen Genet 248(5):592-8 |
大麦B1、C、D大麦醇溶蛋白 | Theor Appl Gen 98:1253-62,1999;Plant J4:343-55,1993;Mol Gen Genet 250:750-60,1996 |
大麦DOF | Mena等人,The Plant Journal,116(1):53-62,1998 |
blz2 | EP99106056.7 |
合成的启动子 | Vicente-Carbajosa等人,Plant J.13:629-640,1998. |
稻谷醇溶蛋白NRP33 | Wu等人,Plant Cen Physiology 39(8)885-889,1998 |
稻α-球蛋白Glb-1 | Wu等人,Plant Cell Physiology 39(8)885-889,1998 |
稻OSH1 | Sato等人,Proc.Natl.Acad.Sci.USA,93:8117-8122,1996 |
稻α-球蛋白REB/OHP-1 | Nakase等人Plant Mol.Biol.33:513-522,1997 |
稻ADP-葡萄糖焦磷酸酶 | Trans Res 6:157-68,1997 |
玉米ESR基因家族 | Plant J 12:235-46,1997 |
高粱α-高粱醇溶蛋白 | DeRose等人,Plant Mol.Biol 32:1029-35,1996 |
KNOX | Postma-Haarsma等人,Plant Mol.Biol.39:257-71,1999 |
稻油质蛋白 | Wu等人,J.Biochem.123:386,1998 |
向日葵油质蛋白 | Cummins等人,Plant Mol.Biol.19:873-876,1992 |
PRO0117,推定的稻40S核糖体蛋白 | WO 2004/070039 |
PRO0136,稻丙氨酸氨基转移酶 | 未公开 |
PRO0147,酪氨酸抑制物ITR1(大麦) | 未公开 |
PRO0151,稻WSI18 | WO 2004/070039 |
PRO0175,稻RAB21 | WO 2004/070039 |
PRO00S | WO 2004/070039 |
PRO0095 | WO 2004/070039 |
α-淀粉酶(Amy32b) | Lanahan等人,Plant Cell 4:203-211,1992; |
Skriver等人,Proc Natl Acad Sci USA88:7266-7270,1991 | |
组织蛋白酶β样基因 | Cejudo等人,Plant Mol Biol 20:849-856,1992 |
大麦Ltp2 | Kalla等人,Plant J.6:849-60,1994 |
Chi26 | Leah等人,Plant J.4:579-89,1994 |
玉米B-Peru | Selinger等人,Genetics 149;1125-38,1998 |
如本文中所定义的绿色组织特异性启动子是优势地在绿色组织中具有转录活性的启动子,在植物的任何其它部分内基本上无活性,尽管在该植物其他这些部分中仍允许任意泄露表达。自59392:绿色组织特异性启动子的例子在Nomura等人,2000Plant Mol Biol.44(1):99-106;WO2004/070039中给出。
组织特异性启动子的另一个例子是分生组织特异性启动子,其优势地在分生组织中具有转录活性,在植物的任何其它部分内基本上无活性,尽管在该植物其他这些部分中仍允许任意泄露表达。
终止子
术语“终止子”包括作为转录单元末端处DNA序列的调控序列,所述的DNA序列产生初级转录物的3’加工和多聚腺苷化及转录终止的信号。所述终止子可以从天然基因、从多种其他植物基因或从T-DNA衍生。待添加的终止子可以从例如胭脂碱合酶或章鱼碱合酶基因或备选地从另一种植物基因或较不优选地从任何其他真核基因衍生。
调节
就表达或基因表达而言,术语“调节”意指这样的过程,在所述过程中与对照植物相比较,表达水平因所述基因的表达而改变,优选地,表达水平可以提高或降低。原始、未调节的表达可以是结构性RNA(rRNA、tRNA)或mRNA的任何类型的表达,随后是翻译。术语“调节活性”意指本发明核酸序列或所编码蛋白质的表达的任何改变,这导致植物产量提高和/或生长增加。
表达
术语“表达”或“基因表达”意指某个特定基因或多个特定基因或特定基因构建体的转录。术语“表达”或“基因表达”尤其意指某个基因或诸基因或基因构建体转录成结构性RNA(rRNA、tRNA)或mRNA,而所述RNA随后翻译或不翻译成蛋白质。该过程包括DNA的转录和所得mRNA产物的加工。
增加的表达/过量表达
如本文中所用的术语“增加的表达”或“过量表达”意指相对于原有野生型表达水平为额外的任何形式的表达。
在本领域内充分记载了用于提高基因或基因产物表达的方法并且这些方法包括例如由适宜启动子驱动的过量表达、使用转录增强子或翻译增强子。充当启动子或增强子元件的分离核酸可以导入多核苷酸的非异源形式的适宜位置(一般在上游)中,从而上调编码目的多肽的核酸表达。例如,内源性启动子可以在体内通过突变、缺失和/或替换进行改变(见Kmiec,US 5,565,350;Zarling等,WO9322443),或可以将分离的启动子以相对于本发明基因的恰当方向及距离导入植物细胞,从而控制该基因的表达。
若需要多肽表达,通常希望的是在多核苷酸编码区的3’末端处包括多聚腺苷化区。所述多聚腺苷化区可以从天然基因、从多种其他植物基因或从T-DNA衍生。待添加的3’末端序列可以从例如胭脂碱合酶或章鱼碱合酶基因或备选地从另一种植物基因或较不优选地从任何其他真核基因衍生。
也可以将内含子序列添加至5’非翻译区(UTR)或部分编码序列的编码序列以提高细胞质内聚集的成熟信使的数量。已经证实在植物和动物表达构建体的转录单位中包含可剪接内含子提高了mRNA水平及蛋白质水平上的基因表达至多到1000倍(Buchman和Berg(1988)Mol.Cell biol.8:4395-4405;Callis等(1987)Gens Dev 1:1183-1200)。此类内含子增强基因表达的作用一般在所述内含子置于转录单位的5’末端附近时最强烈。玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子的用途是本领域已知的。对于总体信息,见:《玉米手册》,第116章,编者Freeling和Walbot,Springer,N.Y.(1994)。
内源基因
本文中对“内源的”基因的称谓不仅仅涉及如植物中以其天然形式(即没有人类任何干预)存在的所讨论基因,还指处于分离形式下的随后(再)导入植物(转基因)的相同基因(或基本上同源的核酸/基因)。例如,含有这种转基因的转基因植物可以出现转基因表达的大幅降低和/或内源基因表达的大幅降低。所述的分离基因可以从生物分离或可以是人造的,例如通过化学合成法人造的。
降低的表达
本文中提及的“降低的表达”或“降低或基本消除表达”意指内源基因表达和/或多肽水平和/或多肽活性相对于对照植物的下降。与对照植物相比较,所述降低或基本上消除以递增优选顺序是至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%或95%、96%、97%、98%、99%或更多降低。
为了最佳实施,用于在植物中降低内源基因表达的基因沉默技术需要使用来自单子叶植物的核酸序列来转化单子叶植物,以及来自双子叶植物的核酸序列来转化双子叶植物。优选地,来自任何给定植物物种的核酸序列被引入该相同物种。例如,来自稻的核酸序列被转化入稻植物。但是,并非完全必要的是待引入的核酸序列来自的植物与其将被引入的植物是同一物种。只要内源靶基因和待被引入的核酸之间有基本同源性即足够。
来自59391:
为了降低或基本消除植物中内源基因的表达,需要核酸序列的基本上连续的核苷酸的足够长度。为了进行基因沉默,这个长度可以是短至20、19、18、17、16、15、14、13、12、11、10个或更少的核苷酸,或者该长度可以长至完整基因(包括部分或完整的5’和/或3’UTR)。基本上连续的核苷酸片段可以从编码目的蛋白的核酸(靶基因)或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸衍生。优选地,基本上连续的核苷酸的片段能够与靶基因(有义链或反义链)形成氢键,更优选地,基本上连续的核苷酸片段以增加的优选顺序与靶基因(有义链或反义链)具有50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、100%的序列同一性。编码(功能性)多肽的核酸序列不是用于降低或基本消除内源基因表达的本文中所讨论多种方法的必要条件。
表达的这种降低或基本消除可以使用常规工具和技术完成。用于降低或基本消除内源基因表达的优选方法是在植物中导入并表达基因构建体,其中将核酸(在此情况下,从目的基因或从能够编码任何一种目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)克隆至所述基因构建体,作为被间隔序列(非编码性DNA)隔开的(部分或完全)反向重复序列。
在这种优选的方法中,使用核酸或其部分(在此情况下,所述部分是从目的基因或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)的反向重复序列(其优选能够形成发夹结构),通过RNA介导的沉默作用降低或基本上消除内源基因的表达。在包含调控序列的表达载体中克隆所述反向重复序列。非编码性DNA核酸序列(间隔序列,例如基质附着区片段(MAR)、内含子、多接头等)位于形成所述反向重复序列的两个反向核酸之间。在反向重复序列转录后,形成具有(部分或完全)自我互补性结构的嵌合RNA。这种双链RNA结构称作发夹RNA(hpRNA)。hpRNA由植物加工成siRNA,该siRNA掺入RNA诱导的沉默复合体(RISC)。该RISC进一步切开所述mRNA转录物,从而大幅降低待翻译成多肽的mRNA转录物的数目。对于其他一般细节,见例如Grierson等人(1998)WO 98/53083;Waterhouse等人(1999)WO99/53050。
本发明方法的实施不依赖在植物中导入并表达所述核酸作为反向重复序列克隆到其中的基因构建体,不过可以使用几种熟知“基因沉默”方法的任何一种或多种方法来实现相同的作用。
用于降低内源基因表达的这样一种方法是RNA介导的基因表达沉默(下调)。在这种情况下,沉默作用由基本上与内源性靶基因相似的双链RNA序列(dsRNA)在植物中触发。这种dsRNA进一步由植物加工成约20个至约26个核苷酸,称作短干扰RNA(siRNA)。siRNA掺入RNA诱导的沉默复合体(RISC)中,其中所述的RISC切割内源性靶基因的mRNA转录物,从而大幅降低待翻译成多肽的mRNA转录物的数目。优选地,所述双链RNA序列对应于靶基因。
RNA沉默方法的另一个例子包括将核酸序列或其部分(在此情况下是从目的基因或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)以有义方向导入植物。“有义方向”指与其mRNA转录物同源的DNA序列。因而,将所述核酸序列的至少一个拷贝导入植物。这种额外的核酸序列会降低内源基因表达,产生称为共抑制作用的现象。当一种核酸序列的几个额外拷贝导入植物时,基因表达的降低将更明显,因为高转录物水平与触发共抑制作用之间存在正相关。
RNA沉默方法的另一个例子包括使用反义核酸序列。“反义”核酸序列包含与编码蛋白质的“有义”核酸序列互补,即与双链cDNA分子的编码链互补,或与mRNA转录物序列互补的核苷酸序列。所述反义核酸序列优选地与待沉默的内源基因互补。此互补性可以位于基因的“编码区”中和/或基因的“非编码区”中。术语“编码区”指包含被翻译成氨基酸残基的密码子的核苷酸序列的区域。术语“非编码区”指被转录但不被翻译成氨基酸的分布在编码区侧翼的5’和3’序列(也称作5’和3’非翻译区)。
反义核酸序列可以根据Watson和Crick碱基对规则设计。反义核酸序列可以与完整核酸序列(在此情况下是从目的基因或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸)互补,不过也可以是仅与所述核酸序列的一部分(包括mRNA5’和3’UTR)反义的寡核苷酸。例如,所述反义寡核苷酸序列可以与编码多肽的mRNA转录物的翻译起点周围的区域互补。合适反义寡核苷酸序列的长度是本领域已知的并且可以从长度约50、45、40、35、30、25、20、15或10个核苷酸或更少的核苷酸开始。本发明的反义核酸序列可以使用化学合成和酶连接反应,利用本领域已知的方法构建。例如,反义核酸序列(例如反义寡核苷酸序列)可以使用天然存在的核苷酸或多种修饰的核苷酸化学地合成,其中设计所述的修饰核苷酸旨在提高分子的生物学稳定性或提高反义核酸序列与有义核酸序列之间所形成双链体的物理稳定性,例如,可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可以用来产生反义核酸序列的修饰核苷酸的例子是本领域熟知的。已知的核苷酸修饰包括甲基化、环化和“加帽”用类似物(如肌苷)替换一个或多个天然存在的核苷酸。对核苷酸的其他修饰是本领域熟知的。
所述反义核酸序列可以使用表达载体以生物学方式产生,其中将一种核酸序列以反义方向亚克隆(即从所插入核酸转录出的RNA将与目的靶核酸呈反义方向)至所述表达载体。优选地,植物中反义核酸序列的产生借助稳定整合的核酸构建体进行,其中所述的核酸构建体包含启动子、有效连接的反义寡核苷酸和终止子。
本发明方法中用于沉默作用的核酸分子(无论导入植物中或原位(insitu)产生)与mRNA转录物和/或编码多肽的基因组DNA杂交或结合,从而抑制蛋白质的表达,例如通过抑制转录和/或翻译做到这一点。杂交可以通过常规核苷酸互补性以形成稳定双链体引起,或例如与DNA双链体结合的反义核酸序列的情形下,因双螺旋大沟内的特异性相互作用引起。反义核酸序列可以通过转化法或在特定组织部位处的直接注射法导入植物。或者,反义核酸序列可以受到修饰以靶向所选的细胞并且随后全身性施用例如,对于全身性施用,可以修饰反义核酸序列,从而它们与表达在所选细胞表面上的受体或抗原特异性地结合,例如通过将所述反义核酸序列连接至与细胞表面受体或抗原结合的肽或抗体连接而做到这一点。所述反义核酸序列也可以使用本文中所述的载体递送至细胞。
根据又一个方面,反义核酸序列是α-端基异构核酸序列。α端基异构核酸序列与互补RNA形成特定的双链杂交体,在所述双链杂交体中与常见的b-单元相反,所述链彼此平行(Gaultier等(1987)Nucl Ac Res 15:6625-6641)。反义核酸序列也可以包含2′-O-甲基核糖核苷酸(Inoue等(1987)Nucl Ac Res 15,6131-6148)或嵌合RNA-DNA类似物(Inoue等(1987)FEBSLett.215,327-330)。
内源基因表达的降低或基本上消除也可以使用核酶进行。核酶是具有核糖核酸酶活性的催化性RNA分子,能够切割与其具有互补区域的单链核酸序列,如mRNA。因此,核酶(例如锤头状核酶(在Haselhoff和Gerlach(1988)Nature 334,585-591中描述)可以用来催化性地切割编码多肽的mRNA转录物,因而大幅降低待翻译成多肽的mRNA转录物的数目。可以设计对核酸序列具有特异性的核酶(见例如:Cech等美国专利号4,987,071;和Cech等美国专利号5,116,742)。或者,与核酸序列相对应的mRNA转录物可以用来从RNA分子汇集物中选出具有特异核糖核酸酶活性的催化性RNA(Bartel和Szostak(1993)Science 261,1411-1418)。核酶用于植物中基因沉默的用途是本领域已知的(例如Atkins等(1994)WO94/00012;Lenne等(1995)WO 95/03404;Lutziger等(2000)WO 00/00619;Prinsen等(1997)WO 97/13865和Scott等(1997)WO 97/38116)。
基因沉默也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如Angell和Baulcombe((1999)Plant J.20(3):357-62)、(Amplicon VIGSWO 98/36083)或Baulcombe(WO 99/15682)及其他人描述的策略实现。
内源基因中存在突变和/或在随后导入植物的分离的基因/核酸中存在突变时,基因沉默也可以发生。所述降低或基本上消除可以由无功能的多肽引起。例如,多肽可以与多种相互作用性蛋白质结合;一种或多种突变和/或截短因而可以产生仍能够结合相互作用性蛋白质(如受体蛋白)但不能表现其正常功能的多肽(如信号配体)。
基因沉默的又一种方法是靶向与基因的调节区(例如启动子和/或增强子)互补的核酸序列以形成可阻止靶细胞中基因转录的三重螺旋结构。见Helene,C.,Anticancer Drug Res.6,569-84,1991;Helene等,Ann.N.Y.Acad.Sci.660,27-36 1992;和Maher,L.J.Bioassays 14,807-15,1992。
技术人员熟知其他方法,如使用针对内源性多肽的抗体以抑制其在植物中的功能,或干扰其中涉及某多肽的信号传导途径。尤其,可以考虑人造分子可用于抑制靶多肽的生物学功能,或用于干扰其中涉及所述靶多肽的信号传导途径。
或者,可以设立筛选程序以鉴定植物群体中基因的天然变体,其中所述的天然变体编码活性降低的多肽。也可以使用此类天然变体,例如来开展同源重组。
人工和/或天然的微RNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源性miRNA是通常长19-24个核苷酸的单链小RNA。它们主要发挥调节基因表达和/或mRNA翻译的功能。大多数的植物微RNA(miRNA)与其靶序列完全互补或接近完全互补。但是,存在具有多达5个错配的天然靶。它们由Dicer家族的双链特异性RNA酶从具有特征性折返结构的较长非编码性RNA加工而来加工后,它们通过与RNA诱导的沉默复合体(RISC)的主要组分-Argonaute蛋白结合被掺入该复合体。miRNA充当RISC的特异性组分,因为它们与胞浆内的靶核酸(大多是mRNA)发生碱基配对。后续调节事件包括靶mRNA切割和摧毁和/或翻译抑制。miRNA过量表达的作用因此往往反映为靶基因的mRNA水平降低。
可以按照遗传工程方式专门设计通常长21个核苷酸的人工微RNA(amiRNA)以负向地调节单个或多个目的基因的基因表达。选择植物的微RNA靶的决定因素是本领域熟知的。已经定义了用于靶识别的经验参数和可以使用它们来辅助特定amiRNA的设计(Schwab等,Dev.Cell 8,517-527,2005)。用于设计并产生amiRNA及其前体的便利工具也是公众可获得的(Schwab等,2006Plant Cell.200618(5):1121-33)。
为了最佳性能,用于降低植物中内源基因表达的基因沉默技术需要使用来自单子叶植物的核酸序列以转化单子叶植物,和使用来自双子叶植物的核酸序列以转化双子叶植物。优选地,来自任何给定植物物种的核酸序列导入相同物种。例如,来自稻的核酸序列转化至稻植物。但是,并非绝对要求待导入的核酸序列源自与该核酸序列待导入的植物相同的植物物种。只要内源性靶基因与待导入的核酸之间存在实质的同源性即可。
上文描述的是用于降低或基本上消除植物中内源基因表达的多种方法的例子。例如,本领域技术人员会轻易地能够调整前述用于沉默的方法以至于通过利用合适启动子,实现降低完整植物中或其部分中内源基因的表达。
本领域的技术人员熟悉多种技术用于降低基因的表达。
选择标记(基因)/报道基因
“选择标记”、“选择标记基因”或“报道基因”包括对细胞赋予表型的任何基因,其中所述″选择标记″、″选择标记基因″或“报道基因”在所述细胞中表达旨在促进鉴定和/或选择用本发明的核酸构建体转染或转化的细胞。这些标记基因能够借助一系列不同原理而鉴定核酸分子的成功转移。合适的标记可以选自赋予抗生素抗性或除草剂抗性、导入新代谢性状或允许目视选择的标记。选择标记基因的例子包括赋予抗生素抗性的基因(如使新霉素和卡那霉素磷酸化的nptII或使潮霉素磷酸化的hpt或赋予针对例如博来霉素、链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(Geneticin)(G418)、壮观霉素或杀稻瘟菌素的抗性的基因)、赋予除草剂抗性的基因(例如提供抗性的bar;提供草甘膦抗性的aroA或gox或赋予针对例如咪唑啉酮、膦丝菌素或磺脲类的抗性的基因)或提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA,或利用木糖的木糖异构酶,或抗营养性标记如2-脱氧葡萄糖抗性)。目视标记基因的表达导致颜色(例如β-葡糖醛酸酶、GUS或β-半乳糖苷酶与其有色底物例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白GFP和其衍生物)的形成。这个名单仅代表少数的可能标记。技术人员熟悉此类标记。取决于生物和选择方法,优选不同的标记。
已知当核酸稳定或瞬时地整合至植物细胞时,仅少数细胞摄取了外来DNA,并且根据需要,将其整合至细胞的基因组中,这取决于所用的表达载体和所用的转染技术。为鉴定并选择这些整合体,编码选择标记的基因(如上文所述的基因)通常连同目的基因一起导入宿主细胞。这些标记可以在这些基因例如通过常规方法缺失而无功能的突变体中使用。此外,编码选择标记的核酸分子可以在包含编码本发明多肽或在本发明方法中所用多肽的序列的相同载体上,或在独立的载体上导入宿主细胞。已经用所导入核酸稳定转染的细胞可以通过选择作用鉴定(例如具有整合的选择标记的细胞存活而其他细胞死亡)。
因为所述标记基因,尤其抗生素抗性基因和除草剂抗性基因一旦已经成功地导入,则在转基因宿主细胞中是不再需要或不想要的,故而,用于导入核酸的本发明方法有利地使用能够去掉或切除这些标记基因的技术。一种这样的方法称作共转化法。共转化法同时使用两种载体用于转化,一种载体携带本发明的核酸而第二种载体携带标记基因。大比例的转化体接受或在植物情况下包含(多达40%或更多的转化体)这两种载体。在用农杆菌(Agrobacterium)转化的情况下,转化体通常仅接受载体的一部分,即侧翼存在T-DNA的序列,该序列通常代表表达盒。标记基因随后可以通过开展杂交从转化的植物中除去。在另一种方法中,整合至转座子的标记基因用来与目的核酸一起进行转化(称作Ac/Ds技术)。转化体可以与转座酶来源物杂交,或该转化体用导致转座酶表达的核酸构建体瞬时或稳定地转化。在一些情况下(大约10%),一旦转化已经成功发生,则转座子从宿主细胞的基因组中跳出并丢失。在其他许多情况下,转座子跳到不同位置。在这些情况下,必须通过开展杂交消除标记基因。在微生物学中,开发了有可能或促进检测这类事件的技术。又一个有利的方法依赖于所谓重组系统;此方法的优势在于可以用所述的重组系统实行杂交消除作用。最知名的该类型系统称作Cre/lox系统。Cre1是除去位于loxP序列之间序列的重组酶。若所述标记基因整合在loxP序列之间,则一旦转化已经成功发生,它因重组酶表达而被除去。其他重组系统是HIN/HIX、FLP/FRT和REP/STB系统(Tribble等,J.Biol.Chem.,275,2000:22255-22267;Velmurugan等,J.Cell Biol.,149,2000:553-566)。有可能将本发明核酸序列以位点特异性方式整合至植物基因组。这些方法自然也可以应用于微生物如酵母、真菌或细菌。
转基因的/转基因/重组
为本发明的目的,“转基因的”、“转基因”或“重组”例如就核酸序列而言,意指包含所述核酸序列的表达盒、基因构建体或载体,或用本发明核酸序列、表达盒或载体转化的生物,这些构建体均通过重组方法产生,其中
(a)编码在本发明方法中有用的蛋白质的核酸序列,或
(b)与本发明核酸序列有效连接的基因调控序列,例如启动子,或
(c)a)和b)
不位于其天然遗传环境中或已经通过重组方法被修饰,所述的修饰有可能采取例如替换、添加、倒位或插入一个或多个核苷酸残基的形式。天然遗传环境理解为意指原初植物中的天然基因组位点或染色体位点或存在于基因组文库中。在基因组文库的情况下,核酸序列的天然遗传环境优选地保留,至少部分保留。该环境分布在所述核酸序列的至少一侧并且具有至少50bp,优选至少500bp,特别优选至少1000bp,最优选至少5000bp序列长度。当天然存在的表达盒受非天然的合成(“人工”)方法(如诱变处理)被修饰时,天然存在的表达盒-例如所述核酸序列的天然启动子与编码在本发明方法中有用的多肽的相应核酸序列的天然存在组合,如上文所定义-变成转基因表达盒。合适方法例如在US 5,565,350或WO 00/15815中描述。
为本发明目的,如上所述,将转基因植物因此理解为意指在本发明方法中有用的核酸不处于所述植物基因组中所述核酸的天然基因座处,所述核酸有可能同源或异源地表达。但是,如所提及,转基因的还意指尽管本发明的或在本发明方法中有用的核酸处于植物基因组中所述核酸的天然位置处,然而其序列相对于天然序列而言已经被修饰,和/或所述天然序列的调节序列已经被修饰。转基因的优选地理解为意指本发明核酸在基因组的非天然基因座处表达,即,所述核酸的同源表达或优选异源表达发生。优选的转基因植物在本文中提及。
转化
如本文中提及的术语“导入”或“转化”包括外源性多核苷酸转移至宿主细胞,无论转化所用的方法是什么方法。能够后续克隆性增殖(无论通过器官发生或胚发生)的植物组织可以用本发明的基因构建体转化并且完整植物可以从中再生。所选的具体组织根据可用于并且最适于正在进行转化的具体物种的克隆性增殖系统变化。示例性靶组织包括叶盘、花粉、胚、子叶、下胚轴、大配子体、愈伤组织、现存分生组织(例如顶端分生组织、腋芽和根分生组织)和诱导性分生组织(例如子叶分生组织和下胚轴分生组织)。多核苷酸可以瞬时或稳定地导入宿主细胞并且可以非整合地维持,例如作为质粒。备选地,它可以整合至宿主基因组。所得的转化植物细胞随后可以用来按照本领域技术人员已知的方式再生出转化植物。
外来基因转移至植物基因组的过程称作转化。转化植物物种现在是极为常规的技术。有利地,几种转化方法中的任何方法可以用来将目的基因导入合适的祖先细胞。描述用于转化并从植物组织或植物细胞再生出植物的方法可以用于瞬时转化或稳定转化。转化方法包括使用脂质体、电穿孔法、提高游离DNA摄入的化学品、DNA直接注射至植物、粒子枪轰击法、使用病毒或花粉的转化法和显微投射法(microprojection)。转化方法可以选自用于原生质体的钙/聚乙二醇法(Krens,F.A.等,(1982)Nature 296,72-74;Negrutiu I等(1987)Plant Mol Biol 8:363-373);原生质体的电穿孔法(Shillito R.D.等(1985)Bio/Technol 3,1099-1102);对植物材料的微量注射法(Crossway A等,(1986)Mol.Gen Genet 202:179-185);DNA或RNA包被的粒子轰击法(Klein TM等,(1987)Nature 327:70)、(非整合性)病毒感染法等。包括转基因作物植物在内的转基因植物优选通过农杆菌介导的转化法产生。有利的转化方法是植物内(in planta)转化法。为此目的,例如有可能将农杆菌作用于植物种子或有可能用农杆菌接种植物分生组织。根据本发明,已经证明特别有利的是将转化的农杆菌悬液作用于完整植物或至少作用于花原基。随后继续培育该植物直至获得已处理植物的种子(Clough和Bent,Plant J.(1998)16,735-743)。用于农杆菌介导稻转化的方法包括用于稻转化的众知方法,如在以下任意文献中描述的那些方法:欧洲专利申请EP 1198985A1,Aldemita和Hodges(Planta 199:612-617,1996);Chan等(Plant Mol Biol 22(3):491-506,1993),Hiei等(Plant J 6(2):271-282,1994),其公开内容如充分所述那样通过引用的方式并入本文。在玉米转化的情况下,优选的方法如Ishida等(Nat.Biotechnol 14(6):745-50,1996)或Frame等(Plant Physiol 129(1):13-22,2002)描述,其公开内容如充分所述那样通过引用的方式并入本文。所述方法还例如由B.Jenes等,Techniques for Gene Transfer,在:Transgenic Plants,第1卷,Engineering and Utilization,编者S.D.Kung和R.Wu,AcademicPress(1993)128-143及在Potrykus Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991)205-225)描述。待表达的核酸或构建体优选地克隆至适于转化根癌农杆菌(Agrobacterium tumefaciens)的载体,例如pBin19(Bevan等,Nucl.Acids Res.12(1984)8711)。通过这种载体转化的农杆菌随后可以按照已知方式用于转化植物,例如作为模型使用的植物如拟南芥属植物(拟南芥在本发明范围不视为作物植物),或作物植物,例如烟草植物,所述方式例如是通过将擦伤的叶或切碎的叶浸泡在农杆菌溶液中并随后将它们在合适培养基中培育。借助根癌农杆菌转化植物例如由和Willmitzer在Nucl.Acid Res.(1988)16,9877中描述或尤其从F.F.White,Vectors forGene Transfer in Higher Plants;在Transgenic Plants,第1卷,Engineeringand Utilization,编者S.D.Kung和R.Wu,Academic Press,1993,第15-38页中获知。
除了转化随后必需再生成完整植物的体细胞之外,还可转化植物分生组织的细胞,并且尤其是发育成配子的那些细胞。在这种情况下,转化的配子遵循天然植物发育过程,从而产生转基因植物。因此,例如用农杆菌处理拟南芥属植物的种子并且从正在发育的植物中获得种子,其中一定比例的所述植物被转化并且因此是转基因的[Feldman,KA和MarksMD(1987)Mol Gen Genet 208:274-289;Feldmann K(1992),在:编者CKoncz,N-H Chua和J Shell,Methods in Arabidopsis Research.WordScientific,Singapore,第274-289页]。备选方法基于反复除去花序并将莲座丛中心内的切除部位与转化的农杆菌温育,因而同样可以在较晚的时间点上获得转化的种子(Chang(1994)Plant J.5:551-558;Katavic(1994)MolGen Genet,245:363-370)。但是,特别有效的方法是改良真空渗入法,如“花器浸蘸”法。在拟南芥属植物真空渗入法的情况下,在减压下用农杆菌悬液处理完整植物[Bechthold,N(1993)。C R Acad Sci Paris Life Sci,316:1194-1199],而在”花器浸蘸法”的情况下,将正在发育的花组织与经表面活性剂处理的农杆菌悬液短暂温育[Clough,SJ和Bent,AF(1998)ThePlant J.16,735-743]。在这两种情况下均收获某个比例的转基因种子,并且这些种子可以通过在如上所述的选择条件下培育与非转基因种子区分。此外,质体的稳定转化是有利的,因为质体在大部分作物中母系地遗传,这降低或消除了经过花粉的转基因流动风险。叶绿体基因组的转化一般通过在Klaus等,2004[Nature Biotechnology 22(2),225-229]中已示意性展示的方法实现。简而言之,将待转化的序列连同选择标记基因一起克隆至同源于叶绿体基因组的侧翼序列之间。这些同源侧翼序列指导进入原质体的位点特异性整合。已经对许多不同植物物种描述了质体转化并且Bock(2001)基础研究和植物生物技术中的转基因质体(Transgenic plastidsin basic research and plant biotechnology).J Mol Biol.2001年9月21日;312(3):425-38或Maliga,P(2003)质体转化技术商业化进展(Progresstowards commercialization of plastid transformation technology),TrendsBiotechnol.21,20-28进行了综述。其他生物技术进展最近已经以无标记质体转化体的形式进行报道,其中所述的无标记质体转化体可以通过瞬时共整合性标记基因产生(Klaus等,2004,Nature Biotechnology 22(2),225-229)。
T-DNA活化标签技术(T-DNA activation tagging)
T-DNA活化标签技术(Hayashi等Science(1992)1350-1353)涉及以启动子指导靶向的基因表达的方式在目的基因的基因组区域内或基因的编码区上游或下游10kb处插入通常含有启动子(也可以是翻译增强子或内含子)的T-DNA。一般,靶向基因的天然启动子对该靶向基因表达的调节被破坏,并且所述基因处于新导入的启动子控制下。该启动子一般嵌入T-DNA中。这种T-DNA随机地插入植物基因组,例如借助农杆菌感染,并且导致在插入的T-DNA附近的基因表达受到调节。所得的转基因植物因在导入的启动子附近的基因表达受到调节而显示显性表型。
TILLING
术语“TILLING”是“基因组中定向诱导的局部损伤法”的缩写并且指用于产生和/或鉴定核酸的诱变技术,其中所述的核酸编码具有改良表达和/或活性的蛋白质。TILLING还允许选择携带此类突变变体的植物。这些突变变体可以表现在强度或在位置或在时间方面改良的表达(例如若所述突变影响启动子)。这些突变变体可以显示比其天然形式基因所表现活性更高的活性。TILLING将高密度诱变与高通量筛选方法组合。在TILLING中一般遵循的步骤是:(a)EMS诱变(Redei GP和Koncz C(1992)在Methodsin Arabidopsis Research,Koncz C,Chua NH,Schell J,Singapore编辑,World Scientific Publishing Co,第16-82页;Feldmann等,(1994)在Meyerowitz EM,Somerville CR编辑,Arabidopsis.Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY,第137-172页;Lightner J和Caspar T(1998)在J Martinez-Zapater,J Salinas编者,Methods onMolecular Biology第82卷.Humana Press,Totowa,NJ,第91-104页);(b)个体的DNA制备和汇集;(c)目的区域的PCR扩增;(d)变性和复性以使得异双链体形成;(e)DHPLC,其中异双链体在汇集物中的存在作为色谱图中一个额外的峰被检测到;(f)鉴定突变个体;和(g)对突变PCR产物的测序。用于TILLING的方法是本领域熟知的(McCallum等,(2000)NatBiotechnol 18:455-457;综述见Stemple(2004)Nat Rev Genet 5(2):145-50)。
同源重组
同源重组允许在基因组中定义的所选位置处导入选择的核酸。同源重组是在生物科学中例行用于低等生物如酵母或小立碗藓属(Physcomitrella)苔藓的标准技术。已经对模式植物(Offringa等(1990)EMBO J 9(10):3077-84)和作物植物例如稻(Terada等(2002)Nat Biotech 20(10):1030-4;Iida和Terada(2004)Curr Opin Biotech 15(2):132-8)描述了用于植物中开展同源重组的方法,并且存在与靶生物无关而通常适用的方法(Miller等,Nature Biotechnol.25,778-785,2007)。
产量
术语“产量”通常意指经济价值的可测量结果,一般与特定作物、与面积并与时间段有关。单个植物部分基于它们的数目、大小和/或重量而直接有助于对产量,或实际产量是对于某种作物和一年的每平方米产量,这通过总产量(包括收获的和评估的产量)除以种植的平方米数而确定。术语植物的“产量”可以涉及该植物的营养生物量(根和/或枝条生物量)、涉及繁殖器官和/或涉及繁殖体(如种子)。
早期萌发势
“早期萌发势”指活跃、健康、充分平衡的生长,尤其是植物生长早期期间,并且可以因植物适应性提高引起,其中所述的植物适应性提高原因在于例如该植物更好地适应环境(即优化能量来源的用途和枝条与根之间的分配)。具有早期萌发势的植物也显示幼苗存活提高和作物建立更佳,这往往产生高度均一的田块(作物以均一方式生长,即大多数植物在基本上相同的时间达到各个发育期)和往往形成更好及更高的产量。因而,早期萌发势可以通过测量多种因子如千粒重(Thousand Kernel Weight)、萌发百分数、出苗百分数、幼苗生长、幼苗高度、根长度、根和枝条生物量和许多其他因素等确定。
提高/改善/增强
术语“提高”、“改善”或“增强”是相互可交换的并且在应用含义上应当意指与如本文中定义的对照植物相比较,至少3%、4%、5%、6%、7%、8%、9%或10%、优选至少15%或20%、更优选地25%、30%、35%或40%更多的产量和/或生长。
种子产量
提高的种子产量自身可以表现为以下一个或多个指标:a)种子生物量(种子总重量)增加,这可以基于单粒种子基础和/或每株植物和/或每平方米;b)提高的每株植物花数目;c)提高的(充实)种子数;d)提高的种子饱满率(其表述为饱满种子数与种子总数之间的比率);e)提高的收获指数,其表述为可收获部分(如种子)产量与总生物量的比率;和f)提高的千粒重(TKW),这从计数的饱满种子数及其总重量中外推出来。提高的TKW可以因增加的种子大小和/或种子重量引起,并且也可以因胚和/或胚乳大小的增加引起。
种子产量的提高也可以表现为种子大小和/或种子体积的增长。此外,种子产量的提高自身也可以表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的提高。提高的产量也可以产生改良的构造,或可以因改良的构造而出现。
绿度指数
从植物的数字图像计算如本文中所用的“绿度指数”。对属于图像上植物目标的每个像素计算绿色值与红色值的比率(在编码颜色的RGB模式中)。绿度指数表述为绿色/红色比超过给定阈值的像素百分数。在正常生长条件下,在盐胁迫生长条件下和在营养可用性降低的生长条件下,在开花前的最后成像中测量植物的绿度指数。相反,在干旱胁迫生长条件下,在干旱后的首次成像中测量植物的绿度指数。
植物
本文中所用的术语“植物”包括完整植物、植物的祖先及子代和包括种子、枝条、茎、叶、根(包括块茎)、花和组织、器官在内的植物部分,其中每种前述对象包含目的基因/核酸。术语“植物”也包括植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样每种前述对象包含目的基因/核酸。
在本发明方法中特别有用的植物包括属于植物界(Viridiplantae)超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木,其中所述植物选自包含以下物种的名单:槭树属物种(Acer spp.)、猕猴桃属物种(Actinidia spp.)、秋葵属物种(Abelmoschus spp.)、剑麻(Agave sisalana)、冰草属物种(Agropyron spp.)、匍匐剪股颖(Agrostis stolonifera)、葱属物种(Allium spp.)、苋属物种(Amaranthus spp.)、欧洲海滨草(Ammophila arenaria)、凤梨(Ananascomosus)、番荔枝属物种(Annona spp.)、旱芹(Apium graveolens)、蜘蛛兰属物种(Arachis spp.)、木波罗属物种(Artocarpus spp.)、石刁柏(Asparagusofficinalis)、燕麦属物种(Avena spp.)(例如燕麦(Avena sativa)、野燕麦(Avenafatua)、比赞燕麦(Avena byzantina)、野燕麦原变种(Avena fatua var.sativa)、杂种燕麦(Avena hybrida)、阳桃(Averrhoa carambola)、箣竹属(Bambusasp.)、冬瓜(Benincasa hispida)、巴西栗(Bertholletia excelsea)、甜菜(Betavulgaris)、芸苔属物种(Brassica spp.)(例如欧洲油菜(Brassica napus)、芜青物种(Brassica rapa ssp.)[卡诺拉油菜、油菜(oilseed rape)、蔓青(turniprape)])、Cadaba farinosa、茶(Camellia sinensis)、美人蕉(Canna indica)、大麻(Cannabis sativa)、辣椒属物种(Capsicum spp.)、Carex elata、番木瓜(Carica papaya)、大果假虎刺(Carissa macrocarpa)、山核桃属物种(Caryaspp.)、红花(Carthamus tinctorius)、栗属物种(Castanea spp.)、美洲木棉(Ceiba pentandra)、苦苣(Cichorium endivia)、樟属物种(Cinnamomum spp.)、西瓜(Citrullus lanatus)、柑桔属物种(Citrus spp.)、椰子属物种(Cocos spp.)、咖啡属物种(Coffea spp.)、芋头(Colocasia esculenta)、非洲梧桐属物种(Colaspp.)、黄麻属(Corchorus sp.)、芫荽(Coriandrum sativum)、榛属物种(Corylusspp.)、山楂属物种(Crataegus spp.)、番红花(Crocus sativus)、南瓜属物种(Cucurbita spp.)、香瓜属物种(Cucumis spp.)、菜蓟属物种(Cynara spp.)、胡萝卜、山马蝗属物种(Desmodium spp.)、龙眼(Dimocarpus longan)、薯蓣属物种(Dioscorea spp.)、柿树属物种(Diospyros spp.)、稗属物种(Echinochloa spp.)、油棕属(Elaeis)(例如油棕(Elaeis guineensis)、美洲油棕(Elaeis oleifera))、穇子(Eleusine coracana)、埃塞俄比亚画眉草(Eragrostistef)、蔗茅属物种(Erianthus sp.)、枇杷(Eriobotrya japonica)、桉属物种(Eucalyptus sp.)、红仔果(Eugenia uniflora)、荞麦属物种(Fagopyrum spp.)、水青冈属物种(Fagus spp.)、苇状羊茅(Festuca arundinacea)、无花果(Ficuscarica)、金桔属物种(Fortunella spp.)、草莓属物种(Fragaria spp.)、银杏(Ginkgo biloba)、大豆属(Glycine spp.)(例如大豆(Glycine max)、大豆(Sojahispida)或大豆(Soja max))、陆地棉(Gossypium hirstum)、向日葵属(Helianthus spp.)(例如向日葵(Helianthus annuus))、长管萱草(Hemerocallisfulva)、木槿属物种(Hibiscus spp.)、大麦属(Hordeum spp.)(例如大麦(Hordeum vulgare))、甘薯(Ipomoea batatas)、核桃属物种(Juglans spp.)、莴苣(Lactuca sativa)、山黧豆属物种(Lathyrus spp.)、兵豆(Lens culinaris)、亚麻(Linum usitatissimum)、荔枝(Litchi chinensis)、百脉根属物种(Lotusspp.)、棱角丝瓜(Luffa acutangula)、羽扇豆属物种(Lupinus spp.)、Luzulasylvatica、番茄属物种(Lycopersicon spp.)(例如番茄(Lycopersiconesculentum)、番茄(Lycopersicon lycopersicum)、番茄(Lycopersiconpyriforme))、硬皮豆属物种(Macrotyloma spp.)、苹果属物种(Malus spp.)、凹缘金虎尾(Malpighia emarginata)、牛油果(Mammea americana)、芒果(Mangifera indica)、木薯属物种(Manihot spp.)、人心果(Manilkara zapota)、苜蓿(Medicago sativa)、草木樨属物种(Melilotus spp.)、薄荷属物种(Menthaspp.)、芒(Miscanthus sinensis)、苦瓜属物种(Momordica spp.)、黑桑(Morusnigra)、芭蕉属物种(Musa spp.)、烟草属物种(Nicotiana spp.)、木犀榄属物种(Olea spp.)、仙人掌属物种(Opuntia spp.)、鸟足豆属物种(Ornithopusspp.)、稻属物种(Oryza spp.)(例如稻、阔叶稻(Oryza latifolia))、稷(Panicummiliaceum)、柳枝稷(Panicum virgatum)、鸡蛋果(Passiflora edulis)、欧防风(Pastinaca sativa)、狼尾草属物种(Pennisetum sp.)、鳄梨属物种(Perseaspp.)、欧芹(Petroselinum crispum)、虉草(Phalaris arundinacea)、菜豆属物种(Phaseolus spp.)、猫尾草(Phleum pratense)、刺葵属物种(Phoenix spp.)、南方芦苇(Phragmites australis)、酸浆属物种(Physalis spp.)、松属物种(Pinusspp.)、阿月浑子(Pistacia vera)、豌豆属物种(Pisum spp.)、早熟禾属物种(Poaspp.)、杨属物种(Populus spp.)、牧豆草属物种(Prosopis spp.)、李属物种(Prunus spp.)、番石榴属物种(Psidium spp.)、石榴(Punica granatum)、西洋梨(Pyrus communis)、栎属物种(Quercus spp.)、萝卜(Raphanus sativus)、波叶大黄(Rheum rhabarbarum)、茶藨子属物种(Ribes spp.)、蓖麻(Ricinuscommunis)、悬钩子属物种(Rubus spp.)、甘蔗属物种(Saccharum spp.)、柳属物种(Salix sp.)、接骨木属物种(Sambucus spp.)、黑麦(Secale cereale)、胡麻属物种(Sesamum spp.)、白芥属物种(Sinapis sp.)、茄属(Solanumspp.)(例如马铃薯(Solanum tuberosum)、红茄(Solanum integrifolium)或番茄)、两色蜀黍(Sorghum bicolor)、菠菜属物种(Spinacia spp.)、蒲桃属物种(Syzygium spp.)、万寿菊属物种(Tagetes spp.)、酸豆(Tamarindus indica)、可可树(Theobroma cacao)、车轴草属物种(Trifolium spp.)、鸭茅状摩擦禾(Tripsacum dactyloides)、Triticosecale rimpaui、小麦属(Triticum spp.)(例如普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、圆柱小麦(Triticum turgidum)、Triticum hybernum、马卡小麦(Triticum macha)、普通小麦(Triticum sativum)或普通小麦(Triticum vulgare))、小金莲花(Tropaeolum minus)、金莲花(Tropaeolum majus)、越桔属物种(Vacciniumspp.)、野碗豆属物种(Vicia spp.)、豇豆属物种(Vigna spp.)、香堇(Violaodorata)、葡萄属物种(Vitis spp.)、玉米(Zea mays)、Zizania palustris、枣属物种(Ziziphus spp.)及其他。
发明详述:
出人意料地,现在已经发现:调节植物中编码bHLH6样多肽的核酸表达产生了相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码bHLH6样多肽的核酸表达。
用于调节(优选提高)编码bHLH6样多肽的核酸表达的优选方法是在植物中导入并表达编码bHLH6样多肽的核酸。
在一个实施方案中,下文对“在本发明方法中有用的蛋白质”的任意称谓意指如本文中定义的bHLH6样多肽。在同一实施方案中,下文对“在本发明方法中有用的核酸”的任意称谓意指能够编码这种bHLH6样多肽的核酸。在一个实施方案中,待导入植物(并且因而在实施本发明方法中有用)的核酸是编码现在将描述的蛋白质类型的任意核酸,下文也称作“bHLH6样核酸”或“bHLH6样基因”。
如本文中定义的“bHLH6样多肽”指下述的任意多肽,其包含有后附HLH结构域(HMMPFam PF00010、ProfileScan PS50888、SMARTSM00353)的碱性结构域,从而形成碱性螺旋-环-螺旋结构域(InterproIPR001092)。优选地,所述bHLH6样多肽包含至少1个、优选2个、更优选3个或多个以下基序:
基序1(SEQ ID NO:3):L(G/E/T)WX(D/E)(G/S)X(Y/F)(K/N)G(E/D)
其中第4位X可以是任何氨基酸,优选转角样氨基酸(turnlike aminoacid),更优选G、R、K、T和S之一;并且其中第7位X可以是任何氨基酸,优选疏水或极性氨基酸,更优选Y、F、N和H之一。
基序2(SEQ ID NO:4):
G(V/I)(V/I/L)E(V/L/I)(G/A)(S/V/T/A)(T/L/S)(E/D/S)
基序3(SEQ ID NO:5):(D/E)K(A/V/I)S(L/I/V)L(G/D/E/A)
基序4(SEQ ID NO:6):(T/N/S)LQ(Q/H)RLQ
基序5(SEQ ID NO:7):
(K/F)(I/F/V)(I/L/V/M/S)G(W/L/R/N/E)(E/D)AM(I/V)(G/R)(V/I)(Q/N/E/Y)
基序6(SEQ ID NO:8):
(H/Y)(A/S)(S/N)(V/C/M/L/T)(S/Q)(V/C/S)(V/MF)(K/N/S)(D/C/E)(L/Q/F/M)(M/R/L)(I/F/L)(Q/D/H)(Q/D/V)
备选地,bHLH6样蛋白的同源物以增加的优选顺序与SEQ ID NO:2所表示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%整体序列同一性,条件是该同源蛋白包含上文所列出的保守基序。使用全局比对算法如程序GAP(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选地采用默认参数,确定整体序列同一性。与整体序列同一性相比较,当仅考虑保守的结构域或基序时,所述序列同一性通常将更高。序列保守性在bHLH结构域区域中高得多(见实施例3中的表B2和图2)。因此,bHLH结构域是定义bHLH6样蛋白组的良好标准。优选地,bHLH6样多肽包含基序7(SEQ ID NO:9)的序列:PKKRGRKPANGREEPLNHVEAERQRREKLNQRFYALRAVVPNVSKMDKASLLGDAIAYINELKSKVVKTE,或以增加的优选顺序与SEQ IDNO:9具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。如由SMART确定的HLH结构域覆盖SEQ ID NO:2中的第454至503位残基并且被包含在基序7中。
优选地,当多肽序列在构建进化系统树例如Li等人(2006)中的图6所描述的进化系统树中使用时,在亚组N(其包含由SEQ ID NO:2所表示的氨基酸序列)中聚类,而不与任何其他组聚类。
优选地,编码bHLH6样多肽的基因组DNA序列不包含内含子。
术语“结构域”、“标签”和“基序”在本文中的“定义”部分定义。存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等人(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等人(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation).(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白质组服务器(The proteomics server for in-depth proteinknowledge and analysis),Nucleic Acids Res.31:3784-3788(2003))。结构域或基序也可以使用常规技术如通过序列比对进行鉴定。
用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等人(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于开展BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用(an application that generates similarity/identitymatrices using protein or DNA sequences))。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。利用上文提及的程序,使用默认参数可以在完整核酸或氨基酸序列范围或选定的结构域或保守基序范围内确定序列同一性值。对于局部比对,所述Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
另外,bHLH6样多肽(至少以它们的天然形式)一般具有DNA结合活性。用于测定DNA结合活性的工具和技术在本领域是熟知的。另外,如本发明中所示的,当bHLH6样蛋白(如SEQ ID NO:2)在稻中过量表达时,产生具有增强的产量相关性状、尤其出苗萌发势和/或每株圆锥花序增加的花数的植物。其他生物测定在Dombrecht等人(Plant Cell 19,2225-2245,2007)。在实施例部分提供其他细节。
本发明通过用SEQ ID NO:1所表示的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:2的多肽序列。但是,本发明的实施不限于这些序列;本发明的方法可以有利地使用任意编码bHLH6样的核酸或如本文中定义的bHLH6样多肽实施。
编码bHLH6样多肽的核酸的例子在本文实施例1的表A1中给出。此类核酸用于实施本发明的方法中。在实施例1的表A1中给出的氨基酸序列是由SEQ ID NO:2所表示的bHLH6样多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文中定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用实施例1的表A1中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST搜索(第二BLAST),其中查询序列从所述的生物中衍生(在查询序列是SEQ ID NO:1或SEQ ID NO:2的情况下,第二BLAST因而将针对拟南芥(Arabidopsis thaliana)序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且在反向BLAST时,优选地产生属于最高命中当中的该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,比较过程也通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚类和鉴定直向同源物和旁系同源物。
核酸变体也可以用于实施本发明的方法中。此类变体的例子包括编码在实施例1的表A1中所给出的任一氨基酸序列的同源物和衍生物的核酸,术语“同源物”和“衍生物”如本文中定义。还用于本发明方法中的是这样的核酸,其编码在实施例1的表A1中所给出的任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物。用于本发明方法中的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。
在实施本发明方法中有用的其他核酸变体包括编码bHLH6样多肽的核酸的部分、与编码bHLH6样多肽的核酸杂交的核酸、编码bHLH6样多肽的核酸的剪接变体、编码bHLH6样多肽的核酸的等位变体和通过基因改组获得的编码bHLH6样多肽的核酸的变体。术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。
编码bHLH6样多肽的核酸不需要是全长核酸,因为本发明方法的实施不取决于全长核酸序列的使用。根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例1的表A1中给出的任一核酸序列的一部分或编码实施例1的表A1中所给出任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的一部分。
核酸的一部分可以例如通过对所述核酸产生一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生组合有几种活性的蛋白质。与其他编码序列融合时,在翻译时产生的所得多肽可以比对于该蛋白质部分所预测的多肽更大。
在本发明方法中有用的部分编码如本文中定义的bHLH6样多肽,并且具有如实施例1的表A1中所给出氨基酸序列基本上相同的生物学活性。优选地,此部分是在实施例1的表A1中给出的任一核酸的一部分,或是编码在实施例1的表A1中所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地,该部分的长度是至少500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200个连续核苷酸,所述连续核苷酸为实施例1的表A1中给出的任一核酸序列或为编码在实施例1的表A1中所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选地,该部分是SEQ IDNO:1的核酸的一部分。优选地,该部分编码氨基酸序列的片段,其中所述的氨基酸序列在构建进化系统树例如Li等人(2006)中的图6所描述的进化系统树中使用时,在亚组N(其包含由SEQ ID NO:2所表示的氨基酸序列)中聚类,而不与任何其他组聚类。
在本发明方法中有用的另一种核酸变体是能够在降低的严格条件下、优选在严格条件下与编码如本文中定义的bHLH6样多肽的核酸或与如本文中定义的部分杂交的核酸。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达能够与实施例1的表A1中给出的任一核酸杂交的核酸,或包括在植物中导入并表达这样的核酸,其中所述核酸能够与编码在实施例1的表A1中给出的任意核酸序列的直向同源物、旁系同源物或同源物的核酸杂交。
在本发明方法中有用的杂交序列编码如本文中定义的bHLH6样多肽,其具有如实施例1的表A1中所给出氨基酸序列基本上相同的生物学活性。优选地,该杂交序列能够与实施例1的表A1中给出的任一核酸或与这些序列中任意序列的一部分杂交,所述的一部分如上文定义,或其中所述杂交序列能够与核酸杂交,其中所述的核酸编码在实施例1的表A1中给出的任一氨基酸序列的直向同源物或旁系同源物。最优选地,该杂交序列能够与如SEQ ID NO:1所表示的核酸或与其一部分杂交。
优选地,该杂交序列编码具有下述氨基酸序列的多肽,其中所述的氨基酸序列是全长的且在构建进化系统树例如Li等人(2006)中的图6所描述的进化系统树中使用时,在亚组N(其包含由SEQ ID NO:2所表示的氨基酸序列)中聚类,而不与任何其他组聚类。
在本发明方法中有用的另一种核酸变体是编码如上文所定义的bHLH6样多肽的剪接变体,剪接变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例1的表A1中给出的任一核酸序列的剪接变体或编码实施例1的表A1中所给出任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
优选的剪接变体是由SEQ ID NO:1所表示的核酸的剪接变体,或是编码SEQ ID NO:2的直向同源物或旁系同源物的核酸的剪接变体。优选地,由该剪接变体编码的氨基酸序列在构建进化系统树例如Li等人(2006)中的图6所描述的进化系统树中使用时,在亚组N(其包含由SEQ ID NO:2所表示的氨基酸序列)中聚类,而不与任何其他组聚类。
在实施本发明方法中有用的另一种核酸变体是编码如上文所定义bHLH6样多肽的核酸的等位变体,等位变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例1的表A1中给出的任一核酸的等位变体,或包括在植物中导入并表达编码在实施例1的表A1中所给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变体。
由本发明方法中有用的等位变体编码的多肽具有如SEQ ID NO:2的bHLH6样多肽和实施例1的表A1中所述任意氨基酸基本上相同的生物学活性。等位变体存在于自然界中,并且在本发明的方法中包括这些天然等位基因的用途。优选地,所述等位变体是SEQ ID NO:1的等位变体或编码SEQ ID NO:2的直向同源物或旁系同源物的核酸的等位变体。优选地,由该等位变体编码的氨基酸序列在构建进化系统树例如Li等人(2006)中的图6所描述的进化系统树中使用时,在亚组N(其包含由SEQ ID NO:2所表示的氨基酸序列)中聚类,而不与任何其他组聚类。
基因改组或定向进化也可以用来产生编码如上文定义的bHLH6样多肽的核酸的变体;术语“基因改组”如本文中定义。优化bHLH蛋白质的例子由Pattanaik等人(BBA1759,308-318,2006)提供。该方法可以用于选择优化的bHLH6样蛋白质用于增强植物中的产量相关性状。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例1的表A1中给出的任一核酸序列的变体,或包括在植物中导入并表达核酸的变体,所述的核酸编码在实施例1的表A1中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物,其中所述的变体核酸通过基因改组获得。
优选地,由通过基因改组获得的变体核酸所编码的氨基酸序列在构建进化系统树例如Li等人(2006)中的图6所描述的进化系统树中使用时,在亚组N(其包含由SEQ ID NO:2所表示的氨基酸序列)中聚类,而不与任何其他组聚类。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码bHLH6样多肽的核酸可以衍生自任何天然来源或人工来源。该核酸可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码bHLH6样多肽的核酸来自植物,进一步优选地来自双子叶植物,更优选地来自十字花科(Brassicaceae),最优选地该核酸来自拟南芥。
本发明方法的实施产生了具有增强的产量相关性状的植物。尤其,本发明方法的实施产生了相对于对照植物而言,具有提高的产量、尤其提高的种子产量的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。
本文中对增强的产量相关性状的称谓意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获的)部分和/或(可收获的)地下部分。尤其,此类可收获部分是种子,并且本发明方法的实施产生了相对于对照植物的种子产量而言,具有提高的种子产量的植物。应当注意增强的产量相关性状不包括对渗透胁迫增加的抗性,增加的氧化胁迫抗性或增加的对昆虫的抗性。
以谷物为例,产量提高可以表现为以下一个或多个指标:每平方米已建立的植物数目增加、每株植物穗数的提高、行数、每行核粒数、核粒重、千粒重、穗长度/直径的提高、种子饱满率(即饱满种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每平方米植物数、每株植物的圆锥花序数、每圆锥花序的小穗数、每个圆锥花序的花(小花)数目(其表述为饱满种子数对原发圆锥花序数的比)、种子饱满率(即饱满种子数除以种子总数并乘以100)提高、千粒重提高及其他。
本发明提供了用于相对于对照植物提高植物的产量、尤其种子产量的方法,所述方法包括调节植物中编码如本文中定义的bHLH6样多肽的核酸表达。
由于本发明的转基因植物具有提高的产量,故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段(在其生活周期的至少部分期间)表现提高的生长速率。
提高的生长速率可以是植物的一个或多个部分(包括种子)特有的,或可以基本上遍及整个植物。具有提到的生长速率的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长直至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或在基本上整个植物生活周期期间发生。提高的生长速率在植物生活周期的早期期间可以反映增强的萌发势。生长速率的提高可以改变植物的收获周期,从而允许植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均处于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适的植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每平方米一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时期(旱季)或在收获时期(晚季)的不利环境条件决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到50%最大植物大小所花费的时间)和T-90(植物达到90%最大植物大小所花费的时间),以及其他。
根据本发明的优选特征,本发明方法的实施产生了相对于对照植物而言,具有提高的生长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包括在植物中调节编码如本文中定义的bHLH6样多肽的核酸表达。
与对照植物相比较,无论所述植物处于非胁迫条件下或无论所述植物暴露于多种胁迫,产量和/或生长速率的提高均出现。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,但同时不能恢复生长。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见生物胁迫和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌、线虫和昆虫引起的那些胁迫。
具体而言,本发明的方法可以在非胁迫条件下或在轻度干旱条件开展以产生相对于对照植物具有提高的产量的植物。如Wang等人(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等人(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫之间极高程度的“交互作用”。例如,干旱和/或盐化作用主要表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以引起功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号传导途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在非胁迫条件下或在轻度干旱条件下培育的植物提高的产量。因此,根据本发明,提供了用于在非胁迫条件下或在轻度干旱条件下培育的植物中提高产量的方法,所述方法包括调节植物中编码bHLH6样多肽的核酸表达。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在营养缺乏条件下、尤其在缺氮条件下培育的植物提高的产量。因此,根据本发明,提供了用于在营养缺乏条件下培育的植物中提高产量的方法,所述方法包括调节植物中编码bHLH6样多肽的核酸表达。营养缺乏可以因营养物如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等缺少所致。
本发明包括通过本发明方法可获得的植物或其部分(包括种子)。所述植物或其部分包含编码如上文定义的bHLH6样多肽的核酸转基因。
本发明也提供了基因构建体和载体以促进在植物中导入和/或表达编码bHLH6样多肽的核酸。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供了如本文中定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供了构建体,其包含:
(a)编码如上文定义的bHLH6样多肽的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(c)转录终止序列。
优选地,编码bHLH6样多肽的核酸如上文定义。术语“调控序列”和“终止序列”如本文中的定义。
用包含任意上述核酸的载体转化植物。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。该目的序列有效地与一个或多个调控序列(至少与启动子)连接。
有利地,任意类型的启动子,无论是天然的或合成的,可以用来驱动所述核酸序列的表达。植物来源的组成型启动子是在所述方法中特别有用的。优选地,该组成型启动子也是遍在启动子。对于多种启动子类型的定义,见本文中的“定义”部分。优选地,植物组成型启动子是中等强度的启动子并且比CaMV 35S启动子强度要低。
应当明白本发明的应用不限于由SEQ ID NO:1表示的编码bHLH6样多肽的核酸,本发明的应用也不限于编码bHLH6样多肽的核酸在受组成型启动子驱动时的表达。
组成型启动子优选地是GOS2启动子,优选地是来自稻的GOS2启动子。还优选地,所述组成型启动子由基本上与SEQ ID NO:12相似的核酸序列表示,最优选地该组成型启动子如SEQ ID NO:12所表示。对于组成型启动子的其他例子,见本文中的“定义”部分中的表2a。
任选地,可以在导入植物的构建体中使用一个或多个终止子序列。优选地,该构建体包含表达盒,所述表达盒与SEQ ID NO:56基本相似或相同,包含GOS2启动子,以及编码所述bHLH6样多肽的核酸。
额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5’非翻译区(UTR)或编码序列中,以提高细胞质内聚集的成熟信使的数量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括对于在特定细胞类型中维持和/或复制所需要的复制起点序列。一个例子是当需要基因构建体作为游离型遗传元件(例如质粒或粘粒分子)在细菌细胞中维持时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如用于本发明方法中的核酸序列的成功转移和/或选择包含这些核酸的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。一旦不再需要所述标记基因时,可以从转基因细胞中去掉或切除它们。用于移出标记的技术是本领域已知的,有用技术在上文定义部分中描述。
本发明也提供了用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增强的产量相关性状,其中所述方法包括在植物中导入并表达编码如上文所定义的bHLH6样多肽的任意核酸。
更具体地,本发明提供了用于产生转基因植物的方法,所述转基因植物具有增加的增强产量相关性状、尤其提高的出苗萌发势和/或种子产量,其中所述方法包括:
(i)在植物或植物细胞中导入并表达编码bHLH6样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
(i)的核酸可以是能够编码如本文中定义的bHLH6样多肽的任意核酸。
所述核酸可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育期间后,通过喷洒进行合适的选择。另一种可能性在于根据需要消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。备选地,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的子代,唯一要求是子代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也包括含有编码如本文以上所定义bHLH6样多肽的分离核酸的宿主细胞。本发明的优选宿主细胞是植物细胞。对于本发明方法中所用核酸或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明的方法有利地适用于任意植物。在本发明方法中特别有用的植物包括属于植物界超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的例子包括大豆、向日葵、卡诺拉油菜(canola)、苜蓿、油菜、亚麻、棉花、番茄、马铃薯和烟草。还优选地,所述植物是单子叶植物。单子叶植物的例子包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的例子包括稻、玉米、小麦、大麦、谷子(millet)、裸麦(rye)、黑小麦(triticale)、高粱、二粒小麦、斯佩尔特小麦(spelt)、黑麦属(secale)、单粒小麦、埃塞俄比亚画眉草(teff)、蜀黍(milo)和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根、根状茎、块茎和球茎。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是增加的表达。用于增加核酸或基因或基因产物表达的方法是本领域中充分经文献报道的并且在定义部分中提供了例子。
如上所述,用于调节编码bHLH6样多肽的核酸表达的优选方法是通过在植物中导入并表达编码bHLH6样多肽的核酸;但是,实施本方法的效果,即增强产量相关性状,也可以使用包括但不限于T-DNA活化标签法、TILLING、同源重组在内的其他熟知技术实现。在定义部分中提供了对这些技术的描述。
本发明也包括编码如本文中所述bHLH6样多肽的核酸的用途,和这些bHLH6样多肽的用途,用于增强植物中任意的前述产量相关性状。
编码本文中所述bHLH6样多肽的核酸或bHLH6样多肽自身可以用于育种程序中,在所述育种程序中鉴定到可以遗传地与编码bHLH6样多肽的基因连锁的DNA标记。所述核酸/基因或bHLH6样多肽自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
编码bHLH6样多肽的核酸/基因的等位变体也可以用于标记辅助的育种程序中。此类育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,所述程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致产量提高的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括将其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码bHLH6样多肽的核酸也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且用作与这些基因连锁的性状的标记。此类信息可以用于植物育种中,以开发具有所希望表型的品系。编码bHLH6样多肽的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码bHLH6样多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用编码bHLH6样多肽的核酸探测。所得的条带图式随后可以使用计算机程序如MapMaker(Lander等人(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和子代。DNA多态性的分离是明显的并用来计算编码bHLH6样多肽的核酸在先前使用这个群体获得的遗传图中的位置(Botstein等人(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。许多出版物描述了使用以上概述的方法学或其变例对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一个实施方案中,所述核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等人(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。方法例子包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等人(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等人(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等人(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。但是,这通常对作图法而言不是必需的。
如前文所述,本发明方法产生了具有增强的产量相关性状的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
在一个实施方案中,本发明涉及总结如下的主题:
条目1:在植物中相对于对照植物增强产量相关性状的方法,其包括在植物中调节编码bHLH6样多肽的核酸的表达,其中所述bHLH6样多肽包含HLH结构域。
条目2:根据条目1的方法,其中所述bHLH6-样多肽包含一个或多个下述基序:
基序1(SEQ ID NO:3),
基序2(SEQ ID NO:4),
基序3:(SEQ ID NO:5)
基序7(SEQ ID NO:9)或与SEQ ID NO:9具有至少80%序列同一性的序列。
条目3:根据条目1或2的方法,其中所述调节的表达通过在植物中导入和表达编码bHLH6样多肽的核酸来实现。
条目4:根据任何前述条目的方法,其中所述编码bHLH6样多肽的核酸编码表A1中所列的任一蛋白质或者是此类核酸的一部分,或者是能够与此类核酸杂交的核酸。
条目5:根据任何前述条目的方法,其中所述核酸序列编码表A1中所给出的任何蛋白质的直向同源物或旁系同源物。
条目6:根据任何前述条目的方法,其中所述增强的产量相关性状包括相对于对照植物提高的产量、优选提高的出苗萌发势和/或提高的种子产量。
条目7:根据条目1至6任一项的方法,其中所述增强的产量相关性状在非胁迫条件下获得。
条目8:根据条目3至7中任一项的方法,其中所述核酸与组成型启动子,优选与GOS2启动子,最优选与来自稻的GOS2启动子有效连接。
条目9:根据任何前述条目的方法,其中所述编码bHLH6样多肽的核酸是植物来源的,优选来自双子叶植物,进一步优选来自十字花科(Brassicaceae),更优选来自拟南芥属(Arabidopsis),最优选来自拟南芥(Arabidopsis thaliana)。
条目10:植物或其部分,其包括种子,通过根据任何前述条目的方法可获得,其中所述植物或其部分包含编码bHLH6样多肽的重组核酸。
条目11:构建体,其包含
(a)编码在条目1或2中定义的bHLH6样多肽的核酸;
(b)一个或多个调控序列,其能够驱动(a)的核酸序列的表达;以及任选地
(c)转录终止序列。
条目12:根据条目11的构建体,其中所述调控序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
条目13:根据条目11或12的构建体在方法中的用途,所述方法用于制备相对于对照植物具有提高的产量,特别是提高的出苗萌发势和/或提高的种子产量的植物。
条目14:用根据条目10或11的构建体转化的植物、植物部分或植物细胞。
条目15:用于产生转基因植物的方法,所述植物相对于对照植物具有提高的产量,特别是提高的生物量和/或提高的种子产量,所述方法包括:
(i)在植物中导入和表达编码如条目1或2中所定义的bHLH6样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
条目16:相对于对照植物具有提高的产量、特别是提高的生物量和/或提高的种子产量的转基因植物或来自所述转基因植物的转基因植物细胞,所述转基因植物获得自编码如条目1或2所定义的bHLH6样多肽的核酸的调节的表达。
条目17:根据条目10、14或16的转基因植物或来自其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷物,例如稻、玉米、小麦、大麦、谷子(millet)、裸麦(rye)、黑小麦(triticale)、高粱、二粒小麦(emmer)、斯佩尔特小麦(spelt)、黑麦属(secale)、单粒小麦(einkorn)、埃塞俄比亚画眉草(teff)、蜀黍(milo)和燕麦。
条目18:根据条目17的植物的可收获部分,其中所述可收获部分优选是枝条生物量和/或种子。
条目19:来自根据条目17的植物和/或来自根据条目19的植物可收获部分的产品。
条目20:编码bHLH6样多肽的核酸在相对于对照植物在植物中提高产量,特别是提高种子产量和/或枝条生物量中的用途。
在本发明的另一个实施方案中,现在发现在植物中调节编码GRP多肽的核酸序列的表达提供了具有相对于对照植物增强的产量相关性状的植物,其中所述GRP多肽是RrmJ/FtsJ核糖体RNA甲基转移酶多肽。根据第一个实施方案,本发明提供了在植物中相对于对照植物增强产量相关性状的方法,所述方法包括在植物中调节编码GRP多肽的核酸序列的表达,其中所述GRP多肽是RrmJ/FtsJ核糖体RNA甲基转移酶多肽(RrmJ/FtsJ多肽)。
用于调节(优选增加)编码GRP多肽的核酸序列表达的优选的方法是通过在植物中导入和表达编码GRP多肽的核酸序列。
在一个实施方案中,下文对“在本发明方法中有用的蛋白质”的任意称谓意指如本文中定义的GRP多肽。在同一实施方案中,下文对“在本发明方法中有用的核酸”的任意称谓意指能够编码这种GRP多肽的核酸序列。在一个实施方案中,待导入植物(并且因而在实施本发明方法中有用)的核酸序列是编码现在将描述的蛋白质类型的任意核酸序列,下文也称作“GRP核酸”或“GRP基因”。
在一个实施方案中,本文定义的“GRP多肽”是指由SEQ ID NO:58、由SEQ ID NO:60所表示的蛋白质,以及其同源物(直向同源物和旁系同源物)。实施例1的表A2在本文中显示了此类直向同源物和旁系同源物。
优选地,SEQ ID NO:58或SEQ ID NO:60的同源物具有核糖体RNA甲基转移酶RrmJ/FtsJ结构域(InterPro进入(entry)IPR002877和IPR015507;Pfam进入PF01728;PANTHER进入PTHR10920)。
可选地或另外地,本文定义的“GRP多肽”涉及任何多肽,所述多肽与SEQ ID NO:58或SEQ ID NO:60所表示的GRP多肽或者与本文实施例1的表A2中所给出的任何多肽序列以优选增加的顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更多的多肽序列同一性。
在一个实施方案中,本发明的方法使用部分GRP多肽,其中GRP多肽是RrmJ/FtsJ多肽。可以通过存在数个熟知的特征(见上)之一或多个来鉴定GRP多肽。鉴定GRP多肽时,本领域的技术人员可以容易地使用常规技术衍生可以用于实施本发明方法的相应的编码部分GRP的核酸序列。
术语“结构域”和“基序”在本文中的“定义”部分定义。存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等人(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等人(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation).(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白质组服务器(The proteomics server for in-depth proteinknowledge and analysis),Nucleic Acids Res.31:3784-3788(2003))。结构域或基序也可以使用常规技术如通过序列比对进行鉴定。
用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等人(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于开展BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用(an application that generates similarity/identitymatrices using protein or DNA sequences))。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。利用上文提及的程序,使用默认参数可以在完整核酸序列或多肽序列范围或在选定的结构域或保守基序范围内确定序列同一性值。
此外,GRP多肽,在涉及到SEQ ID NO:58、SEQ ID NO:60以及其同源物时,通常具有在核糖体的氨酰(A)1-位点中的第U2552位处甲基化23S核糖体RNA的能力,这仅在当23S rRNA存在于50S核糖体亚基中时。用于测定rRNA甲基转移酶活性的工具和技术是本领域熟知的,例如在Hager等人(2004)J Bacteriol 186(19):6634-6642中。
本发明通过用SEQ ID NO:57所表示的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:58的多肽序列。但是,本发明的实施不限于这些序列;本发明的方法可以有利地使用任意编码GRP的核酸序列或如本文中定义的GRP多肽实施。
编码GRP多肽的核酸的例子在本领域已知的数据库中发现。此类核酸用于实施本发明的方法中。直向同源物和旁系同源物(术语“直向同源物”和“旁系同源物”如本文中定义)可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用SEQ ID NO:58或SEQ ID NO:60)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST搜索(第二BLAST),其中查询序列从所述的生物中衍生(在查询序列是SEQ ID NO:57、SEQ IDNO:58、SEQ IDNO:59或SEQ ID NO:60的情况下,第二BLAST因而将针对烟草(Nicotiana tabacum)序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且在反向BLAST时,优选地产生属于最高命中当中的该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,比较过程也通过同一性百分数评分。同一性百分数指两个所比较的核酸序列(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚类和鉴定直向同源物和旁系同源物。
编码SEQ ID NO:58或SEQ ID NO:60的同源物和衍生物的核酸变体也可以用于实施本发明的方法中,术语“同源物”和“衍生物”如本文中定义。还用于本发明方法中的是这样的核酸,其编码SEQ ID NO:58或SEQ IDNO:60的直向同源物或旁系同源物的同源物和衍生物。用于本发明方法中的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。
在实施本发明方法中有用的其他核酸序列变体包括编码GRP多肽的核酸的部分、与编码GRP多肽的核酸杂交的核酸、编码GRP多肽的核酸的剪接变体、编码GRP多肽的核酸的等位变体和通过基因改组获得的编码GRP多肽的核酸的变体。术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。
编码GRP多肽的核酸不需要是全长核酸,因为本发明方法的实施不取决于全长核酸序列的使用。根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达SEQ ID NO:57的一部分或SEQID:59的一部分或编码SEQ ID NO:60的直向同源物、旁系同源物或同源物的核酸序列的一部分。
核酸序列的一部分可以例如通过对所述核酸产生一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生组合有几种活性的蛋白质。与其他编码序列融合时,在翻译时产生的所得多肽可以比对于该蛋白质部分所预测的多肽更大。
在本发明方法中有用的部分编码如本文中定义的GRP多肽,并且具有如SEQ ID NO:58或SEQ ID NO:60中所给出多肽序列基本上相同的生物学活性。优选地,此部分是在SEQ ID NO:57或SEQ ID NO:59中给出的核酸的一部分,或是编码在SEQ ID NO:58或SEQ ID NO:60中所给出的多肽序列的直向同源物或旁系同源物的核酸序列的一部分。优选地,该部分的长度是至少400、450、500、550、600、650、700、750个连续核苷酸,所述连续核苷酸属于SEQ ID NO:57或SEQ ID NO:59,或属于编码SEQ ID NO:58或SEQ ID NO:60的直向同源物或旁系同源物的核酸序列。最优选地,该部分是SEQ ID NO:57或SEQ ID NO:59的核酸序列的一部分。
在本发明方法中有用的另一种核酸序列变体是能够在降低的严格条件下、优选在严格条件下与编码如本文中定义的GRP多肽的核酸序列或与如本文中定义的部分杂交的核酸序列。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达能够与SEQ ID NO:57或与SEQ ID NO:59杂交的核酸序列,或包括在植物中导入并表达能够与编码SEQ ID NO:58或SEQ IDNO:60的直向同源物、旁系同源物或同源物的核酸序列杂交的核酸序列。
在本发明方法中有用的杂交序列编码如本文中定义的GRP多肽,具有如SEQID NO:58中所给出多肽序列基本上相同的生物学活性。优选地,该杂交序列能够与SEQ ID NO:57或SEQ ID NO:59或与任何这些序列的一部分杂交,所述的一部分如上文定义,或所述杂交序列能够与编码SEQID NO:58或SEQ ID NO:60的直向同源物或旁系同源物的核酸序列杂交。
在本发明方法中有用的另一种核酸序列变体是编码如上文所定义的GRP多肽的剪接变体,剪接变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达SEQ ID NO:57或SEQ ID NO:59的剪接变体或编码SEQID NO:58或SEQ ID NO:60的直向同源物、旁系同源物或同源物的核酸序列的剪接变体。
在实施本发明方法中有用的另一种核酸序列变体是编码如上文所定义GRP多肽的核酸序列的等位变体,等位变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达SEQ ID NO:57或SEQ ID NO:59的等位变体,或包括在植物中导入并表达核酸序列的等位变体,其中所述核酸序列编码由SEQ IDNO:58或SEQ ID NO:60表示的多肽序列的直向同源物、旁系同源物或同源物。
本发明方法中有用的等位变体具有与SEQ ID NO:58或SEQ IDNO:60的GRP多肽基本上相同的生物学活性。等位变体存在于自然界中,并且在本发明的方法中包括这些天然等位基因的用途。基因改组或定向进化也可以用来产生编码如上文定义的GRP多肽的核酸的变体;术语“基因改组”如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达SEQ ID NO:57或SEQ ID NO:59的变体,或包括在植物中导入并表达编码SEQ ID NO:58或SEQ ID NO:60的直向同源物、旁系同源物或同源物的核酸序列的变体,其中所述变体核酸序列通过基因改组获得。
另外,核酸序列变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码GRP多肽的核酸可以衍生自任何天然来源或人工来源。该核酸序列可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码GRP多肽的核酸序列来自植物。在SEQ ID NO:57或SEQ ID NO:59的情况下,编码GRP多肽的核酸序列优选地来自双子叶植物,更优选地来自茄科(Solanaceae),该核酸序列最优选地来自烟草(Nicotiana tabacum)。
本发明方法的实施产生了具有增强的产量相关性状的植物。尤其,本发明方法的实施产生了相对于对照植物而言,具有提高的早期萌发势和提高的产量、尤其提高的生物量和提高的种子产量的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。
本文中对增强的产量相关性状的称谓意指早期萌发势和/或植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获的)部分和/或(可收获的)地下部分。尤其,此类可收获部分是生物量和/或种子,并且本发明方法的实施产生了相对于对照植物的早期萌发势、生物量或种子产量而言,具有提高的早期萌发势、生物量或种子产量的植物。
以谷物为例,产量提高可以表现为以下一个或多个指标:每公顷或英亩已建立的植物数目增加、每株植物穗数的提高、行数、每行核粒数、核粒重、千粒重、穗长度/直径的提高、种子饱满率(即饱满种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每公顷或英亩植物数、每株植物的圆锥花序数、每圆锥花序的小穗数、每个圆锥花序的花(小花)数目(其表述为饱满种子数对原发圆锥花序数的比)、种子饱满率(即饱满种子数除以种子总数并乘以100)提高、千粒重提高及其他。
本发明提供了用于相对于对照植物增强植物的产量相关性状、尤其生物量和/或种子产量的方法,所述方法包括调节植物中编码如本文中定义的GRP多肽的核酸序列表达,优选地增加该核酸表达。
由于本发明的转基因植物具有增强的产量相关性状,故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段(在其生活周期的至少部分期间)表现提高的生长速率。
提高的生长速率可以是植物的一个或多个部分(包括种子)特有的,或可以基本上遍及整个植物。具有提到的生长速率的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长直至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或在基本上整个植物生活周期期间发生。提高的生长速率在植物生活周期的早期期间可以反映增强的萌发势。生长速率的提高可以改变植物的收获周期,从而允许植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均处于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适的植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时期(早季)或在收获时期(晚季)的不利环境条件决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到50%最大植物大小所花费的时间)和T-90(植物达到90%最大植物大小所花费的时间),以及其他。
根据本发明的优选特征,本发明方法的实施产生了相对于对照植物而言,具有提高的生长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包括在植物中调节、优选地提高编码如本文中定义的GRP多肽的核酸序列表达。
与对照植物相比较,无论所述植物处于非胁迫条件下或无论所述植物暴露于多种胁迫,出现产量相关性状的增强(产量和/或生长速率的提高)。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,但同时不能恢复生长。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见生物胁迫和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。本文中使用的术语“非胁迫”条件是那些环境条件,其允许植物的最佳生长。本领域的技术人员已知给定的地点的正常土壤条件和气候条件。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在非胁迫条件下或在轻度干旱条件下培育的植物增强的产量相关性状。因此,根据本发明,提供了用于在非胁迫条件下或在轻度干旱条件下培育的植物中增强产量相关性状的方法,所述方法包括在植物中调节,优选增加编码GRP多肽的核酸序列的表达。
根据本发明方法的实施产生在非生物胁迫条件下生长的植物,其相对于在可比较胁迫条件下生长的对照植物而言具有增强的产量相关性状,优选增强的种子产量相关性状。如Wang等人(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等人(PlantPhysiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫之间极高程度的“交互作用”。例如,干旱和/或盐化作用主要表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以引起功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号传导途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。由于多样的环境胁迫激活相似的途径,本发明干旱胁迫的例子不应当被视为限于干旱胁迫,而更应当被视为指示了下述的视窗:上述定义的GRP多肽一般在非生物胁迫中相对于在可比较胁迫条件中生长的对照植物增强产量相关性状,优选增强种子产量相关性状中的参与。
如本文中定义的术语“非生物胁迫”意指以下任意一项或多项:水胁迫(因干旱或过量的水所致)、缺氧胁迫、盐胁迫、温度胁迫(因热、寒冷或冰冻温度所致)、化学毒性胁迫和氧化胁迫。根据本发明的一个方面,所述非生物胁迫是渗透胁迫,其选自水胁迫、盐胁迫、氧化胁迫和离子胁迫。优选地,所述水胁迫是干旱胁迫。术语“盐胁迫”不限于常见盐(NaCl),不过可以是由NaCl、KCl、LiCl、MgCl2、CaCl2等中一种或多种盐引起的任意胁迫。
相对于在可比较胁迫条件下培育的对照植物,本发明方法的实施产生这样的植物,所述植物在非生物胁迫条件下具有增强的产量相关性状、优选增强的种子产量相关性状。因此,根据本发明,提供了用于在非生物胁迫条件下培育的植物中增强产量相关性状、优选增强种子产量相关性状的方法,所述方法包括调节植物中编码GRP多肽的核酸序列表达。根据本发明的一个方面,所述非生物胁迫是渗透胁迫,其选自以下一个或多个胁迫:水胁迫、盐胁迫、氧化胁迫和离子胁迫。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在营养缺乏条件下、尤其在缺氮条件下培育的植物增强的产量相关性状。因此,根据本发明,提供了用于在营养缺乏条件下培育的植物中增强产量相关性状的方法,所述方法包括调节,优选增加植物中编码GRP多肽的核酸序列的表达。营养缺乏可以因营养物如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等缺少所致。
本发明包括通过本发明方法可获得的植物、其部分(包括种子)或植物细胞。所述植物、其部分或植物细胞包含编码如上文定义的GRP多肽的核酸转基因。
本发明也提供了基因构建体和载体以促进在植物中导入和/或表达编码GRP多肽的核酸。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供了如本文中定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供了构建体,其包含:
(a)编码如上文定义的GRP多肽的核酸序列;
(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(c)转录终止序列。
优选地,编码GRP多肽的核酸序列如上文定义。术语“调控序列”和“终止序列”如本文中的定义。
用包含任意上述核酸的载体转化植物。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。该目的序列有效地与一个或多个调控序列(至少与启动子)连接。
有利地,任意类型的启动子,无论是天然的或人工的,可以用来驱动所述核酸序列的表达。种子特异性启动子是在本发明方法中特别有用的。对于多种启动子类型的定义,见本文中的“定义”部分。
应当明白本发明的应用不限于由SEQ ID NO:57或SEQ ID NO:59表示的编码GRP多肽的核酸序列,本发明的应用也不限于编码GRP多肽的核酸序列在受种子特异性启动子驱动时的表达。
种子特异性启动子优选地是油质蛋白启动子,优选地是来自稻的油质蛋白启动子。还优选地,所述油质蛋白启动子由基本上与SEQ ID NO:91相似的核酸序列表示,最优选地该油质蛋白启动子如SEQ ID NO:91所表示。对于种子特异性启动子的其他例子,见本文中的“定义”部分的表2b。
任选地,可以在导入植物的构建体中使用一个或多个终止子序列。额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5’非翻译区(UTR)或编码序列中,以提高细胞质内聚集的成熟信使的数量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括对于在特定细胞类型中维持和/或复制所需要的复制起点序列。一个例子是当需要基因构建体作为游离型遗传元件(例如质粒或粘粒分子)在细菌细胞中维持时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如用于本发明方法中的核酸序列的成功转移和/或选择包含这些核酸的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。一旦不再需要所述标记基因时,可以从转基因细胞中去掉或切除它们。用于移出标记的技术是本领域已知的,有用技术在上文定义部分中描述。
本发明也提供了用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增强的产量相关性状,其中所述方法包括在植物中导入并表达编码如上文所定义的GRP多肽的任意核酸序列。
更具体地,本发明提供了用于产生转基因植物的方法,所述转基因植物具有增强产量相关性状,其中所述方法包括:
(i)在植物、植物部分或植物细胞中导入并表达编码GRP多肽的核酸序列;和
(ii)在促进植物生长和发育的条件下培养植物、植物部分或植物细胞。
(i)的核酸序列可以是能够编码如本文中定义的GRP多肽的任意核酸。
所述核酸序列可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸序列优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育期间后,通过喷洒进行合适的选择。另一种可能性在于根据需要消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。备选地,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的子代,唯一要求是子代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也包括含有编码如本文以上所定义GRP多肽的分离核酸序列的宿主细胞。本发明的优选宿主细胞是植物细胞。对于本发明方法中所用核酸或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明的方法有利地适用于任意植物。在本发明方法中特别有用的植物包括属于植物界超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的例子包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,所述植物是单子叶植物。单子叶植物的例子包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的例子包括稻、玉米、小麦、大麦、谷子、裸麦、黑小麦、高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根、根状茎、块茎和球茎。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是增加的表达。用于增加核酸或基因或基因产物表达的方法是本领域中充分经文献报道的并且在定义部分中提供了例子。
如上所述,用于调节(优选地增加)编码GRP多肽的核酸序列表达的优选方法是通过在植物中导入并表达编码GRP多肽的核酸序列;但是,实施本方法的效果,即增强产量相关性状,也可以使用包括但不限于T-DNA活化标签法、TILLING、同源重组在内的其他熟知技术实现。在定义部分中提供了对这些技术的描述。
本发明也包括编码如本文中所述GRP多肽的核酸的用途,和这些GRP多肽的用途,用于增强植物中任意的前述产量相关性状。
编码本文中所述GRP多肽的核酸或GRP多肽自身可以用于育种程序中,在所述育种程序中鉴定到可以遗传地与编码GRP多肽的基因连锁的DNA标记。所述核酸/基因或GRP多肽自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
编码GRP多肽的核酸/基因的等位变体也可以用于标记辅助的育种程序中。此类育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,所述程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致增强产量相关性状的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括将其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码GRP多肽的核酸也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且用作与这些基因连锁的性状的标记。此类信息可以用于植物育种中,以开发具有所希望表型的品系。编码GRP多肽的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码GRP多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用编码GRP的核酸探测。所得的条带图式随后可以使用计算机程序如MapMaker(Lander等人(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和子代。DNA多态性的分离是明显的并用来计算编码GRP多肽的核酸序列在先前使用这个群体获得的遗传图中的位置(Botstein等人(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。许多出版物描述了使用以上概述的方法学或其变例对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸序列探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一个实施方案中,所述核酸序列探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等人(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸序列扩增的方法可以使用所述核酸而实施。方法例子包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等人(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等人(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)NucleicAcid sequence Res.18:3671)、放射杂交作图(Walter等人(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acidsequence Res.17:6795-6807)。对于这些方法,使用一种核酸序列的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。但是,这通常对作图法而言不是必需的。
如前文所述,本发明方法产生了具有增强的产量相关性状的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
在本说明书中使用的术语“表A2”是为了指定表A2a和表A2b的内容。本说明书中使用的术语“表A2a”是为了指定表A2a中的内容。本说明书中使用的术语“表A2b”是为了指定表A2b中的内容。在一个优选的实施方案中,术语“表A2”意思是表A2b。
在一个实施方案中,本发明涉及总结如下的主题:
条目21:在植物中相对于对照植物增强产量相关性状的方法,其包括在植物中调节编码GRP的核酸序列的表达以及任选地选择具有增强的产量相关性状的植物,其中所述GRP是RrmJ/FtsJ核糖体RNA甲基转移酶多肽(RrmJ/FtsJ多肽)。
条目22:根据条目21的方法,其中所述GRP多肽包含核糖体RNA甲基转移酶RrmJ/FtsJ结构域(InterPro进入IPR002877和IPR015507;Pfam进入PF01728;PANTHER进入PTHR10920)。
条目23:根据条目21或22的方法,其中所述GRP多肽与SEQ IDNO:58或SEQ ID NO:60所表示的GRP多肽或者与实施例1的表A2中所给出的任何多肽序列以优选增加的顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更多的多肽序列同一性。
条目24:根据条目21至23的任一项的方法,其中所述编码GRP多肽的核酸序列由下述表示:表A2中所给出的任一核酸序列SEQ ID NO或其部分,或能够与实施例1的表A2中给出的任一核酸序列SEQ ID NO杂交的序列。
条目25:根据任一前述条目的方法,其中所述调节的表达通过在植物中导入和表达编码所述GRP多肽的核酸序列来实现。
条目26:根据任一前述条目的方法,其中所述增强的产量相关性状包括相对于对照植物提高的种子产量、提高的饱满种子数、提高的种子饱满率以及提高的收获指数。
条目27.根据任一前述条目的方法,其中所述调节的表达是增加的表达。
条目28:根据任一前述条目的方法,其中所述核酸序列与种子特异性启动子,优选与油质蛋白启动子,最优选与来自稻的油质蛋白启动子有效连接。
条目29:根据任一前述条目的方法,其中所述编码GRP多肽的核酸序列是植物来源,优选来自双子叶植物,进一步优选来自茄科(Solanaceae),更优选来自烟草(Nicotiana tabacum)。
条目30:包含选自以下的核酸序列的分离的核酸序列:
a)编码如SEQ ID NO:97、99、101和/或103和/或表A2b中所示的多肽的分离的核酸分子;
b)如SEQ ID NO:96、98、100和/或102和/或表A2b所示的分离的核酸分子;
c)分离的核酸分子,其作为遗传密码子简并性的结果,可以来自如表A2中所示的多肽序列并且赋予相对于对照植物增强的产量相关性状;
d)分离的核酸分子,其与多核苷酸的核酸分子序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的序列同一性并且赋予相对于对照植物增强的产量相关性状,所述多核苷酸包含表A2中所示的核酸分子;
e)编码多肽并且赋予了相对于对照植物增强的产量相关性状的分离的核酸分子,所述多肽与(a)至(c)的核酸分子所编码的多肽的氨基酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的序列同一性;
f)分离的核酸分子,其与(a)至(c)的核酸分子在严格杂交条件下杂交并且赋予相对于对照植物增强的产量相关性状;
g)编码多肽的分离的核酸分子,所述多肽包含图5中所示的共有序列或一个或多个多肽基序,并且所述分离的核酸分子优选地具有下述核酸分子所代表的活性,所述核酸分子包含表A2中所示的多核苷酸;
h)编码多肽并且赋予相对于对照植物增强的产量相关性状的分离的核酸分子,所述多肽具有如表A2中所示的蛋白质所代表的活性;
以及
i)通过在严格杂交条件下用探针或用其片段筛选适当的核酸文库可获得的核酸分子,所述探针包含(a)或(b)的核酸分子的互补序列,所述可获得的核酸分子具有与(a)至(e)中表征的核酸分子序列互补的核酸分子的至少15nt、优选20nt、30nt、50nt、100nt、200nt或500nt并且编码具有活性的多肽,所述活性由包含表A2中所示的多肽的蛋白质所代表;
其中根据(a)至(i)的核酸分子至少在一个或多个核苷酸上不同于表A2a中所示的序列并且优选地编码下述蛋白质,所述蛋白质至少在一个或多个氨基酸上不同于表A2a中所示的蛋白质序列。
条目31:通过根据任一前述条目的方法可获得的植物、其部分(包括种子)或植物细胞,其中所述植物、其部分或植物细胞包含(优选根据条目30)编码GRP多肽的核酸转基因。
条目32:构建体,其包含
(i)编码如条目21至24所定义的GRP多肽或由条目30的核酸分子所编码的多肽的核酸序列;
(ii)一个或多个能够驱动(i)的核酸序列表达的调控序列;以及任选地
(iii)转录终止序列。
条目33:根据条目32的构建体,其中所述调控序列之一是种子特异性启动子,优选油质蛋白启动子,最优选来自稻的油质蛋白启动子。
条目34:根据条目32或33的任一项的构建体或根据条目30的核酸在制备下述植物的方法中的用途,所述植物相对于对照植物具有增强的产量相关性状,特别是提高的种子产量、提高的饱满种子数、提高的种子饱满率以及提高的收获指数。
条目35:用根据条目32或33的任一项的构建体转化的植物、植物部分或植物细胞。
条目36:用于产生转基因植物的方法,所述转基因植物具有相对于对照植物增强的产量相关性状,所述方法包括:
(i)在植物、植物部分或植物细胞中导入和表达核酸序列,所述核酸序列编码如条目21至24所定义的GRP多肽或者由条目30的核酸分子所编码的多肽;以及
(ii)在促进植物生长和发育的条件下培养植物、植物部分或植物细胞。
条目37:相对于对照植物具有增强的产量相关性状、特别是提高的种子产量、提高的饱满种子数、提高的种子饱满率以及提高的收获指数的转基因植物或来自所述转基因植物的转基因植物细胞,所述转基因植物从下述产生:编码如条目21至24中所定义的GRP多肽的核酸序列的增加的表达,或者条目30的核酸分子所编码的多肽的增加的表达。
条目38:根据条目31、35或37的转基因植物,或来自其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷物,例如稻、玉米、小麦、大麦、谷子、裸麦、黑小麦、高粱和燕麦。
条目39:根据条目38的包含编码GRP多肽的核酸序列的植物的可收获部分,其中所述可收获部分优选为种子。
条目40:来自根据条目38的植物和/或来自根据条目39的植物的可收获部分的产品。
条目41:编码GRP多肽的核酸序列在植物中相对于对照植物增强产量相关性状、特别是在增加特别是提高种子产量、提高饱满种子数、提高种子饱满率、以及提高收获指数中的用途。
根据本发明的另一个实施方案,还提供了包含选自以下的多肽序列的分离的多肽:
(i)由条目30所表示的任一核酸所编码的氨基酸序列;
(ii)与(i)的氨基酸序列以优选增加的顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列;
(iii)上文(i)或(ii)中所给出的任何氨基酸序列的衍生物。
在本发明的另一个实施方案中,现在发现在植物中调节(优选增加)编码GRP多肽的核酸序列的表达提供了具有相对于对照植物增强的产量相关性状(优选增强的种子产量相关性状)的植物,其中所述GRP多肽是碱性-螺旋-环-螺旋4(bHLH4)多肽。根据第一个实施方案,本发明提供了在植物中相对于对照植物增强产量相关性状(优选增强的种子产量相关性状)的方法,所述方法包括在植物中调节(优选增加)编码GRP多肽的核酸序列的表达,其中所述GRP多肽是碱性-螺旋-环-螺旋4(bHLH4)多肽。
用于调节(优选增加)编码GRP多肽的核酸序列表达的优选的方法是通过在植物中导入和表达编码GRP多肽的核酸序列。
下文对“在本发明方法中有用的蛋白质”的任意称谓意指如本文中定义的GRP多肽。下文对“在本发明方法中有用的核酸序列”的任意称谓意指能够编码这种GRP多肽的核酸序列。待导入植物(并且因而在实施本发明方法中有用)的核酸序列是编码现在将描述的蛋白质类型的任意核酸序列,下文也称作“GRP核酸序列”或“GRP基因”。
在本发明的一个实施方案中,本文定义的“GRP多肽”是指由SEQ IDNO:105所表示的蛋白质,以及其直向同源物、旁系同源物和同源物。实施例1的表A3在本文中显示了此类直向同源物和旁系同源物。
优选地,SEQ ID NO:105的直向同源物、旁系同源物和同源物具有碱性-螺旋-环-螺旋二聚化区域(其具有InterPro进入IPR001092)和螺旋-环-螺旋DNA-结合(其具有InterPro进入IPR011598)。
可选地或另外地,本文定义的“GRP多肽”涉及任何多肽,所述多肽与SEQ ID NO:105所表示的GRP多肽或者与本文实施例1的表A3中所给出的任何多肽序列以优选增加的顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更多的氨基酸序列同一性。
术语“结构域”和“基序”在本文中的“定义”部分定义。存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等人(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等人(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation).(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白质组服务器(The proteomics server for in-depth proteinknowledge and analysis),Nucleic Acids Res.31:3784-3788(2003))。结构域或基序也可以使用常规技术如通过序列比对进行鉴定。
用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等人(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于开展BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用(an application that generates similarity/identitymatrices using protein or DNA sequences))。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。利用上文提及的程序,使用默认参数可以在完整核酸序列或多肽序列范围或在选定的结构域或保守基序范围内确定序列同一性值。
此外,GRP多肽,在涉及SEQ ID NO:105以及其直向同源物、旁系同源物和同源物时,一般具有结合DNA(至少以其天然形式)的能力,而并非必须地具有转录调节活性以及与其它蛋白质相互作用的能力。因此,具有降低的转录调节活性、无转录调节活性、具有降低的蛋白质-蛋白质相互作用能力或无蛋白质-蛋白质相互作用能力的GRP多肽可以等价地被用于本发明的方法。DNA结合活性和蛋白质-蛋白质相互作用可以使用本领域熟知的技术(例如在Current Protocols in Molecular Biology,第1和2卷,Ausubel等人(1994),Current Protocols中)轻易地在体外或体内测定。为了测定GRP多肽的DNA结合活性,可用几种测定法,如DNA结合凝胶迁移率测定法(或凝胶阻滞测定法;Korfhage等人(1994)Plant C 6:695-708)、体外DNA结合作用测定法(Schindler等人(1993)Plant J 4(1):137-150)或GRP多肽在酵母、动物和植物细胞中的转录激活作用。GRP多肽通常与被称为E-框,CANNTG的共有序列结合。规范的E-框是CACGTG(回文),但是一些bHLH4转录因子结合不同的序列,所述不同序列通常与E-框类似。可以使用使用随机寡核苷酸选择技术(Viola和Gonzalez(2007年5月26)Biochemistry)确定特定的DNA结合序列。
本发明通过用SEQ ID NO:104所表示的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:105的多肽序列。但是,本发明的实施不限于这些序列;本发明的方法可以有利地使用任意编码GRP的核酸序列或如本文中定义的GRP多肽实施。
编码GRP多肽的核酸序列的例子在本领域已知的数据库中发现。此类核酸序列用于实施本发明的方法中。直向同源物和旁系同源物(术语“直向同源物”和“旁系同源物”如本文中定义)可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用SEQ ID NO:105)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST搜索(第二BLAST),其中查询序列从所述的生物中衍生(在查询序列是SEQ ID NO:104或SEQ ID NO:105的情况下,第二BLAST因而将针对拟南芥序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且在反向BLAST时,优选地产生属于最高命中当中的该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,比较过程也通过同一性百分数评分。同一性百分数指两个所比较的核酸序列(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚类和鉴定直向同源物和旁系同源物。
编码SEQ ID NO:105的同源物和衍生物的核酸序列变体也可以用于实施本发明的方法中,术语“同源物”和“衍生物”如本文中定义。还用于本发明方法中的是这样的核酸序列,其编码SEQ ID NO:105的直向同源物或旁系同源物的同源物和衍生物。用于本发明方法中的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。
在实施本发明方法中有用的其他核酸序列变体包括编码GRP多肽的核酸序列的部分、与编码GRP多肽的核酸序列杂交的核酸序列、编码GRP多肽的核酸序列的剪接变体、编码GRP多肽的核酸序列的等位变体和通过基因改组获得的编码GRP多肽的核酸序列的变体。术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。
编码GRP多肽的核酸序列不需要是全长核酸序列,因为本发明方法的实施不取决于全长核酸序列的使用。根据本发明,提供了用于增强植物中产量相关性状(优选增强的种子产量相关性状)的方法,包括在植物中导入并表达SEQ ID NO:104的一部分或编码SEQ ID NO:105的直向同源物、旁系同源物或同源物的核酸序列的一部分。
核酸序列的一部分可以例如通过对所述核酸序列产生一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生组合有几种活性的蛋白质。与其他编码序列融合时,在翻译时产生的所得多肽可以比对于该蛋白质部分所预测的多肽更大。
在本发明方法中有用的部分编码如本文中定义的GRP多肽,并且具有如SEQ ID NO:105中所给出多肽序列基本上相同的生物学活性。优选地,此部分是在SEQ ID NO:104中给出的核酸序列的一部分,或是编码在SEQ ID NO:105中所给出的多肽序列的直向同源物或旁系同源物的核酸序列的一部分。优选地,该部分的长度是至少500、600、700、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750或更多个连续核苷酸,所述连续核苷酸属于SEQ ID NO:104,或属于编码SEQ ID NO:105的直向同源物或旁系同源物的核酸序列。最优选地,该部分是SEQ ID NO:104的核酸序列的一部分。
在本发明方法中有用的另一种核酸序列变体是能够在降低的严格条件下、优选在严格条件下与编码如本文中定义的GRP多肽的核酸序列或与如本文中定义的部分杂交的核酸序列。
根据本发明,提供了用于增强植物中产量相关性状(优选增强的种子产量相关性状)的方法,包括在植物中导入并表达能够与SEQ ID NO:104杂交的核酸序列,或包括在植物中导入并表达能够与编码SEQ ID NO:105的直向同源物、旁系同源物或同源物的核酸序列杂交的核酸序列。
在本发明方法中有用的杂交序列编码如本文中定义的GRP多肽,具有如SEQ ID NO:105中所给出多肽序列基本上相同的生物学活性。优选地,该杂交序列能够与SEQ ID NO:104或与该序列的一部分杂交,所述的一部分如上文定义,或所述杂交序列能够与编码SEQ ID NO:105的直向同源物或旁系同源物的核酸序列或其部分杂交。
在本发明方法中有用的另一种核酸序列变体是编码如上文所定义的GRP多肽的剪接变体,剪接变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状(优选增强种子产量相关性状)的方法,包括在植物中导入并表达SEQ ID NO:104的剪接变体或编码SEQ ID NO:105的直向同源物、旁系同源物或同源物的核酸序列的剪接变体。
在实施本发明方法中有用的另一种核酸序列变体是编码如上文所定义GRP多肽的核酸序列的等位变体,等位变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状(优选增强种子产量相关性状)的方法,包括在植物中导入并表达SEQ ID NO:104的等位变体,或包括在植物中导入并表达核酸序列的等位变体,其中所述核酸序列编码由SEQ ID NO:105表示的多肽序列的直向同源物、旁系同源物或同源物。
本发明方法中有用的等位变体具有与SEQ ID NO:105的GRP多肽基本上相同的生物学活性。等位变体存在于自然界中,并且在本发明的方法中包括这些天然等位基因的用途。基因改组或定向进化也可以用来产生编码如上文定义的GRP多肽的核酸序列的变体;术语“基因改组”如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状(优选增强种子产量相关性状)的方法,包括在植物中导入并表达SEQ ID NO:104的变体核酸序列,或包括在植物中导入并表达编码SEQ ID NO:105的直向同源物、旁系同源物或同源物的核酸序列的变体,其中所述变体核酸序列通过基因改组获得。
另外,核酸序列变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码GRP多肽的核酸序列可以衍生自任何天然来源或人工来源。该核酸序列可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码GRP多肽的核酸序列来自植物。在SEQ IDNO:104的情况下,编码GRP多肽的核酸序列优选地来自双子叶植物,更优选地来自十字花科(Brassicaceae),该核酸序列最优选地来自拟南芥(Arabidopsis thaliana)。
本发明方法的实施产生了具有增强的产量相关性状(特别是增强的种子产量相关性状)的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。
本文中对增强的产量相关性状的称谓意指早期萌发势和/或植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获的)部分和/或(可收获的)地下部分。尤其,此类可收获部分是生物量和/或种子,并且本发明方法的实施产生了相对于对照植物的早期萌发势、生物量或种子产量而言,具有提高的早期萌发势、生物量或种子产量的植物。
以谷物为例,产量提高可以表现为以下一个或多个指标:每公顷或英亩已建立的植物数目增加、每株植物穗数的提高、行数、每行核粒数、核粒重、千粒重、穗长度/直径的提高、种子饱满率(即饱满种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每公顷或英亩植物数、每株植物的圆锥花序数、每圆锥花序的小穗数、每个圆锥花序的花(小花)数目(其表述为饱满种子数对原发圆锥花序数的比)、种子饱满率(即饱满种子数除以种子总数并乘以100)提高、千粒重提高及其他。
本发明提供了用于相对于对照植物增强植物的产量相关性状、尤其生物量和/或种子产量的方法,所述方法包括调节(优选增加)植物中编码如本文中定义的GRP多肽的核酸序列表达。
由于本发明的转基因植物具有增强的产量相关性状(优选增强的种子产量相关性状),故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段(在其生活周期的至少部分期间)表现提高的生长速率。
提高的生长速率可以是植物的一个或多个部分(包括种子)特有的,或可以基本上遍及整个植物。具有提到的生长速率的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长直至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或在基本上整个植物生活周期期间发生。提高的生长速率在植物生活周期的早期期间可以反映增强的萌发势。生长速率的提高可以改变植物的收获周期,从而允许植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均处于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适的植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时期(早季)或在收获时期(晚季)的不利环境条件决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到50%最大植物大小所花费的时间)和T-90(植物达到90%最大植物大小所花费的时间),以及其他。
根据本发明的优选特征,本发明方法的实施产生了相对于对照植物而言,具有提高的生长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包括在植物中调节(优选地提高)编码如本文中定义的GRP多肽的核酸序列表达。
与对照植物相比较,无论所述植物处于非胁迫条件下或无论所述植物暴露于多种胁迫,出现产量相关性状的增强(种子产量和/或生长速率的提高)。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,但同时不能恢复生长。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见生物胁迫和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、线虫、真菌和昆虫引起的那些胁迫。本文中使用的术语“非胁迫”条件是那些环境条件,其允许植物的最佳生长。本领域的技术人员已知给定的地点的正常土壤条件和气候条件。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在非胁迫条件下或在轻度胁迫条件下培育的植物具有增强的产量相关性状,优选增强的种子产量相关性状。因此,根据本发明,提供了用于在非胁迫条件下或在轻度胁迫条件下培育的植物中增强产量相关性状(优选增强的种子产量相关性状)的方法,所述方法包括在植物中调节(优选增加)编码GRP多肽的核酸序列的表达。
根据本发明方法的实施产生在非生物胁迫条件下生长的植物,其相对于在可比较胁迫条件下生长的对照植物而言具有增强的产量相关性状,优选增强的种子产量相关性状。如Wang等人(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等人(PlantPhysiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫之间极高程度的“交互作用”。例如,干旱和/或盐化作用主要表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以引起功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号传导途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。由于多样的环境胁迫激活相似的途径,相对于在可比较非生物胁迫条件下培育的对照植物而言,在一种类型的非生物胁迫生长条件下具有增强的产量相关性状(优选增强的种子产量相关性状)的植物不应当被视为限于非生物胁迫生长条件的该类型,而更应当视为指示了如上文所定义的GRP多肽一般在非生物胁迫生长条件中增强产量相关性状中的参与。
如本文中定义的术语“非生物胁迫”意指以下任意一项或多项:水胁迫(因干旱或过量的水所致)、缺氧胁迫、盐胁迫、温度胁迫(因热、寒冷或冰冻温度所致)、化学毒性胁迫和氧化胁迫。根据本发明的一个方面,所述非生物胁迫是渗透胁迫,其选自水胁迫、盐胁迫、氧化胁迫和离子胁迫。优选地,所述水胁迫是干旱胁迫。术语“盐胁迫”不限于常见盐(NaCl),不过可以是由NaCl、KCl、LiCl、MgCl2、CaCl2等中一种或多种盐引起的任意胁迫。
相对于在可比较胁迫条件下培育的对照植物,本发明方法的实施产生这样的植物,所述植物在非生物胁迫生长条件下具有增强的产量相关性状、优选增强的种子产量相关性状。因此,根据本发明,提供了用于在非生物胁迫生长条件下培育的植物中增强产量相关性状、优选增强种子产量相关性状的方法,所述方法包括调节(优选增加)植物中编码GRP多肽的核酸序列表达。根据本发明的一个方面,所述非生物胁迫是渗透胁迫,其选自以下一个或多个胁迫:水胁迫、盐胁迫、氧化胁迫和离子胁迫。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在降低的营养物有效性条件下、尤其在降低的氮有效性条件下培育的植物增强的产量相关性状,特别是增强种子产量相关性状。因此,根据本发明,提供了用于在降低的营养物有效性条件下培育的植物中增强产量相关性状的方法,所述方法包括调节(优选增加)植物中编码GRP多肽的核酸序列的表达。降低的营养物有效性可以包含营养物如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等的降低的有效性。
本发明包括通过本发明方法可获得的植物、其部分(包括种子)或植物细胞。所述植物、其部分或植物细胞包含编码如上文定义的GRP多肽(优选地碱性-螺旋-环-螺旋4(bHLH4)多肽)的核酸转基因。
本发明也提供了基因构建体和载体以促进在植物中导入和/或表达编码GRP多肽的核酸序列。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供了如本文中定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供了构建体,其包含:
(a)编码如上文定义的GRP多肽(优选碱性-螺旋-环-螺旋4(bHLH4)多肽)的核酸序列;
(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(c)转录终止序列。
优选地,编码GRP多肽的核酸序列如上文定义。术语“调控序列”和“终止序列”如本文中的定义。
用包含任意上述核酸序列的载体转化植物。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。该目的序列有效地与一个或多个调控序列(至少与启动子)连接。
有利地,任意类型的启动子,无论是天然的或人工的,可以用来驱动所述核酸序列的表达。组成型启动子是在本发明方法中特别有用的。对于多种启动子类型的定义,见本文中的“定义”部分。
应当明白本发明的应用不限于由SEQ ID NO:104表示的编码GRP多肽的核酸序列,本发明的应用也不限于编码GRP多肽的核酸序列在受组成型启动子驱动时的表达。
组成型启动子优选地是高速泳动族B(HMGB)启动子,优选地是来自稻的HMGB启动子。还优选地,所述HMGB启动子由基本上与SEQ IDNO:106相似的核酸序列表示,最优选地该HMGB启动子如SEQ ID NO:106所表示。对于组成型启动子的其他例子,见本文中的“定义”部分的表2。
任选地,可以在导入植物的构建体中使用一个或多个终止子序列。额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5’非翻译区(UTR)或编码序列中,以提高细胞质内聚集的成熟信使的数量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括对于在特定细胞类型中维持和/或复制所需要的复制起点序列。一个例子是当需要基因构建体作为游离型遗传元件(例如质粒或粘粒分子)在细菌细胞中维持时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如用于本发明方法中的核酸序列的成功转移和/或选择包含这些核酸序列的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。一旦不再需要所述标记基因时,可以从转基因细胞中去掉或切除它们。用于移出标记的技术是本领域已知的,有用技术在上文定义部分中描述。
本发明也提供了用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增强的产量相关性状(优选增强的种子产量相关性状),其中所述方法包括在植物中导入并表达编码如上文所定义的GRP多肽的核酸序列。
更具体地,本发明提供了用于产生转基因植物的方法,所述转基因植物具有增强产量相关性状,优选增强的种子产量相关性状,其中所述方法包括:
(i)在植物、植物部分或植物细胞中导入并表达编码GRP多肽的核酸序列;和
(ii)在促进植物生长和发育的条件下培养植物、植物部分或植物细胞。
(i)的核酸序列可以是能够编码如本文中定义的GRP多肽(在一个实施方案中所述多肽具有碱性-螺旋-环-螺旋4(bHLH4)多肽的活性)的任意核酸序列。
所述核酸序列可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸序列优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
遗传修饰的植物细胞可以通过技术人员熟悉的全部方法再生。合适的方法可以在上文提及的S.D.Kung和R.Wu,Potrykus或和Willmitzer的出版物中找到。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育期间后,通过喷洒进行合适的选择。另一种可能性在于根据需要消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。备选地,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的子代,唯一要求是子代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也包括含有编码如本文以上所定义GRP多肽的分离核酸序列的宿主细胞。本发明的优选宿主细胞是植物细胞。对于本发明方法中所用核酸转基因或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明的方法有利地适用于任意植物。在本发明方法中特别有用的植物包括属于植物界超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的例子包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,所述植物是单子叶植物。单子叶植物的例子包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的例子包括稻、玉米、小麦、大麦、谷子、裸麦、黑小麦、高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根、根状茎、块茎和球茎。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是增加的表达。用于增加核酸序列或基因或基因产物表达的方法是本领域中充分经文献报道的并且在定义部分中提供了例子。
如上所述,用于调节(优选地增加)编码GRP多肽的核酸序列表达的优选方法是通过在植物中导入并表达编码GRP多肽的核酸序列;但是,实施本方法的效果,即增强产量相关性状,优选增强种子产量相关性状也可以使用包括但不限于T-DNA活化标签法、TILLING、同源重组在内的其他熟知技术实现。在定义部分中提供了对这些技术的描述。
本发明也包括编码如本文中所述GRP多肽的核酸序列的用途,和这些GRP多肽的用途,用于增强植物中任意的前述产量相关性状,优选种子产量相关性状。
编码本文中所述GRP多肽的核酸序列或GRP多肽自身可以用于育种程序中,在所述育种程序中鉴定到可以遗传地与编码GRP多肽的基因连锁的DNA标记。所述基因/核酸序列或GRP多肽自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有如上文所定义的增强的产量相关性状(优选增强的种子产量相关性状)的植物。
编码GRP多肽的核酸序列/基因的等位变体也可以用于标记辅助的育种程序中。此类育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,所述程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致增强产量相关性状(优选增强的种子产量相关性状)的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括将其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码GRP多肽的核酸序列也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且用作与这些基因连锁的性状的标记。此类信息可以用于植物育种中,以开发具有所希望表型的品系。编码GRP多肽的核酸序列的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码GRP多肽的核酸序列可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用编码GRP的核酸序列探测。所得的条带图式随后可以使用计算机程序如MapMaker(Lander等人(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸序列可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和子代。DNA多态性的分离是明显的并用来计算编码GRP多肽的核酸序列在先前使用这个群体获得的遗传图中的位置(Botstein等人(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。许多出版物描述了使用以上概述的方法学或其变例对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸序列探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一个实施方案中,所述核酸序列探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等人(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸序列扩增的方法可以使用所述核酸序列而实施。方法例子包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等人(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等人(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)NucleicAcid Res.18:3671)、放射杂交作图(Walter等人(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸序列的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。但是,这通常对作图法而言不是必需的。
如前文所述,本发明方法产生了具有增强的产量相关性状(优选增强的种子产量相关性状)的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
在本说明书中使用的术语“表A3”是为了指定表A3a和表A3b的内容。本说明书中使用的术语“表A3a”是为了指定表A3a中的内容。本说明书中使用的术语“表A3b”是为了指定表A3b中的内容。在一个优选的实施方案中,术语“表A3”意思是表A3b。
在一个实施方案中,本发明涉及总结如下的主题:
条目42:在植物中相对于对照植物增强产量相关性状,优选增强种子产量相关性状的方法,其包括在植物中调节(优选增加)编码GRP多肽的核酸序列的表达以及任选地选择具有增强的产量相关性状(优选增强的种子产量相关性状)的植物,其中所述GRP多肽是如SEQ ID NO:2所表示的碱性-螺旋-环-螺旋4(bHLH4)多肽或者表A3中所给出的任何多肽或其直向同源物、旁系同源物或同源物。
条目43:根据条目42的方法,其中所述如SEQ ID NO:105所示的GRP多肽以及其直向同源物、旁系同源物或同源物具有碱性-螺旋-环-螺旋二聚化区域(具有InterPro进入IPR001092)和螺旋-环-螺旋DNA结合(具有InterPro进入IPR011598)。
条目44:根据条目42或43的方法,其中所述GRP多肽与SEQ IDNO:105所表示的GRP多肽或者与实施例1的表A3中所给出的任何多肽序列以优选增加的顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更多的氨基酸序列同一性。
条目45:根据任一前述条目42至44的方法,其中所述编码GRP多肽的核酸序列由下述表示:SEQ ID NO:104的核酸序列或其部分,或能够与SEQ ID NO:104的核酸序列或其部分杂交的序列,或者能够与实施例1的表A3中给出的任一核酸序列SEQ ID NO杂交的序列。
条目46:根据任一前述条目42至45的方法,其中所述调节(优选增加)的表达通过在植物中导入和表达编码所述GRP多肽的核酸序列来实现。
条目47:根据任一前述条目42至46的方法,其中所述增强的产量相关性状包括以下一种或多种:相对于对照植物提高的早期萌发势、提高的绿度指数、提高的每株植物的总种子产量、提高的饱满种子数、提高的种子饱满率以及提高的收获指数。
条目48:根据任一前述条目42至47的方法,其中所述调节的表达是增加的表达。
条目49:根据任一前述条目42至48的方法,其中所述核酸序列与组成型启动子,优选与高速泳动族B(high mobility group B)(HMGB)启动子,最优选与来自稻的HMGB启动子有效连接。
条目50:根据任一前述条目42至49的方法,其中所述编码GRP多肽的核酸序列是植物来源,优选来自双子叶植物,进一步优选来自十字花科(Brassicaceae),更优选来自拟南芥(Arabidopsis thaliana)。
条目51:通过根据任一前述条目42至45的方法可获得的植物、其部分(包括种子)或植物细胞,其中所述植物、其部分或植物细胞包含编码GRP多肽的核酸转基因。
条目52:包含选自以下的核酸序列的分离的核酸序列:
a)编码如SEQ ID NO:122、124、126、128和/或130和/或表A3b中所示的多肽的分离的核酸分子;
b)如SEQ ID NO:121、123、125、127和/或129和/或表A3b所示的分离的核酸分子;
c)分离的核酸分子,其作为遗传密码子简并性的结果,可以来自如表A3中所示的多肽序列并且赋予相对于对照植物增强的产量相关性状;
d)分离的核酸分子,其与多核苷酸的核酸分子序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性并且赋予相对于对照植物增强的产量相关性状,所述多核苷酸包含表A3中所示的核酸分子;
e)编码多肽并且赋予了相对于对照植物增强的产量相关性状的分离的核酸分子,所述多肽与(a)至(c)的核酸分子所编码的多肽的氨基酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性;
f)分离的核酸分子,其与(a)至(c)的核酸分子在严格杂交条件下杂交并且赋予相对于对照植物增强的产量相关性状;
g)编码多肽的分离的核酸分子,所述多肽包含图10中所示的共有序列或一个或多个多肽基序,并且所述分离的核酸分子优选地具有下述核酸分子所代表的活性,所述核酸分子包含表A3中所示的多核苷酸;
h)编码多肽并且赋予相对于对照植物增强的产量相关性状的分离的核酸分子,所述多肽具有如表A3中所示的蛋白质所代表的活性;
以及
i)通过在严格杂交条件下用探针或用其片段筛选适当的核酸文库可获得的核酸分子,所述探针包含(a)或(b)的核酸分子的互补序列,所述可获得的核酸分子具有与(a)至(e)中表征的核酸分子序列互补的核酸分子的至少15nt、优选20nt、30nt、50nt、100nt、200nt或500nt并且编码具有活性的多肽,所述活性由包含表A3中所示的多肽的蛋白质所代表;
其中根据(a)至(i)的核酸分子至少在一个或多个核苷酸上不同于表A3a中所示的序列并且优选地编码下述蛋白质,所述蛋白质至少在一个或多个氨基酸上不同于表A3a中所示的蛋白质序列。
条目53:构建体,其包含
(a)如条目42至44或52所定义的编码GRP多肽的核酸序列;一个或多个能够驱动(a)的核酸序列表达的调控序列;以及任选地
(b)转录终止序列。
条目54:根据条目53的构建体,其中所述调控序列之一是组成型启动子,优选HMGB启动子,最优选来自稻的HMGB启动子。
条目55:根据条目53至54的任一项的构建体在制备下述植物的方法中的用途,所述植物相对于对照植物具有增强的产量相关性状,特别是提高的早期萌发势、提高的绿度指数、提高的每株植物的总种子产量、提高的饱满种子数、提高的种子饱满率以及提高的收获指数。
条目56:用根据条目53至54的任一项的构建体转化的植物、植物部分或植物细胞。
条目57:用于产生转基因植物的方法,所述转基因植物具有相对于对照植物增强的产量相关性状,所述方法包括:
(i)在植物、植物部分或植物细胞中导入和表达如条目42至44和52所定义的编码GRP多肽的核酸序列;以及
(ii)在促进植物生长和发育的条件下培养植物、植物部分或植物细胞。
条目58:相对于对照植物具有增强的产量相关性状、特别是提高的早期萌发势、提高的绿度指数、提高的每株植物的总种子产量、提高的饱满种子数、提高的种子饱满率以及提高的收获指数的转基因植物或来自所述转基因植物的转基因植物细胞,所述转基因植物从下述产生:如条目42至44和52中所定义的编码GRP多肽的核酸序列的增加的表达。
条目59:根据条目51、56和58的转基因植物,或来自其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷物,例如稻、玉米、小麦、大麦、谷子、裸麦、黑小麦、高粱和燕麦。
条目60:根据条目59的包含编码GRP多肽的核酸序列的植物的可收获部分,其中所述可收获部分优选为种子。
条目61:来自根据条目59的植物和/或来自根据条目60的植物的可收获部分的产品。
条目62:编码GRP多肽的核酸序列在植物中相对于对照植物增强产量相关性状、特别是提高早期萌发势、提高绿度指数、提高每株植物的总种子产量、提高饱满种子数、提高种子饱满率以及提高收获指数中的用途。
根据本发明的另一个实施方案,还提供了包含选自以下的多肽序列的分离的多肽:
(i)由条目52所表示的任一核酸所编码的氨基酸序列;
(ii)与(i)的氨基酸序列以优选增加的顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列;
(iii)上文(i)或(ii)中所给出的任何氨基酸序列的衍生物。
在本发明的一个实施方案中,现在发现在植物中调节(优选增加)编码GRP多肽的核酸序列的表达提供了具有相对于对照植物增强的产量相关性状的植物,其中所述GRP多肽是异戊烯基转移酶(isopentenyl transferase(IPT))多肽。根据第一个实施方案,本发明提供了在植物中相对于对照植物增强产量相关性状的方法,所述方法包括在植物中调节(优选增加)编码GRP多肽的核酸序列的表达,其中所述GRP多肽是异戊烯基转移酶(IPT)多肽。
用于调节(优选增加)编码GRP多肽的核酸序列表达的优选的方法是通过在植物中导入和表达编码GRP多肽的核酸序列。
下文对“在本发明方法中有用的蛋白质”的任意称谓意指如本文中定义的GRP多肽。下文对“在本发明方法中有用的核酸序列”的任意称谓意指能够编码这种GRP多肽的核酸序列。待导入植物(并且因而在实施本发明方法中有用)的核酸序列是编码现在将描述的蛋白质类型的任意核酸序列,下文也称作“GRP核酸序列”或“GRP基因”。
本文定义的“GRP多肽”是指由SEQ ID NO:132所表示的多肽,以及其直向同源物、旁系同源物和同源物,或者本文实施例1的表A4中给出的任何多肽序列。
优选地,SEQ ID NO:132的直向同源物、旁系同源物和同源物属于具有InterPro进入IPR002627和IPR011593的tRNA异戊烯基转移酶家族。
可选地或另外地,本文定义的“GRP多肽”涉及任何多肽,所述多肽与SEQ ID NO:132所表示的GRP多肽或者与本文实施例1的表A4中所给出的任何多肽序列以优选增加的顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更多的氨基酸序列同一性。
术语“结构域”和“基序”在本文中的“定义”部分定义。存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等人(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等人(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation).(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白质组服务器(The proteomics server for in-depth proteinknowledge and analysis),Nucleic Acids Res.31:3784-3788(2003))。结构域或基序也可以使用常规技术如通过序列比对进行鉴定。
用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等人(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于开展BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用(an application that generates similarity/identitymatrices using protein or DNA sequences))。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。利用上文提及的程序,使用默认参数可以在完整核酸序列或多肽序列范围或在选定的结构域或保守基序范围内确定序列同一性值。
细胞分裂素是植物中细胞分裂和分化的重要调节子,是携带可以被羟基化的异戊烯基侧链的腺嘌呤衍生物。植物具有两类作用于腺嘌呤部分的异戊烯基转移酶(IPT):ATP/ADP异戊烯基转移酶(在拟南芥中,AtIPT1,3,4-8)和tRNA IPT(在拟南芥中AtIPT2和9;Miyawaki等人(2006)ProcNatl Acad Sci U S A.103(44):16598-16603)。如上所述,通过ATP/ADPIPT的ATP和ADP的异戊烯基化(isopentenylation)是iP-和tZ-型细胞分裂素的生物合成中的关键步骤。GRP多肽,在涉及SEQ ID NO:2以及其直向同源物、旁系同源物和同源物时,通常负责iP-和tZ-型细胞分裂素的生物合成中的ATP和ADP的异戊烯基化。测量此类酶活性是本领域中熟知的(例如Miyawaki等人,见上文)。
本发明通过用SEQ ID NO:131所表示的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:132的多肽序列。但是,本发明的实施不限于这些序列;本发明的方法可以有利地使用任意编码GRP的核酸序列或如本文中定义的GRP多肽实施。
编码GRP多肽的核酸序列的例子在本领域已知的数据库中发现。此类核酸序列用于实施本发明的方法中。直向同源物和旁系同源物(术语“直向同源物”和“旁系同源物”如本文中定义)可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用SEQ ID NO:132)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST搜索(第二BLAST),其中查询序列从所述的生物中衍生(在查询序列是SEQ ID NO:131或SEQ ID NO:132的情况下,第二BLAST因而将针对拟南芥序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且在反向BLAST时,优选地产生属于最高命中当中的该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,比较过程也通过同一性百分数评分。同一性百分数指两个所比较的核酸序列(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚类和鉴定直向同源物和旁系同源物。
编码SEQ ID NO:132的同源物和衍生物的核酸序列变体也可以用于实施本发明的方法中,术语“同源物”和“衍生物”如本文中定义。还用于本发明方法中的是这样的核酸序列,其编码SEQ ID NO:132或实施例1的表A4中所给出的任何多肽序列的直向同源物或旁系同源物的同源物和衍生物。用于本发明方法中的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。
在实施本发明方法中有用的其他核酸序列变体包括编码GRP多肽的核酸序列的部分、与编码GRP多肽的核酸序列杂交的核酸序列、编码GRP多肽的核酸序列的剪接变体、编码GRP多肽的核酸序列的等位变体和通过基因改组获得的编码GRP多肽的核酸序列的变体。术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。
编码GRP多肽的核酸序列不需要是全长核酸序列,因为本发明方法的实施不取决于全长核酸序列的使用。根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达SEQ ID NO:131的一部分或编码SEQ ID NO:132的直向同源物、旁系同源物或同源物的核酸序列的一部分。
核酸序列的一部分可以例如通过对所述核酸序列产生一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生组合有几种活性的蛋白质。与其他编码序列融合时,在翻译时产生的所得多肽可以比对于该多肽部分所预测的多肽更大。
在本发明方法中有用的部分编码如本文中定义的GRP多肽,并且具有如SEQ ID NO:132中所给出多肽序列或如实施例1的表A4中所给出的任何多肽序列的基本上相同的生物学活性。优选地,此部分是在SEQ IDNO:131中给出的核酸序列的一部分,或是编码在SEQ ID NO:132中所给出的多肽序列的直向同源物或旁系同源物的核酸序列的一部分。优选地,该部分的长度是至少300、400、500、600、700、800、850、900、950、1000、1050或更多个连续核苷酸,所述连续核苷酸属于SEQ ID NO:131,或属于编码SEQ ID NO:132的直向同源物或旁系同源物的核酸序列。最优选地,该部分是SEQ ID NO:131的核酸序列的一部分。
在本发明方法中有用的另一种核酸序列变体是能够在降低的严格条件下、优选在严格条件下与编码如本文中定义的GRP多肽的核酸序列或与如本文中定义的部分杂交的核酸序列。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达能够与SEQ ID NO:131杂交的核酸序列,或包括在植物中导入并表达能够与编码SEQ ID NO:132或实施例1的表A中所给出的任何多肽序列的直向同源物、旁系同源物或同源物的核酸序列杂交的核酸序列。
在本发明方法中有用的杂交序列编码如本文中定义的GRP多肽,具有如SEQ ID NO:132中所给出多肽序列基本上相同的生物学活性。优选地,该杂交序列能够与SEQ ID NO:131或与该序列的一部分杂交,所述的一部分如上文定义,或所述杂交序列能够与编码SEQ ID NO:132的直向同源物或旁系同源物的核酸序列或与其部分或与实施例1的表A中所给出的任何多肽序列杂交。
在本发明方法中有用的另一种核酸序列变体是编码如上文所定义的GRP多肽的剪接变体,剪接变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达SEQ ID NO:131的剪接变体或编码SEQ ID NO:132的直向同源物、旁系同源物或同源物的核酸序列的剪接变体。
在实施本发明方法中有用的另一种核酸序列变体是编码如上文所定义GRP多肽的核酸序列的等位变体,等位变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达SEQ ID NO:131的等位变体,或包括在植物中导入并表达核酸序列的等位变体,其中所述核酸序列编码由SEQ ID NO:132表示的多肽序列的直向同源物、旁系同源物或同源物。
本发明方法中有用的等位变体具有与SEQ ID NO:132的GRP多肽基本上相同的生物学活性。等位变体存在于自然界中,并且在本发明的方法中包括这些天然等位基因的用途。基因改组或定向进化也可以用来产生编码如上文定义的GRP多肽的核酸序列的变体;术语“基因改组”如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达SEQ ID NO:131的变体核酸序列,或包括在植物中导入并表达编码SEQ ID NO:132的直向同源物、旁系同源物或同源物的核酸序列的变体,其中所述变体核酸序列通过基因改组获得。
另外,核酸序列变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码GRP多肽的核酸序列可以衍生自任何天然来源或人工来源。该核酸序列可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码GRP多肽的核酸序列来自植物。在SEQ IDNO:131的情况下,编码GRP多肽的核酸序列优选地来自双子叶植物,更优选地来自十字花科(Brassicaceae),该核酸序列最优选地来自拟南芥(Arabidopsis thaliana)。
本发明方法的实施产生了具有增强的产量相关性状(优选增强的种子产量相关性状)的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。
本文中对增强的产量相关性状的称谓意指早期萌发势和/或植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获的)部分和/或(可收获的)地下部分。尤其,此类可收获部分是生物量和/或种子,并且本发明方法的实施产生了相对于对照植物的早期萌发势、生物量或种子产量而言,具有提高的早期萌发势、生物量或种子产量的植物。
以谷物为例,产量提高可以表现为以下一个或多个指标:每公顷或英亩已建立的植物数目增加、每株植物穗数的提高、行数、每行核粒数、核粒重、千粒重、穗长度/直径的提高、种子饱满率(即饱满种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每公顷或英亩植物数、每株植物的圆锥花序数、每圆锥花序的小穗数、每个圆锥花序的花(小花)数目(其表述为饱满种子数对原发圆锥花序数的比)、种子饱满率(即饱满种子数除以种子总数并乘以100)提高、千粒重提高及其他。
本发明提供了用于相对于对照植物增强植物的产量相关性状、尤其生物量和/或种子产量的方法,所述方法包括调节(优选增加)植物中编码如本文中定义的GRP多肽的核酸序列表达。
由于本发明的转基因植物具有增强的产量相关性状,故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段(在其生活周期的至少部分期间)表现提高的生长速率。
提高的生长速率可以是植物的一个或多个部分(包括种子)特有的,或可以基本上遍及整个植物。具有提到的生长速率的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长直至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或在基本上整个植物生活周期期间发生。提高的生长速率在植物生活周期的早期期间可以反映增强的萌发势。生长速率的提高可以改变植物的收获周期,从而允许植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均处于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适的植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时期(早季)或在收获时期(晚季)的不利环境条件决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到50%最大植物大小所花费的时间)和T-90(植物达到90%最大植物大小所花费的时间),以及其他。
根据本发明的优选特征,本发明方法的实施产生了相对于对照植物而言,具有提高的生长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包括在植物中调节(优选地提高)编码如本文中定义的GRP多肽的核酸序列表达。
与对照植物相比较,无论所述植物处于非胁迫条件下或无论所述植物暴露于多种胁迫,出现产量相关性状的增强(种子产量和/或生长速率的提高)。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,但同时不能恢复生长。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见生物胁迫和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、线虫、真菌和昆虫引起的那些胁迫。本文中使用的术语“非胁迫”条件是那些环境条件,其允许植物的最佳生长。本领域的技术人员已知给定的地点的正常土壤条件和气候条件。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在非胁迫条件下或在轻度胁迫条件下培育的植物具有增强的产量相关性状。因此,根据本发明,提供了用于在非胁迫条件下或在轻度胁迫条件下培育的植物中增强产量相关性状的方法,所述方法包括在植物中调节(优选增加)编码GRP多肽的核酸序列的表达。
根据本发明方法的实施产生在非生物胁迫条件下生长的植物,其相对于在可比较胁迫条件下生长的对照植物而言具有增强的产量相关性状。如Wang等人(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等人(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫之间极高程度的“交互作用”。例如,干旱和/或盐化作用主要表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以引起功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号传导途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。由于多样的环境胁迫激活相似的途径,相对于在可比较非生物胁迫条件下培育的对照植物而言,在一种类型的非生物胁迫生长条件下具有增强的产量相关性状(优选增强的种子产量相关性状)的植物不应当被视为限于非生物胁迫生长条件的该类型,而更应当视为指示了如上文所定义的GRP多肽一般在非生物胁迫生长条件中增强产量相关性状中的参与。
如本文中定义的术语“非生物胁迫”意指以下任意一项或多项:水胁迫(因干旱或过量的水所致)、缺氧胁迫、盐胁迫、温度胁迫(因热、寒冷或冰冻温度所致)、化学毒性胁迫和氧化胁迫。根据本发明的一个方面,所述非生物胁迫是渗透胁迫,其选自水胁迫、盐胁迫、氧化胁迫和离子胁迫。优选地,所述水胁迫是干旱胁迫。术语“盐胁迫”不限于常见盐(NaCl),不过可以是由NaCl、KCl、LiCl、MgCl2、CaCl2等中一种或多种盐引起的任意胁迫。
相对于在可比较胁迫条件下培育的对照植物,本发明方法的实施产生这样的植物,所述植物在非生物胁迫生长条件下具有增强的产量相关性状。因此,根据本发明,提供了用于在非生物胁迫生长条件下培育的植物中增强产量相关性状的方法,所述方法包括调节(优选增加)植物中编码GRP多肽的核酸序列表达。根据本发明的一个方面,所述非生物胁迫是渗透胁迫,其选自以下一个或多个胁迫:水胁迫、盐胁迫、氧化胁迫和离子胁迫。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在降低的营养物有效性条件下、尤其在降低的氮有效性条件下培育的植物增强的产量相关性状。因此,根据本发明,提供了用于在降低的营养物有效性条件下培育的植物中增强产量相关性状的方法,所述方法包括调节(优选增加)植物中编码GRP多肽的核酸序列的表达。降低的营养物有效性可以包含营养物如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等的降低的有效性。
本发明包括通过本发明方法可获得的植物、其部分(包括种子)或植物细胞。所述植物、其部分或植物细胞包含编码如上文定义的GRP多肽(优选地异戊烯基转移酶(IPT)多肽)的核酸转基因。
本发明也提供了基因构建体和载体以促进在植物中导入和/或表达编码GRP多肽的核酸序列。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供了如本文中定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供了构建体,其包含:
(i)编码如上文定义的GRP多肽(优选异戊烯基转移酶(IPT)多肽)的核酸序列;
(ii)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(iii)转录终止序列。
优选地,编码GRP多肽的核酸序列如上文定义。术语“调控序列”和“终止序列”如本文中的定义。
用包含任意上述核酸序列的载体转化植物。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。该目的序列有效地与一个或多个调控序列(至少与启动子)连接。
有利地,任意类型的启动子,无论是天然的或人工的,可以用来驱动所述核酸序列的表达。种子特异性启动子是在本发明方法中特别有用的。对于多种启动子类型的定义,见本文中的“定义”部分。
应当明白本发明的应用不限于由SEQ ID NO:131表示的编码GRP多肽的核酸序列,本发明的应用也不限于编码GRP多肽的核酸序列在受种子特异性启动子驱动时的表达。
种子特异性启动子优选地是谷醇溶蛋白(prolamin)启动子,优选地是来自稻的谷醇溶蛋白启动子。还优选地,所述谷醇溶蛋白启动子由基本上与SEQ ID NO:133相似的核酸序列表示,最优选地该谷醇溶蛋白启动子如SEQ ID NO:133所表示。对于种子特异性启动子的其他例子,见本文中的“定义”部分的表2。
任选地,可以在导入植物的构建体中使用一个或多个终止子序列。额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5’非翻译区(UTR)或编码序列中,以提高细胞质内聚集的成熟信使的数量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括对于在特定细胞类型中维持和/或复制所需要的复制起点序列。一个例子是当需要基因构建体作为游离型遗传元件(例如质粒或粘粒分子)在细菌细胞中维持时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如用于本发明方法中的核酸序列的成功转移和/或选择包含这些核酸序列的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。一旦不再需要所述标记基因时,可以从转基因细胞中去掉或切除它们。用于移出标记的技术是本领域已知的,有用技术在上文定义部分中描述。
本发明也提供了用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增强的产量相关性状,其中所述方法包括在植物中导入并表达编码如上文所定义的GRP多肽(优选异戊烯基转移酶(IPT)多肽)的核酸序列。
更具体地,本发明提供了用于产生转基因植物的方法,所述转基因植物具有增强产量相关性状,其中所述方法包括:
(i)在植物、植物部分或植物细胞中导入并表达编码GRP多肽的核酸序列;和
(ii)在促进植物生长和发育的条件下培养植物、植物部分或植物细胞。
(i)的核酸序列可以是能够编码如本文中定义的GRP多肽的任意核酸序列。
所述核酸序列可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸序列优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育期间后,通过喷洒进行合适的选择。另一种可能性在于根据需要消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。备选地,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的子代,唯一要求是子代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也包括含有编码如本文以上所定义GRP多肽的分离核酸序列的宿主细胞。本发明的优选宿主细胞是植物细胞。对于本发明方法中所用核酸转基因或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明的方法有利地适用于任意植物。在本发明方法中特别有用的植物包括属于植物界超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的例子包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,所述植物是单子叶植物。单子叶植物的例子包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的例子包括稻、玉米、小麦、大麦、谷子、裸麦、黑小麦、高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根、根状茎、块茎和球茎。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是增加的表达。用于增加核酸序列或基因或基因产物表达的方法是本领域中充分经文献报道的并且在定义部分中提供了例子。
如上所述,用于调节(优选地增加)编码GRP多肽的核酸序列表达的优选方法是通过在植物中导入并表达编码GRP多肽的核酸序列;但是,实施本方法的效果,即增强产量相关性状也可以使用包括但不限于T-DNA活化标签法、TILLING、同源重组在内的其他熟知技术实现。在定义部分中提供了对这些技术的描述。
本发明也包括编码如本文中所述GRP多肽的核酸序列的用途,和这些GRP多肽的用途,用于增强植物中任意的前述产量相关性状。
编码本文中所述GRP多肽的核酸序列或GRP多肽自身可以用于育种程序中,在所述育种程序中鉴定到可以遗传地与编码GRP多肽的基因连锁的DNA标记。所述基因/核酸序列或GRP多肽自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
编码GRP多肽的核酸序列/基因的等位变体也可以用于标记辅助的育种程序中。此类育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,所述程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致增强产量相关性状的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括将其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码GRP多肽的核酸序列也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且用作与这些基因连锁的性状的标记。此类信息可以用于植物育种中,以开发具有所希望表型的品系。编码GRP多肽的核酸序列的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码GRP多肽的核酸序列可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用编码GRP的核酸序列探测。所得的条带图式随后可以使用计算机程序如MapMaker(Lander等人(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸序列可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和子代。DNA多态性的分离是明显的并用来计算编码GRP多肽的核酸序列在先前使用这个群体获得的遗传图中的位置(Botstein等人(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。许多出版物描述了使用以上概述的方法学或其变例对特定eDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸序列探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一个实施方案中,所述核酸序列探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等人(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸序列扩增的方法可以使用所述核酸序列而实施。方法例子包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等人(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等人(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)NucleicAcid Res.18:3671)、放射杂交作图(Walter等人(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸序列的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。但是,这通常对作图法而言不是必需的。
如前文所述,本发明方法产生了具有增强的产量相关性状的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
在一个实施方案中,本发明涉及总结如下的主题:
条目63:在植物中相对于对照植物增强产量相关性状的方法,其包括在植物中调节(优选增加)编码GRP多肽的核酸序列的表达以及任选地选择具有增强的产量相关性状的植物,其中所述GRP多肽是如SEQ IDNO:132所表示的异戊烯基转移酶(IPT)多肽或其直向同源物、旁系同源物或同源物。
条目64:根据条目63的方法,其中所述如SEQ ID NO:132所示的GRP多肽以及其直向同源物、旁系同源物或同源物属于具有InterPro进入IPR002627和IPR011593的tRNA异戊烯基转移酶家族或者包含根据如图13中所示的共有序列的结构域或基序。
条目65:根据条目63或64的方法,其中所述GRP多肽与SEQ IDNO:132所表示的GRP多肽或者与实施例1的表A4中所给出的任何多肽序列以优选增加的顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更多的氨基酸序列同一性。
条目66:根据任一前述条目63至65的方法,其中所述编码GRP多肽的核酸序列由下述表示:SEQ ID NO:131的核酸序列或其部分,或能够与SEQ ID NO:131的核酸序列或其部分杂交的序列,或者能够与实施例1的表A4中给出的任一核酸序列SEQ ID NO杂交的序列。
条目67:根据任一前述条目63至66的方法,其中所述调节(优选增加)的表达通过在植物中导入和表达编码所述GRP多肽的核酸序列来实现。
条目68:根据任一前述条目63至67的方法,其中所述增强的产量相关性状包括以下一种或多种:相对于对照植物提高的每株植物的总种子产量、提高的饱满种子数、提高的种子总数以及提高的收获指数。
条目69:根据任一前述条目63至68的方法,其中所述调节的表达是增加的表达。
条目70:根据任一前述条目63至69的方法,其中所述核酸序列与种子特异性启动子,优选与谷醇溶蛋白启动子,最优选与来自稻的谷醇溶蛋白启动子有效连接。
条目71:根据任一前述条目63至70的方法,其中所述编码GRP多肽的核酸序列是植物来源,优选来自双子叶植物,进一步优选来自十字花科(Brassicaceae),更优选来自拟南芥(Arabidopsis thaliana)。
条目72:通过根据任一前述条目63至71的方法可获得的植物、其部分(包括种子)或植物细胞,其中所述植物、其部分或植物细胞包含编码GRP多肽的核酸转基因。
条目73:构建体,其包含
(a)编码如条目63至65所定义的GRP多肽的核酸序列;
(b)一个或多个能够驱动(a)的核酸序列表达的调控序列;以及任选地
(c)转录终止序列。
条目74:根据条目73的构建体,其中所述调控序列之一是种子特异性启动子,优选谷醇溶蛋白启动子,最优选来自稻的谷醇溶蛋白启动子。
条目75:根据条目73至75的任一项的构建体在制备下述植物的方法中的用途,所述植物相对于对照植物具有增强的产量相关性状,特别是提高的每株植物的总种子产量、提高的饱满种子数、提高的种子总数以及提高的收获指数。
条目76:用根据条目74至75的任一项的构建体转化的植物、植物部分或植物细胞。
条目77:用于产生转基因植物的方法,所述转基因植物具有相对于对照植物增强的产量相关性状,所述方法包括:
(i)在植物、植物部分或植物细胞中导入和表达核酸序列,所述核酸序列编码如条目63至65所定义的GRP多肽;以及
(ii)在促进植物生长和发育的条件下培养植物、植物部分或植物细胞。
条目78:相对于对照植物具有增强的产量相关性状、特别是提高的每株植物的总种子产量、提高的饱满种子数、提高的种子总数以及提高的收获指数的转基因植物或来自所述转基因植物的转基因植物细胞,所述转基因植物从下述产生:编码如条目63至65中所定义的GRP多肽的核酸序列的增加的表达。
条目79:根据条目72、76或78的转基因植物,或来自其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷物,例如稻、玉米、小麦、大麦、谷子、裸麦、黑小麦、高粱和燕麦。
条目80:根据条目79的包含编码GRP多肽的核酸序列的植物的可收获部分,其中所述可收获部分优选为种子。
条目81:来自根据条目79的植物和/或来自根据条目80的植物的可收获部分的产品。
条目81:编码GRP多肽的核酸序列在植物中相对于对照植物增强产量相关性状、特别是提高每株植物的总种子产量、提高饱满种子数、提高种子总数以及提高收获指数中的用途。
在本发明的一个实施方案中,现在已经发现:调节植物中编码STO多肽的核酸表达产生了相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码STO多肽的核酸表达。
用于调节(优选提高)编码STO多肽的核酸表达的优选方法是在植物中导入并表达编码STO多肽的核酸。
对“在本发明方法中有用的蛋白质”的任意称谓意指如本文中定义的STO多肽。下文对“在本发明方法中有用的核酸”的任意称谓意指能够编码这种STO多肽的核酸。待导入植物(并且因而在实施本发明方法中有用)的核酸是编码现在将描述的蛋白质类型的任意核酸,下文也称作“STO核酸”或“STO基因”。
本文定义的“STO多肽”涉及包含至少一个B框结构域的任何多肽。B框结构域是在多种来源的蛋白质中保守的氨基酸结构域,所述来源包括原核和真核生物。B框结构域约40个氨基酸长,在关键位置包含保守的半胱氨酸残基和/或组氨酸残基,从而所述结构域被分成与锌离子配位中所涉及的锌指类似的三级结构。NMR分析显示B框结构包含两个β链、两个螺旋转角和三个延伸的环区域(不同于任何其它锌结合基序)(Borden等人1995EMBO J.1995年12月1日;14(23):5947-56)。
包含B框结构域的蛋白质可以在特定的数据库例如Pfam和Interpro中找到。在Interpro数据库的release15.1中的B框的结构域的登录号是IPR000315,在Pfam版本21.0中是PF00643。
基于在不同蛋白质中发现的B框结构域的序列比较,可能定义代表了B框结构域的共有序列。例如Reymond等人(EMBO J.2001年5月1日;20(9):2140-51)能够将共有序列定义至在人的TRIM蛋白质中存在的两个B框结构域,如对于B框1,由CXX(C/D)X(7-12)CXXCXXXXCXX(C/H)X(3-4)HX(4-9)H所代表,对于B框2,由CXXHX(7-9)CXX(C/D/E/H)XXXXCXXCX(3-6)H(X-4)(H/C)所代表。在植物来源的许多STO蛋白质的B框结构域中发现的共有序列由SEQ ID NO:221(CX2CX16CX2C)所表示。所有B框结构域的标签特征是存在至少4个氨基酸残基,通常半胱氨酸和/或组氨酸残基具有推定的结合锌离子的能力。
优选的用于本发明方法中的STO多肽包含至少一个,更优选两个B框结构域,所述结构域具有如CX2CX16CX2C(SEQ ID NO:221)所示的共有序列。
在SEQ ID NO:169中发现的B框结构域如SEQ ID NO:219和SEQ IDNO:220所表示。更优选的用于本发明方法中的STO多肽包含至少一个,更优选两个B框结构域,所述结构域与SEQ ID NO:219或SEQ ID NO:220具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多的序列同一性。
可选地,STO多肽中的B框结构域可以通过实施与包含B框结构域的已知多肽的序列比较并且建立在B框结构域区域中的相似性来鉴定。可以使用本领域熟知的任何方法例如Blast算法来比对序列。与给定的序列发生比对的概率被作为鉴定类似多肽的基础。通常用来表示此类概率的参数被称为e值。E值是S分数可靠性的量度。S分数是查询与所显示序列的相似性的量度。e值描述了预期给定S分数随机发生有多经常。e值界点(cut-off)可以高至1.0。来自使用STO多肽作为查询序列的BLAST搜索输出的可信的e-值的典型阈值可以低于1.e-5、1.e-10、1.e-15、1.e-20、1.e-25、1.e-50、1.e-75、1.e-100、1.e-200、1.e-300、1.e-400、1.e-500、1.e-600、1.e-700和1.e-800。优选的用于本发明方法中的STO多肽包含至少一个,更优选两个B框结构域,所述结构域具有下述序列,所述序列以优选增加的顺序具有低于e-5(=10-5)、1.e-10、1.e-15、1.e-20、1.e-25、1.e-50、1.e-75、1.e-100、1.e-200、1.e-300、1.e-400、1.e-500、1.e-600、1.e-700和1.e-800的e值(在与SEQ ID NO:219或SEQ ID NO:220或在已知STO多肽中发现的任何B框结构域(如表A中所列出的那些)的比对中)。
优选地,用于本发明方法中的STO多肽序列,当用于构建进化系统树例如图16中所描述的进化系统树时,与包含如SEQ ID NO:169所示的氨基酸序列(图中OS04g0540200)的STO多肽的组聚类,而不与任何其他组聚类。
可选地或额外地,本文定义的“STO多肽”涉及任何多肽,所述多肽以优选增加的顺序与如SEQ ID NO:169或由SEQ ID NO:171表示的STO多肽或者与本文实施例1的表A5中所给出的任何多肽序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更多的多肽序列同一性。
术语“结构域”和“基序”在本文中的“定义”部分定义。存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等人(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等人(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation).(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白质组服务器(The proteomics server for in-depth proteinknowledge and analysis),Nucleic Acids Res.31:3784-3788(2003))。结构域或基序也可以使用常规技术如通过序列比对进行鉴定。
用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等人(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于开展BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用(an application that generates similarity/identitymatrices using protein or DNA sequences))。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。利用上文提及的程序,使用默认参数可以在完整核酸或氨基酸序列范围或选定的结构域或保守基序范围内确定序列同一性值。
另外,STO多肽(至少以它们的天然形式)一般在转基因植物(优选稻)中表达时,在组成型启动子的调控下,产生对开花时间的调节,通常缩短开花时间。用于产生转基因植物以及测量开花时间的工具和技术是本领域熟知的。其它细节提供在实施例部分中。
本发明通过用SEQ ID NO:168所表示的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:169的多肽序列。但是,本发明的实施不限于这些序列;本发明的方法可以有利地使用任意编码STO的核酸或如本文中定义的STO多肽实施。
编码STO多肽的核酸的例子在本文实施例1的表A5中给出。此类核酸用于实施本发明的方法中。在实施例1的表A5中给出的氨基酸序列是由SEQ ID NO:169所表示的STO多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文中定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用实施例1的表A5中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST搜索(第二BLAST),其中查询序列从所述的生物中衍生(在查询序列是SEQ ID NO:168或SEQ ID NO:169的情况下,第二BLAST因而将针对稻序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且在反向BLAST时,优选地产生属于最高命中当中的该查询序列。
优选的同源物
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,比较过程也通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚类和鉴定直向同源物和旁系同源物。
核酸变体也可以用于实施本发明的方法中。此类变体的例子包括编码在实施例1的表A5中所给出的任一氨基酸序列的同源物和衍生物的核酸,术语“同源物”和“衍生物”如本文中定义。还用于本发明方法中的是这样的核酸,其编码在实施例1的表A5中所给出的任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物。用于本发明方法中的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。
在实施本发明方法中有用的其他核酸变体包括编码STO多肽的核酸的部分、与编码STO多肽的核酸杂交的核酸、编码STO多肽的核酸的剪接变体、编码STO多肽的核酸的等位变体和通过基因改组获得的编码STO多肽的核酸的变体。术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。
编码STO多肽的核酸不需要是全长核酸,因为本发明方法的实施不取决于全长核酸序列的使用。根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例1的表A5中给出的任一核酸序列的一部分或编码实施例1的表A5中所给出任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的一部分。
核酸的一部分可以例如通过对所述核酸产生一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生组合有几种活性的蛋白质。与其他编码序列融合时,在翻译时产生的所得多肽可以比对于该蛋白质部分所预测的多肽更大。
在本发明方法中有用的部分编码如本文中定义的STO多肽,并且具有如实施例1的表A5中所给出氨基酸序列基本上相同的生物学活性。优选地,此部分是在实施例1的表A中给出的任一核酸的一部分,或是编码在实施例1的表A5中所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地,该部分的长度是至少100、200、300、400、500、550、600、650、700、750、800、850、900、950、1000个连续核苷酸,所述连续核苷酸为实施例1的表A5中给出的任一核酸序列或为编码在实施例1的表A5中所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选地,该部分是SEQ ID NO:168的核酸的一部分。优选地,该部分编码氨基酸序列,其中所述的氨基酸序列当用于构建进化系统树例如图16中所描述的进化系统树时,优选地,用于本发明方法中的STO多肽序列当用于构建进化系统树例如图16中所描述的进化系统树时,与包含如SEQ ID NO:169所示的氨基酸序列(图中OS04g0540200)的STO多肽的组聚类,而不与任何其他组聚类。
在本发明方法中有用的另一种核酸变体是能够在降低的严格条件下、优选在严格条件下与编码如本文中定义的STO多肽的核酸或与如本文中定义的部分杂交的核酸。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达能够与实施例1的表A5中给出的任一核酸杂交的核酸,或包括在植物中导入并表达这样的核酸,其中所述核酸能够与编码在实施例1的表A5中给出的任意核酸序列的直向同源物、旁系同源物或同源物的核酸杂交。
在本发明方法中有用的杂交序列编码如本文中定义的STO多肽,其具有如实施例1的表A5中所给出氨基酸序列基本上相同的生物学活性。优选地,该杂交序列能够与实施例1的表A5中给出的任一核酸或与这些序列中任意序列的一部分杂交,所述的一部分如上文定义,或其中所述杂交序列能够与核酸杂交,其中所述的核酸编码在实施例1的表A5中给出的任一氨基酸序列的直向同源物或旁系同源物。最优选地,该杂交序列能够与如SEQ ID NO:168所表示的核酸或与其一部分杂交。
优选地,该杂交序列编码具有下述氨基酸序列的多肽,其中所述的氨基酸序列是全长的且当用于构建进化系统树例如图16中所描述的进化系统树时,与包含如SEQ ID NO:169所示的氨基酸序列(图中OS04g0540200)的STO多肽的组聚类,而不与任何其他组聚类。
在本发明方法中有用的另一种核酸变体是编码如上文所定义的STO多肽的剪接变体,剪接变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例1的表A5中给出的任一核酸序列的剪接变体或编码实施例1的表A5中所给出任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
优选的剪接变体是由SEQ ID NO:168所表示的核酸的剪接变体,或是编码SEQ ID NO:169的直向同源物或旁系同源物的核酸的剪接变体。优选地,由该剪接变体编码的氨基酸序列当用于构建进化系统树例如图16中所描述的进化系统树时,与包含如SEQ ID NO:169所示的氨基酸序列(图中OS04g0540200)的STO多肽的组聚类,而不与任何其他组聚类。
在实施本发明方法中有用的另一种核酸变体是编码如上文所定义STO多肽的核酸的等位变体,等位变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例1的表A5中给出的任一核酸的等位变体,或包括在植物中导入并表达编码在实施例1的表A5中所给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变体。
本发明方法中有用的等位变体具有如SEQ ID NO:169的STO多肽和实施例1的表A中所述任意氨基酸基本上相同的生物学活性。等位变体存在于自然界中,并且在本发明的方法中包括这些天然等位基因的用途。优选地,所述等位变体是SEQ ID NO:168的等位变体或编码SEQ ID NO:169的直向同源物或旁系同源物的核酸的等位变体。优选地,由该等位变体编码的氨基酸序列当用于构建进化系统树例如图16中所描述的进化系统树时,与包含如SEQ ID NO:169所示的氨基酸序列(图中OS04g0540200)的STO多肽的组聚类,而不与任何其他组聚类。
基因改组或定向进化也可以用来产生编码如上文定义的STO多肽的核酸的变体;术语“基因改组”如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例1的表A5中给出的任一核酸序列的变体,或包括在植物中导入并表达核酸的变体,所述的核酸编码在实施例1的表A5中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物,其中所述的变体核酸通过基因改组获得。
优选地,由通过基因改组直接或间接获得的变体核酸所编码的氨基酸序列当用于构建进化系统树例如图16中所描述的进化系统树时,与包含如SEQ ID NO:169所示的氨基酸序列(图中OS04g0540200)的STO多肽的组聚类,而不与任何其他组聚类。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码STO多肽的核酸可以衍生自任何天然来源或人工来源。该核酸可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码STO多肽的核酸来自植物,进一步优选地来自单子叶植物,更优选地来自禾本科(Poaceae),最优选地该核酸来自稻(Oryzasativa)。
本发明方法的实施产生了具有增强的产量相关性状的植物。尤其,本发明方法的实施产生了相对于对照植物而言,具有提高的产量、尤其提高的种子产量的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。
此处中对增强的产量相关性状的称谓意思是相对于对照植物早期(幼苗)萌发势提高和改变的开花时间(更特别地更短的开花时间)。优选地,开花时间缩短了至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25天,或者缩短了与相对于对照植物相比的时间的至少5%、10%、15%、20%或25%。
以谷物为例,产量提高可以表现为以下一个或多个指标:每公顷或英亩已建立的植物数目增加、每株植物穗数的提高、行数、每行核粒数、核粒重、千粒重、穗长度/直径的提高、种子饱满率(即饱满种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每公顷或英亩植物数、每株植物的圆锥花序数、每圆锥花序的小穗数、每个圆锥花序的花(小花)数目(其表述为饱满种子数对原发圆锥花序数的比)、种子饱满率(即饱满种子数除以种子总数并乘以100)提高、千粒重提高及其他。
本发明提供了用于相对于对照植物提高早期(幼苗)萌发势和改变开花时间(特别是缩短植物的开花时间)的方法,所述方法包括调节(优选增加)植物中编码如本文中定义的STO多肽的核酸表达。
由于本发明的转基因植物具有提高的产量,故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段(在其生活周期的至少部分期间)表现提高的生长速率。
提高的生长速率可以是植物的一个或多个部分(包括种子)特有的,或可以基本上遍及整个植物。具有提到的生长速率的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长直至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或在基本上整个植物生活周期期间发生。提高的生长速率在植物生活周期的早期期间可以反映增强的或提高的萌发势。生长速率的提高可以改变植物的收获周期,从而允许植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均处于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适的植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时期(早季)或在收获时期(晚季)的不利环境条件决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到50%最大植物大小所花费的时间)和T-90(植物达到90%最大植物大小所花费的时间),以及其他。
根据本发明的优选特征,本发明方法的实施产生了相对于对照植物而言,具有提高的生长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包括在植物中调节(优选增加)编码如本文中定义的STO多肽的核酸表达。
与对照植物相比较,无论所述植物处于非胁迫条件下或无论所述植物暴露于多种胁迫,产量和/或生长速率的提高均出现。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,但同时不能恢复生长。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见生物胁迫和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
具体而言,本发明的方法可以在非胁迫条件下或在轻度干旱条件开展以产生相对于对照植物具有提高的产量的植物。如Wang等人(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等人(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫之间极高程度的“交互作用”。例如,干旱和/或盐化作用主要表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以引起功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号传导途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在非胁迫条件下或在轻度干旱条件下培育的植物提高的产量。因此,根据本发明,提供了用于在非胁迫条件下或在轻度干旱条件下培育的植物中提高产量的方法,所述方法包括增加植物中编码STO多肽的核酸表达。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在营养缺乏条件下、尤其在缺氮条件下培育的植物提高的产量。因此,根据本发明,提供了用于在营养缺乏条件下培育的植物中提高产量的方法,所述方法包括增加植物中编码STO多肽的核酸表达。营养缺乏可以因营养物如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等缺少所致。
本发明包括通过本发明方法可获得的植物或其部分(包括种子)。所述植物或其部分包含编码如上文定义的STO多肽的核酸转基因。
本发明也提供了基因构建体和载体以促进在植物中导入和/或表达编码STO多肽的核酸。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供了如本文中定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供了构建体,其包含:
(a)编码如上文定义的STO多肽的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(c)转录终止序列。
优选地,编码STO多肽的核酸如上文定义。术语“调控序列”和“终止序列”如本文中的定义。
用包含任意上述核酸的载体转化植物。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。该目的序列有效地与一个或多个调控序列(至少与启动子)连接。
有利地,任意类型的启动子,无论是天然的或合成的,可以用来驱动所述核酸序列的表达。组成型启动子是方法中特别有用的。多种启动子类型的定义参见本文“定义”部分。
应当明白本发明的应用不限于由SEQ ID NO:168表示的编码STO多肽的核酸,本发明的应用也不限于编码STO多肽的核酸在受组成型启动子驱动时的表达。
组成型启动子优选地是GOS2启动子,优选地是来自稻的GOS2启动子。还优选地,所述组成型启动子由基本上与SEQ ID NO:218相似的核酸序列表示,最优选地该组成型启动子如SEQ ID NO:218所表示。对于组成型启动子的其他例子,见本文中的“定义”部分中的表2。
任选地,可以在导入植物的构建体中使用一个或多个终止子序列。额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5’非翻译区(UTR)或编码序列中,以提高细胞质内聚集的成熟信使的数量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括对于在特定细胞类型中维持和/或复制所需要的复制起点序列。一个例子是当需要基因构建体作为游离型遗传元件(例如质粒或粘粒分子)在细菌细胞中维持时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如用于本发明方法中的核酸序列的成功转移和/或选择包含这些核酸的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。一旦不再需要所述标记基因时,可以从转基因细胞中去掉或切除它们。用于移出标记的技术是本领域已知的,有用技术在上文定义部分中描述。
本发明也提供了用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增强的产量相关性状,其中所述方法包括在植物中导入并表达编码如上文所定义的STO多肽的任意核酸。
更具体地,本发明提供了用于产生转基因植物的方法,所述转基因植物具有增加的增强产量相关性状、尤其提高的(早期)幼苗萌发势和/或改变的开花时间(更特别地植物的更短的开花时间),其中所述方法包括:
(i)在植物或植物细胞中导入并表达编码STO多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
(i)的核酸可以是能够编码如本文中定义的STO多肽的任意核酸。
所述核酸可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育期间后,通过喷洒进行合适的选择。另一种可能性在于根据需要消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。备选地,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的子代,唯一要求是子代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也包括含有编码如本文以上所定义STO多肽的分离核酸的宿主细胞。本发明的优选宿主细胞是植物细胞。对于本发明方法中所用核酸或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明的方法有利地适用于任意植物。在本发明方法中特别有用的植物包括属于植物界超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的例子包括大豆、向日葵、卡诺拉油菜(canola)、苜蓿、油菜(rapeseed)、棉花、番茄、马铃薯和烟草。还优选地,所述植物是单子叶植物。单子叶植物的例子包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的例子包括稻、玉米、小麦、大麦、谷子(millet)、裸麦(rye)、黑小麦(triticale)、高粱、和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根、根状茎、块茎和球茎。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是增加的表达。用于增加核酸或基因或基因产物表达的方法是本领域中充分经文献报道的并且在定义部分中提供了例子。
如上所述,用于调节(优选增加)编码STO多肽的核酸表达的优选方法是通过在植物中导入并表达编码STO多肽的核酸;但是,实施本方法的效果,即增强产量相关性状,也可以使用包括但不限于T-DNA活化标签法、TILLING、同源重组在内的其他熟知技术实现。在定义部分中提供了对这些技术的描述。
本发明也包括编码如本文中所述STO多肽的核酸的用途,和这些STO多肽的用途,用于增强植物中任意的前述产量相关性状。
编码本文中所述STO多肽的核酸或STO多肽自身可以用于育种程序中,在所述育种程序中鉴定到可以遗传地与编码STO多肽的基因连锁的DNA标记。所述核酸/基因或STO多肽自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
编码STO多肽的核酸/基因的等位变体也可以用于标记辅助的育种程序中。此类育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,所述程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致产量提高的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括将其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码STO多肽的核酸也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且用作与这些基因连锁的性状的标记。此类信息可以用于植物育种中,以开发具有所希望表型的品系。编码STO多肽的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码STO多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用编码STO多肽的核酸探测。所得的条带图式随后可以使用计算机程序如MapMaker(Lander等人(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和子代。DNA多态性的分离是明显的并用来计算编码STO多肽的核酸在先前使用这个群体获得的遗传图中的位置(Botstein等人(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。许多出版物描述了使用以上概述的方法学或其变例对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一个实施方案中,所述核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等人(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。方法例子包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等人(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等人(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等人(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。但是,这通常对作图法而言不是必需的。
如前文所述,本发明方法产生了具有增强的产量相关性状的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
在本说明书中使用的术语“表A5”是为了指定表A5a和表A5b的内容。本说明书中使用的术语“表A5a”是为了指定表A5a中的内容。本说明书中使用的术语“表A5b”是为了指定表A5b中的内容。在一个优选的实施方案中,术语“表A5”意思是表A5b。
在一个实施方案中,本发明涉及总结如下的主题:
条目82:在植物中相对于对照植物增强产量相关性状的方法,其包括在植物中调节编码STO多肽的核酸的表达,其中所述STO多肽包含B框结构域。
条目83:根据条目82的方法,其中所述B框结构域包含如SEQ IDNO:221所表示的共有序列。
条目84:根据条目82或83的方法,其中所述STO多肽包含B框结构域,所述结构域与SEQ ID NO:219或SEQ ID NO:220具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多的序列同一性。
条目85:根据条目82至84的任一项的方法,其中所述调节的表达通过在植物中导入和表达编码STO多肽的核酸来实现。
条目86:根据条目82至85的任一项的方法,其中所述编码STO多肽的核酸编码表A5中所列的任一蛋白质或者是此类核酸的一部分或者是能够与此类核酸杂交的核酸。
条目87:根据条目82至86的任一项的方法,其中所述核酸序列编码表A5中所给出的任何蛋白质的直向同源物或旁系同源物。
条目88:根据条目82至87的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物提高的幼苗萌发势和/或改变的开花时间,优选更短的开花时间。
条目89:根据条目82至88任一项的方法,其中所述增强的产量相关性状在非胁迫条件下获得。
条目90:根据条目85至89中任一项的方法,其中所述核酸与组成型启动子,优选与GOS2启动子,最优选与来自稻的GOS2启动子有效连接。
条目91:根据条目82至90中任一项的方法,其中所述编码STO多肽的核酸是植物来源的,优选来自单子叶植物,进一步优选来自禾本科(Poaceae),更优选来自稻属(Oryza),最优选来自稻(Oryza sativa)。
条目92:植物或其部分(包括种子),通过根据任何前述条目的方法可获得,其中所述植物或其部分包含编码STO多肽的重组核酸。
条目93:包含选自以下的核酸序列的分离的核酸序列:
a)编码如SEQ ID NO:223和/或表A5b中所示的多肽的分离的核酸分子;
b)如SEQ ID NO:222和/或表A5b所示的分离的核酸分子;
c)分离的核酸分子,其作为遗传密码子简并性的结果,可以来自如表A5中所示的多肽序列并且赋予相对于对照植物增强的产量相关性状;
d)分离的核酸分子,其与多核苷酸的核酸分子序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性并且赋予相对于对照植物增强的产量相关性状,所述多核苷酸包含表A5中所示的核酸分子;
e)编码多肽并且赋予了相对于对照植物增强的产量相关性状的分离的核酸分子,所述多肽与(a)至(c)的核酸分子所编码的多肽的氨基酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性;
f)分离的核酸分子,其与(a)至(c)的核酸分子在严格杂交条件下杂交并且赋予相对于对照植物增强的产量相关性状;
g)编码多肽的分离的核酸分子,所述多肽包含图15中所示的共有序列或一个或多个多肽基序,并且所述分离的核酸分子优选地具有下述核酸分子所代表的活性,所述核酸分子包含表A5中所示的多核苷酸;
h)编码多肽并且赋予相对于对照植物增强的产量相关性状的分离的核酸分子,所述多肽具有如表A5中所示的蛋白质所代表的活性;
以及
i)通过在严格杂交条件下用探针或用其片段筛选适当的核酸文库可获得的核酸分子,所述探针包含(a)或(b)的核酸分子的互补序列,所述可获得的核酸分子具有与(a)至(e)中表征的核酸分子序列互补的核酸分子的至少15nt、优选20nt、30nt、50nt、100nt、200nt或500nt并且编码具有活性的多肽,所述活性由包含表A5中所示的多肽的蛋白质所代表;
其中根据(a)至(i)的核酸分子至少在一个或多个核苷酸上不同于表A5a中所示的序列并且优选地编码下述蛋白质,所述蛋白质至少在一个或多个氨基酸上不同于表A5a中所示的蛋白质序列。
条目94:构建体,其包含
(a)在条目82至84和93的任一项中定义的编码STO多肽的核酸;
(b)一个或多个调控序列,其能够驱动(a)的核酸序列的表达,以及任选地
(c)转录终止序列。
条目95:根据条目94的构建体,其中所述调控序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
条目96:根据条目94至95的任一项的构建体在方法中的用途,所述方法用于制备相对于对照植物具有增强的产量相关性状,优选提高的幼苗萌发势和/或改变的开花时间(特别是更短的开花时间)的植物。
条目97:用根据条目94至95的任一项的构建体转化的植物、植物部分或植物细胞。
条目98:用于产生转基因植物的方法,所述植物相对于对照植物具有增强的产量相关性状,优选提高的幼苗萌发势和/或改变的开花时间(特别是更短的开花时间),所述方法包括:
(i)在植物中导入和表达如条目82至84和93中任一项中所定义的编码STO多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
条目99:相对于对照植物具有增强的产量相关性状,优选提高的幼苗萌发势和/或改变的开花时间(特别是更短的开花时间)的转基因植物或来自所述转基因植物的转基因植物细胞,所述转基因植物获得自如条目82至84和93的任一项中所定义的编码STO多肽的核酸的增加的表达。
条目100:根据条目92、97或99的转基因植物或来自其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷物,例如稻、玉米、小麦、大麦、谷子、裸麦、黑小麦、高粱和燕麦。
条目101:根据条目100的植物的可收获部分,其中所述可收获部分优选是枝条生物量和/或种子。
条目102:来自根据条目100的植物和/或来自根据条目101的植物可收获部分的产品。
条目103:编码STO多肽的核酸在相对于对照植物提高幼苗萌发势和/或改变开花时间,特别是缩短开花时间中的用途。
根据本发明的另一个实施方案,还提供了包含选自以下的多肽序列的分离的多肽:
(i)由条目93所表示的任一核酸所编码的氨基酸序列;
(ii)与(i)的氨基酸序列以优选增加的顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列;
(iii)上文(i)或(ii)中所给出的任何氨基酸序列的衍生物。
在本发明的另一个实施方案中,现在已经发现:调节植物中编码UGE多肽的核酸表达产生了相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码UGE多肽的核酸表达。
用于调节(优选增加)编码UGE多肽的核酸表达的优选方法是在植物中导入并表达编码UGE多肽的核酸。
对“在本发明方法中有用的蛋白质”的任意称谓意指UGE多肽。下文对“在本发明方法中有用的核酸”的任意称谓意指能够编码这种UGE多肽的核酸。待导入植物(并且因而在实施本发明方法中有用)的核酸是编码现在将描述的蛋白质类型的任意核酸,下文也称作“UGE核酸”或“UGE基因”。已经在以前描述了UGE多肽和UGE核酸(Maxwell和Robichon-Szulmajster(1960);J.Biol.Chem.235(1960)308-312;Wilson,D.B.和Hogness,D.S.(1964).J.Biol.Chem.2392469-2481;综述见FreyFASEB J.1996Mar;10(4):461-70;Thoden等人(1997)Biochemistry36:6294-6304;Dormann和Benning 1998;Shaw等人2003.Mol.Biochem.Parasitol.126,173-180;Barber等人2006)。
“UGE多肽”包含差向异构酶结构域并且通常具有UDP-葡萄糖-4-差向异构酶活性。差向异构酶结构域涉及不同长度的序列,平均在大约200个氨基酸长,在差向异构酶中保守(InterPro参考IPR005886;Pfam参考:PF01370)。
UGE多肽可以通过搜索专门化数据库例如Pfam来发现(Finn等人Nucleic Acids Research(2006)Database Issue 34:D247-D251)。Pfam编纂了覆盖许多常见蛋白质结构域和家族的多重序列比对和隐匿马尔科夫模型(HMM)的庞大集合和并且通过英国Sanger研究所可使用。Pfam数据库中所认为的可信任匹配是评分高于收集临界阈值的那些序列。差向异构酶结构域的收集临界阈值在Pfam HMM_fs方法中是-46.3并且在PfamHMM_ls方法中是16.7。但是,包含真实差向异构酶结构域的潜在匹配依旧可以低于该收集界点。优选地,在本发明方法中有用的UGE多肽是在其序列中具有超出Pfam蛋白质结构域家族PF01370(已知为差向异构酶或NAD依赖性差向异构酶/脱水酶家族结构域)的收集临界值的一个或多个结构域的蛋白质。
可选地,多肽中的差向异构酶结构域可以通过实施与包含差向异构酶结构域的已知多肽的序列比较并且建立在差向异构酶结构域区域中的相似性来鉴定。可以使用本领域熟知的任何方法例如Blast算法来比对序列。与给定的序列发生比对的概率被作为鉴定类似多肽的基础。通常用来表示此类概率的参数被称为e值。E值是S分数可靠性的量度。S分数是查询与所显示序列的相似性的量度。e值描述了预期给定S分数随机发生有多经常。e值界点(cut-off)可以高至1.0。来自使用差向异构酶多肽作为查询序列的BLAST搜索输出的可信的e-值的典型阈值低于e-5(=10-5)、1.e-10、1.e-15、1.e-20、1.e-25、1.e-50、1.e-75、1.e-100、1.e-200、1.e-300、1.e-400、1.e-500、1.e-600、1.e-700和1.e-800。优选的用于本发明方法中的UGE多肽包含下述序列,所述序列以优选增加的顺序具有低于e-5(=10-5)、1.e-10、1.e-15、1.e-20、1.e-25、1.e-50、1.e-75、1.e-100、1.e-200、1.e-300、1.e-400、1.e-500、1.e-600、1.e-700和1.e-800的e值(在与已知UGE多肽中发现的差向异构酶结构域(如SEQ ID NO:225)的比对中)。
优选的用于本发明方法中的UGE多肽涉及包含差向异构酶结构域的多肽,此类结构域与SEQ ID NO:275(在SEQ ID NO:225中所包含的代表差向异构酶结构域的序列)以优选增加的顺序具有至少70%、75%、80%、85%、90%、95%、97%或更多的序列同一性。
用于本发明方法中的UGE多肽的例子在表A6中给出。在代表性UGE蛋白质(如SEQ ID NO:225所示)中的差向异构酶结构域的氨基酸坐标在表C中给出。在SEQ ID NO:225中包含的差向异构酶结构域的序列在SEQID NO:275中给出。
优选的用于本发明方法中的UGE多肽是下述那些,所述多肽与表A6中所给出的任何多肽以优选增加的顺序具有至少70%、75%、80%、85%、90%、95%、96%、98%或更多的序列同一性。
UGE多肽通常包含与其酶促活性相关的保守基序,例如i)参与UGE蛋白质与辅因子NAD+结合的基序8,如GXXGXXG(SEQ ID NO:276)所示,以及ii)位于活性位点的基序9,如YGRT/S(SEQ ID NO:277)所示,其中所述G可以被任何其它非极性氨基酸所取代,R可以被任何其它极性氨基酸所取代。
除了差向异构酶结构域外,UGE多肽还可以包含一个或多个下列保守基序:i)如SEQ ID NO:278所示的基序10,其包含NAD+结合基序;ii)如SEQ ID NO:279所示的基序11以及iii)如SEQ ID NO:280所示的基序12。图19显示了保守基序基序8至基序12,以及它们在如SEQ ID NO:225中所示的UGE多肽序列中的相对位置。
因此,用于本发明方法中的优选的UGE多肽除了包含差向异构酶结构域以外,还包含任何一个或多个下列保守基序:
(i)基序8,其如SEQ ID NO:276所示;
(ii)基序9,其如SEQ ID NO:277所示,其中G可以被任何其它非极性氨基酸所取代,R可以被任何其它极性氨基酸所取代;
(iii)基序10,其如SEQ ID NO:278所示,其中允许1、2、3或4个错配;
(iv)基序11,其如SEQ ID NO:279所示,
(v)基序12,其如SEQ ID NO:280所示,其中允许1、2、3或4个错配。
在表3中给出了20个关键氨基酸的极性。最常见的包含在多肽中的氨基酸是α氨基酸,其具有连接在相同碳(α碳)上的胺和羧基,所述氨基酸分子通常包含与α碳相连的侧链。表3显示了基于侧链的物理和生物化学性质的氨基酸的分类。
表3:根据侧链性质的氨基酸的分类
氨基酸 | 3-字母 | 1-字母 | 侧链极性 | 侧链酸性或碱性 | 亲水性指数 |
精氨酸 | Arg | R | 极性 | 碱性 | -4.5 |
天冬酰胺 | Asn | N | 极性 | 中性 | -3.5 |
天冬氨酸 | Asp | D | 极性 | 酸性 | -3.5 |
半胱氨酸 | Cys | C | 极性 | 中性 | 2.5 |
谷氨酸 | Glu | E | 极性 | 酸性 | -3.5 |
谷氨酰胺 | Gln | Q | 极性 | 中性 | -3.5 |
组氨酸 | His | H | 极性 | 碱性 | -3.2 |
赖氨酸 | Lys | K | 极性 | 碱性 | -3.9 |
丝氨酸 | Ser | S | 极性 | 中性 | -0.8 |
苏氨酸 | Thr | T | 极性 | 中性 | -0.7 |
酪氨酸 | Tyr | Y | 极性 | 中性 | -1.3 |
丙氨酸 | Ala | A | 非极性 | 中性 | 1.8 |
甘氨酸 | Gly | G | 非极性 | 中性 | -0.4 |
异亮氨酸 | Ile | I | 非极性 | 中性 | 4.5 |
亮氨酸 | Leu | L | 非极性 | 中性 | 3.8 |
甲硫氨酸 | Met | M | 非极性 | 中性 | 1.9 |
苯丙氨酸 | Phe | F | 非极性 | 中性 | 2.8 |
脯氨酸 | Pro | P | 非极性 | 中性 | -1.6 |
色氨酸 | Trp | W | 非极性 | 中性 | -0.9 |
氨基酸 | 3-字母 | 1-字母 | 侧链极性 | 侧链酸性或碱性 | 亲水性指数 |
缬氨酸 | Val | V | 非极性 | 中性 | 4.2 |
包含一个或多个保守基序基序8至基序12的UGE多肽的例子在实施例1中给出。图20显示了保守基序在那些UGE多肽中的位置。
额外地,UGE多肽可以包含在细胞中蛋白质的亚细胞定位中有功能的信号多肽。例如,SEQ ID NO:225包含位于氨基酸13和37之间的推定的分泌途径信号肽,其具有在氨基酸36和37之间的推定的切割位点。
UGE多肽可以进一步在细胞中被修饰,例如通过切割信号肽以产生所谓的成熟UGE多肽。优选的用于本发明方法中的UGE多肽的衍生物是从移除信号传导肽所得来的,对应于成熟UGE多肽。
优选地,多肽序列当用于构建进化系统树,例如图21中所描述的进化系统树时,与包含SEQ ID NO:225(Os_UGE2)所示的氨基酸序列的组聚类,或者可选地,当在树,例如Rosti等人2007(The Plant Cell 19:1565-1579)的图1中的树中时,与包含AtUGE2的组聚类。
术语“结构域”和“基序”在本文中的“定义”部分定义。存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等人(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等人(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation).(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。一组用于计算机方式分析蛋白质序列的工具可在ExPASY蛋白质组服务器上获得(瑞士生物信息研究所维护(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白质组服务器(The proteomics server for in-depth proteinknowledge and analysis),Nucleic Acids Res.31:3784-3788(2003))。结构域或基序也可以使用常规技术如通过序列比对进行鉴定。
用于比对序列以进行比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列的)比对结果。BLAST算法(Altschul等人(1990)J Mol Biol 215:403-10)计算序列同一性百分数并在两个序列之间开展相似性的统计分析。用于开展BLAST分析的软件是通过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一种应用(an application that generates similarity/identitymatrices using protein or DNA sequences))。如本领域技术人员显而易见,可以进行少许手工编辑以优化保守基序之间的比对。此外,作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。利用上文提及的程序,使用默认参数可以在完整核酸或氨基酸序列范围或选定的结构域或保守基序范围内确定序列同一性值。
另外,UGE多肽(至少以它们天然的形式)通常具有UDP-葡萄糖4-差向异构酶或UDP-半乳糖4-差向异构酶活性。此外,用于本发明方法中的UGE多肽还可以是酶促失活的。用于测量UDP_葡萄糖4-差向异构酶和UDP-半乳糖4-差向异构酶活性的工具和技术是本领域熟知的。对于反应性质或活性以及UGE多肽的例子的其它细节是本领域熟知的,并且可以在专门化数据库例如BRENDA(The Comprehensive Enzyme InformationSystem)中发现,所述数据库BRENDA由University of Cologne(德国)开发和维护。体内测定包括在携带编码UGE多肽的基因中的突变的微生物中的缺陷型UDP葡萄糖4-差向异构酶活性的补偿,所述微生物例如携带编码GAL10蛋白质的基因中的缺陷的酿酒酵母(Scharomyces cerevisiae)菌株(Dormann和Benning.1996.Arch Biochem Biophys.327(1):27-34)。纯化UGE多肽和体外测量差向异构酶活性的方法也被描述(Barber2006)。
本发明通过用SEQ ID NO:224所表示的核酸序列转化植物进行说明,其中所述的核酸序列编码SEQ ID NO:225的多肽序列。但是,本发明的实施不限于这些序列;本发明的方法可以有利地使用任意编码UGE的核酸或如本文中定义的UGE多肽实施。
编码UGE多肽的核酸的例子在本文实施例1的表A6中给出。此类核酸用于实施本发明的方法中。在实施例1的表A6中给出的氨基酸序列是由SEQ ID NO:225所表示的UGE多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文中定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一BLAST,其中所述的第一BLAST包括将查询序列(例如使用实施例1的表A6中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST搜索(第二BLAST),其中查询序列从所述的生物中衍生(在查询序列是SEQ ID NO:224或SEQ ID NO:225的情况下,第二BLAST因而将针对稻序列进行)。随后比较第一BLAST和第二BLAST的结果。若来自第一blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且在反向BLAST时,优选地产生属于最高命中当中的该查询序列。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了E-值外,比较过程也通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法,以帮助观察相关基因的聚类和鉴定直向同源物和旁系同源物。
核酸变体也可以用于实施本发明的方法中。此类变体的例子包括编码在实施例1的表A6中所给出的任一氨基酸序列的同源物和衍生物的核酸,术语“同源物”和“衍生物”如本文中定义。还用于本发明方法中的是这样的核酸,其编码在实施例1的表A6中所给出的任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物。用于本发明方法中的同源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。
在实施本发明方法中有用的其他核酸变体包括编码UGE多肽的核酸的部分、与编码UGE多肽的核酸杂交的核酸、编码UGE多肽的核酸的剪接变体、编码UGE多肽的核酸的等位变体和通过基因改组获得的编码UGE多肽的核酸的变体。术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中所述。
编码UGE多肽的核酸不需要是全长核酸,因为本发明方法的实施不取决于全长核酸序列的使用。根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例1的表A6中给出的任一核酸序列的一部分或编码实施例1的表A6中所给出任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的一部分。
核酸的一部分可以例如通过对所述核酸产生一个或多个缺失而制备。所述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生组合有几种活性的蛋白质。与其他编码序列融合时,在翻译时产生的所得多肽可以比对于该蛋白质部分所预测的多肽更大。
在本发明方法中有用的部分编码如本文中定义的UGE多肽,并且具有如实施例1的表A6中所给出氨基酸序列基本上相同的生物学活性。优选地,此部分是在实施例1的表A中给出的任一核酸的一部分,或是编码在实施例1的表A6中所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地,该部分的长度是至少250、500、550、600、650、700、750、800、850、900、950、1000个连续核苷酸,所述连续核苷酸为实施例1的表A6中给出的任一核酸序列或为编码在实施例1的表A6中所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选地,该部分是SEQ ID NO:224的核酸的一部分。优选地,该部分编码氨基酸序列,其中所述的氨基酸序列当用于构建进化系统树,例如图21中所描述的进化系统树时,与包含SEQ ID NO:225(Os_UGE2)所示的氨基酸序列的组聚类,或者可选地,当在树,例如Rosti等人2007(The Plant Cell19:1565-1579)的图1中的树中时,与包含AtUGE2的组聚类。
在本发明方法中有用的另一种核酸变体是能够在降低的严格条件下、优选在严格条件下与编码如本文中定义的UGE多肽的核酸或与如本文中定义的部分杂交的核酸。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达能够与实施例1的表A6中给出的任一核酸杂交的核酸,或包括在植物中导入并表达这样的核酸,其中所述核酸能够与编码在实施例1的表A6中给出的任意核酸序列的直向同源物、旁系同源物或同源物的核酸杂交。
在本发明方法中有用的杂交序列编码如本文中定义的UGE多肽,其具有如实施例1的表A6中所给出氨基酸序列基本上相同的生物学活性。优选地,该杂交序列能够与实施例1的表A6中给出的任一核酸或与这些序列中任意序列的一部分杂交,所述的一部分如上文定义,或其中所述杂交序列能够与核酸杂交,其中所述的核酸编码在实施例1的表A6中给出的任一氨基酸序列的直向同源物或旁系同源物。最优选地,该杂交序列能够与如SEQ ID NO:224所表示的核酸或与其一部分杂交。
优选地,该杂交序列编码具有下述氨基酸序列的多肽,其中所述的氨基酸序列当用于构建进化系统树,例如图21中所描述的进化系统树时,与包含SEQ ID NO:225(Os_UGE2)所示的氨基酸序列的组聚类,或者可选地,当用于构建进化系统树,例如Rosti等人2007(The Plant Cell 19:1565-1579)的图1中的进化系统树时,与包含AtUGE2的组聚类。
在本发明方法中有用的另一种核酸变体是编码如上文所定义的UGE多肽的剪接变体,剪接变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例1的表A6中给出的任一核酸序列的剪接变体或编码实施例1的表A6中所给出任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
优选的剪接变体是由SEQ ID NO:224所表示的核酸的剪接变体,或是编码SEQ ID NO:225的直向同源物或旁系同源物的核酸的剪接变体。优选地,由该剪接变体编码的氨基酸序列当用于构建进化系统树,例如图21中所描述的进化系统树时,与包含SEQ ID NO:225(Os_UGE2)所示的氨基酸序列的组聚类,或者可选地,当用于构建进化系统树,例如Rosti等人2007(The Plant Cell 19:1565-1579)的图1中的进化系统树时,与包含AtUGE2的组聚类。
在实施本发明方法中有用的另一种核酸变体是编码如上文所定义UGE多肽的核酸的等位变体,等位变体如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达实施例1的表A6中给出的任一核酸的等位变体,或包括在植物中导入并表达编码在实施例1的表A6中所给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变体。
本发明方法中有用的等位变体具有如SEQ ID NO:225的UGE多肽和实施例1的表A6中所述任意氨基酸基本上相同的生物学活性。等位变体存在于自然界中,并且在本发明的方法中包括这些天然等位基因的用途。优选地,所述等位变体是SEQ ID NO:224的等位变体或编码SEQ IDNO:225的直向同源物或旁系同源物的核酸的等位变体。优选地,由该等位变体编码的氨基酸序列当用于构建进化系统树,例如图21中所描述的进化系统树时,与包含SEQ ID NO:225(Os_UGE2)所示的氨基酸序列的组聚类,或者可选地,当用于构建进化系统树,例如Rosti等人2007(The Plant Cell19:1565-1579)的图1中的进化系统树时,与包含AtUGE2的组聚类。
基因改组或定向进化也可以用来产生编码如上文定义的UGE多肽的核酸的变体;术语“基因改组”如本文中定义。
根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并表达在实施例1的表A6中给出的任一核酸序列的变体,或包括在植物中导入并表达核酸的变体,所述的核酸编码在实施例1的表A6中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物,其中所述的变体核酸通过基因改组获得。
优选地,由通过基因改组获得的变体核酸所编码的氨基酸序列当用于构建进化系统树,例如图21中所描述的进化系统树时,与包含SEQ IDNO:225(Os_UGE2)所示的氨基酸序列的组聚类,或者可选地,当用于构建进化系统树,例如Rosti等人2007(The Plant Cell 19:1565-1579)的图1中的进化系统树时,与包含AtUGE2的组聚类。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码UGE多肽的核酸可以衍生自任何天然来源或人工来源。该核酸可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码UGE多肽的核酸来自植物,进一步优选地来自单子叶植物,更优选地来自禾本科(Poaceae),最优选地该核酸来自稻(Oryzasativa)。
本发明方法的实施产生了具有增强的产量相关性状的植物。尤其,本发明方法的实施产生了相对于对照植物而言,具有提高的产量、尤其提高的种子产量的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。
此处中对增强的产量相关性状的称谓意思是植物的一个或多个部分的生物量(重量)的提高,所述部分包括地上(可收获)部分和/或地下的(可收获)部分。特别地,此类可收获部分是种子,并且本发明方法的实施产生了相对于对照植物的种子产量具有提高的种子产量的植物。
以谷物为例,产量提高可以表现为以下一个或多个指标:每公顷或英亩已建立的植物数目增加、每株植物穗数的提高、行数、每行核粒数、核粒重、千粒重、穗长度/直径的提高、种子饱满率(即饱满种子数除以种子总数并乘以100)提高,及其他。以稻为例,产量提高可以自身表现为下列一种或多种指标的提高:每公顷或英亩植物数、每株植物的圆锥花序数、每圆锥花序的小穗数、每个圆锥花序的花(小花)数目(其表述为饱满种子数对原发圆锥花序数的比)、种子饱满率(即饱满种子数除以种子总数并乘以100)提高、千粒重提高及其他。
本发明提供了用于相对于对照植物提高植物的产量,尤其是种子产量的方法,所述方法包括调节(优选增加)植物中编码如本文中定义的UGE多肽的核酸表达。
由于本发明的转基因植物具有提高的产量,故相对于对照植物的生长速率,这些植物有可能在其生活周期的对应阶段(在其生活周期的至少部分期间)表现提高的生长速率。
提高的生长速率可以是植物的一个或多个部分(包括种子)特有的,或可以基本上遍及整个植物。具有提到的生长速率的植物可以具备较短的生活周期。植物的生活周期可以意指从干燥成熟种子成长直至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受以下因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的提高可以在植物生活周期的一个或多个阶段上或在基本上整个植物生活周期期间发生。提高的生长速率在植物生活周期的早期期间可以反映增强的萌发势。生长速率的提高可以改变植物的收获周期,从而允许植物较晚播种和/或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得)。若生长速率充分提高,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均处于一个常规生长时期中)。类似地,若生长速率充分地提高,可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适的植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许转基因植物在比其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时期(早季)或在收获时期(晚季)的不利环境条件决定。这类不利条件可以避开,若缩短收获周期。生长速率可以通过从生长曲线获得多个参数而确定,此类参数可以是:T-Mid(植物达到50%最大植物大小所花费的时间)和T-90(植物达到90%最大植物大小所花费的时间),以及其他。
根据本发明的优选特征,本发明方法的实施产生了相对于对照植物而言,具有提高的生长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包括在植物中调节(优选增加)编码如本文中定义的UGE多肽的核酸表达。
与对照植物相比较,无论所述植物处于非胁迫条件下或无论所述植物暴露于多种胁迫,产量和/或生长速率的提高均出现。植物一般通过生长得更慢而应答于胁迫暴露。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在本文中定义为植物所暴露的任何下述胁迫,其中所述的胁迫未导致植物完全停止生长,但同时不能恢复生长。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明意义中导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴露的常见生物胁迫和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
具体而言,本发明的方法可以在非胁迫条件下或在轻度干旱条件开展以产生相对于对照植物具有提高的产量的植物。如Wang等人(Planta(2003)218:1-14)中报道,非生物胁迫导致一系列不利地影响植物生长及生产量的形态学、生理学、生物化学和分子变化。干旱、盐度、极端温度和氧化胁迫已知是相互联系的并可以通过相似机制诱导生长损害及细胞损害。Rabbani等人(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫之间极高程度的“交互作用”。例如,干旱和/或盐化作用主要表现为渗透胁迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以引起功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号传导途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在非胁迫条件下或在轻度干旱条件下培育的植物提高的产量。因此,根据本发明,提供了用于在非胁迫条件下或在轻度干旱条件下培育的植物中提高产量的方法,所述方法包括增加植物中编码UGE多肽的核酸表达。
相对于在可比较条件下培育的对照植物,本发明方法的实施赋予在营养缺乏条件下、尤其在缺氮条件下培育的植物提高的产量。因此,根据本发明,提供了用于在营养缺乏条件下培育的植物中提高产量的方法,所述方法包括增加植物中编码UGE多肽的核酸表达。营养缺乏可以因营养物如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等缺少所致。
本发明包括通过本发明方法可获得的植物或其部分(包括种子)。所述植物或其部分包含编码如上文定义的UGE多肽的核酸转基因。
本发明也提供了基因构建体和载体以促进在植物中导入和/或表达编码UGE多肽的核酸。所述基因构建体可以插入适于转化至植物并适于在转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供了如本文中定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供了构建体,其包含:
(a)编码如上文定义的UGE多肽的核酸;
(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
(c)转录终止序列。
优选地,编码UGE多肽的核酸如上文定义。术语“调控序列”和“终止序列”如本文中的定义。
用包含任意上述核酸的载体转化植物。技术人员非常了解必须存在于所述载体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。该目的序列有效地与一个或多个调控序列(至少与启动子)连接。
有利地,任意类型的启动子,无论是天然的或合成的,可以用来驱动所述核酸序列的表达。组成型启动子是方法中特别有用的。多种启动子类型的定义参见本文“定义”部分。
应当明白本发明的应用不限于由SEQ ID NO:1表示的编码UGE多肽的核酸,本发明的应用也不限于编码UGE多肽的核酸在受组成型启动子驱动时或在受根特异性启动子驱动时的表达。
组成型启动子优选地是GOS2启动子,优选地是来自稻的GOS2启动子。还优选地,所述组成型启动子由基本上与SEQ ID NO:270相似的核酸序列表示,最优选地该组成型启动子如SEQ ID NO:270所表示。对于组成型启动子的其他例子,见本文中的“定义”部分中的表2。
任选地,可以在导入植物的构建体中使用一个或多个终止子序列。额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5’非翻译区(UTR)或编码序列中,以提高细胞质内聚集的成熟信使的数量。(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质/或RNA稳定元件。此类序列将是已知的或可以由本领域技术人员轻易获得。
本发明的基因构建体还可以包括对于在特定细胞类型中维持和/或复制所需要的复制起点序列。一个例子是当需要基因构建体作为游离型遗传元件(例如质粒或粘粒分子)在细菌细胞中维持时的复制起点。优选的复制起点包括但不限于f1-ori和colE1。
为检测如用于本发明方法中的核酸序列的成功转移和/或选择包含这些核酸的转基因植物,有利的是使用标记基因(或报道基因)。因此,所述基因构建体可以任选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。一旦不再需要所述标记基因时,可以从转基因细胞中去掉或切除它们。用于移出标记的技术是本领域已知的,有用技术在上文定义部分中描述。
本发明也提供了用于产生转基因植物的方法,所述转基因植物相对于对照植物具有增强的产量相关性状,其中所述方法包括在植物中导入并表达编码如上文所定义的UGE多肽的任意核酸。
更具体地,本发明提供了用于产生转基因植物的方法,所述转基因植物具有增加的增强产量相关性状、尤其提高的(种子)产量,其中所述方法包括:
(i)在植物或植物细胞中导入并表达编码UGE多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
(i)的核酸可以是能够编码如本文中定义的UGE多肽的任意核酸。
所述核酸可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植物的任何其他部分)。根据本发明的优选特征,该核酸优选地通过转化作用导入植物。术语“转化”在本文的“定义”部分中更详细地描述。
通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植物。为了选择转化植物,在所述转化中获得的植物材料原则上经历选择性条件,从而转化植物可以与非转化植物区分。例如,可以将以上述方式获得的种子播种,并且在初始培育期间后,通过喷洒进行合适的选择。另一种可能性在于根据需要消毒后,在使用合适选择剂的琼脂板上培育种子,从而仅转化的种子可以长成植物。备选地,对所述转化植物筛选选择标记(如上文所述的选择标记)的存在性。
在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析对目的基因的存在性、拷贝数和/或基因组构造进行评价。备选地或额外地,新导入的DNA的表达水平可以使用RNA印迹分析和/或蛋白质印迹分析或这两种分析法监测,这两项技术均是本领域普通技术人员熟知的。
产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并且T2植物随后可以通过经典育种技术进一步繁殖。产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转化根状茎)。
本发明明确地扩展至由本文中所述的任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转化或转染细胞、组织、器官或完整植物的子代,唯一要求是子代表现与如本发明方法中的亲代相同的基因型和/或表型特征。
本发明也包括含有编码如本文以上所定义UGE多肽的分离核酸的宿主细胞。本发明的优选宿主细胞是植物细胞。对于本发明方法中所用核酸或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发明方法中所使用多肽的全部植物。
本发明的方法有利地适用于任意植物。在本发明方法中特别有用的植物包括属于植物界超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌木。根据本发明的一个优选实施方案,所述植物是作物植物。作物植物的例子包括大豆、向日葵、卡诺拉油菜(canola)、苜蓿、油菜(rapeseed)、棉花、番茄、马铃薯和烟草。还优选地,所述植物是单子叶植物。单子叶植物的例子包括甘蔗。更优选地,所述植物是谷物植物。谷物植物的例子包括稻、玉米、小麦、大麦、谷子(millet)、裸麦(rye)、黑小麦(triticale)、高粱、和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根、根状茎、块茎和球茎。本发明进一步涉及了衍生自、优选直接衍生自此种植物的可收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是增加的表达。用于增加核酸或基因或基因产物表达的方法是本领域中充分经文献报道的并且在定义部分中提供了例子。
如上所述,用于调节(优选增加)编码UGE多肽的核酸表达的优选方法是通过在植物中导入并表达编码UGE多肽的核酸;但是,实施本方法的效果,即增强产量相关性状,也可以使用包括但不限于T-DNA活化标签法、TILLING、同源重组在内的其他熟知技术实现。在定义部分中提供了对这些技术的描述。
本发明也包括编码如本文中所述UGE多肽的核酸的用途,和这些UGE多肽的用途,用于增强植物中任意的前述产量相关性状。
编码本文中所述UGE多肽的核酸或UGE多肽自身可以用于育种程序中,在所述育种程序中鉴定到可以遗传地与编码UGE多肽的基因连锁的DNA标记。所述核酸/基因或UGE多肽自身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
编码UGE多肽的核酸/基因的等位变体也可以用于标记辅助的育种程序中。此类育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,所述程序可以从收集并非故意造成的所谓“自然”源性等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤:选择所讨论和导致产量提高的序列的优异等位变体。选择一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施。生长性能可以在温室或在田间监测。其他任选步骤包括将其中鉴定到优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征组合。
编码UGE多肽的核酸也可以作为探针用于遗传地或物理地绘制所述探针构成其一部分的基因并且用作与这些基因连锁的性状的标记。此类信息可以用于植物育种中,以开发具有所希望表型的品系。编码UGE多肽的核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码UGE多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用编码UGE多肽的核酸探测。所得的条带图式随后可以使用计算机程序如MapMaker(Lander等人(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一组个体代表具有定义的遗传杂交的亲代和子代。DNA多态性的分离是明显的并用来计算编码UGE多肽的核酸在先前使用这个群体获得的遗传图中的位置(Botstein等人(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因来源的探针的产生及其在遗传作图中的用途。许多出版物描述了使用以上概述的方法学或其变例对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一个实施方案中,所述核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大的克隆(几个kb至几百个kb;见Laan等人(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。方法例子包括等位基因特异性扩增法(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等人(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等人(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等人(1997)Nat.Genet.7:22-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲代之间的DNA序列差异。但是,这通常对作图法而言不是必需的。
如前文所述,本发明方法产生了具有增强的产量相关性状的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
在本说明书中使用的术语“表A6”是为了指定表A6a和表A6b的内容。本说明书中使用的术语“表A6a”是为了指定表A6a中的内容。本说明书中使用的术语“表A6b”是为了指定表A6b中的内容。在一个优选的实施方案中,术语“表A6”意思是表A6b。
在一个实施方案中,本发明涉及总结如下的主题:
条目104:在植物中相对于对照植物增强产量相关性状的方法,其包括在植物中调节编码UGE多肽的核酸的表达。
条目105:根据条目104的方法,其中所述UGE多肽包含差向异构酶结构域,所述结构域与SEQ ID NO:275以优选增加的顺序具有至少70%、75%、80%、85%、90%、95%、97%或更多的序列同一性。
条目106:根据条目104或105的方法,其中所述UGE多肽包含下述基序中的一个或多个:
基序8,其如SEQ ID NO:276所示;
基序9,其如SEQ ID NO:277所示,其中G可以被任何其它非极性氨基酸所取代,R可以被任何其它极性氨基酸所取代;
基序10,其如SEQ ID NO:278所示,其中允许1、2、3或4个错配;
基序11,其如SEQ ID NO:279所示,
基序12,其如SEQ ID NO:280所示,其中允许1、2、3或4个错配。
条目107:根据条目104至106的方法,其中所述调节的表达通过在植物中导入和表达编码UGE多肽的核酸来实现。
条目108:根据条目104至107的任一项的方法,其中所述编码UGE多肽的核酸编码表A6中所列的任一蛋白质或者是此类核酸的一部分或者是能够与此类核酸杂交的核酸。
条目109:根据条目104至108的任一项的方法,其中所述核酸序列编码表A6中所给出的任何蛋白质的直向同源物或旁系同源物。
条目110:根据条目104至109的任一项的方法,其中所述增强的产量相关性状包括相对于对照植物提高的产量,优选提高的种子产量。
条目111:根据条目104至110任一项的方法,其中所述增强的产量相关性状在非胁迫条件下获得。
条目112:根据条目104至111任一项的方法,其中所述增强的产量相关性状在干旱胁迫条件下获得。
条目113:根据条目104至112中任一项的方法,其中所述核酸与组成型启动子,优选与GOS2启动子,最优选与来自稻的GOS2启动子有效连接。
条目114:根据条目104至113中任一项的方法,其中所述编码UGE多肽的核酸是植物来源的,优选来自单子叶植物,进一步优选来自禾本科(Poaceae),更优选来自稻属(Oryza),最优选来自稻(Oryza sativa)。
条目115:植物或其部分(包括种子),通过根据条目104至114的任何一项的方法可获得,其中所述植物或其部分包含编码UGE多肽的重组核酸。
条目116:包含选自以下的核酸序列的分离的核酸序列:
a)编码如SEQ ID NO:282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318和/或320和/或表A6b中所示的多肽的分离的核酸分子;
b)如SEQ ID NO:281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317和/或319和/或表A6b所示的分离的核酸分子;
c)分离的核酸分子,其作为遗传密码子简并性的结果,可以来自如表A6中所示的多肽序列并且赋予相对于对照植物增强的产量相关性状;
d)分离的核酸分子,其与多核苷酸的核酸分子序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性并且赋予相对于对照植物增强的产量相关性状,所述多核苷酸包含表A6中所示的核酸分子;
e)编码多肽并且赋予了相对于对照植物增强的产量相关性状的分离的核酸分子,所述多肽与(a)至(c)的核酸分子所编码的多肽的氨基酸序列具有至少30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性;
f)分离的核酸分子,其与(a)至(c)的核酸分子在严格杂交条件下杂交并且赋予相对于对照植物增强的产量相关性状;
g)编码多肽的分离的核酸分子,所述多肽包含图20中所示的共有序列或一个或多个多肽基序,并且所述分离的核酸分子优选地具有下述核酸分子所代表的活性,所述核酸分子包含表A6中所示的多核苷酸;
h)编码多肽并且赋予相对于对照植物增强的产量相关性状的分离的核酸分子,所述多肽具有如表A6中所示的蛋白质所代表的活性;
以及
i)通过在严格杂交条件下用探针或用其片段筛选适当的核酸文库可获得的核酸分子,所述探针包含(a)或(b)的核酸分子的互补序列,所述可获得的核酸分子具有与(a)至(e)中表征的核酸分子序列互补的核酸分子的至少15nt、优选20nt、30nt、50nt、100nt、200nt或500nt并且编码具有活性的多肽,所述活性由包含表A6中所示的多肽的蛋白质所代表;
其中根据(a)至(i)的核酸分子至少在一个或多个核苷酸上不同于表A6a中所示的序列并且优选地编码下述蛋白质,所述蛋白质至少在一个或多个氨基酸上不同于表A6a中所示的蛋白质序列。
条目117:构建体,其包含
(a)在条目104至106或116中定义的编码UGE多肽的核酸;
(b)一个或多个调控序列,其能够驱动(a)的核酸序列的表达;以及任选地
(c)转录终止序列。
条目118:根据条目117的构建体,其中所述调控序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
条目119:根据条目117至118的任一项的构建体在方法中的用途,所述方法用于制备相对于对照植物具有增强的产量相关性状,优选提高的产量,更优选提高的种子产量的植物。
条目120:用根据条目117或118的构建体转化的植物、植物部分或植物细胞。
条目121:用于产生转基因植物的方法,所述植物相对于对照植物具有提高的产量,特别是提高的种子产量,所述方法包括:
(i)在植物中导入和表达如条目104至106或116中所定义的编码UGE多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
条目122:相对于对照植物具有提高的产量,特别是提高的种子产量的转基因植物或来自所述转基因植物的转基因植物细胞,所述转基因植物获得自如条目104至106或116中所定义的编码UGE多肽的核酸的增加的表达。
条目123:根据条目115、120或122的转基因植物或来自其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷物,例如稻、玉米、小麦、大麦、谷子、裸麦、黑小麦、高粱和燕麦。
条目124:根据条目123的植物的可收获部分,其中所述可收获部分优选是枝条生物量和/或种子。
条目125:来自根据条目123的植物和/或来自根据条目124的植物可收获部分的产品。
条目126:编码UGE多肽的核酸相对于对照植物增强产量相关性状,优选提高产量,更优选提高种子产量的用途。
根据本发明的另一个实施方案,还提供了包含选自以下的多肽序列的分离的多肽:
(i)由条目116所表示的任一核酸所编码的氨基酸序列;
(ii)与(i)的氨基酸序列以优选增加的顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列;
(iii)上文(i)或(ii)中所给出的任何氨基酸序列的衍生物。
附图说明
本发明现在将参考下列图进行描述,其中
图1表示SEQ ID NO:2的结构域结构,其具有由下划线和其编号表示的保守基序。通过SMART确定的HLH结构域以黑体下划线显示。
图2表示一些bHLH6样蛋白质的多重比对。点表示保守的残基,冒号表示高度保守的残基,星号代表优选保守的残基。最高程度的序列保守性在bHLH结构域的区域中和蛋白质序列的更多的N末端部分中发现。
图3表示二元载体,其用于在稻中编码bHLH6样的核酸在稻GOS2启动子(pGOS2)控制下的增加的表达。
图4详细描述了用于实施本发明方法的序列的例子。
图5表示来自表A2的RrmJ/FtsJ多肽的CLUSTAL W(1;83)的多重序列比对。
图6表示二元载体,其用于在稻中编码GRP的核酸序列在稻油质蛋白启动子(pOleo::GRP)的控制下的增加的表达(其中所述GRP多肽为RrmJ/FtsJ多肽)。
图7详细描述了用于实施本发明方法的序列的例子。
图8表示二元载体,其用于在稻中编码GRP的核酸序列在稻HMGB启动子(pHMGB::GRP)的控制下的增加的表达(其中所述GRP多肽是碱性-螺旋-环-螺旋4(bHLH4)多肽)。
图9详细描述了用于实施本发明方法的序列的例子。
图10表示了GRP多肽的多重序列比对(其中所述GRP多肽是碱性-螺旋-环-螺旋4(bHLH4)多肽)。给出了代表性的bHLH4多肽的共有序列、结构域和基序。在共有序列中,提供了高度保守的氨基酸;其间的空的空白空间代表任何氨基酸。
图11表示二元载体,其用于在稻中编码GRP的核酸序列在稻谷醇溶蛋白启动子(pProl::GRP)的控制下的增加的表达(其中所述GRP多肽是异戊烯基转移酶(IPT)多肽)。
图12详细描述了用于实施本发明方法的序列的例子。
图13表示了GRP多肽的多重序列比对(其中所述GRP多肽是异戊烯基转移酶(IPT)多肽)。给出了代表性的IPT多肽的共有序列、结构域和基序。在共有序列中,提供了高度保守的氨基酸;其间的空的空白空间代表任何氨基酸。
图14表示了SEQ ID NO:169的氨基酸序列和结构域结构。SEQ IDNO:169中的两个保守B框结构域如点线所指示(B框结构域1)和如实线(B框结构域2)所指示。每个B框结构域中的4个半胱氨酸残基(具有推定的结合锌离子的潜力)用框标示。
图15表示了STO多肽的多重序列比对。指示了对应于在图14中所描述的那些的保守氨基酸残基和结构域的位置。给出了代表性的STO多肽的共有序列。在共有序列中,提供了高度保守的氨基酸;其间的空的空白空间代表任何氨基酸。
图16显示了STO多肽的进化系统树。在进化系统树中,通过Os04g0540200代表SEQ ID NO:169。
图17表示了二元载体,其用于在稻中在稻GOS2启动子(pGOS2)的控制下的编码STO的核酸的增加的表达。
图18详细描述了用于实施本发明方法的序列的例子。
图19显示了SEQ ID NO:225的氨基酸序列,其中指示了相关功能性结构域和保守基序。指示了差向异构酶结构域(框中的区域)、基序8(黑体大写字母,以间断的线标示下划线)、基序9(黑体小写字母)、基序10(黑体大写字母)、基序11(以点标示下划线的大写字母)和基序12(以实线标示下划线的大写字母)。
图20显示了表A6的UGE多肽的多重蛋白质比对。给出了共有序列。指示了保守结构域以及基序的部分。
图21显示了表A6的UGE多肽的进化系统树。
图22表示了二元载体,其用于在稻中在稻GOS2启动子(pGOS2)的控制下的编码UGE的核酸的增加的表达。
图23详细描述了用于实施本发明方法的序列的例子。
实施例
本发明现在参考如下实施例进行描述,所述实施例仅是示意性的。以下实施例不意图完全限定或限制本发明的范围。
DNA操作:除非另外说明,重组DNA技术根据(Sambrook(2001)Molecular Cloning:a laboratory manual,第3版Cold Spring HarborLaboratory Press,CSH,New York)或Ausubel等人(1994),CurrentProtocols in Molecular Biology,Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和Blackwell科学出版社(Blackwell Scientific Publications(英国))出版的R.D.D.Croy的Plant Molecular Biology Labfax(1993)中描述。
实施例1:鉴定与本发明方法中所用核酸序列相关的序列
用数据库搜索工具如基本局部比对工具(BLAST)(Altschul等人(1990)J.Mol.Biol.215:403-410;和Altschul等人(1997)Nucleic Acids Res.25:3389-3402),在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列中鉴定到与本发明方法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。使用该程序通过将核酸序列或多肽序列与序列数据库比较并且计算匹配的统计显著性来找到序列之间的局部相似性区域。由与本发明方法中所用核酸编码的多肽用于TBLASTN算法,采用默认设置和过滤程序以忽略低复杂性序列启动。这种分析的结果通过配对比较进行观察,并根据概率评分(E-值)进行评级,其中所述的评分反映特定比对结果因偶然发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较过程也可以通过同一性百分数评分。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在一些情况下,可以调整默认参数以修改搜索的严格性。例如,可以提高E-值以显示更少的严格匹配。以这种方式,可以鉴定几乎完美的短匹配。
表A提供与本发明方法中所用核酸序列相关的核酸序列名单。
表A1:bHLH6样多肽的例子
植物来源 | 核酸SEQ ID NO: | 蛋白质SEQ ID NO: |
拟南芥 | 1 | 2 |
菜豆(Phaseolus vulgaris) | 13 | 14 |
黄长春花(Catharanthus roseus) | 15 | 16 |
马铃薯(Solanum tuberosum) | 17 | 18 |
豌豆(Pisum sativum) | 19 | 20 |
甘蓝(Brassica oleracea) | 21 | 22 |
稻(Oryza sativa) | 23 | 24 |
藏边大黄(Rheum australe) | 25 | 26 |
玉米 | 27 | 28 |
展叶剑叶藓(Physcomitrellapatens) | 29 | 30 |
番茄(Lycopersicon esculentum) | 31 | 32 |
Populus trichocarpa | 33 | 34 |
普通小麦(Triticum aestivum) | 35 | 36 |
杨属物种(Populus sp) | 37 | 38 |
葡萄(Vitis vinifera) | 39 | 40 |
稻 | 41 |
表2a:GRP多肽的例子,其中所述GRP多肽是RrmJ/FtsJ多肽:
名称 | 来源生物 | SEQIDNO核酸序列 | SEQIDNO多肽序列 | 状态 | 公共数据库登录号 |
Nicta_RrmJ/FtsJ部分 | 烟草(Nicotianatabacum) | 57 | 58 | 部分 | |
Nicta_RrmJ/FtsJ | 烟草 | 59 | 60 | 全长 | EB446219,EB448450.1 |
Arath_RrmJ/FtsJ | 拟南芥 | 61 | 62 | 全长 | AY087952.1 |
Lyces_RrmJ/FtsJ | 番茄 | 63 | 64 | 全长 | BT013964 |
Medtr_RrmJ/FtsJ | 蒺藜苜蓿(Medicagotruncatula) | 65 | 66 | 全长 | AC149135.2 |
Orysa_RrmJ/FtsJ | 稻 | 67 | 68 | 全长 | AK103054 |
Osta_RrmJ/FtsJ | OstreococcuslucimarinusCCE9901 | 69 | 70 | 全长 | XM_001418019 |
Poptr_RrmJ/FtsJ | Populustremuloides | 71 | 72 | 全长 | CX183550.1的重叠群DT504907.1 |
Sacof_RrmJ/FtsJ | 甘蔗(Saccharumofficinarum) | 73 | 74 | 全长 | CA279558.1的重叠群CF576902.1 |
Triae_RrmJ/FtsJ | 普通小麦 | 75 | 76 | 全长 | DR740715 |
Apime_RrmJ/FtsJ | 蜜蜂(Apismellifera) | 77 | 78 | 全长 | XM_392223 |
Caeel_RrmJ/FtsJ | 漂亮新小杆线虫(Caenorhabditiselegans) | 79 | 80 | 全长 | NM_065442 |
Danre_RrmJ/FtsJ | 鲐(Danio rerio) | 81 | 82 | 全长 | BC085449 |
Homsa_RrmJ/FtsJ | 人(Homosapiens) | 83 | 84 | 全长 | AK024023 |
Horvu_FtsJ | 大麦(Hordeumvulgare) | 92 | 93 | 全长 |
Sorbi_FtsJ | 两色蜀黍(Sorghumbicolor) | 94 | 95 | 全长 |
表A2b:GRP多肽的例子,其中所述GRP多肽是RrmJ/FtsJ多肽:
名称 | 来源生物 | SEQ ID NO核酸序列 | SEQ ID NO多肽序列 | 状态 |
Brana_FtsJ | 欧洲油菜(Brassicanapus) | 96 | 97 | 全长 |
Glyma_FtsJ | 大豆(Glycinemax) | 98 | 99 | 全长 |
Zeama_FtsJ | 玉米 | 100 | 101 | 全长 |
Tager_FtsJ_部分 | 万寿菊(Tageteserecta) | 部分 |
表A3a:GRP多肽的例子,其中所述GRP多肽是bHLH4多肽:
名称 | 来源生物 | SEQ IDNO核酸序列 | SEQ IDNO多肽序列 | 公共数据库登录号 |
Arath_bHLH4 | 拟南芥 | 104 | 105 | |
Arath_bHLH4II | 拟南芥 | 109 | 110 | |
Brana_bHLH4II | 欧洲油菜 | 111 | 112 | |
Lotja_bHLH4 | Lotusjaponicus | 113 | 114 |
Lyces_bHLH4 | 番茄 | 115 | 116 | |
Vitvi_bHLH4 | 葡萄 | 117 | 118 | 重叠群样VV78X118066.5 |
AM475703.2 | ||||
Zeama_bHLH4 | 玉米 | 119 | 120 | AF061107和EE190449的全长核酸序列重叠群 |
表A3b:GRP多肽的例子,其中所述GRP多肽是bHLH4多肽:
名称 | 来源生物 | SEQ IDNO核酸序列 | SEQ IDNO多肽序列 | 公共数据库登录号 |
Brana_bHLH4 | 欧洲油菜 | 121 | 122 | |
Glyma_bHLH4 | 大豆 | 123 | 124 | |
Glyma_bHLH4II | 大豆 | 125 | 126 | |
Horvu_bHLH4 | 大麦 | 127 | 128 | |
Zeama_bHLH4II | 玉米 | 129 | 130 |
表A4:GRP多肽的例子,其中所述GRP多肽是IPT多肽:
表A5a:STO核酸和多肽的例子:
名称 | 植物来源 | 核酸SEQID NO: | 蛋白质SEQ IDNO: |
Os04g0540200 cds3887 | 稻 | 168 | 169 |
Os01g0202500 | 稻 | 170 | 171 |
Os02g0606200 | 稻 | 172 | 173 |
Os02g0646200 | 稻 | 174 | 175 |
Os04g049300 | 稻 | 176 | 177 |
Os05g0204600 | 稻 | 178 | 179 |
Os06g0152200 | 稻 | 180 | 181 |
Os06g071300 | 稻 | 182 | 183 |
Os09g0527900 | 稻 | 184 | 185 |
Os12g0209200 | 稻 | 186 | 187 |
SO_STO | 甘蔗 | 188 | 189 |
AT1G06040_剪接变体1 | 拟南芥 | 190 | 191 |
AT1G06040_剪接变体2 | 拟南芥 | 192 | 193 |
AT1G75540 | 拟南芥 | 194 | 195 |
AT1G78600 | 拟南芥 | 196 | 197 |
名称 | 植物来源 | 核酸SEQID NO: | 蛋白质SEQ IDNO: |
AT2G31380 | 拟南芥 | 198 | 199 |
AT4G10240 | 拟南芥 | 200 | 201 |
AT4G39070 | 拟南芥 | 202 | 203 |
Mt_ABO84497 | 蒺藜苜蓿 | 204 | 205 |
LE_gi|45544865 | 番茄(Lycopersicul esculentum) | 206 | 207 |
ST_gi|76160970 | 马铃薯 | 208 | 209 |
PP_STO样 | populus trichoparcca | 210 | 211 |
VV_CAN72879 | 葡萄 | 212 | 213 |
GM_gi|78173056 | 大豆 | 214 | 215 |
表A5b:STO核酸和多肽的序列:
名称 | 植物来源 | 核酸SEQID NO: | 蛋白质SEQ IDNO: |
Zeama_STO | 玉米 | 222 | 223 |
表A6:UGE核酸和多肽的例子:
名称 | 来源生物 | 核酸SEQ IDNO: | 蛋白质SEQID NO: |
OS_UGE2 | 稻 | 224 | 225 |
Os04g0618200 | 稻 | 226 | 227 |
Os05g0595100 | 稻 | 228 | 229 |
Os07g0139400 | 稻 | 230 | 231 |
Os08g0374800 | 稻 | 232 | 233 |
Os09g0323000 | 稻 | 234 | 235 |
Os09g0504000 | 稻 | 236 | 237 |
Os09g0526700 | 稻 | 238 | 239 |
AT1G12780_UGE1 | 拟南芥 | 240 | 241 |
AT1G63180_UGE3 | 拟南芥 | 242 | 243 |
AT1G64440_UGE4 | 拟南芥 | 244 | 245 |
名称 | 来源生物 | 核酸SEQ IDNO: | 蛋白质SEQID NO: |
AT4G10960_UGE5 | 拟南芥 | 246 | 247 |
AT4G23920_UGE2 | 拟南芥 | 248 | 249 |
Pt_lcl|scaff_XVI.140 | Populus trichocarpa | 250 | 251 |
Pt_lcl|scaff_XI.1329 | Populus trichocarpa | 252 | 253 |
Pt_lcl|scaff_VI.203 | Populus trichocarpa | 254 | 255 |
Pt_lcl|scaff_III.961 | Populus trichocarpa | 256 | 257 |
Pt_lcl|scaff_III.1133 | Populus trichocarpa | 258 | 259 |
Pt_lcl|scaff_I.773 | Populus trichocarpa | 260 | 261 |
Pt_lcl|scaff_I.2996 | Populus trichocarpa | 262 | 263 |
Pt_lcl|scaff_5422 | Populus trichocarpa | 264 | 265 |
Ot08g015500 | Ostreococcus tauri | 266 | 267 |
SC_GAL10_P04397 | Ostreococcus tauri | 268 | 269 |
Ec_GALE_AAO37702 | 大肠杆菌(Escherichia coli) | 270 | 271 |
表A6b:UGE核酸和多肽的例子:
名称 | 来源生物 | 核酸SEQ IDNO: | 蛋白质SEQID NO: |
Brana_UGE I | 欧洲油菜 | 281 | 282 |
Brana_UGE II | 欧洲油菜 | 283 | 284 |
Zeama_UGE I | 玉米 | 285 | 286 |
Zeama_UGE II | 玉米 | 287 | 288 |
Zeama_UGE III | 玉米 | 289 | 290 |
Zeama_UGE IV | 玉米 | 291 | 292 |
Zeama_UGE V | 玉米 | 293 | 294 |
Zeama_UGE VI | 玉米 | 295 | 296 |
Zeama_UGE VII | 玉米 | 297 | 298 |
Zeama_UGE VIII | 玉米 | 299 | 300 |
Orysa_UGE | 稻 | 301 | 302 |
Glyma_UGE I | 大豆 | 303 | 304 |
Glyma_UGE II | 大豆 | 305 | 306 |
Glyma_UGE III | 大豆 | 307 | 308 |
Glyma_UGE IV | 大豆 | 309 | 310 |
Glyma_UGE V | 大豆 | 311 | 312 |
名称 | 来源生物 | 核酸SEQ IDNO: | 蛋白质SEQID NO: |
Helan_UGE | 向日葵(Helianthusannuus) | 313 | 314 |
Zeama_UGE IX | 玉米 | 315 | 316 |
Zeama_UGE X | 玉米 | 317 | 318 |
Glyma_UGE VI | 大豆 | 319 | 320 |
此外,在一些情况下,相关序列已经由研究机构如基因组研究机构(ThiInstitute for Genomic Research,TIGR)暂时汇编并且公共公开。可以使用真核生物基因直向同源物(Eukaryotic Gene Orthologs,EGO)数据库来鉴定此类相关序列,这可通过关键词搜索或者通过使用BLAST算法以目的核酸或多肽序列进行。一些列出的序列是部分的;优选全长序列或功能性等价的片段用于本发明的方法。当仅部分序列从数据库中可得时,可以通过本领域的技术人员使用标准克隆技术来获得全长基因序列。
实施例2:本发明多肽序列的比对
多肽序列的比对使用来自Vector NTI(Invitrogen)的Alignment X程序进行,其中所述Alignment X程序基于受欢迎的累进比对Clustal W算法(Thompson等人(1997)Nucleic Acids Res 25:4876-4882;Chenna等人(2003),Nucleic Acids Res 31:3497-3500)。空位开口罚分的默认值是10,空位延伸罚分0.1并且所选的权重矩阵是Blosum 62(若比对多肽)。进行少许手工编辑以优化该比对。
bHLH6样多肽序列的比对
诸bHLH6样多肽之间的序列保守性基本上在所述多肽的氨基端结构域和羧基端bHLH结构域内,中心部分通常在序列长度和组成方面更为多变。所述bHLH6样多肽在图2中比对。
RrmJ/FtsJ多肽序列的比对
在图5中显示了来自表A2的RrmJ/FtsJ多肽的CLUSTAL W(1;83)多重序列比对。
给出了在每个位置处包含高度保守的代表性氨基酸的bHLH4多肽的共有序列;在共有序列中的给定氨基酸之间的空白代表任何氨基酸。
bHLH4多肽在图10中比对。
基本上沿着bHLH结构域发现了bHLH4多肽之间的序列保守性。共有序列代表bHLH4多肽中的高度保守的氨基酸残基;共有序列中的空白代表高度可变的区域。
IPT多肽序列的比对
给出了在每个位置处包含高度保守的代表性氨基酸的IPT多肽的共有序列;在共有序列中的给定氨基酸之间的空白代表任何氨基酸。
IPT多肽在图13中比对。
共有序列代表IPT多肽中的高度保守的氨基酸残基;共有序列中的空白代表高度可变的区域。
使用邻接聚类算法(如Vector NTI(Invitrogen)的AlignX程序中提供)构建GRP多肽的进化系统树。
STO多肽中的序列保守性基本上在包含两个B框结构域的氨基端区域中。两个B框结构域通过可变长度(通常在2至20个氨基酸之间)的接头区域分隔开。
使用邻接聚类算法(如Vector NTI(Invitrogen)的AlignX程序中提供)构建STO多肽的进化系统树(图16)。
给出了在每个位置处包含高度保守的代表性氨基酸的UGE多肽的共有序列;在共有序列中的给定氨基酸之间的空白代表任何氨基酸。
UGE多肽在图20中比对。
UGE多肽之间的序列保守性在位于差向异构酶结构域的氨基端处的区域中更高。其中在共有序列中存在给定的定义的氨基酸的区域代表具有高相似性的区域;共有序列中的空白代表高度可变区域。
使用邻接聚类算法(如Vector NTI(Invitrogen)的AlignX程序中提供)构建UGE多肽的进化系统树(图21)。
实施例3:在实施本发明方法中有用的多肽序列之间的总体同一性百分数的计算
使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics.20034:29.MatGAT:使用蛋白质序列或DNA序列产生相似性/同一性矩阵的一项应用(an application thatgenerates similarity/identity matrices using protein or DNA sequences),Campanella JJ,Bitincka L,Smalley J;该软件由Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预先比对。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2)执行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵内。在分割线下半部分显示序列相似性,和在对角分割线的上半部分显示序列同一性。
比较中使用的参数是:
评分矩阵:Blosum62
第一空位:12
延伸空位:2
表B1中显示在多肽序列的全长范围内总体相似性和同一性的软件分析结果。在对角线上方以黑体给出同一性百分数而在对角线下方(正常面)给出相似性百分数。
在实施本发明方法中有用的bHLH6样多肽之间的同一性百分数可以低至与SEQ ID NO:2(AAL55713)相比30%的氨基酸同一性。但是,当比对在bHLH结构域范围内进行时,序列同一性可以在不同的bHLH6样蛋白质之间高得多。在表B2中,列出了与SEQ ID NO:9(包含bHLH6样多肽序列的bHLH结构域)比对的序列之间的总体相似性和同一性的值。序列同一性是大约80%或更高。使用的肽序列是SEQ ID NO:42,NP_001065478;SEQ ID NO:43,EAY79619;SEQ ID NO:44,AAD15818;SEQ ID NO:45,AAB00686;SEQ ID NO:46,ABD59338;SEQ ID NO:47,Pt29.195#1;SEQ ID NO:48,CAF74710;SEQ ID NO:49,AAF04917;SEQID NO:50,AAQ14332;SEQ ID NO:51,AAY90122;SEQ ID NO:52,AAL55713;SEQ ID NO:53,ABD65632;SEQ ID NO:54,ABK94979;SEQID NO:55,EDQ81347。
表B1:在多肽序列的全长范围内的总体相似性和同一性的MatGAT结果。
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | |
1.AAB00686 | 66.5 | 59.1 | 56.6 | 58.3 | 28.2 | 49.1 | 48.4 | 48.0 | 43.7 | 47.8 | 31.9 | 30.5 | 62.6 | |
2.ABD59338 | 79.1 | 54.1 | 50.1 | 55.1 | 27.9 | 46.6 | 43.8 | 45.8 | 41.7 | 45.5 | 29.5 | 31.7 | 57.4 | |
3.AAQ14332 | 71.1 | 67.7 | 53.5 | 64.0 | 28.8 | 52.1 | 45.4 | 47.8 | 43.6 | 46.2 | 29.3 | 30.6 | 60.5 | |
4.AAL55713 | 70.7 | 68.3 | 67.2 | 52.0 | 24.7 | 46.3 | 47.6 | 47.2 | 42.6 | 45.8 | 33.6 | 33.2 | 55.4 | |
5.CAF74710 | 70.2 | 68.8 | 78.4 | 66.8 | 37.3 | 52.9 | 46.4 | 49.7 | 45.5 | 49.2 | 30.0 | 30.0 | 60.5 | |
6.AAF04917 | 34.9 | 34.4 | 35.1 | 32.4 | 40.9 | 26.0 | 27.8 | 23.3 | 24.4 | 24.2 | 23.2 | 20.7 | 29.5 | |
7.AAY90122 | 63.6 | 62.1 | 68.1 | 59.6 | 67.6 | 30.7 | 41.1 | 45.1 | 42.4 | 44.2 | 27.0 | 29.8 | 49.7 | |
8.ABD65632 | 66.8 | 61.8 | 60.2 | 66.8 | 59.1 | 34.3 | 54.2 | 39.3 | 36.8 | 40.0 | 33.5 | 32.2 | 49.2 | |
9.NP001065478 | 63.8 | 63.5 | 64.8 | 60.8 | 65.5 | 30.9 | 61.4 | 53.5 | 94.7 | 79.2 | 28.7 | 29.9 | 48.3 | |
10.EAY79619 | 62.0 | 61.2 | 59.8 | 58.7 | 61.4 | 32.3 | 57.9 | 52.6 | 94.8 | 75.3 | 27.9 | 27.9 | 43.2 | |
11.AAD15818 | 62.3 | 62.4 | 63.4 | 59.0 | 65.7 | 31.1 | 62.1 | 54.1 | 87.6 | 83.3 | 28.5 | 31.1 | 47.0 | |
12.ABK94979 | 48.6 | 45.4 | 45.2 | 52.6 | 44.9 | 35.8 | 42.6 | 52.2 | 42.9 | 42.8 | 42.7 | 27.3 | 30.4 | |
13.EDQ81347 | 50.3 | 49.4 | 47.1 | 50.6 | 48.7 | 31.4 | 46.7 | 53.2 | 45.9 | 44.6 | 45.6 | 48.1 | 32.2 |
14.Pt29.195#1 | 76.8 | 72.6 | 74.5 | 71.6 | 73.4 | 36.9 | 64.0 | 66.2 | 63.7 | 61.5 | 61.8 | 47.9 | 48.8 |
表B2:在对应于基序7的肽序列范围内的总体相似性和同一性的MatGAT结果。
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | |
1.AAL55713 | 88.6 | 88.6 | 88.6 | 90.0 | 90.0 | 87.1 | 92.9 | 90.0 | 91.4 | 90.0 | 90.0 | 81.4 | 82.9 | |
2.NP_001065478 | 94.3 | 100.0 | 98.6 | 92.9 | 94.3 | 92.9 | 92.9 | 90.0 | 92.9 | 91.4 | 91.4 | 80.0 | 84.3 | |
3.EAY79619 | 94.3 | 100.0 | 98.6 | 92.9 | 94.3 | 92.9 | 92.9 | 90.0 | 92.9 | 91.4 | 91.4 | 80.0 | 84.3 | |
4.AAD15818 | 94.3 | 100.0 | 100.0 | 92.9 | 94.3 | 94.3 | 92.9 | 90.0 | 92.9 | 91.4 | 91.4 | 80.0 | 84.3 | |
5.AAB00686 | 95.7 | 95.7 | 95.7 | 95.7 | 94.3 | 90.0 | 94.3 | 91.4 | 92.9 | 92.9 | 91.4 | 84.3 | 82.9 | |
6.ABD59338 | 94.3 | 95.7 | 95.7 | 95.7 | 94.3 | 92.9 | 95.7 | 92.9 | 95.7 | 94.3 | 94.3 | 81.4 | 85.7 | |
7.Pt29.195#1 | 95.7 | 95.7 | 95.7 | 95.7 | 94.3 | 95.7 | 92.9 | 90.0 | 92.9 | 91.4 | 92.9 | 77.1 | 85.7 | |
8.CAF74710 | 97.1 | 94.3 | 94.3 | 95.7 | 94.3 | 95.7 | 98.6 | 97.1 | 97.1 | 97.1 | 94.3 | 80.0 | 85.7 | |
9.AAF04917 | 97.1 | 94.3 | 94.3 | 95.7 | 94.3 | 95.7 | 98.6 | 100.0 | 94.3 | 94.3 | 94.3 | 77.1 | 82.9 | |
10.AAQ14332 | 97.1 | 94.3 | 94.3 | 95.7 | 94.3 | 95.7 | 97.1 | 98.6 | 98.6 | 94.3 | 95.7 | 81.4 | 85.7 | |
11.AAY90122 | 95.7 | 95.7 | 95.7 | 97.1 | 95.7 | 97.1 | 98.6 | 98.6 | 98.6 | 97.1 | 92.9 | 78.6 | 84.3 | |
12.ABD65632 | 97.1 | 94.3 | 94.3 | 94.3 | 95.7 | 95.7 | 97.1 | 97.1 | 97.1 | 97.1 | 97.1 | 80.0 | 87.1 | |
13.ABK94979 | 90.0 | 88.6 | 88.6 | 88.6 | 92.9 | 88.6 | 87.1 | 88.6 | 88.6 | 88.6 | 90.0 | 90.0 | 71.4 |
14.EDQ81347 | 91.4 | 91.4 | 91.4 | 91.4 | 91.4 | 92.9 | 94.3 | 92.9 | 92.9 | 92.9 | 92.9 | 95.7 | 87.1 |
在实施本发明方法中有用的STO多肽序列之间的同一性百分数可以低至与SEQ ID NO:2(Os04g0540200)相比15%氨基酸同一性。
表B3:在稻STO蛋白质中的多肽序列的全长范围内的总体相似性和同一性的MatGAT结果。
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | |
1.Os04g0540200 | 29.4 | 32.3 | 63.1 | 33.8 | 28 | 29.2 | 39.3 | 28 | 37.2 | |
2.Os01g0202500 | 39.5 | 27.1 | 27.4 | 26.5 | 50.1 | 39.1 | 28.6 | 17.9 | 30.9 | |
3.Os02g0606200 | 49.1 | 38.4 | 30.3 | 61.2 | 26.4 | 29.6 | 31.8 | 26.6 | 29.6 | |
4.Os02g0646200 | 71.7 | 39.8 | 45.8 | 30.5 | 27 | 29.1 | 41.1 | 25.3 | 33.3 | |
5.Os04g0493000 | 48.2 | 37.5 | 71.6 | 43.9 | 28.2 | 30.4 | 34.6 | 25.7 | 31.7 | |
6.Os05g0204600 | 36.2 | 63 | 36.2 | 36 | 36 | 37.9 | 26.2 | 17.6 | 29.4 | |
7.Os06g0152200 | 40 | 54.4 | 42.5 | 39.2 | 40.3 | 54.2 | 28.8 | 21.1 | 28 | |
8.Os06g0713000 | 52.3 | 39.8 | 43.8 | 51.9 | 45.5 | 37 | 41.4 | 21.4 | 29.9 | |
9.Os09g0527900 | 39.2 | 27.5 | 34.3 | 35.3 | 41.6 | 25.7 | 30.3 | 32.5 | 25.1 | |
10.Os12g0209200 | 46.8 | 37.8 | 42.4 | 44.6 | 43.6 | 34.1 | 36.1 | 38.6 | 38.4 |
表B4:在SEQ ID NO:2的直向同源物序列中的多肽序列的全长范围内的总体相似性和同一性的MatGAT结果。
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | |
1.AT1G06040_剪接变体1 | 68.5 | 29.5 | 32 | 69.2 | 29.1 | 31.5 | 31.6 | 58.9 | 59.7 | 32.3 | 30 | 62.5 | |
2.AT1G06040_剪接变体2 | 69 | 26.2 | 30.1 | 47.4 | 38.3 | 30.6 | 32.9 | 49.4 | 49.8 | 30 | 39.3 | 48.6 | |
3.AT1G75540 | 43.2 | 35.6 | 29.5 | 28.4 | 23.4 | 35.6 | 32.3 | 30.5 | 30.2 | 51.5 | 25.5 | 29 | |
4.AT1G78600 | 48.2 | 40.1 | 45.9 | 32.1 | 28.2 | 29.7 | 28.9 | 32.1 | 32.1 | 30.9 | 30.5 | 30.6 | |
5.AT2G31380 | 82.7 | 60.9 | 40.5 | 44.5 | 29.5 | 34.6 | 32.6 | 58.2 | 58.2 | 32.2 | 29.6 | 58.3 | |
6.AT4G10240 | 41.9 | 57.6 | 32.9 | 36.5 | 42 | 30 | 31 | 31.4 | 29.3 | 23.8 | 39.9 | 30.3 | |
7.AT4G39070 | 50.4 | 43 | 47.7 | 43.5 | 48.3 | 40.9 | 46.8 | 30 | 30.4 | 38.7 | 29.6 | 30.9 | |
8.MS_ABO84497 | 49.2 | 49.1 | 46.5 | 41.8 | 49.2 | 44.6 | 60.7 | 32.6 | 30.8 | 37.5 | 35.1 | 30.6 | |
9.LE_AAS67368 | 69.4 | 57.1 | 41.4 | 45.2 | 70.6 | 45.9 | 47.1 | 51.9 | 98.3 | 33.4 | 33.2 | 65.8 | |
10.ST_ABA40448.1 | 69.8 | 57.1 | 40.8 | 45.5 | 71 | 45.1 | 47.1 | 48.5 | 99.1 | 33.1 | 32.8 | 66.7 | |
11.PP_STO | 43.5 | 37.1 | 65.3 | 43.5 | 42.6 | 33.9 | 50.3 | 53.2 | 46.1 | 46.1 | 27.3 | 30.8 | |
12.VV-CAN72879.1 | 45.6 | 53.2 | 35.6 | 45.2 | 49.2 | 54.6 | 44.2 | 47.3 | 49.8 | 48.9 | 37.1 | 30.9 | |
13.GM_ABB29467 | 74.6 | 57.1 | 40.2 | 44.1 | 73.5 | 43.7 | 45 | 50 | 76.5 | 76.5 | 42.3 | 45.4 |
在实施本发明方法中有用的UGE多肽序列之间的同一性百分数可以低至与SEQ ID NO:222相比15%氨基酸同一性。
表B5:在代表稻中UGE同种型的多肽序列的全长范围内的总体相似性和同一性的MatGAT结果。
UGE蛋白质名称 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
1.Os04g0618200 | 36.7 | 74.3 | 35.9 | 37 | 21.4 | 36.5 | 36.7 | |
2.Os05g0595100 | 51.7 | 36.2 | 65.8 | 72.2 | 21.1 | 58.6 | 99.7 |
3.Os07g0139400 | 81.7 | 50.6 | 34.7 | 34.8 | 21.5 | 33.7 | 36 | |
4.Os08g0374800 | 51 | 75.7 | 50.6 | 74.4 | 21.7 | 53.4 | 65.8 | |
5.Os09g0323000 | 51.9 | 82.4 | 49.6 | 82.1 | 22.6 | 56.3 | 72.8 | |
6.Os09g0504000 | 36.7 | 33.1 | 38.8 | 34.5 | 35.7 | 21.4 | 21.6 | |
7.Os09g0526700 | 51.4 | 74 | 48.2 | 67.6 | 72.9 | 34.5 | 58.6 | |
8.OS_UGE2 | 51.7 | 100 | 50.6 | 75.5 | 82.9 | 33.5 | 73.5 |
表B6:在代表来自不同生物的UGE同种型的多肽序列的全长范围内的总体相似性和同一性的MatGAT结果。
UGE蛋白质名称 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 |
1.AT1G12780_UGE | 90.6 | 63.3 | 64.6 | 64.3 | 33.9 | 33.1 | 32.9 | 43.6 | 65.8 | 54.3 | 33.1 | 33.5 | 24.5 | 59.6 | 47.7 | 65.1 | |
2.AT1G63180_UGE | 95.4 | 62.1 | 63.8 | 63.5 | 32.7 | 31.8 | 32.1 | 42.7 | 65.5 | 53.7 | 32 | 33.1 | 24 | 60.1 | 49.1 | 65.4 | |
3.AT1G64440_UGE | 78.3 | 77.5 | 79.2 | 79.4 | 37.6 | 34.6 | 34.2 | 32.3 | 79.6 | 64.6 | 34.4 | 33.9 | 26.9 | 59.9 | 49.3 | 74.9 | |
4.AT4G10960_UGE | 81.5 | 80.1 | 88 | 88.3 | 37.4 | 34.9 | 34.6 | 31 | 81.2 | 64.6 | 34.7 | 35.9 | 28.3 | 64.2 | 50.3 | 76.4 | |
5.AT4G23920_UGE | 80.1 | 77.8 | 88 | 92.9 | 37.1 | 35.3 | 34.8 | 31.3 | 83.1 | 65.9 | 35.3 | 35.6 | 28.5 | 62.4 | 50.4 | 75.8 | |
6.Pt_lcl|scaff_XVI.140 | 53.2 | 51.3 | 55 | 54.5 | 54 | 75.3 | 82.7 | 21.1 | 36.8 | 32.9 | 73.2 | 22.5 | 19.6 | 36.1 | 35.2 | 36.1 | |
7.Pt_lcl|scaff_XI.1329 | 49.4 | 47.5 | 51.1 | 49.2 | 49.2 | 81.5 | 76.2 | 18.9 | 34.7 | 31 | 94.5 | 21.1 | 19.9 | 33.3 | 33.1 | 34.3 | |
8.Pt_lcI|scaff_VI.203 | 49.5 | 48 | 50 | 50.2 | 48.8 | 87.6 | 85.9 | 20.4 | 34.9 | 32.2 | 75.5 | 22 | 19.4 | 34.2 | 33 | 34.3 | |
9.Pt_lcl|scaff_III.961 | 47.9 | 46.4 | 42 | 41.9 | 42.6 | 33.3 | 30.9 | 31.7 | 33.1 | 29.9 | 19.6 | 18.2 | 15.2 | 30 | 25.4 | 31.8 | |
10.Pt_lcl|scaff_III.1133 | 79.8 | 78.3 | 88.2 | 90.3 | 90.3 | 52.9 | 48.7 | 47.8 | 43.4 | 73.1 | 34.4 | 34.7 | 27.2 | 62.5 | 50 | 78.2 | |
11.Pt_lcl|scaff_I.773 | 69.2 | 68.7 | 76.1 | 76.1 | 77.4 | 49.2 | 44.1 | 45.9 | 41.9 | 80.5 | 30.8 | 28.6 | 23.7 | 52 | 41.8 | 62.5 | |
12.Pt_lcl|scaff_I.2996 | 49.4 | 47.5 | 50.8 | 49.4 | 48.9 | 80.6 | 97.1 | 85.1 | 30.9 | 48.2 | 44.1 | 20.8 | 19.4 | 33.3 | 32.4 | 34 | |
13.Pt_lcl|scaff_5422 | 45 | 44.5 | 45.8 | 48.1 | 47.3 | 39.3 | 38.4 | 39.5 | 25 | 46.4 | 40.1 | 38.2 | 32.5 | 35.5 | 32.9 | 35 | |
14.Ot08g015500 | 34.9 | 34.5 | 35.5 | 37.1 | 36.8 | 28.9 | 29.8 | 29.8 | 20 | 36.3 | 32.2 | 29.8 | 45.8 | 26.2 | 24.5 | 26.9 | |
15.SC_GAL10_P04397 | 77.8 | 76.4 | 73.6 | 75.6 | 75.3 | 52.1 | 47 | 47.3 | 40.9 | 73.9 | 65.1 | 47.2 | 48.7 | 34.6 | 47.3 | 61.7 | |
16.Ec_GALE_AAO37702 | 67.5 | 67.8 | 65.5 | 66.7 | 67.4 | 51.1 | 46.5 | 46.1 | 39.5 | 67.5 | 61.9 | 46.3 | 44.5 | 34.2 | 63.6 | 50 | |
17.OS_UGE2 | 80.2 | 79.9 | 83.9 | 87.3 | 86.7 | 55.6 | 50.6 | 50.2 | 42.1 | 87.6 | 74.3 | 50.4 | 45 | 37.5 | 73.2 | 67.8 |
也可以针对本发明的其它多肽(或其部分)产生特定结构域的局部比对的MATGAT表,或者特定结构域之间的%同一性/相似性的数据。
实施例4:鉴定在实施本发明方法中有用的多肽序列中所包含的结构域
蛋白质家族、结构域和位点的集成资源(Integrated Resousce of ProteinFamilies,Domains and Sites)(InterPro)数据库是针对基于文本及基于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库,所述数据库使用不同的方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得蛋白质特征标识。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAM。Pfam是覆盖许多常见蛋白质结构域和家族的多重序列比对结果和隐匿马尔科夫模型(HMM)的庞大集合。Pfam在英国Sanger研究所服务器上维护。Interpro由英国欧洲生物信息学研究所维护。
在表C1中呈现如SEQ ID NO:2所代表的多肽序列的InterPro扫描结果。检测的结构域归类于Interpro家族IPR001092(碱性螺旋-环-螺旋二聚化区域bHLH)和IPR001092(碱性螺旋-环-螺旋二聚化区域bHLH)。表C1:如SEQ ID NO:2所显示的多肽序列的InterPro扫描结果(主要登录号)
数据库 | 登录号 | 登录名称 | SEQ ID NO 2上的氨基酸坐标 |
HMMPfam | PF00010 | HLH | 449-498 |
ProfileScan | PS50888 | HLH | 438-498 |
超家族 | SSF47459 | HLH碱性 | 451-522 |
代表GRP(RrmJ/FtsJ多肽)的蛋白质序列被用作为查询序列以搜索InterPro数据库。在实施本发明方法中有用的GRP多肽具有核糖体RNA甲基转移酶RrmJ/FtsJ结构域(InterPro进入IPR002877和IPR015507;Pfam进入PF01728;PANTHER进入PTHR10920)。
GRP多肽(bHLH4多肽)序列被用作为查询序列以搜索InterPro数据库。在实施本发明方法中有用的GRP多肽匹配两个InterPro进入:(i)IPR001092碱性螺旋-环-螺旋二聚化区域bHLH和(ii)IPR011598螺旋-环-螺旋DNA-结合。
表C2:
InterPro登录号 | 完整的(Integrated)数据库名称 | 完整的数据库登录号 | 完整的数据库登录名称 |
IPR001092碱性螺旋-环-螺旋二聚化区域bHLH | Pfam | PF00010 | HLH |
“ | SMART | SM00353 | HLH |
“ | Prosite | PS50888 | HLH |
IPR011598螺旋-环-螺旋DNA-结合 | SSF47459 | HLH碱性 | |
未整合的(unintegrated) | Panther | PTHR12565 | |
Panther | PTHR12565 | SF7 |
GRP多肽(IPT多肽)序列被用作为查询序列以搜索InterPro数据库。在实施本发明方法中有用的GRP多肽匹配InterPro进入:(i)IPR002627;和(ii)IPR011593,如下表中所显示的:
表C3:
InterPro登录号 | 完整的数据库名称 | 完整的数据库登录号 | 完整的数据库登录名称 |
IPR002627家族tRNA异戊烯基转移酶 | ProDom | PD004674 | Q6GHD2_STAAR_Q6GHD2 |
Panther | PTHR11088 | TRNAδ(2)-异戊烯焦磷酸转移酶相关(TRNADELTA(2)-ISOPENTENYLPYROPHOSPHATETRANSFERASE-RELATED) | |
Pfam | PF01715 | IPPT | |
IPR011593结构域异戊烯基转移酶样 | ProDom | PD005388 | Q9CA35_ARATH_Q9CA35 |
未IPR整合的(integrated) | Panther | PTHR11088:SF20 | 细胞分裂素合酶(CYTOKININSYNTHASE) |
表C4中显示了如SEQ ID NO:166所示的多肽序列的InterPro扫描的结果。
表C4:如SEQ ID NO:166所示的多肽序列的InterPro扫描的结果(主要登录号)。
Interpro命中 | 登录号 | 登录号 | 名称登录号 | B-框1结构域的氨基酸 | E-值 | B-框2结构域的氨基酸 | E-值 |
坐标 | 坐标 | ||||||
IPR000315 | PFAM | PF00643 | zf-B_box | [1-47] | 1.20E-10 | [58-105] | 8.00E-12 |
SMART | SM00336 | BBOX | [1-47] | 3.00E-11 | [58-105] | 4.80E-13 | |
PROFILE | PS50119 | ZF_BBOX | [1-47] | 9.84 | [58-105] | 10.04 |
表C5:用于在pfam中针对B框结构域建立HMM的参数
表C6中显示了如SEQ ID NO:222所示的多肽序列的InterPro扫描的结果。
表C6:如SEQ ID NO:222所示的多肽序列的InterPro扫描的结果(主要登录号)
数据库 | 登录号 | 登录名称 | SEQ ID NO 2上的氨基酸坐标 | e-值 |
INTERPRO | IPR001509 | NAD-依赖性差向异构酶/脱水酶 | [9-273] | 4.20E-74 |
PFAM | PF01370 | 差向异构酶 | [9-273] | 4.20E-74 |
实施例5:在实施本发明方法中有用的多肽序列的拓扑结构预测
TargetP 1.1预测真核生物蛋白的亚细胞定位。基于任何氨基端前序列:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)的预测存在性进行定位指派。作为最终预测基础的评分并不真正是概率,并且它们不是必需地加合成一体。但是,根据TargetP,具有最高评分的定位是最可能的,并且评分之间的关系(可靠性级别)可以指示该预测具有多大确定性。可靠性级别(RC)范围从1至5,其中1表示最可靠的预测。TargetP在丹麦技术大学(Technical University of Denmark)的服务器上维护。
对于预测含有氨基端前序列的序列而言,也可以预测潜在的切割位点。
可以选择许多参数,如生物组别(非植物或植物)、界点集合(无、预定义的界点集合或用户指定的界点集合)和切割位点预测的计算(是或否)。
在表D中呈现如SEQ ID NO:2所表示的多肽序列的TargetP 1.1分析的结果。选择“植物”生物组别,未定义界点,并且对转运肽的预测长度提出要求。如SEQ ID NO:2所代表的多肽序列的亚细胞定位可以是细胞质或细胞核,没有预测到转运肽。
表D1:如SEQ ID NO:2所代表的多肽序列的TargetP 1.1分析结果
长度(AA) | 623 |
叶绿体转运肽 | 0.155 |
线粒体转运肽 | 0.143 |
分泌途径信号肽 | 0.099 |
其他亚细胞靶向 | 0.816 |
预测的位置 | / |
可靠性级别 | 2 |
预测的转运肽长度 | / |
当用PredictNLS算法分析时,预测SEQ ID NO:2的核定位具有98%的概率。
许多其他算法可以用来进行此类分析,包括:
·在丹麦技术大学服务器上维护的ChloroP 1.1;
·在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1.2版;
·在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分析专家PA-GOSUB 2.5;
·在丹麦技术大学服务器上维护的TMHMM。
代表GRP的蛋白质序列用作为查询TargetP 1.1。选择“植物”生物组别,未定义临界值,并且对转运肽的预测长度提出要求。。
在表D中呈现如SEQ ID NO:225所代表的多肽序列的TargetP 1.1分析的结果。选择“植物”生物组别,未定义临界值,并且对转运肽的预测长度提出要求。如SEQ ID NO:225所代表的多肽序列可以通过分泌途径被送至其最终的亚细胞定位。
表D2:如SEQ ID NO:222所代表的多肽序列的TargetP 1.1分析结果
长度(AA) | 354 |
叶绿体转运肽 | / |
线粒体转运肽 | 0.218 |
分泌途径信号肽 | 0.451 |
其他亚细胞靶向 | 0.268 |
预测的位置 | S* |
可靠性级别 | 5 |
预测的转运肽长度 | / |
*S:分泌途径
实施例6:bHLH6样多肽的功能测定法
在Dombrecht等人(2007)中提供AtbHLH6的DNA结合测定法。简而言之,从基因组DNA扩增出包括密码子285至623的AtbHLH6编码序列的1000-bp片段并克隆到经NheI-BamHI消化的pTacLCELD6·His载体(Xue,Plant J.41,638-649,2005)。所得构建体编码AtbHLH6的最后338个氨基酸(包括bHLH区),与报道蛋白CelD和6xHis标签的可读框符合。通过DNA测序验证正确的扩增和克隆。
根据Xue(2005)确定MYC2DNA结合基序的共有序列和这些位点的相对结合亲和力,其中DNA-结合蛋白(DBP)与6·His标记的纤维素酶D(CELD)的融合物充当用于从生物素化的随机序列寡核苷酸汇集物中选择结合位点时亲和纯化DBP-DNA复合物的工具并充当用于测量DNA-结合活性的报道分子。为了使用纤维素纸作为亲和基质选择结合位点,将DBP-CELD与40μl含有1mM EDTA,0.25μg/μl聚d(AC-TG)、1mg/mlBSA和10%甘油的(上述)结合/洗涤缓冲液中的20ng生物素标记的Bio-RS-Oligo在室温孵育1小时。适宜量的用于结合位点选择的粗制DBP-CELD是实现20-30%相对纤维素结合效率(洗涤后结合于纤维素的纤维素活性百分数)的DBP-CELD。将DBP-CELD/Bio-RS-Oligo混合物转移至含有Whatman 1滤纸(4mm2)的96孔微量滴定平板孔内,其中所述的滤纸用10μl封闭溶液[含有0.5μg/μl聚d(AC-TG)和10%甘油的结合/洗涤缓冲液]预先浸透。在0℃孵育1小时同时轻柔振摇温育后,该纤维素纸用含有1mM EDTA和0.1mg/ml BSA的结合/洗涤缓冲液洗涤6次。彻底洗涤在靶位点选择中的使用基于观察到在固体基质上固定的DBP-寡核苷酸复合物的稳定性相当高。携带靶结合位点的DBP-CELD在40℃用40μl纤维素酶洗脱缓冲液[10mM HEPES,pH7,50mM KCl,0.2mM EDTA,4mM纤维二糖,0.05mg/ml BSA和10μg/ml有义序列-特异性引物SP-S]洗脱15分钟。洗脱物用于所选择寡核苷酸的PCR扩增。未经纯化的PCR产物(0.1μl)用于下一轮位点选择。
备选地,6·His标记的DBP-CELD(10-25μg粗制蛋白)在室温于含有10mM咪唑和350μg Ni-NTA磁性琼脂糖珠(Qiagen)的60μl PNT缓冲液(50mM磷酸钠,pH8.0,300mM NaCl和0.05%吐温20)中孵育45-60分钟,同时在微量管混和仪(日本东京Tomy Seiko Co.)中轻柔振荡。通过将所述管置于12管磁体(Qiagen)中,在管的侧边收集所述Ni-NTA磁珠。未结合的蛋白质通过用含有20mM咪唑的150-200μl PNT洗涤3次并用含有2mM MgCl2、1mg/ml BSA和10%甘油的60μl结合/洗涤缓冲液洗涤1次除去。洗过的珠子悬浮在含有2mM MgCl2,0.25μg/μl聚d(AC-TG),1mg/ml BSA,0.0025%Nonidet P-40,10%甘油和生物素标记的寡核苷酸(50ng Bio-RS-Oligo或从先前选择的寡核苷酸中扩增的1μl PCR产物)的40μl结合/洗涤缓冲液中。悬浮液在室温孵育1.5小时,同时在微量管混和仪中轻柔振荡。用含有2mMMgCl2、0.1mg/ml BSA和0.0025%Nonidet P-40的150-200μl结合/洗涤缓冲液洗涤4次(每次洗涤3-4分钟)后,携带靶位点结合的BDP-CELD的珠子重悬于8μl含有5μg/ml有义序列特异性引物(SP-S)的5mM Tris-Cl(pH8.0)/0.5mM EDTA中,并且悬浮液转移至一只清洁管内并用于所选择寡核苷酸的PCR扩增。未经纯化的PCR产物(1μl)用于下一轮位点选择。
对于EMSA测定法,利用高严格结合缓冲液(50mM磷酸钠,pH8.0,1MNaCl,10%甘油,1%吐温20和10mM咪唑),使用Ni-NTA磁性琼脂糖珠纯化6·His标记的DBP-CELD蛋白,并且该方法的其余部分按照制造商的说明书进行。在3’末端以洋地黄毒甙标记的双链合成性寡核苷酸(30-45fmol)与纯化的DBP(30-75ng)在15μl结合缓冲液[25mM HEPES/KOH,pH 7.0,50mM KCl,0.5mM DTT,2mM MgCl2,0.2μg/μl聚d(AC-TG),0.3mg/mlBSA和10%甘油]中孵育。在室温孵育30分钟后,DBP/DNA复合物在含有5mM乙酸钠,0.5mM EDTA和5%甘油的40-mM Tris乙酸盐缓冲液(pH 7.5)中的6%聚丙烯酰胺凝胶上与游离探针分开。电泳后,将凝胶中的DBP/DNA复合物和游离探针转移至Hybond Np膜。碱性磷酸酶缀和的抗洋地黄毒甙抗体和化学发光底物CDP-Star(Roche Diagnostics)用于根据制造商的说明书检测洋地黄毒甙。
其他细节在Xue(2005)中提供。
实施例7:在本发明方法中所用的核酸序列的克隆
本发明方法中所用的核酸序列通过PCR,使用定制的拟南芥幼苗cDNA文库(在pCMV Sport 6.0内;Invitrogen,Paisley,UK)作为模板进行扩增。使用Hifi Taq DNA聚合酶,在标准条件下利用在50μl PCR混合物中的200ng模板进行PCR。所用的引物是prm06515(SEQ ID NO:10;有义,起始密码子为粗体字):
和prm06516(SEQ ID NO:11;反义,互补):
5’-ggggaccactttgtacaagaaagctgggtacacccttttaaccgattttt-3’,
其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间根据Gateway术语学,所述PCR片段与pDONR201质粒在体内重组以产生“进入克隆”pbHLH6样。质粒pDONR201作为技术的部分从Invitrogen购买。
包含SEQ ID NO:1的进入克隆随后在LR反应中与用于稻转化法的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于根特异性表达的稻GOS2启动子(SEQ ID NO:12)位于该Gateway盒上游。
在所述LR重组步骤后,所得表达载体pGOS2::bHLH6样(图3)根据本领域熟知的方法转化入农杆菌菌株LBA4044。
实施例8:植物转化
稻转化
使用含有所述表达载体的农杆菌来转化稻植物。将稻粳型栽培品种Nipponbare的成熟干燥种子脱壳。通过如下方式实施消毒:在70%乙醇中孵育1分钟,随后在0.2%HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将胚发生的盾片衍生的愈伤组织切下并在相同的培养基上增殖。2周后,将所述愈伤组织通过在同一种培养基上传代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代培养3日,随后共培育(以助长细胞分裂活性)。
将含有所述表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后收集细菌并在液体共培育培养基中悬浮至密度(OD600)约1。该悬液随后转移至培养皿内并将所述愈伤组织浸没于此悬液中15分钟。该愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并在25℃于黑暗中孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28℃于黑暗中在选择剂存在下培育4周。在此期间,迅速生长的抗性愈伤组织团发育。将这种材料转移至再生培养基并在光照下孵育后,释放了胚发生潜能并且枝条在随后4至5周内发育。将枝条从愈伤组织上切下并且在含有植物生长素的培养基上孵育2至3周,将枝条从所述培养基转移至土壤。硬化的枝条在温室中于高湿度和短日照下培育。
对于一个构建体,产生大约35个独立的T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后,仅保留针对所述选择剂显示抗性的单拷贝转基因植物用于收获T1种子。种子随后在移栽后3至5个月收获。该方法以超过50%的比例产生单基因座转化体(Aldemita和Hodges 1996,Chan等1993,Hiei等1994)。
玉米转化
玉米(Zea mays)的转化用Ishida等人(1996).Nature Biotech 14(6):745-50所述方法的改良方法进行。在玉米中,转化是基因型依赖的并且仅特定基因型适合于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材料的良好来源,不过其他基因型也可以成功地使用。谷穗在授粉后大约11日(DAP)从玉米植物收获,此时不成熟胚的长度是大约1至1.2mm。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至枝条发育。将源自每个胚的绿色枝条转移至玉米生根培养基并在25℃孵育2-3周,直至根发育。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
小麦转化
小麦的转化用Ishida等人(1996)Nature Biotech 14(6):745-50描述的方法进行。栽培品种Bobwhite(可从墨西哥CIMMYT获得)通常用于转化中。不成熟的胚与含有所述表达载体的根癌农杆菌培育,并且转基因植物通过器官发生过程回收。在与农杆菌培育后,所述胚在愈伤组织诱导培养基上、随后在玉米再生培养基上体外培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至枝条发育。将源自每个胚的绿色枝条转移至生根培养基并在25℃孵育2-3周,直至根发育。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
大豆转化
根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大豆。几个商业大豆品种适合于通过这种方法转化。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。将下胚轴、胚根和一片子叶从7日龄年幼幼苗中切下。进一步培育上胚轴和剩余子叶以使辅助节发育。切下这些辅助节并与含有所述表达载体的根癌农杆菌孵育。在共培育处理之后,洗涤外植体并转移至选择培养基。切下再生的枝条并置于枝条伸长培养基上。将长度不超过1cm的枝条置于生根培养基上直至根发育。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
油菜/卡诺拉油菜转化
使用5-6日龄年幼幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等人(1998,Plant Cell Rep 17:183-188)进行转化。商业品种Westar(Agriculture Canada)是用于转化的标准品种,不过其他品种也可以使用。对卡诺拉油菜种子进行表面消毒以便体外播种。从所述体外幼苗切下附带子叶的子叶叶柄外植体,并且通过将此叶柄外植体的切口末端浸入细菌悬液以(含有所述表达载体的)农杆菌接种。所述外植体随后在23℃,16小时光照下于含有3mg/l BAP、3%蔗糖、0.7%植物琼脂的MSBAP-3培养基上培养2日。与农杆菌共培育2日后,将所述叶柄外植体转移至含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至枝条再生。当枝条长度是5-10mm时,切下这些枝条并转移至枝条伸长培养基(MSBAP-0.5,含有0.5mg/l BAP)。将长度大约2cm的枝条转移至生根培养基(MS0)用于根诱导。将生根的枝条(shoot)移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
苜蓿转化
使用(McKersie等,1999Plant Physiol 119:839-847)的方法转化苜蓿((Medicago sativa))的再生性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW和A Atanassov(1985.Plant Cell Tissue Culture 4:111-112)所述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养(Walker等,1978Am J Bot 65:654-659)。叶柄外植体与含有所述表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999PlantPhysiol 119:839-847)或LBA4404的过夜培养物共培育。所述外植体在黑暗中于含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3日。所述外植体在浓度减半的Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有合适选择剂和抑止农杆菌生长的合适抗生素的相同SH诱导培养基上。几周后,将体细胞胚转移至不含生长调节剂、不含抗生素和含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在浓度减半的Murashige-Skoog培养基上萌发。生根的幼苗移植至花钵内并且在温室中培育。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
棉花转化
使用根癌农杆菌根据US5,159,135中描述的方法转化棉花。将棉花种子在3%次氯酸钠溶液中在20分钟的期间内表面灭菌,并且在具500μg/ml头孢噻肟的蒸馏水中洗涤。然后将种子转移至具有50μg/ml苯菌灵的SH培养基中用于萌发。将4-6日龄的幼苗的下胚轴移出,切割成0.5cm的片,放置在0.8%的琼脂上。使用农杆菌悬浮液(大约108个细胞每ml,自用目的基因和适当的选择标记转化的过夜培养物中稀释)用于接种下胚轴外植体。在室温和光照下3天后,将组织转移至固体培养基(1.6g/l Gelrite),其具有Murashige和Skoog盐(具有B5维生素(Gamborg等人,Exp.CellRes.50:151-158(1968))、0.1mg/l 2,4-D、0.1mg/l 6-糠胺嘌呤和750μg/mlMgCL2),并且具有50-100μg/ml的头孢噻肟和400-500μg/ml的羧苄西林以杀死剩余的细菌。在两个或三个月后(每4至6周继代培养)分离单个细胞系,然后将它们进一步培养在选择培养基上用于组织扩增(30℃,16小时光照期)。然后将转化的组织再培养在非选择性培养基中,经过2至3个月以产生体细胞胚。至少4mm长的健康样子的胚被转移至具有SH培养基的试管中,所述培养基在细的蛭石(vermiculite)中,补充有0.1mg/l的吲哚乙酸、6糠胺嘌呤和赤霉酸。将胚培养在30℃,光周期为16小时,并且将第2或3叶阶段的小植株转移到具有蛭石和营养物的花盆中。将植物硬化并且随后移到温室中用于进一步培养。
实施例9:表型评价方法
9.1评价建立
产生大约35个独立的T0稻转化体。将原代转化体从组织培养室转移至温室以培育和收获T1种子。留下下述6个事件,其中所述事件的T1子代对所述转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1幼苗(杂合子和纯合子)和大约10株缺少该转基因的T1幼苗(失效合子)。转基因植物和相应的失效合子以随机的位置并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃,和70%相对湿度。
4个T1事件在T2世代中按照如对T1世代相同的评价方法进一步评估,不过每个事件采用更多个体。植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
干旱筛选
来自T2种子的植物在盆栽土壤中在正常条件下培育直至它们达到抽穗期。随后将它们转移至其中减少灌溉的“干燥”区域。将湿度探针插入随机选择的花钵内,以监测土壤水分含量(SWC)。当SWC下降低于某个阈值时,自动地对所述植物连续地再灌溉直至再次达到正常水平。随后将植物再次转移至正常条件。其余的培育(植物成熟、种子收获)与并不在非生物胁迫条件下培育的植物相同。如对正常条件下生长详述那样记录生长和产量参数。
氮使用效率筛选
源自T2种子的稻植物在盆栽土壤中于正常条件下培育,除了营养溶液之外。从移植至成熟期间用氮(N)浓度降低、通常7至8倍之间降低的特定营养溶液浇灌所述花钵。其余的培育(植物成熟、种子收获)与并不在非生物胁迫下培育的植物相同。如对正常条件下的生长详述那样记录生长和产量参数。
盐胁迫筛选
植物在由椰子纤维和argex(3∶1比率)组成的基质上培育。在温室中移植小植物后,在头两周期间使用正常营养溶液。在这两周后,添加25mM盐(NaCl)至所述营养溶液,直至收获植物。随后测量种子相关参数。
9.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于所述F检验设置在5%概率水平上。显著性F检验值指出基因作用,这意味不仅仅是基因的存在或位置才造成表型上的差异。
因为实施了具有重叠事件的两个实验,故而进行联合分析。这用于检验对这两个实验影响的一致性,并且若是一致的,则用于积累来自两个实验的证据以提高结论的可信度。所用方法是考虑数据的多重水平结构的混合模型法(即实验-事件-分离子)。通过比较针对卡方分布的似然比检验而获得P-值。
9.3测量的参数
生物量相关的参数测量
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是植物已经实现其最大叶生物量的时间点上所测量的面积。早期萌发势是萌发后3周的植物(幼苗)地上部分的面积。
早期萌发势通过计数来自植物部分的区别于背景的像素总数确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。下述结果针对萌发后3周的植物。
种子相关的参数测量
将成熟的原发圆锥花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述圆锥花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。饱满种子数通过计数所述分离步骤后仍留下的充实粒的数目来确定。种子总产量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。从计数的饱满种子数及其总重量外推出千粒重(TKW)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义的每圆锥花序总花数是种子总数与成熟原发圆锥花序之间的比例。如本发明中定义的种子饱满率是饱满种子数对种子(或小花)总数的比例(表述为%)。每圆锥花序的花数从总种子数和第一圆锥花序数计算,并且是植物上每圆锥花序的小花的平均数的评估。
实施例10:转基因植物表型评价的结果
在正常生长条件下培育的表达SEQ ID NO:2的bHLH6样蛋白质的转基因稻植物相比于对照植物,显示出出苗萌发势和种子产量的提高(如每圆锥花序的花数所显示的,见下表)。这些提高在用T1和T2世代植物的2个实验中测量,并且是统计学显著的。
T1世代 | T2世代 | |
参数 | %提高 | %提高 |
出苗萌发势 | 11.9 | 2.8 |
每圆锥花序的花数 | 7.4 | 6.2 |
此外,对于种子总重量、饱满种子数和收获指数,在T1和T2世代中观察到正向作用。
实施例11:在本发明方法中有用的核酸序列的克隆
SEQ ID NO:57的克隆(编码RrmJ/FtsJ甲基转移酶)
鉴定和选择在同步烟草BY2细胞培养物(烟草淡黄色-2栽培品种(Nicotiana tabacum L.cv.Bright Yellow-2)上进行的cDNA-AFLP实验,以及受细胞周期调节的BY2表达序列标签用于进一步克隆。使用所述表达序列标签来筛选烟草cDNA文库(在Gateway相容载体中;Invitrogen Paisley,UK)以分离全长目的cDNA,即编码SEQ ID NO:57所示的RrmJ/FtsJ甲基转移酶核酸序列的cDNA。
包含SEQ ID NO:57的分离的质粒随后在LR反应中与用于稻转化法的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于种子特异性表达的稻油质蛋白启动子(SEQ ID NO:91)位于该Gateway盒上游。
在所述LR重组步骤后,所得表达载体pOleo::GRP(图6)根据本领域熟知的方法转化入农杆菌菌株LBA4044。
实施例12:植物转化
稻转化
使用含有所述表达载体的农杆菌来转化稻植物。将稻粳型栽培品种Nipponbare的成熟干燥种子脱壳。通过如下方式实施消毒:在70%乙醇中孵育1分钟,随后在0.2%HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将胚发生的盾片衍生的愈伤组织切下并在相同的培养基上增殖。2周后,将所述愈伤组织通过在同一种培养基上传代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代培养3日,随后共培育(以助长细胞分裂活性)。
将含有所述表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后收集细菌并在液体共培育培养基中悬浮至密度(OD600)约1。该悬液随后转移至培养皿内并将所述愈伤组织浸没于此悬液中15分钟。该愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并在25℃于黑暗中孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28℃于黑暗中在选择剂存在下培育4周。在此期间,迅速生长的抗性愈伤组织团发育。将这种材料转移至再生培养基并在光照下孵育后,释放了胚发生潜能并且枝条在随后4至5周内发育。将枝条从愈伤组织上切下并且在含有植物生长素的培养基上孵育2至3周,将枝条从所述培养基转移至土壤。硬化的枝条在温室中于高湿度和短日照下培育。
对于一个构建体,产生大约35个独立的T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后,仅保留针对所述选择剂显示抗性的单拷贝转基因植物用于收获T1种子。种子随后在移栽后3至5个月收获。该方法以超过50%的比例产生单基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
实施例13:表型评价方法
13.1评价建立
产生大约35个独立的T0稻转化体。将原代转化体从组织培养室转移至温室以培育和收获T1种子。留下下述6个事件,其中所述事件的T1子代对所述转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1幼苗(杂合子和纯合子)和大约10株缺少该转基因的T1幼苗(失效合子)。转基因植物和相应的失效合子以随机的位置并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃,和70%相对湿度。
4个T1事件在T2世代中按照如对T1世代相同的评价方法进一步评估,不过每个事件采用更多个体。
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
干旱筛选
来自T2种子的植物在盆栽土壤中在正常条件下培育直至它们达到抽穗期。随后将它们转移至其中减少灌溉的“干燥”区域。将湿度探针插入随机选择的花钵内,以监测土壤水分含量(SWC)。当SWC下降低于某个阈值时,自动地对所述植物连续地再灌溉直至再次达到正常水平。随后将植物再次转移至正常条件。其余的培育(植物成熟、种子收获)与并不在非生物胁迫条件下培育的植物相同。如对正常条件生长下详述那样记录生长和产量参数。
氮使用效率筛选
源自T2种子的稻植物在盆栽土壤中于正常条件下培育,除了营养溶液之外。从移植至成熟期间用氮(N)浓度降低、通常7至8倍之间降低的特定营养溶液浇灌所述花钵。其余的培育(植物成熟、种子收获)与并不在非生物胁迫下培育的植物相同。如对正常条件生长下详述那样记录生长和产量参数。
13.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于所述F检验设置在5%概率水平上。显著性F检验值指出基因作用,这意味不仅仅是基因的存在或位置才造成表型上的差异。
因为实施了具有重叠事件的两个实验,故而进行联合分析。这用于检验对这两个实验影响的一致性,并且若是一致的,则用于积累来自两个实验的证据以提高结论的可信度。所用方法是考虑数据的多重水平结构的混合模型法(即实验-事件-分离子)。通过比较针对卡方分布的似然比检验而获得P-值。
13.3测量的参数
生物量相关的参数测量
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是植物已经实现其最大叶生物量的时间点上所测量的面积。
种子相关的参数测量
将成熟的原发圆锥花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述圆锥花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。饱满种子数通过计数所述分离步骤后仍留下的充实粒的数目来确定。种子总产量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。从计数的饱满种子数及其总重量外推出千粒重(TKW)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义的每圆锥花序总花数是种子总数与成熟原发圆锥花序之间的比例。如本发明中定义的种子饱满率是饱满种子数对种子(或小花)总数的比例(表述为%)。
实施例14:转基因植物表型评价的结果
在油质蛋白启动子的控制下表达如SEQ ID NO:57所表示的GRP核酸序列的转基因稻植物显示对于种子总重量、饱满种子数、饱满率和收获指数超过5%的提高。
在T1世代中2个事件的平均%提高 | 在T2世代中2个事件的平均%提高 | |
每株植物的总种子产量 | 48% | 46% |
饱满种子总数 | 46% | 44% |
饱满率 | 39% | 45% |
收获指数 | 40% | 40% |
实施例15:其他作物转化
玉米转化
玉米(Zea mays)的转化用Ishida等人(1996).Nature Biotech 14(6):745-50所述方法的改良方法进行。在玉米中,转化是基因型依赖的并且仅特定基因型适合于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材料的良好来源,不过其他基因型也可以成功地使用。谷穗在授粉后大约11日(DAP)从玉米植物收获,此时不成熟胚的长度是大约1至1.2mm。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至枝条发育。将源自每个胚的绿色枝条转移至玉米生根培养基并在25℃孵育2-3周,直至根发育。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
小麦转化
小麦的转化用Ishida等人(1996)Nature Biotech 14(6):745-50描述的方法进行。栽培品种Bobwhite(可从墨西哥CIMMYT获得)通常用于转化中。不成熟的胚与含有所述表达载体的根癌农杆菌培育,并且转基因植物通过器官发生过程回收。在与农杆菌培育后,所述胚在愈伤组织诱导培养基上、随后在玉米再生培养基上体外培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至枝条发育。将源自每个胚的绿色枝条转移至生根培养基并在25℃孵育2-3周,直至根发育。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
大豆转化
根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大豆。几个商业大豆品种适合于通过这种方法转化。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。将下胚轴、胚根和一片子叶从7日龄年幼幼苗中切下。进一步培育上胚轴和剩余子叶以使辅助节发育。切下这些辅助节并与含有所述表达载体的根癌农杆菌孵育。在共培育处理之后,洗涤外植体并转移至选择培养基。切下再生的枝条并置于枝条伸长培养基上。将长度不超过1cm的枝条置于生根培养基上直至根发育。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
油菜/卡诺拉油菜转化
使用5-6日龄年幼幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等人(1998,Plant Cell Rep 17:183-188)进行转化。商业品种Westar(Agriculture Canada)是用于转化的标准品种,不过其他品种也可以使用。对卡诺拉油菜种子进行表面消毒以便体外播种。从所述体外幼苗切下附带子叶的子叶叶柄外植体,并且通过将此叶柄外植体的切口末端浸入细菌悬液以(含有所述表达载体的)农杆菌接种。所述外植体随后在23℃,16小时光照下于含有3mg/l BAP、3%蔗糖、0.7%植物琼脂的MSBAP-3培养基上培养2日。与农杆菌共培育2日后,将所述叶柄外植体转移至含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至枝条再生。当枝条长度是5-10mm时,切下这些枝条并转移至枝条伸长培养基(MSBAP-0.5,含有0.5mg/l BAP)。将长度大约2cm的枝条转移至生根培养基(MS0)用于根诱导。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
苜蓿转化
使用(McKersie等,1999 Plant Physiol 119:839-847)的方法转化苜蓿(Medicago sativa)的再生性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW和A Atanassov(1985.Plant Cell Tissue Culture 4:111-112)所述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养(Walker等,1978Am J Bot 65:654-659)。叶柄外植体与含有所述表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999PlantPhysiol 119:839-847)或LBA4404的过夜培养物共培育。所述外植体在黑暗中于含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3日。所述外植体在浓度减半的Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有合适选择剂和抑止农杆菌生长的合适抗生素的相同SH诱导培养基上。几周后,将体细胞胚转移至不含生长调节剂、不含抗生素和含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在浓度减半的Murashige-Skoog培养基上萌发。生根的幼苗移植至花钵内并且在温室中培育。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
棉花转化
使用根癌农杆菌,在下胚轴外植体上进行棉花(Gossypium hirsutum L.)转化。商业品种如Coker 130或Coker 312(SeedCo,Lubbock,TX)是用于转化的标准品种,不过其他品种也可以使用。将种子进行表面消毒并在黑暗中萌发。从萌发的幼苗切下下胚轴外植体成约1-1.5厘米长度。该下胚轴外植体浸没在含有所述表达载体的根癌农杆菌接种物中5分钟,随后在MS+1.8mg/l KNO3+2%葡萄糖上在24℃于黑暗中共培育约48小时。所述外植体转移至含有适宜细菌选择标记和植物选择标记的相同培养基(更换数次),直至看到生胚性愈伤组织。将所述愈伤组织分开继代培养直至体细胞胚出现。从所述体细胞胚衍生的小植物在生根培养基上成熟直至根发育。将生根的枝条移植至温室中的盆栽土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
实施例16:在本发明方法中所用的核酸序列的克隆
克隆SEQ ID NO:104(编码GRP,其中所述GRP多肽是碱性-螺旋-环-螺旋4(bHLH4)多肽)
本发明方法中所用的核酸序列SEQ ID NO:104通过PCR,使用定制的拟南芥混合组织cDNA文库(在pCMV Sport 6.0内;Invitrogen,Paisley,UK)作为模板进行扩增。使用Hifi Taq DNA聚合酶,在标准条件下利用在50μl PCR混合物中的200ng模板进行PCR。所用的引物是prm06763(SEQID NO:107;有义):
5’ggggacaagtttgtacaaaaaagcaggcttaaacaatggctccgacgaatgtt 3’
和prm06764(SEQ ID NO:108;反义,互补):
5’ggggaccactttgtacaagaaagctgggttgctgacttcaattcatggac 3’
其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间根据Gateway术语学,所述PCR片段与pDONR201质粒在体内重组以产生“进入克隆”。质粒pDONR201作为技术的部分从Invitrogen购买。
包含SEQ ID NO:104的进入克隆随后在LR反应中与用于稻转化法的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于组成型表达的稻HMGB启动子(SEQ ID NO:106)位于该Gateway盒上游。
在所述LR重组步骤后,所得表达载体pHMGB::GRP(图8)根据本领域熟知的方法转化入农杆菌菌株LBA4044。
实施例17:植物转化
稻转化
使用含有所述表达载体的农杆菌来转化稻植物。将稻粳型栽培品种Nipponbare的成熟干燥种子脱壳。通过如下方式实施消毒:在70%乙醇中孵育1分钟,随后在0.2%HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将胚发生的盾片衍生的愈伤组织切下并在相同的培养基上增殖。2周后,将所述愈伤组织通过在同一种培养基上传代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代培养3日,随后共培育(以助长细胞分裂活性)。
将含有所述表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后收集细菌并在液体共培育培养基中悬浮至密度(OD600)约1。该悬液随后转移至培养皿内并将所述愈伤组织浸没于此悬液中15分钟。该愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并在25℃于黑暗中孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28℃于黑暗中在选择剂存在下培育4周。在此期间,迅速生长的抗性愈伤组织团发育。将这种材料转移至再生培养基并在光照下孵育后,释放了胚发生潜能并且枝条在随后4至5周内发育。将枝条从愈伤组织上切下并且在含有植物生长素的培养基上孵育2至3周,将枝条从所述培养基转移至土壤。硬化的枝条在温室中于高湿度和短日照下培育。
对于一个构建体,产生大约35个独立的T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后,仅保留针对所述选择剂显示抗性的单拷贝转基因植物用于收获T1种子。种子随后在移栽后3至5个月收获。该方法以超过50%的比例产生单基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
实施例18:表型评价方法
18.1评价建立
产生大约35个独立的T0稻转化体。将原代转化体从组织培养室转移至温室以培育和收获T1种子。留下下述5个事件,其中所述事件的T1子代对所述转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1幼苗(杂合子和纯合子)和大约10株缺少该转基因的T1幼苗(失效合子)。转基因植物和相应的失效合子以随机的位置并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃,和70%相对湿度。
4个T1事件在T2世代中按照如对T1世代相同的评价方法进一步评估,不过每个事件采用更多个体。
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
18.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于所述F检验设置在5%概率水平上。显著性F检验值指出基因作用,这意味不仅仅是基因的存在或位置才造成表型上的差异。
因为实施了具有重叠事件的两个实验,故而进行联合分析。这用于检验对这两个实验影响的一致性,并且若是一致的,则用于积累来自两个实验的证据以提高结论的可信度。所用方法是考虑数据的多重水平结构的混合模型法(即实验-事件-分离子)。通过比较针对卡方分布的似然比检验而获得P-值。
18.3测量的参数
生物量相关的参数测量
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是植物已经实现其最大叶生物量的时间点上所测量的面积。
种子相关的参数测量
将成熟的原发圆锥花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述圆锥花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。饱满种子数通过计数所述分离步骤后仍留下的充实粒的数目来确定。种子总产量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。从计数的饱满种子数及其总重量外推出千粒重(TKW)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义的每圆锥花序总花数是种子总数与成熟原发圆锥花序之间的比例。如本发明中定义的种子饱满率是饱满种子数对种子(或小花)总数的比例(表述为%)。
实施例19:转基因植物表型评价的结果
在HMGB启动子的控制下表达如SEQ ID NO:104所表示的GRP核酸序列的转基因稻植物显示对于种子总重量、饱满种子数、饱满率和收获指数超过5%的提高。
T1世代中5个事件的总平均%提高 | T2世代中2个事件平均%提高 | |
早期萌发势 | 21% | 7% |
每株植物的总种子产量 | 23% | 27% |
饱满种子总数 | 22% | 28% |
种子饱满率 | 12% | 15% |
收获指数 | 18% | 17% |
绿度指数 | 4% | 9% |
实施例20:其他作物转化
玉米转化
玉米(Zea mays)的转化用Ishida等人(1996).Nature Biotech 14(6):745-50所述方法的改良方法进行。在玉米中,转化是基因型依赖的并且仅特定基因型适合于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材料的良好来源,不过其他基因型也可以成功地使用。谷穗在授粉后大约11日(DAP)从玉米植物收获,此时不成熟胚的长度是大约1至1.2mm。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至枝条发育。将源自每个胚的绿色枝条转移至玉米生根培养基并在25℃孵育2-3周,直至根发育。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
小麦转化
小麦的转化用Ishida等人(1996)Nature Biotech 14(6):745-50描述的方法进行。栽培品种Bobwhite(可从墨西哥CIMMYT获得)通常用于转化中。不成熟的胚与含有所述表达载体的根癌农杆菌培育,并且转基因植物通过器官发生过程回收。在与农杆菌培育后,所述胚在愈伤组织诱导培养基上、随后在玉米再生培养基上体外培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至枝条发育。将源自每个胚的绿色枝条转移至生根培养基并在25℃孵育2-3周,直至根发育。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
大豆转化
根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大豆。几个商业大豆品种适合于通过这种方法转化。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。将下胚轴、胚根和一片子叶从7日龄年幼幼苗中切下。进一步培育上胚轴和剩余子叶以使辅助节发育。切下这些辅助节并与含有所述表达载体的根癌农杆菌孵育。在共培育处理之后,洗涤外植体并转移至选择培养基。切下再生的枝条并置于枝条伸长培养基上。将长度不超过1cm的枝条置于生根培养基上直至根发育。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
油菜/卡诺拉油菜转化
使用5-6日龄年幼幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等人(1998,Plant Cell Rep 17:183-188)进行转化。商业品种Westar(Agriculture Canada)是用于转化的标准品种,不过其他品种也可以使用。对卡诺拉油菜种子进行表面消毒以便体外播种。从所述体外幼苗切下附带子叶的子叶叶柄外植体,并且通过将此叶柄外植体的切口末端浸入细菌悬液以(含有所述表达载体的)农杆菌接种。所述外植体随后在23℃,16小时光照下于含有3mg/l BAP、3%蔗糖、0.7%植物琼脂的MSBAP-3培养基上培养2日。与农杆菌共培育2日后,将所述叶柄外植体转移至含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至枝条再生。当枝条长度是5-10mm时,切下这些枝条并转移至枝条伸长培养基(MSBAP-0.5,含有0.5mg/l BAP)。将长度大约2cm的枝条转移至生根培养基(MS0)用于根诱导。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
苜蓿转化
使用(McKersie等,1999Plant Physiol 119:839-847)的方法转化苜蓿(Medicago sativa)的再生性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW和A Atanassov(1985.Plant Cell Tissue Culture 4:111-112)所述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养(Walker等,1978Am J Bot 65:654-659)。叶柄外植体与含有所述表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999PlantPhysiol 119:839-847)或LBA4404的过夜培养物共培育。所述外植体在黑暗中于含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3日。所述外植体在浓度减半的Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有合适选择剂和抑止农杆菌生长的合适抗生素的相同SH诱导培养基上。几周后,将体细胞胚转移至不含生长调节剂、不含抗生素和含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在浓度减半的Murashige-Skoog培养基上萌发。生根的幼苗移植至花钵内并且在温室中培育。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
棉花转化
使用根癌农杆菌,在下胚轴外植体上进行棉花(Gossypium hirsutum L.)转化。商业品种如Coker 130或Coker 312(SeedCo,Lubbock,TX)是用于转化的标准品种,不过其他品种也可以使用。将种子进行表面消毒并在黑暗中萌发。从萌发的幼苗切下下胚轴外植体成约1-1.5厘米长度。该下胚轴外植体浸没在含有所述表达载体的根癌农杆菌接种物中5分钟,随后在MS+1.8mg/l KNO3+2%葡萄糖上在24℃于黑暗中共培育约48小时。所述外植体转移至含有适宜细菌选择标记和植物选择标记的相同培养基(更换数次),直至看到生胚性愈伤组织。将所述愈伤组织分开继代培养直至体细胞胚出现。从所述体细胞胚衍生的小植物在生根培养基上成熟直至根发育。将生根的枝条移植至温室中的盆栽土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
实施例21:非生物胁迫筛选
干旱筛选
来自T1、T2或其它世代的稻植物在盆栽土壤中在正常条件下培育直至它们达到抽穗期。随后将它们转移至其中减少灌溉的“干燥”区域。将湿度探针插入随机选择的花钵内,以监测土壤水分含量(SWC)。当SWC下降低于某个阈值时,自动地对所述植物连续地再灌溉直至再次达到正常水平。随后将植物再次转移至正常条件。其余的培育(植物成熟、种子收获)与并不在非生物胁迫条件下培育的植物相同。如对正常条件生长下详述那样记录生长和产量参数。
盐胁迫筛选
来自T1、T2或其它世代的稻植物在由椰子纤维和argex(3∶1比率)组成的基质上培育。在温室中移植小植物后,在头两周期间使用正常营养溶液。在这两周后,添加25mM盐(NaCl)至所述营养溶液,直至收获植物。如对正常条件生长下详述那样记录生长和产量参数。
氮使用效率筛选
来自T1、T2或其它世代的稻植物在盆栽土壤中于正常条件下培育,除了营养溶液之外。从移植至成熟期间用氮(N)浓度降低、通常7至8倍之间降低的特定营养溶液浇灌所述花钵。其余的培育(植物成熟、种子收获)与并不在非生物胁迫下培育的植物相同。如对正常条件生长下详述那样记录生长和产量参数。
实施例22:在本发明方法中所用的核酸序列的克隆
克隆SEQ ID NO:131(编码GRP,其中所述GRP多肽是异戊烯基转移酶(IPT)多肽)
本发明方法中所用的核酸序列SEQ ID NO:131通过PCR,使用定制的拟南芥混合组织cDNA文库(在pCMV Sport 6.0内;Invitrogen,Paisley,UK)作为模板进行扩增。使用Hifi Taq DNA聚合酶,在标准条件下利用在50μl PCR混合物中的200ng模板进行PCR。所用的引物是prm03095(SEQID NO:134;有义):
5’ggggacaagtttgtacaaaaaagcaggcttcacaatgacagaactcaacttccac 3’
和prm03096(SEQ ID NO:135;反义,互补):
5’ggggaccactttgtacaagaaagctgggtaactaattttgcaccaaatg 3’
其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间根据Gateway术语学,所述PCR片段与pDONR201质粒在体内重组以产生“进入克隆”。质粒pDONR201作为技术的部分从Invitrogen购买。
包含SEQ ID NO:131的进入克隆随后在LR反应中与用于稻转化法的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于种子特异性表达的稻谷醇溶蛋白启动子(SEQ ID NO:133)位于该Gateway盒上游。
在所述LR重组步骤后,所得表达载体pProl::GRP(图11)根据本领域熟知的方法转化入农杆菌菌株LBA4044。
实施例23:植物转化
稻转化
使用含有所述表达载体的农杆菌来转化稻植物。将稻粳型栽培品种Nipponbare的成熟干燥种子脱壳。通过如下方式实施消毒:在70%乙醇中孵育1分钟,随后在0.2%HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将胚发生的盾片衍生的愈伤组织切下并在相同的培养基上增殖。2周后,将所述愈伤组织通过在同一种培养基上传代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代培养3日,随后共培育(以助长细胞分裂活性)。
将含有所述表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后收集细菌并在液体共培育培养基中悬浮至密度(OD600)约1。该悬液随后转移至培养皿内并将所述愈伤组织浸没于此悬液中15分钟。该愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并在25℃于黑暗中孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28℃于黑暗中在选择剂存在下培育4周。在此期间,迅速生长的抗性愈伤组织团发育。将这种材料转移至再生培养基并在光照下孵育后,释放了胚发生潜能并且枝条在随后4至5周内发育。将枝条从愈伤组织上切下并且在含有植物生长素的培养基上孵育2至3周,将枝条从所述培养基转移至土壤。硬化的枝条在温室中于高湿度和短日照下培育。
对于一个构建体,产生大约35个独立的T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后,仅保留针对所述选择剂显示抗性的单拷贝转基因植物用于收获T1种子。种子随后在移栽后3至5个月收获。该方法以超过50%的比例产生单基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
实施例24:表型评价方法
24.1评价建立
产生大约35个独立的T0稻转化体。将原代转化体从组织培养室转移至温室以培育和收获T1种子。留下下述6个事件,其中所述事件的T1子代对所述转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1幼苗(杂合子和纯合子)和大约10株缺少该转基因的T1幼苗(失效合子)。转基因植物和相应的失效合子以随机的位置并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃,和70%相对湿度。
4个T1事件在T2世代中按照如对T1世代相同的评价方法进一步评估,不过每个事件采用更多个体。
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
24.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于所述F检验设置在5%概率水平上。显著性F检验值指出基因作用,这意味不仅仅是基因的存在或位置才造成表型上的差异。
因为实施了具有重叠事件的两个实验,故而进行联合分析。这用于检验对这两个实验影响的一致性,并且若是一致的,则用于积累来自两个实验的证据以提高结论的可信度。所用方法是考虑数据的多重水平结构的混合模型法(即实验-事件-分离子)。通过比较针对卡方分布的似然比检验而获得P-值。
24.3测量的参数
生物量相关的参数测量
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是植物已经实现其最大叶生物量的时间点上所测量的面积。
种子相关的参数测量
将成熟的原发圆锥花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述圆锥花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。饱满种子数通过计数所述分离步骤后仍留下的充实粒的数目来确定。种子总产量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。从计数的饱满种子数及其总重量外推出千粒重(TKW)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义的每圆锥花序总花数是种子总数与成熟原发圆锥花序之间的比例。如本发明中定义的种子饱满率是饱满种子数对种子(或小花)总数的比例(表述为%)。
实施例25:转基因植物表型评价的结果
在谷醇溶蛋白启动子的控制下表达如SEQ ID NO:131所表示的GRP核酸序列的转基因稻植物显示对于每株植物的总种子产量、饱满种子数、种子总数和收获指数超过5%的提高。
T1世代中4个事件的总平均%提高 | T2世代中4个事件平均%提高 | |
每株植物的总种子产量 | 19% | 14% |
饱满种子数 | 20% | 16% |
种子总数 | 16% | 8% |
收获指数 | 9% | 15% |
实施例26:其他作物转化
玉米转化
玉米(Zea mays)的转化用Ishida等人(1996).Nature Biotech 14(6):745-50所述方法的改良方法进行。在玉米中,转化是基因型依赖的并且仅特定基因型适合于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材料的良好来源,不过其他基因型也可以成功地使用。谷穗在授粉后大约11日(DAP)从玉米植物收获,此时不成熟胚的长度是大约1至1.2mm。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至枝条发育。将源自每个胚的绿色枝条转移至玉米生根培养基并在25℃孵育2-3周,直至根发育。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
小麦转化
小麦的转化用Ishida等人(1996)Nature Biotech 14(6):745-50描述的方法进行。栽培品种Bobwhite(可从墨西哥CIMMYT获得)通常用于转化中。不成熟的胚与含有所述表达载体的根癌农杆菌培育,并且转基因植物通过器官发生过程回收。在与农杆菌培育后,所述胚在愈伤组织诱导培养基上、随后在玉米再生培养基上体外培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至枝条发育。将源自每个胚的绿色枝条转移至生根培养基并在25℃孵育2-3周,直至根发育。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
大豆转化
根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大豆。几个商业大豆品种适合于通过这种方法转化。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。将下胚轴、胚根和一片子叶从7日龄年幼幼苗中切下。进一步培育上胚轴和剩余子叶以使辅助节发育。切下这些辅助节并与含有所述表达载体的根癌农杆菌孵育。在共培育处理之后,洗涤外植体并转移至选择培养基。切下再生的枝条并置于枝条伸长培养基上。将长度不超过1cm的枝条置于生根培养基上直至根发育。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
油菜/卡诺拉油菜转化
使用5-6日龄年幼幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等人(1998,Plant Cell Rep 17:183-188)进行转化。商业品种Westar(Agriculture Canada)是用于转化的标准品种,不过其他品种也可以使用。对卡诺拉油菜种子进行表面消毒以便体外播种。从所述体外幼苗切下附带子叶的子叶叶柄外植体,并且通过将此叶柄外植体的切口末端浸入细菌悬液以(含有所述表达载体的)农杆菌接种。所述外植体随后在23℃,16小时光照下于含有3mg/l BAP、3%蔗糖、0.7%植物琼脂的MSBAP-3培养基上培养2日。与农杆菌共培育2日后,将所述叶柄外植体转移至含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至枝条再生。当枝条长度是5-10mm时,切下这些枝条并转移至枝条伸长培养基(MSBAP-0.5,含有0.5mg/l BAP)。将长度大约2cm的枝条转移至生根培养基(MS0)用于根诱导。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
苜蓿转化
使用(McKersie等,1999Plant Physiol 119:839-847)的方法转化苜蓿(Medicago sativa)的再生性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW和A Atanassov(1985.Plant Cell Tissue Culture 4:111-112)所述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养(Walker等,1978Am J Bot 65:654-659)。叶柄外植体与含有所述表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999PlantPhysiol 119:839-847)或LBA4404的过夜培养物共培育。所述外植体在黑暗中于含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3日。所述外植体在浓度减半的Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有合适选择剂和抑止农杆菌生长的合适抗生素的相同SH诱导培养基上。几周后,将体细胞胚转移至不含生长调节剂、不含抗生素和含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在浓度减半的Murashige-Skoog培养基上萌发。生根的幼苗移植至花钵内并且在温室中培育。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
棉花转化
使用根癌农杆菌,在下胚轴外植体上进行棉花(Gossypium hirsutum L.)转化。商业品种如Coker 130或Coker 312(SeedCo,Lubbock,TX)是用于转化的标准品种,不过其他品种也可以使用。将种子进行表面消毒并在黑暗中萌发。从萌发的幼苗切下下胚轴外植体成约1-1.5厘米长度。该下胚轴外植体浸没在含有所述表达载体的根癌农杆菌接种物中5分钟,随后在MS+1.8mg/l KNO3+2%葡萄糖上在24℃于黑暗中共培育约48小时。所述外植体转移至含有适宜细菌选择标记和植物选择标记的相同培养基(更换数次),直至看到生胚性愈伤组织。将所述愈伤组织分开继代培养直至体细胞胚出现。从所述体细胞胚衍生的小植物在生根培养基上成熟直至根发育。将生根的枝条移植至温室中的盆栽土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
实施例27:非生物胁迫筛选
干旱筛选
来自T1、T2或其它世代的稻植物在盆栽土壤中在正常条件下培育直至它们达到抽穗期。随后将它们转移至其中减少灌溉的“干燥”区域。将湿度探针插入随机选择的花钵内,以监测土壤水分含量(SWC)。当SWC下降低于某个阈值时,自动地对所述植物连续地再灌溉直至再次达到正常水平。随后将植物再次转移至正常条件。其余的培育(植物成熟、种子收获)与并不在非生物胁迫条件下培育的植物相同。如对正常条件生长下详述那样记录生长和产量参数。
盐胁迫筛选
来自T1、T2或其它世代的稻植物在由椰子纤维和argex(3∶1比率)组成的基质上培育。在温室中移植小植物后,在头两周期间使用正常营养溶液。在这两周后,添加25mM盐(NaCl)至所述营养溶液,直至收获植物。如对正常条件生长下详述那样记录生长和产量参数。
氮使用效率筛选
来自T1、T2或其它世代的稻植物在盆栽土壤中于正常条件下培育,除了营养溶液之外。从移植至成熟期间用氮(N)浓度降低、通常7至8倍之间降低的特定营养溶液浇灌所述花钵。其余的培育(植物成熟、种子收获)与并不在非生物胁迫下培育的植物相同。如对正常条件生长下详述那样记录生长和产量参数。
实施例28:在本发明方法中所用的核酸序列(编码STO(盐耐受性)蛋白质)的克隆
本发明方法中所用的核酸序列通过PCR,使用定制的稻幼苗cDNA文库(在pCMV Sport 6.0内;Invitrogen,Paisley,UK)作为模板进行扩增。使用Hifi Taq DNA聚合酶,在标准条件下利用在50μl PCR混合物中的200ng模板进行PCR。所用的引物是prm1-STO(SEQ ID NO:216;有义,起始密码子为粗体字):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaaaggtgcagtgcga-3’和prm2-STO(SEQ ID NO:217;反义,互补):5’-ggggacactttgtacaagaaagctgggttcaccagtacaagcagggag 3’,其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间根据Gateway术语学,所述PCR片段与pDONR201质粒在体内重组以产生“进入克隆”pSTO。质粒pDONR201作为技术的部分从Invitrogen购买。
包含SEQ ID NO:168的进入克隆随后在LR反应中与用于稻转化法的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于根特异性表达的稻GOS2启动子(SEQ ID NO:218)位于该Gateway盒上游。
在所述LR重组步骤后,所得表达载体pGOS2::STO(图17)根据本领域熟知的方法转化入农杆菌菌株LBA4044。
实施例29:植物转化
稻转化
使用含有所述表达载体的农杆菌来转化稻植物。将稻粳型栽培品种Nipponbare的成熟干燥种子脱壳。通过如下方式实施消毒:在70%乙醇中孵育1分钟,随后在0.2%HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将胚发生的盾片衍生的愈伤组织切下并在相同的培养基上增殖。2周后,将所述愈伤组织通过在同一种培养基上传代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代培养3日,随后共培育(以助长细胞分裂活性)。
将含有所述表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后收集细菌并在液体共培育培养基中悬浮至密度(OD600)约1。该悬液随后转移至培养皿内并将所述愈伤组织浸没于此悬液中15分钟。该愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并在25℃于黑暗中孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28℃于黑暗中在选择剂存在下培育4周。在此期间,迅速生长的抗性愈伤组织团发育。将这种材料转移至再生培养基并在光照下孵育后,释放了胚发生潜能并且枝条在随后4至5周内发育。将枝条从愈伤组织上切下并且在含有植物生长素的培养基上孵育2至3周,将枝条从所述培养基转移至土壤。硬化的枝条在温室中于高湿度和短日照下培育。
对于一个构建体,产生大约35个独立的T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后,仅保留针对所述选择剂显示抗性的单拷贝转基因植物用于收获T1种子。种子随后在移栽后3至5个月收获。该方法以超过50%的比例产生单基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
玉米转化
玉米(Zea mays)的转化用Ishida等人(1996).Nature Biotech 14(6):745-50所述方法的改良方法进行。在玉米中,转化是基因型依赖的并且仅特定基因型适合于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材料的良好来源,不过其他基因型也可以成功地使用。谷穗在授粉后大约11日(DAP)从玉米植物收获,此时不成熟胚的长度是大约1至1.2mm。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至枝条发育。将源自每个胚的绿色枝条转移至玉米生根培养基并在25℃孵育2-3周,直至根发育。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
小麦转化
小麦的转化用Ishida等人(1996)Nature Biotech 14(6):745-50描述的方法进行。栽培品种Bobwhite(可从墨西哥CIMMYT获得)通常用于转化中。不成熟的胚与含有所述表达载体的根癌农杆菌培育,并且转基因植物通过器官发生过程回收。在与农杆菌培育后,所述胚在愈伤组织诱导培养基上、随后在玉米再生培养基上体外培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至枝条发育。将源自每个胚的绿色枝条转移至生根培养基并在25℃孵育2-3周,直至根发育。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
大豆转化
根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大豆。几个商业大豆品种适合于通过这种方法转化。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。将下胚轴、胚根和一片子叶从7日龄年幼幼苗中切下。进一步培育上胚轴和剩余子叶以使辅助节发育。切下这些辅助节并与含有所述表达载体的根癌农杆菌孵育。在共培育处理之后,洗涤外植体并转移至选择培养基。切下再生的枝条并置于枝条伸长培养基上。将长度不超过1cm的枝条置于生根培养基上直至根发育。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
油菜/卡诺拉油菜转化
使用5-6日龄年幼幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等人(1998,Plant Cell Rep 17:183-188)进行转化。商业品种Westar(Agriculture Canada)是用于转化的标准品种,不过其他品种也可以使用。对卡诺拉油菜种子进行表面消毒以便体外播种。从所述体外幼苗切下附带子叶的子叶叶柄外植体,并且通过将此叶柄外植体的切口末端浸入细菌悬液以(含有所述表达载体的)农杆菌接种。所述外植体随后在23℃,16小时光照下于含有3mg/l BAP、3%蔗糖、0.7%植物琼脂的MSBAP-3培养基上培养2日。与农杆菌共培育2日后,将所述叶柄外植体转移至含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至枝条再生。当枝条长度是5-10mm时,切下这些枝条并转移至枝条伸长培养基(MSBAP-0.5,含有0.5mg/l BAP)。将长度大约2cm的枝条转移至生根培养基(MS0)用于根诱导。将生根的枝条(shoot)移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
苜蓿转化
使用(MeKersie等,1999Plant Physiol 119:839-847)的方法转化苜蓿((Medicago sativa))的再生性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW和A Atanassov(1985.Plant Cell Tissue Culture 4:111-112)所述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养(Walker等,1978Am J Bot 65:654-659)。叶柄外植体与含有所述表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999PlantPhysiol 119:839-847)或LBA4404的过夜培养物共培育。所述外植体在黑暗中于含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3日。所述外植体在浓度减半的Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有合适选择剂和抑止农杆菌生长的合适抗生素的相同SH诱导培养基上。几周后,将体细胞胚转移至不含生长调节剂、不含抗生素和含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在浓度减半的Murashige-Skoog培养基上萌发。生根的幼苗移植至花钵内并且在温室中培育。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
实施例30:表型评价方法
30.1评价建立
产生大约35个独立的T0稻转化体。将原代转化体从组织培养室转移至温室以培育和收获T1种子。留下下述6个事件,其中所述事件的T1子代对所述转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1幼苗(杂合子和纯合子)和大约10株缺少该转基因的T1幼苗(失效合子)。转基因植物和相应的失效合子以随机的位置并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃,和70%相对湿度。
4个T1事件在T2世代中按照如对T1世代相同的评价方法进一步评估,不过每个事件采用更多个体。植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
干旱筛选
来自T2种子的植物在盆栽土壤中在正常条件下培育直至它们达到抽穗期。随后将它们转移至其中减少灌溉的“干燥”区域。将湿度探针插入随机选择的花钵内,以监测土壤水分含量(SWC)。当SWC下降低于某个阈值时,自动地对所述植物连续地再灌溉直至再次达到正常水平。随后将植物再次转移至正常条件。其余的培育(植物成熟、种子收获)与并不在非生物胁迫条件下培育的植物相同。如对正常条件下生长详述那样记录生长和产量参数。
氮使用效率筛选
源自T2种子的稻植物在盆栽土壤中于正常条件下培育,除了营养溶液之外。从移植至成熟期间用氮(N)浓度降低、通常7至8倍之间降低的特定营养溶液浇灌所述花钵。其余的培育(植物成熟、种子收获)与并不在非生物胁迫下培育的植物相同。如对正常条件下的生长详述那样记录生长和产量参数。
30.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于所述F检验设置在5%概率水平上。显著性F检验值指出基因作用,这意味不仅仅是基因的存在或位置才造成表型上的差异。
因为实施了具有重叠事件的两个实验,故而进行联合分析。这用于检验对这两个实验影响的一致性,并且若是一致的,则用于积累来自两个实验的证据以提高结论的可信度。所用方法是考虑数据的多重水平结构的混合模型法(即实验-事件-分离子)。通过比较针对卡方分布的似然比检验而获得P-值。
30.3测量的参数
生物量相关的参数测量
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是植物已经实现其最大叶生物量的时间点上所测量的面积。早期萌发势是萌发后3周的植物(幼苗)地上部分的面积。根生物量的提高表述为总根生物量(测量为植物生命期期间观察到的最大的根生物量)的提高;或者表述为根/枝条指数(测量为在根和枝条活性生长阶段根量和枝条量之间的比例)的提高
早期萌发势通过计数来自植物部分的区别于背景的像素总数确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。下述结果针对萌发后3周的植物。
按照以前所述计算开花时间(PCT/EP2007/001422)。简而言之,计算在播种和当第一个圆锥花序在植物中出现时之间所持续的时间。第一个圆锥花序的出现是指在植物的摄像图像(如(PCT/EP2007/001422)中所描述的进行)中圆锥花序是可见并且可检测的时间点。
种子相关的参数测量
将成熟的原发圆锥花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述圆锥花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。饱满种子数通过计数所述分离步骤后仍留下的充实粒的数目来确定。种子总产量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。从计数的饱满种子数及其总重量外推出千粒重(TKW)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义的每圆锥花序总花数是种子总数与成熟原发圆锥花序之间的比例。如本发明中定义的种子饱满率是饱满种子数对种子(或小花)总数的比例(表述为%)。
实施例31:转基因植物表型评价的结果
在非胁迫条件下表达STO核酸的转基因稻植物的评价结果显示如下。与相对的对照植物相比,对于出苗萌发势(早期萌发势)观察到至少5%的提高,并且在第3至6天之间(6%-9%),取决于特定的转基因系,在转基因植物中观察到更早的开花。
在干旱胁迫条件下表达STO核酸的转基因稻植物的评价结果显示如下。对于总种子重量、饱满种子数、饱满率、收获指数和千粒重观察到提高(表D)。
表D:转基因STO植物的表型评价结果
参数 | 转基因植物相对于对照植物的差异百分数 |
出苗萌发势 | 15 |
开花时间(早/更短) | 7 |
实施例32:在本发明方法中所用的核酸序列(编码UGE(UDP-葡萄糖4-差向异构酶或UDP-Gal4-差向异构酶)多肽)的克隆
本发明方法中所用的核酸序列通过PCR,使用定制的稻幼苗cDNA文库(在pCMV Sport 6.0内;Invitrogen,Paisley,UK)作为模板进行扩增。使用Hifi Taq DNA聚合酶,在标准条件下利用在50μl PCR混合物中的200ng模板进行PCR。所用的引物是prm1(SEQ ID NO:272;有义,起始密码子为粗体字):5’-ggggacaagtttgtacaaaaaagcaggcttaaacagtttcggccttgttg-3’和prm2(SEQ ID NO:273;反义,互补):5’-ggggaccactttgtacaagaaagctgggtgctgctgctactggaggatt-3’,其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间根据Gateway术语学,所述PCR片段与pDONR201质粒在体内重组以产生“进入克隆”pUGE。质粒pDONR201作为技术的部分从Invitrogen购买。
包含SEQ ID NO:224的进入克隆随后在LR反应中与用于稻转化法的目的载体一起使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于根特异性表达的稻GOS2启动子(SEQ ID NO:274)位于该Gateway盒上游。
在所述LR重组步骤后,所得表达载体pGOS2::UGE(图22)根据本领域熟知的方法转化入农杆菌菌株LBA4044。
实施例33:植物转化
稻转化
使用含有所述表达载体的农杆菌来转化稻植物。将稻粳型栽培品种Nipponbare的成熟干燥种子脱壳。通过如下方式实施消毒:在70%乙醇中孵育1分钟,随后在0.2%HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将胚发生的盾片衍生的愈伤组织切下并在相同的培养基上增殖。2周后,将所述愈伤组织通过在同一种培养基上传代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代培养3日,随后共培育(以助长细胞分裂活性)。
将含有所述表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后收集细菌并在液体共培育培养基中悬浮至密度(OD600)约1。该悬液随后转移至培养皿内并将所述愈伤组织浸没于此悬液中15分钟。该愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并在25℃于黑暗中孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28℃于黑暗中在选择剂存在下培育4周。在此期间,迅速生长的抗性愈伤组织团发育。将这种材料转移至再生培养基并在光照下孵育后,释放了胚发生潜能并且枝条在随后4至5周内发育。将枝条从愈伤组织上切下并且在含有植物生长素的培养基上孵育2至3周,将枝条从所述培养基转移至土壤。硬化的枝条在温室中于高湿度和短日照下培育。
对于一个构建体,产生大约35个独立的T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后,仅保留针对所述选择剂显示抗性的单拷贝转基因植物用于收获T1种子。种子随后在移栽后3至5个月收获。该方法以超过50%的比例产生单基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
玉米转化
玉米(Zea mays)的转化用Ishida等人(1996).Nature Biotech 14(6):745-50所述方法的改良方法进行。在玉米中,转化是基因型依赖的并且仅特定基因型适合于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材料的良好来源,不过其他基因型也可以成功地使用。谷穗在授粉后大约11日(DAP)从玉米植物收获,此时不成熟胚的长度是大约1至1.2mm。不成熟的胚与含有所述表达载体的根癌农杆菌共培育,并且转基因植物通过器官发生过程回收。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至枝条发育。将源自每个胚的绿色枝条转移至玉米生根培养基并在25℃孵育2-3周,直至根发育。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
小麦转化
小麦的转化用Ishida等人(1996)Nature Biotech 14(6):745-50描述的方法进行。栽培品种Bobwhite(可从墨西哥CIMMYT获得)通常用于转化中。不成熟的胚与含有所述表达载体的根癌农杆菌培育,并且转基因植物通过器官发生过程回收。在与农杆菌培育后,所述胚在愈伤组织诱导培养基上、随后在玉米再生培养基上体外培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25℃于光照下孵育2-3周,或直至枝条发育。将源自每个胚的绿色枝条转移至生根培养基并在25℃孵育2-3周,直至根发育。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
大豆转化
根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大豆。几个商业大豆品种适合于通过这种方法转化。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。将下胚轴、胚根和一片子叶从7日龄年幼幼苗中切下。进一步培育上胚轴和剩余子叶以使辅助节发育。切下这些辅助节并与含有所述表达载体的根癌农杆菌孵育。在共培育处理之后,洗涤外植体并转移至选择培养基。切下再生的枝条并置于枝条伸长培养基上。将长度不超过1cm的枝条置于生根培养基上直至根发育。将生根的枝条移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
油菜/卡诺拉油菜转化
使用5-6日龄年幼幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等人(1998,Plant Cell Rep 17:183-188)进行转化。商业品种Westar(Agriculture Canada)是用于转化的标准品种,不过其他品种也可以使用。对卡诺拉油菜种子进行表面消毒以便体外播种。从所述体外幼苗切下附带子叶的子叶叶柄外植体,并且通过将此叶柄外植体的切口末端浸入细菌悬液以(含有所述表达载体的)农杆菌接种。所述外植体随后在23℃,16小时光照下于含有3mg/l BAP、3%蔗糖、0.7%植物琼脂的MSBAP-3培养基上培养2日。与农杆菌共培育2日后,将所述叶柄外植体转移至含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至枝条再生。当枝条长度是5-10mm时,切下这些枝条并转移至枝条伸长培养基(MSBAP-0.5,含有0.5mg/l BAP)。将长度大约2cm的枝条转移至生根培养基(MS0)用于根诱导。将生根的枝条(shoot)移植至温室中的土壤内。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
苜蓿转化
使用(McKersie等,1999Plant Physiol 119:839-847)的方法转化苜蓿((Medicago sativa))的再生性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW和A Atanassov(1985.Plant Cell Tissue Culture 4:111-112)所述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养(Walker等,1978Am J Bot 65:654-659)。叶柄外植体与含有所述表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999PlantPhysiol 119:839-847)或LBA4404的过夜培养物共培育。所述外植体在黑暗中于含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3日。所述外植体在浓度减半的Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有合适选择剂和抑止农杆菌生长的合适抗生素的相同SH诱导培养基上。几周后,将体细胞胚转移至不含生长调节剂、不含抗生素和含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在浓度减半的Murashige-Skoog培养基上萌发。生根的幼苗移植至花钵内并且在温室中培育。从针对所述选择剂显示耐受性并且含有单拷贝T-DNA插入物的植物产生T1种子。
实施例34:表型评价方法
34.1评价建立
产生大约35个独立的T0稻转化体。将原代转化体从组织培养室转移至温室以培育和收获T1种子。留下下述6个事件,其中所述事件的T1子代对所述转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一个,通过监测目视标记表达而选出大约10株含有该转基因的T1幼苗(杂合子和纯合子)和大约10株缺少该转基因的T1幼苗(失效合子)。转基因植物和相应的失效合子以随机的位置并排培育。温室条件是短日照(12小时光照),在光照下28℃和在黑暗中22℃,和70%相对湿度。
4个T1事件在T2世代中按照如对T1世代相同的评价方法进一步评估,不过每个事件采用更多个体。植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
干旱筛选
来自T2种子的植物在盆栽土壤中在正常条件下培育直至它们达到抽穗期。随后将它们转移至其中减少灌溉的“干燥”区域。将湿度探针插入随机选择的花钵内,以监测土壤水分含量(SWC)。当SWC下降低于某个阈值时,自动地对所述植物连续地再灌溉直至再次达到正常水平。随后将植物再次转移至正常条件。其余的培育(植物成熟、种子收获)与并不在非生物胁迫条件下培育的植物相同。如对正常条件下生长详述那样记录生长和产量参数。
氮使用效率筛选
源自T2种子的稻植物在盆栽土壤中于正常条件下培育,除了营养溶液之外。从移植至成熟期间用氮(N)浓度降低、通常7至8倍之间降低的特定营养溶液浇灌所述花钵。其余的培育(植物成熟、种子收获)与并不在非生物胁迫下培育的植物相同。如对正常条件下的生长详述那样记录生长和产量参数。
34.2统计分析:F-检验
使用两因素ANOVA(变量分析)作为整体评价植物表型特征的统计模型。对于用本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基因总体作用显著性的阈值对于所述F检验设置在5%概率水平上。显著性F检验值指出基因作用,这意味不仅仅是基因的存在或位置才造成表型上的差异。
因为实施了具有重叠事件的两个实验,故而进行联合分析。这用于检验对这两个实验影响的一致性,并且若是一致的,则用于积累来自两个实验的证据以提高结论的可信度。所用方法是考虑数据的多重水平结构的混合模型法(即实验-事件-分离子)。通过比较针对卡方分布的似然比检验而获得P-值。
34.3测量的参数
生物量相关的参数测量
植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同角度拍摄每株植物的数字图像(2048x1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上区别于背景的像素总数而确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是植物已经实现其最大叶生物量的时间点上所测量的面积。早期萌发势是萌发后3周的植物(幼苗)地上部分的面积。根生物量的提高表述为总根生物量(测量为植物生命期期间观察到的最大的根生物量)的提高;或者表述为根/枝条指数(测量为在根和枝条活性生长阶段根量和枝条量之间的比例)的提高
早期萌发势通过计数来自植物部分的区别于背景的像素总数确定。该值对相同时间点上从不同角度拍摄的画面进行平均化并且转化成通过校正以平方mm表述的物理表面值。下述结果针对萌发后3周的植物。
种子相关的参数测量
将成熟的原发圆锥花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干燥3日。随后将所述圆锥花序脱粒,并且收集和计数全部种子。充实粒使用吹气装置与空粒分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。饱满种子数通过计数所述分离步骤后仍留下的充实粒的数目来确定。种子总产量通过称量从一株植物收获的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数目测量。从计数的饱满种子数及其总重量外推出千粒重(TKW)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义的每圆锥花序总花数是种子总数与成熟原发圆锥花序之间的比例。如本发明中定义的种子饱满率是饱满种子数对种子(或小花)总数的比例(表述为%)。
实施例35:转基因植物表型评价的结果
在非胁迫条件下和在干旱胁迫条件下(水受限)表达UGE核酸的转基因稻植物的评价结果显示如下。对于总种子产量、饱满种子数、饱满率和收获指数观察到至少5%的提高。表E显示了表型评价的结果。
表E:转基因植物的表型评价结果
产量性状 | 非胁迫 | 干旱胁迫 |
%差异转基因/对照* | %差异转基因/对照* | |
种子产量(克) | 15 | 45 |
饱满种子Nr | 13 | 42 |
饱满率 | 5 | 45 |
收获指数 | 10 | 49 |
*在转基因植物相对于对应的对照无义纯合子植物中测量的提高,表述为百分数(%)。
序列表
<110>巴斯夫植物科学有限公司(BASF Plant Science GmbH)
<120>具有增强的产量相关性状的植物和用于制备该植物的方法
<130>PF59348
<160>320
<170>PatentIn版本3.3
<210>1
<211>1872
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<400>1
atgactgatt accggctaca accaacgatg aatctttgga ccaccgacga caacgcttct 60
atgatggaag ctttcatgag ctcttccgat atctcaactt tatggcctcc ggcgtcgacg 120
acaaccacga cggcgacgac tgaaacaact ccgacgccgg cgatggagat tccggcacag 180
gcgggattta atcaagagac tcttcagcaa cgtttacaag ctttgattga aggaacacac 240
gaaggttgga cctacgctat attctggcaa ccgtcgtatg atttctccgg cgcctccgtg 300
ctcggatggg gagatggtta ttacaaaggt gaagaagata aagcaaaccc gagacggaga 360
tcgagttcgc cgccgttttc tactccggcg gatcaggagt acaggaaaaa agtgttgaga 420
gagcttaact cgttgatctc cggtggtgtt gctccgtcgg atgacgctgt tgatgaggag 480
gtgacggata cggaatggtt tttcttggtt tcgatgacgc agagcttcgc ttgcggtgcg 540
ggattagctg gtaaagcgtt tgcaacgggt aacgcggttt gggtttccgg gtcagatcaa 600
ttatccgggt cgggttgtga acgggctaag caaggaggag tgtttgggat gcatactatt 660
gcgtgtattc cttcggcgaa cggagttgtg gaagtcgggt caacggagcc gatccgacag 720
agttcggacc ttattaacaa ggttcgaatt cttttcaatt tcgacggcgg agctggagat 780
ttatcgggtc ttaattggaa tcttgacccg gatcaaggtg agaacgaccc gtctatgtgg 840
attaatgacc cgattggaac acctggatct aacgaaccgg gtaacggagc tccaagttct 900
agctcccagc ttttttcaaa gtctattcag tttgagaacg gtagctcaag cacaataacc 960
gaaaacccga atctggatcc gactccgagt ccggttcatt ctcagaccca gaatccgaaa 1020
ttcaataaca ctttctcccg agaacttaat ttttcgacgt caagttctac tttagtgaaa 1080
ccaagatccg gcgagatatt aaacttcggc gatgaaggta aacgaagctc cggaaacccg 1140
gatccaagtt cttattcggg tcaaacacaa ttcgaaaaca aaagaaagag gtcgatggtt 1200
ttgaacgaag ataaagttct atcattcgga gataaaaccg ccggagaatc agatcactcc 1260
gatctagaag cttccgtcgt gaaagaagta gcagtagaga aacgtccaaa gaaacgagga 1320
agaaagccag caaacggtag agaagagcca ctaaaccacg tcgaagcaga gagacaaaga 1380
cgcgagaaac taaaccaaag attctacgcg ttacgagcgg ttgtaccaaa cgtttcaaaa 1440
atggataaag cttcgttact cggtgacgca atcgcttaca tcaacgagct taaatccaaa 1500
gtagtcaaaa cagagtcaga gaaactccaa atcaagaacc agctcgagga agtgaaactc 1560
gagctcgccg gaagaaaagc gagtgctagt ggaggagata tgtcgtcttc gtgttcttcg 1620
attaaaccgg tggggatgga gattgaagtg aagataattg gttgggacgc aatgattaga 1680
gttgaatcta gtaagaggaa tcatccggcg gcgaggttga tgtcggcgtt gatggatttg 1740
gagttggaag tgaatcacgc gagtatgtcg gtggttaacg atttgatgat tcaacaagcg 1800
acggtgaaga tgggttttag gatctatacg caagaacagc tcagagcaag tttgatttca 1860
aaaatcggtt aa 1872
<210>2
<211>623
<212>PRT
<213>拟南芥
<400>2
Met Thr Asp Tyr Arg Leu Gln Pro Thr Met Asn Leu Trp Thr Thr Asp
1 5 10 15
Asp Asn Ala Ser Met Met Glu Ala Phe Met Ser Ser Ser Asp Ile Ser
20 25 30
Thr Leu Trp Pro Pro Ala Ser Thr Thr Thr Thr Thr Ala Thr Thr Glu
35 40 45
Thr Thr Pro Thr Pro Ala Met Glu Ile Pro Ala Gln Ala Gly Phe Asn
50 55 60
Gln Glu Thr Leu Gln Gln Arg Leu Gln Ala Leu Ile Glu Gly Thr His
65 70 75 80
Glu Gly Trp Thr Tyr Ala Ile Phe Trp Gln Pro Ser Tyr Asp Phe Ser
85 90 95
Gly Ala Ser Val Leu Gly Trp Gly Asp Gly Tyr Tyr Lys Gly Glu Glu
100 105 110
Asp Lys Ala Asn Pro Arg Arg Arg Ser Ser Ser Pro Pro Phe Ser Thr
115 120 125
Pro Ala Asp Gln Glu Tyr Arg Lys Lys Val Leu Arg Glu Leu Asn Ser
130 135 140
Leu Ile Ser Gly Gly Val Ala Pro Ser Asp Asp Ala Val Asp Glu Glu
145 150 155 160
Val Thr Asp Thr Glu Trp Phe Phe Leu Val Ser Met Thr Gln Ser Phe
165 170 175
Ala Cys Gly Ala Gly Leu Ala Gly Lys Ala Phe Ala Thr Gly Asn Ala
180 185 190
Val Trp Val Ser Gly Ser Asp Gln Leu Ser Gly Ser Gly Cys Glu Arg
195 200 205
Ala Lys Gln Gly Gly Val Phe Gly Met His Thr Ile Ala Cys Ile Pro
210 215 220
Ser Ala Asn Gly Val Val Glu Val Gly Ser Thr Glu Pro Ile Arg Gln
225 230 235 240
Ser Ser Asp Leu Ile Asn Lys Val Arg Ile Leu Phe Asn Phe Asp Gly
245 250 255
Gly Ala Gly Asp Leu Ser Gly Leu Asn Trp Asn Leu Asp Pro Asp Gln
260 265 270
Gly Glu Asn Asp Pro Ser Met Trp Ile Asn Asp Pro Ile Gly Thr Pro
275 280 285
Gly Ser Asn Glu Pro Gly Asn Gly Ala Pro Ser Ser Ser Ser Gln Leu
290 295 300
Phe Ser Lys Ser Ile Gln Phe Glu Asn Gly Ser Ser Ser Thr Ile Thr
305 310 315 320
Glu Asn Pro Asn Leu Asp Pro Thr Pro Ser Pro Val His Ser Gln Thr
325 330 335
Gln Asn Pro Lys Phe Asn Asn Thr Phe Ser Arg Glu Leu Asn Phe Ser
340 345 350
Thr Ser Ser Ser Thr Leu Val Lys Pro Arg Ser Gly Glu Ile Leu Asn
355 360 365
Phe Gly Asp Glu Gly Lys Arg Ser Ser Gly Asn Pro Asp Pro Ser Ser
370 375 380
Tyr Ser Gly Gln Thr Gln Phe Glu Asn Lys Arg Lys Arg Ser Met Val
385 390 395 400
Leu Asn Glu Asp Lys Val Leu Ser Phe Gly Asp Lys Thr Ala Gly Glu
405 410 415
Ser Asp His Ser Asp Leu Glu Ala Ser Val Val Lys Glu Val Ala Val
420 425 430
Glu Lys Arg Pro Lys Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu
435 440 445
Glu Pro Leu Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu
450 455 460
Asn Gln Arg Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Lys
465 470 475 480
Met Asp Lys Ala Ser Leu Leu Gly Asp Ala Ile Ala Tyr Ile Asn Glu
485 490 495
Leu Lys Ser Lys Val Val Lys Thr Glu Ser Glu Lys Leu Gln Ile Lys
500 505 510
Asn Gln Leu Glu Glu Val Lys Leu Glu Leu Ala Gly Arg Lys Ala Ser
515 520 525
Ala Ser Gly Gly Asp Mer Ser Ser Ser Cys Ser Ser Ile Lys Pro Val
530 535 540
Gly Met Glu Ile Glu Val Lys Ile Ile Gly Trp Asp Ala Met Ile Arg
545 550 555 560
Val Glu Ser Ser Lys Arg Asn His Pro Ala Ala Arg Leu Met Ser Ala
565 570 575
Leu Met Asp Leu Glu Leu Glu Val Asn His Ala Ser Met Ser Val Val
580 585 590
Asn Asp Leu Met Ile Gln Gln Ala Thr Val Lys Met Gly Phe Arg Ile
595 600 605
Tyr Thr Gln Glu Gln Leu Arg Ala Ser Leu Ile Ser Lys Ile Gly
610 615 620
<210>3
<211>11
<212>PRT
<213>人工序列
<220>
<223>基序1
<220>
<221>VARIANT
<222>(2)..(2)
<223>/替换=″Glu″/替换=″Thr″
<220>
<221>UNSURE
<222>(4)..(4)
<223>未知氨基酸
<220>
<221>VARIANT
<222>(5)..(5)
<223>/替换=″Glu″
<220>
<221>VARIANT
<222>(6)..(6)
<223>/替换=″Ser″
<220>
<221>UNSURE
<222>(7)..(7)
<223>未知氨基酸
<220>
<221>VARIANT
<222>(8)..(8)
<223>/替换=″Phe″
<220>
<221>VARIANT
<222>(9)..(9)
<223>/替换=″Asn″
<220>
<221>VARIANT
<222>(11)..(11)
<223>/替换=″Asp″
<400>3
Leu Gly Trp Xaa Asp Gly Xaa Tyr Lys Gly Glu
1 5 10
<210>4
<211>9
<212>PRT
<213>人工序列
<220>
<223>基序2
<220>
<221>VARIANT
<222>(2)..(2)
<223>/替换=″Ile″
<220>
<221>VARIANT
<222>(3)..(3)
<223>/替换=″Ile″/替换=″Leu″
<220>
<221>VARIANT
<222>(5)..(5)
<223>/替换=″Leu″/替换=″Ile″
<220>
<221>VARIANT
<222>(6)..(6)
<223>/替换=″Ala″
<220>
<221>VARIANT
<222>(7)..(7)
<223>/替换=″Val″/替换=″Thr″/替换=″Ala″
<220>
<221>VARIANT
<222>(8)..(8)
<223>/替换=″Leu″/替换=″Ser″
<220>
<221>VARIANT
<222>(9)..(9)
<223>/替换=″Asp″/替换=″Ser″
<400>4
Gly Val Val Glu Val Gly Ser Thr Glu
1 5
<210>5
<211>7
<212>PRT
<213>人工序列
<220>
<223>基序3
<220>
<221>VARIANT
<222>(1)..(1)
<223>/替换=″Glu″
<220>
<221>VARIANT
<222>(3)..(3)
<223>/替换=″Val″/替换=″Ile″
<220>
<221>VARIANT
<222>(5)..(5)
<223>/替换=″Ile″/替换=″Val″
<220>
<221>VARIANT
<222>(7)..(7)
<223>/替换=″Asp″/替换=″Glu″/替换=″Ala″
<400>5
Asp Lys Ala Ser Leu Leu Gly
1 5
<210>6
<211>7
<212>PRT
<213>人工序列
<220>
<223>基序4
<220>
<221>VARIANT
<222>(1)..(1)
<223>/替换=″Asn″/替换=″Ser″
<220>
<221>VARIANT
<222>(4)..(4)
<223>/替换=″His″
<400>6
Thr Leu Gln Gln Arg Leu Gln
1 5
<210>7
<211>12
<212>PRT
<213>人工序列
<220>
<223>基序5
<220>
<221>VARIANT
<222>(1)..(1)
<223>/替换=″Phe″
<220>
<221>VARIANT
<222>(2)..(2)
<223>/替换=″Phe″/替换=″Val″
<220>
<22l>VARIANT
<222>(3)..(3)
<223>/替换=″Leu″/替换=″Val″/替换=″Met″/替换=
″Ser″
<220>
<221>VARIANT
<222>(5)..(5)
<223>/替换=″Leu″/替换=″Arg″/替换=″Asn″/替换=
″Glu″
<220>
<221>VARIANT
<222>(6)..(6)
<223>/替换=″Asp″
<220>
<221>VARIANT
<222>(9)..(9)
<223>/替换=″Val″
<220>
<221>VARIANT
<222>(10)..(10)
<223>/替换=″Arg″
<220>
<221>VARIANT
<222>(11)..(11)
<223>/替换=″Ile″
<220>
<221>VARIANT
<222>(12)..(12)
<223>/替换=″Asn″/替换=″Glu″/替换=″Tyr″
<400>7
Lys Ile Ile Gly Trp Glu Ala Met Ile Gly Val Gln
1 5 10
<210>8
<211>14
<212>PRT
<213>人工序列
<220>
<223>基序6
<220>
<221>VARIANT
<222>(1)..(1)
<223>/替换=″Tyr″
<220>
<221>VARIANT
<222>(2)..(2)
<223>/替换=″Ser″
<220>
<221>VARIANT
<222>(3)..(3)
<223>/替换=″Asn″
<220>
<22l>VARIANT
<222>(4)..(4)
<223>/替换=″Cys″/替换=″Met″/替换=″Leu″/替换=
″Thr″
<220>
<22l>VARIANT
<222>(5)..(5)
<223>/替换=″Gln″
<220>
<22l>VARIANT
<222>(6)..(6)
<223>/替换=″Cys″/替换=″Ser″
<220>
<22l>VARIANT
<222>(7)..(7)
<223>/替换=″Met″/替换=″Phe″
<220>
<221>VARIANT
<222>(8)..(8)
<223>/替换=″Asn″/替换=″Ser″
<220>
<221>VARIANT
<222>(9)..(9)
<223>/替换=″Cys″/替换=″Glu″
<220>
<221>VARIANT
<222>(10)..(10)
<223>/替换=″Gln″/替换=″Phe″/替换=″Met″
<220>
<221>VARIANT
<222>(11)..(11)
<223>/替换=″Arg″/替换=″Leu″
<220>
<221>VARIANT
<222>(12)..(12)
<223>/替换=″Phe″/替换=″Leu″
<220>
<221>VARIANT
<222>(13)..(13)
<223>/替换=″Aps″/替换=″His″
<220>
<22l>VARIANT
<222>(14)..(14)
<223>/替换=″Asp″/替换=″Val″
<400>8
His Ala Ser Val Ser Val Val Lys Asp Leu Met Ile Gln Gln
1 5 10
<210>9
<211>70
<212>PRT
<213>人工序列
<220>
<223>基序7
<400>9
Pro Lys Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu
1 5 10 15
Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg
20 25 30
Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys
35 40 45
Ala Ser Leu Leu Gly Asp Ala Ile Ala Tyr Ile Asn Glu Leu Lys Ser
50 55 60
Lys Val Val Lys Thr Glu
65 70
<210>10
<211>56
<212>DNA
<213>人工序列
<220>
<223>引物:prm06515
<400>10
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgac tgattaccgg ctacaa 56
<210>11
<211>50
<212>DNA
<213>人工序列
<220>
<223>引物:prm06516
<400>11
ggggaccact ttgtacaaga aagctgggta cacccttttaaccgattttt 50
<210>12
<211>2194
<212>DNA
<213>稻(Oryza sativa)
<400>12
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160
ttggtgtagc ttgccacttt caccagcaaa gttc 2194
<210>13
<211>1929
<212>DNA
<213>菜豆(Phaseolus vulgaris)
<400>13
atgacggagt accggtcgcc gcccacaatg aatctctgga ccgacgacaa cgcttccgtc 60
atggaggcct tcatgagctc ctccgatttc tcctcccttt ggctgccaac accgcaatcc 120
gctgcctcta ccaccactcc gggagccgac actgccagag ccctgccgcc gcctccgccg 180
tcgcagtccc agtccctttt taaccaggag accttacaac agcggctgca aacgctgatc 240
gaaggcgccg aagagagctg gacctacgcc attttctggc aatcttctta tgactactcc 300
tccagcactt cccttctcgg ttggggtgac ggatactaca agggagagga ggacaaagga 360
aaaggaaaag cccccaaaga gatgtcgtcg gcggagcagg accaccgtaa gaaggttctc 420
cgcgagctca attcgttgat ttccggccct ttccgttccg ctgatgacgt cgacgaagag 480
gtatccgaca ctgagtggtt ctttctagtg tccatgactc agtcctttct cagcggaagc 540
gggctcccgg gccaggcttt tcttaattcc agcccggttt gggtcgccgg ggctgaccgg 600
ttatccgatt cgacgtcgga gcgggctcgc caggggcagg tctttggggt tcagactctg 660
gtttgcatac cgtccgcaaa cggcgtcgtt gagctggctt ctacggaggt gattttccag 720
aactccgatc tcatgaagaa agtgcgggat ttgttcaact tcaacaaccc agacgcgggt 780
ttctggccgt tgaatcaggg cgagaacgac ccttcctcac tctggctcaa cccttcttcc 840
tcgattgaaa tcaaggacac ctctaacgcc gttgcactcg tttcagcgaa tgcatcactg 900
agcaaaacca tgccgttcga aacccctggt tccagcactc taacagaaac ccctagtgcc 960
gccgccgcag ctcacgtccc caatcccaag aaccagggtt tcttccccag agaattgaac 1020
ttctcgaact ccttaaaacc cgaatccggt gaaattctga gcttcggaga gagcaagaag 1080
agctcttaca acgggagtta cttccccggt gttgcggctg aggagaccaa caagaagaga 1140
aggtctcctg cttctcgcag cagcattgac gatggaatgc tgtccttcac ctccggcgtg 1200
attataccgg cttcgaatat aaaatctggt gccgttgctg gtggtggtgc cagcggcggt 1260
gattccgaga actcggatct ggaagcttcc gtggtgaaag aggcggacag cagggtggtg 1320
gagccggaga aacggccccg gaagaggggt cggaagccgg ggaacggcag agaggagccg 1380
ctgaatcacg tggaagcgga gaggcagagg agggaaaagc tgaatcaacg gttctacgcg 1440
cttcgtgcgg tggttcccaa cgtgtcgaag atggacaaag catcgctctt aggcgatgcc 1500
atatcctaca taaacgagct gaagtcgaag ctgagtgagc tggaatcaga gaaaggggaa 1560
ttggagaagc aattggagtt ggtgaagaag gagcttgagc tggcaactaa aagcccttct 1620
cctccacctg ggccacctcc atccaacaaa gaagcgaagg aaacgacgag caagctgatt 1680
gatttggagt tagaggtgaa gatcataggg tgggacgcca tgataaggat ccaatgcagc 1740
aagaaaaacc accctgcggc caggttgatg gctgcgttga aggagctgga ccttgacgtg 1800
aatcatgcca gcgtatccgt ggtgaatgat ttgatgatcc aacaagccac cgtgaatatg 1860
ggaaaccggt tttacactca ggaacagctc cggtcggcgc gctcctccaa aattggcaat 1920
gcactatag 1929
<210>14
<211>642
<212>PRT
<213>菜豆
<400>14
Met Thr Glu Tyr Arg Ser Pro Pro Thr Met Asn Leu Trp Thr Asp Asp
1 5 10 15
Asn Ala Ser Val Met Glu Ala Phe Met Ser Ser Ser Asp Phe Ser Ser
20 25 30
Leu Trp Leu Pro Thr Pro Gln Ser Ala Ala Ser Thr Thr Thr Pro Gly
35 40 45
Ala Asp Thr Ala Arg Ala Leu Pro Pro Pro Pro Pro Ser Gln Ser Gln
50 55 60
Ser Leu Phe Asn Gln Glu Thr Leu Gln Gln Arg Leu Gln Thr Leu Ile
65 70 75 80
Glu Gly Ala Glu Glu Ser Trp Thr Tyr Ala Ile Phe Trp Gln Ser Ser
85 90 95
Tyr Asp Tyr Ser Ser Ser Thr Ser Leu Leu Gly Trp Gly Asp Gly Tyr
100 105 110
Tyr Lys Gly Glu Glu Asp Lys Gly Lys Gly Lys Ala Pro Lys Glu Met
115 120 125
Ser Ser Ala Glu Gln Asp His Arg Lys Lys Val Leu Arg Glu Leu Asn
130 135 140
Ser Leu Ile Ser Gly Pro Phe Arg Ser Ala Asp Asp Val Asp Glu Glu
145 150 155 160
Val Ser Asp Thr Glu Trp Phe Phe Leu Val Ser Met Thr Gln Ser Phe
165 170 175
Leu Ser Gly Ser Gly Leu Pro Gly Gln Ala Phe Leu Asn Ser Ser Pro
180 185 190
Val Trp Val Ala Gly Ala Asp Arg Leu Ser Asp Ser Thr Ser Glu Arg
195 200 205
Ala Arg Gln Gly Gln Val Phe Gly Val Gln Thr Leu Val Cys Ile Pro
210 215 220
Ser Ala Asn Gly Val Val Glu Leu Ala Ser Thr Glu Val Ile Phe Gln
225 230 235 240
Asn Ser Asp Leu Met Lys Lys Val Arg Asp Leu Phe Asn Phe Asn Asn
245 250 255
Pro Asp Ala Gly Phe Trp Pro Leu Asn Gln Gly Glu Asn Asp Pro Ser
260 265 270
Ser Leu Trp Leu Asn Pro Ser Ser Ser Ile Glu Ile Lys Asp Thr Ser
275 280 285
Asn Ala Val Ala Leu Val Ser Ala Asn Ala Ser Leu Ser Lys Thr Met
290 295 300
Pro Phe Glu Thr Pro Gly Ser Ser Thr Leu Thr Glu Thr Pro Ser Ala
305 310 315 320
Ala Ala Ala Ala His Val Pro Asn Pro Lys Asn Gln Gly Phe Phe Pro
325 330 335
Arg Glu Leu Asn Phe Ser Asn Ser Leu Lys Pro Glu Ser Gly Glu Ile
340 345 350
Leu Ser Phe Gly Glu Ser Lys Lys Ser Ser Tyr Asn Gly Ser Tyr Phe
355 360 365
Pro Gly Val Ala Ala Glu Glu Thr Asn Lys Lys Arg Arg Ser Pro Ala
370 375 380
Ser Arg Ser Ser Ile Asp Asp Gly Met Leu Ser Phe Thr Ser Gly Val
385 390 395 400
Ile Ile Pro Ala Ser Asn Ile Lys Ser Gly Ala Val Ala Gly Gly Gly
405 410 415
Ala Ser Gly Gly Asp Ser Glu Asn Ser Asp Leu Glu Ala Ser Val Val
420 425 430
Lys Glu Ala Asp Ser Arg Val Val Glu Pro Glu Lys Arg Pro Arg Lys
435 440 445
Arg Gly Arg Lys Pro Gly Asn Gly Arg Glu Glu Pro Leu Asn His Val
450 455 460
Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg Phe Tyr Ala
465 470 475 480
Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys Ala Ser Leu
485 490 495
Leu Gly Asp Ala Ile Ser Tyr Ile Asn Glu Leu Lys Ser Lys Leu Ser
500 505 510
Glu Leu Glu Ser Glu Lys Gly Glu Leu Glu Lys Gln Leu Glu Leu Val
515 520 525
Lys Lys Glu Leu Glu Leu Ala Thr Lys Ser Pro Ser Pro Pro Pro Gly
530 535 540
Pro Pro Pro Ser Asn Lys Glu Ala Lys Glu Thr Thr Ser Lys Leu Ile
545 550 555 560
Asp Leu Glu Leu Glu Val Lys Ile Ile Gly Trp Asp Ala Met Ile Arg
565 570 575
Ile Gln Cys Ser Lys Lys Asn His Pro Ala Ala Arg Leu Met Ala Ala
580 585 590
Leu Lys Glu Leu Asp Leu Asp Val Asn His Ala Ser Val Ser Val Val
595 600 605
Asn Asp Leu Met Ile Gln Gln Ala Thr Val Asn Met Gly Asn Arg Phe
610 615 620
Tyr Thr Gln Glu Gln Leu Arg Ser Ala Arg Ser Ser Lys Ile Gly Asn
625 630 635 640
Ala Leu
<210>15
<211>2100
<212>DNA
<213>黄长春花(Catharanthus roseus)
<400>15
atgacggact ataggctaca accgaaaatg aacctatggg gtacgacgac caacaccgca 60
gcttcaccaa taattacttc agatgataat agttcgatga tggaggcttt tatgacctca 120
tcagatccga tttctttgtg gccgccgtca atgtctgtga atcatcacca tccaccaact 180
cctacttctt ccgccgtaac aactgcggtg gactccgcta aatctatgcc tgcccaacct 240
gcttttttca atcaagaaaa tctccaacag cgccttcaaa ctctaattga tggtgctagg 300
gagagttgga cttatgccat attttggcag tcgtctgttg tcgaattcgc cggtccttcg 360
gtcttgggtt ggggcgatgg atattataag ggagaagaag ataaagggaa gaggaagaat 420
tcgtcttccg cgagttcttt tgcagaacag gaacacagaa agaaagtcct tagagagctc 480
aattctttga ttgctgggcc acaaggcacc gccgatgatg cagttgatga agaggtgacc 540
gataccgaat ggtttttctt aatttcaatg actcagtcat ttgtttccgg gagcggtctt 600
ccagggcagg ccttatacaa ttcaaacccg gtatgggtta ccggagcagg gaggctggcg 660
gtttcacact gcgaccgggc caggcaggct caaagttttg ggcttcagac cttagtttgt 720
attccctccg caaacggcgt tgtggagctg ggttcaacgg aattgatttt tcagagctcc 780
gatctcatga ataaggttag gatactgttc aattttaata atatagattt gggttcgagc 840
tctggacctt ggcctgagaa cgatccttct tctctgtggc ttactgatcc atcgccctca 900
ggggtagggg ttaaggaggg ggtgaatact aataataata ctagtgttca agggaattca 960
attccttctg gtaataagca gcaacttgtg tttggaaata atgataatca tccaaccacg 1020
agtactttga ctgatcatcc cggggctggg gctgtaaata gttataataa ttcatctcag 1080
aatgcccagc agcctcaagg tagtttcttt acaagggaat tgaatttttc agaatacggg 1140
tttgaaagga gtagtgtaaa gaatgggaat tgtaagccag aatcgggaga aatattgaac 1200
tttggtggtg aatctgttac caagaagaat tctgtaagtg gaaatgggaa cttgttttca 1260
gtacaatcac agtttggagc tggggaggag aacaagaaca agaaaaggcc atctcctgtg 1320
tcaaggggga gcaatgatga ggggatgctt tcttttactt ctggggtagt tttgccctct 1380
actggtgtag tgaagtctag tggtggtggt ggtggtggag actccgatca ttctgatctt 1440
gaggcctcag tggtgaagga ggcagagagt agtagggttg tggatcccga gaaacggcct 1500
aggaagaggg ggagaaagcc tgcaaatgga agggaagagc cattgaatca tgtggaggca 1560
gagaggcaga ggagggagaa gttgaaccag aggttctatg ctcttagagc cgtggttcct 1620
aatgtttcaa aaatggataa agcttcactt cttggtgatg ctatttctta tatcaatgag 1680
ttgaaagcta aacttcaaac tacagaaaca gataaagatg aattgaagaa ccaattggac 1740
tcattaaaga aggaattagc aagtaaagaa tctcggcttt tatcatcacc agatcaagat 1800
ctcaagtcct caaacaagca gtcagtgggt aacttggata tggatattga tgtgaaaatc 1860
attggtcggg aagcaatgat tcgagtccaa tccagtaaaa acaaccaccc tgcagcaaga 1920
gtaatgggag cactaaagga tcttgatctt gaattactcc atgctagtgt ctcagtggta 1980
aatgatttga tgatccagca aaatacagtg agaatgggga gccgatttta tactcaggag 2040
cagcttagaa tagcattgac atccagaata gccggaaact cgatgaggct cttggtatga 2100
<210>16
<211>699
<212>PRT
<213>黄长春花
<400>16
Met Thr Asp Tyr Arg Leu Gln Pro Lys Met Asn Leu Trp Gly Thr Thr
1 5 10 15
Thr Asn Thr Ala Ala Ser Pro Ile Ile Thr Ser Asp Asp Asn Ser Ser
20 25 30
Met Met Glu Ala Phe Met Thr Ser Ser Asp Pro Ile Ser Leu Trp Pro
35 40 45
Pro Ser Met Ser Val Asn His His His Pro Pro Thr Pro Thr Ser Ser
50 55 60
Ala Val Thr Thr Ala Val Asp Ser Ala Lys Ser Met Pro Ala Gln Pro
65 70 75 80
Ala Phe Phe Asn Gln Glu Asn Leu Gln Gln Arg Leu Gln Thr Leu Ile
85 90 95
Asp Gly Ala Arg Glu Ser Trp Thr Tyr Ala Ile Phe Trp Gln Ser Ser
100 105 110
Val Val Glu Phe Ala Gly Pro Ser Val Leu Gly Trp Gly Asp Gly Tyr
115 120 125
Tyr Lys Gly Glu Glu Asp Lys Gly Lys Arg Lys Asn Ser Ser Ser Ala
130 135 140
Ser Ser Phe Ala Glu Gln Glu His Arg Lys Lys Val Leu Arg Glu Leu
145 150 155 160
Asn Ser Leu Ile Ala Gly Pro Gln Gly Thr Ala Asp Asp Ala Val Asp
165 170 175
Glu Glu Val Thr Asp Thr Glu Trp Phe Phe Leu Ile Ser Met Thr Gln
180 185 190
Ser Phe Val Ser Gly Ser Gly Leu Pro Gly Gln Ala Leu Tyr Asn Ser
195 200 205
Asn Pro Val Trp Val Thr Gly Ala Gly Arg Leu Ala Val Ser His Cys
210 215 220
Asp Arg Ala Arg Gln Ala Gln Ser Phe Gly Leu Gln Thr Leu Val Cys
225 230 235 240
Ile Pro Ser Ala Asn Gly Val Val Glu Leu Gly Ser Thr Glu Leu Ile
245 250 255
Phe Gln Ser Ser Asp Leu Met Asn Lys Val Arg Ile Leu Phe Asn Phe
260 265 270
Asn Asn Ile Asp Leu Gly Ser Ser Ser Gly Pro Trp Pro Glu Asn Asp
275 280 285
Pro Ser Ser Leu Trp Leu Thr Asp Pro Ser Pro Ser Gly Val Gly Val
290 295 300
Lys Glu Gly Val Asn Thr Asn Asn Asn Thr Ser Val Gln Gly Asn Ser
305 310 315 320
Ile Pro Ser Gly Asn Lys Gln Gln Leu Val Phe Gly Asn Asn Asp Asn
325 330 335
His Pro Thr Thr Ser Thr Leu Thr Asp His Pro Gly Ala Gly Ala Val
340 345 350
Asn Ser Tyr Asn Asn Ser Ser Gln Asn Ala Gln Gln Pro Gln Gly Ser
355 360 365
Phe Phe Thr Arg Glu Leu Asn Phe Ser Glu Tyr Gly Phe Glu Arg Ser
370 375 380
Ser Val Lys Asn Gly Asn Cys Lys Pro Glu Ser Gly Glu Ile Leu Asn
385 390 395 400
Phe Gly Gly Glu Ser Val Thr Lys Lys Asn Ser Val Ser Gly Asn Gly
405 410 415
Asn Leu Phe Ser Val Gln Ser Gln Phe Gly Ala Gly Glu Glu Asn Lys
420 425 430
Asn Lys Lys Arg Pro Ser Pro Val Ser Arg Gly Ser Asn Asp Glu Gly
435 440 445
Met Leu Ser Phe Thr Ser Gly Val Val Leu Pro Ser Thr Gly Val Val
450 455 460
Lys Ser Ser Gly Gly Gly Gly Gly Gly Asp Ser Asp His Ser Asp Leu
465 470 475 480
Glu Ala Ser Val Val Lys Glu Ala Glu Ser Ser Arg Val Val Asp Pro
485 490 495
Glu Lys Arg Pro Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu
500 505 510
Glu Pro Leu Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu
515 520 525
Asn Gln Arg Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Lys
530 535 540
Met Asp Lys Ala Ser Leu Leu Gly Asp Ala Ile Ser Tyr Ile Asn Glu
545 550 555 560
Leu Lys Ala Lys Leu Gln Thr Thr Glu Thr Asp Lys Asp Glu Leu Lys
565 570 575
Asn Gln Leu Asp Ser Leu Lys Lys Glu Leu Ala Ser Lys Glu Ser Arg
580 585 590
Leu Leu Ser Ser Pro Asp Gln Asp Leu Lys Ser Ser Asn Lys Gln Ser
595 600 605
Val Gly Asn Leu Asp Met Asp Ile Asp Val Lys Ile Ile Gly Arg Glu
610 615 620
Ala Met Ile Arg Val Gln Ser Ser Lys Asn Asn His Pro Ala Ala Arg
625 630 635 640
Val Met Gly Ala Leu Lys Asp Leu Asp Leu Glu Leu Leu His Ala Ser
645 650 655
Val Ser Val Val Asn Asp Leu Met Ile Gln Gln Asn Thr Val Arg Met
660 665 670
Gly Ser Arg Phe Tyr Thr Gln Glu Gln Leu Arg Ile Ala Leu Thr Ser
675 680 685
Arg Ile Ala Gly Asn Ser Met Arg Leu Leu Val
690 695
<210>17
<211>2079
<212>DNA
<213>马铃薯(Solanum tuberosum)
<400>17
atgactgaat acagcttacc caccatgaat ttgtggaaca atagtactag cgatgataac 60
gtgtctatga tggaagcttt tatgtcttct gatctttctt tttgggctac tactaattct 120
actactacta attctgcttc tgctgctgtg gttggcgtca attcaaatct tcttcatact 180
aataataata atccgtctgt ttttcctcta tcttcttcta catctgtatc cgcggctgcg 240
gctgttgatg ctaccaaatc tatgccgttt ttcaaccaag aaacccttca gcagcgtctt 300
caagctctta tcgatggtgc tagagagacg tggacttacg ctatcttttg gcaatcgtcg 360
gttgttgatt tctcgagtcc gtctgtgttg ggttggggag atggttatta caaaggcgaa 420
gaagataaag ccaaaaggaa attagcggtt tcttctcctg cttatattgc tgagcaggag 480
caccggaaga aggttctccg ggagctgaat tcgttgattt caggggcacc agctgggacc 540
gatgatgctg ttgatgaaga agttaccgac accgaatggt tctttcttat ctccatgacc 600
caatcgtttg ttaatggaag tgggcttcct ggtcaggcgt tgtatagttc cagccctatt 660
tgggtcgccg gaactgagaa attggcagct tcccactgcg aacgggttag acaagcacaa 720
gggttcgggc ttcagactat tgtctgtatt ccttcagcta acggcgtggt tgaattgggc 780
tcgacagagt tgattgttga aagttctgat ctcatgaaca aggttagagt attgtttaac 840
ttcagtaatg atttggggtc tggttcatgg gctgtgcagc cggagagcga cccgtcggcg 900
ctttggctca ctgaaccatc gtcctcaggt atggaagtta gagagtcttt aaatacagta 960
caaacaaatt cagttccatc aagtaatagt aataagcaaa ttgcttatgc aaatgagaat 1020
aatcatcaat ctggaaatgg tcagagttgt tacaatctgc agcaacaaca gaacaatcct 1080
cctcaacaac aaacacaagg atttttcacg agggagttga atttttcgga attcgggttc 1140
gatggaagta gcaataggaa tgggaatgca tcgctctctt gcaaacctga atcaggagaa 1200
atcttgaatt ttggtgatag tactaaaaaa agtgcttcca gtgcaaatgt gaacttgttt 1260
acgggtcagt cccaatttgg ggcagtggag gagaataaca ataacaagaa caagaaaaga 1320
tcagctactt ccaggggaag caatgaagaa ggaatgcttt catttgtttc aggtacagtt 1380
ttgccttctt cgggtatgaa gtcaggtgga ggtggaggcg aagactctga acattcagat 1440
cttgaggctt cagtggtgaa agaagctgat agtagtagag tggtagaacc agaaaagagg 1500
ccaaggaagc gagggagaaa gccagcgaat ggacgagagg agcctttgaa tcacgtcgag 1560
gcagagaggc aaaggaggga gaaattgaac caaagattct acgcgcttag agctgttgta 1620
ccaaatgtgt ctaagatgga caaggcatca cttcttggag atgcaatttc atatataaac 1680
gagttgaaat caaagcttca aaatacagag tcagataaag aagacttgaa gagccaaata 1740
gaagatttaa agaaagaatc aaggcgcccc ggtcctccac caccaaacca agatctcaag 1800
attggaggca agattgtaga cgtggatata gacgttaaga taatcggatg ggatgcaatg 1860
attggtatac aatgtaataa aaagaatcat ccagctgcaa ggttaatggc agccctcatg 1920
gaattagacc tagacgtgca ccatgccagt gtttcagttg tcaacgattt gatgatccaa 1980
caagccacag tgaaaatggg tagcagacat tacactgaag agcagcttag ggtagcattg 2040
aaatcgaaaa ttgctgaaac ccccttagaa agtagatag 2079
<210>18
<211>692
<212>PRT
<213>马铃薯
<400>18
Met Thr Glu Tyr Ser Leu Pro Thr Met Asn Leu Trp Asn Asn Ser Thr
1 5 10 15
Ser Asp Asp Asn Val Ser Met Met Glu Ala Phe Met Ser Ser Asp Leu
20 25 30
Ser Phe Trp Ala Thr Thr Asn Ser Thr Thr Thr Asn Ser Ala Ser Ala
35 40 45
Ala Val Val Gly Val Ash Ser Asn Leu Leu His Thr Asn Asn Asn Asn
50 55 60
Pro Ser Val Phe Pro Leu Ser Ser Ser Thr Ser Val Ser Ala Ala Ala
65 70 75 80
Ala Val Asp Ala Thr Lys Ser Met Pro Phe Phe Asn Gln Glu Thr Leu
85 90 95
Gln Gln Arg Leu Gln Ala Leu Ile Asp Gly Ala Arg Glu Thr Trp Thr
100 105 110
Tyr Ala Ile Phe Trp Gln Ser Ser Val Val Asp Phe Ser Ser Pro Ser
115 120 125
Val Leu Gly Trp Gly Asp Gly Tyr Tyr Lys Gly Glu Glu Asp Lys Ala
130 135 140
Lys Arg Lys Leu Ala Val Ser Ser Pro Ala Tyr Ile Ala Glu Gln Glu
145 150 155 160
His Arg Lys Lys Val Leu Arg Glu Leu Asn Ser Leu Ile Ser Gly Ala
165 170 175
Pro Ala Gly Thr Asp Asp Ala Val Asp Glu Glu Val Thr Asp Thr Glu
180 185 190
Trp Phe Phe Leu Ile Ser Met Thr Gln Ser Phe Val Asn Gly Ser Gly
195 200 205
Leu Pro Gly Gln Ala Leu Tyr Ser Ser Ser Pro Ile Trp Val Ala Gly
210 215 220
Thr Glu Lys Leu Ala Ala Ser His Cys Glu Arg Val Arg Gln Ala Gln
225 230 235 240
Gly Phe Gly Leu Gln Thr Ile Val Cys Ile Pro Ser Ala Asn Gly Val
245 250 255
Val Glu Leu Gly Ser Thr Glu Leu Ile Val Glu Ser Ser Asp Leu Met
260 265 270
Asn Lys Val Arg Val Leu Phe Asn Phe Ser Asn Asp Leu Gly Ser Gly
275 280 285
Ser Trp Ala Val Gln Pro Glu Ser Asp Pro Ser Ala Leu Trp Leu Thr
290 295 300
Glu Pro Ser Ser Ser Gly Met Glu Val Arg Glu Ser Leu Asn Thr Val
305 310 315 320
Gln Thr Asn Ser Val Pro Ser Ser Asn Ser Asn Lys Gln Ile Ala Tyr
325 330 335
Ala Asn Glu Asn Asn His Gln Ser Gly Asn Gly Gln Ser Cys Tyr Asn
340 345 350
Leu Gln Gln Gln Gln Asn Asn Pro Pro Gln Gln Gln Thr Gln Gly Phe
355 360 365
Phe Thr Arg Glu Leu Asn Phe Ser Glu Phe Gly Phe Asp Gly Ser Ser
370 375 380
Asn Arg Asn Gly Asn Ala Ser Leu Ser Cys Lys Pro Glu Ser Gly Glu
385 390 395 400
Ile Leu Asn Phe Gly Asp Ser Thr Lys Lys Ser Ala Ser Ser Ala Asn
405 410 415
Val Asn Leu Phe Thr Gly Gln Ser Gln Phe Gly Ala Val Glu Glu Asn
420 425 430
Asn Asn Asn Lys Asn Lys Lys Arg Ser Ala Thr Ser Arg Gly Ser Asn
435 440 445
Glu Glu Gly Met Leu Ser Phe Val Ser Gly Thr Val Leu Pro Ser Ser
450 455 460
Gly Met Lys Ser Gly Gly Gly Gly Gly Glu Asp Ser Glu His Ser Asp
465 470 475 480
Leu Glu Ala Ser Val Val Lys Glu Ala Asp Ser Ser Arg Val Val Glu
485 490 495
Pro Glu Lys Arg Pro Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg
500 505 510
Glu Glu Pro Leu Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys
515 520 525
Leu Asn Gln Arg Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser
530 535 540
Lys Met Asp Lys Ala Ser Leu Leu Gly Asp Ala Ile Ser Tyr Ile Asn
545 550 555 560
Glu Leu Lys Ser Lys Leu Gln Asn Thr Glu Ser Asp Lys Glu Asp Leu
565 570 575
Lys Ser Gln Ile Glu Asp Leu Lys Lys Glu Ser Arg Arg Pro Gly Pro
580 585 590
Pro Pro Pro Asn Gln Asp Leu Lys Ile Gly Gly Lys Ile Val Asp Val
595 600 605
Asp Ile Asp Val Lys Ile Ile Gly Trp Asp Ala Met Ile Gly Ile Gln
610 615 620
Cys Asn Lys Lys Asn His Pro Ala Ala Arg Leu Met Ala Ala Leu Met
625 630 635 640
Glu Leu Asp Leu Asp Val His His Ala Ser Val Ser Val Val Asn Asp
645 650 655
Leu Met Ile Gln Gln Ala Thr Val Lys Met Gly Ser Arg His Tyr Thr
660 665 670
Glu Glu Gln Leu Arg Val Ala Leu Lys Ser Lys Ile Ala Glu Thr Pro
675 680 685
Leu Glu Ser Arg
690
<210>19
<211>1941
<212>DNA
<213>豌豆(Pisum sativum)
<400>19
atgacagatt accgctcact cccgacaatg aataatagta tctggacaga cgacaactcc 60
tccgtcatgg aagctttcat gagcaccacc gccgaccttt cttctatctg gcttccacca 120
ccaaattccg ctgcatcaac caccacacca ggacccgata caaccaaacc tccaccacaa 180
caacagccac tcttcaacca agaaactctc caacaccgtc ttcaagcttt aatcgaagac 240
gcaaaagaga attggactta cgccatcttc tggcaaacct cttacgacta ctctacaagc 300
agacagctcc ttggttgggg agacggttat tacaaaggcg aagatgacaa agaaaaagct 360
aaaaaagtta tcttgcctga acaacaagct catcgcaata aagtcctccg tgaacttaac 420
gccttaattt ccggctcatc tagctcagat gatgtcgttg acgaagatgt caccgacact 480
gagtggttct ttctcacgtc gatgacacac tccttcgtca acggaagcgg tttactgagc 540
caggcttact ttaattcttc cccagtatgg atcaacgata ggctttccat gtccacatgt 600
gaaagaaccc gtgcagcaca tgttcacggg cttcagactt tggtatatat accagcaccg 660
tcttcaaacg gtgtcgttga gctcgcatct actgagataa ttccacatag cgctggtata 720
atggagaagg ttcgtttttt gtttgatttc aataatccag aagcacggtc ttggccgttg 780
aattccgccg acaacgatcc ttcttccatg tggttggata tccccggctc cggtggaatt 840
gaaattagag actccatcaa cactgttagt gccgtcagtg taacggcttc agcaaatgca 900
acaatcccta aaaaatcgcc gtttgaaatt cacggtgctt ctactactct accggaatca 960
tccaccaccg ttaatatttc aactgctcag cgccaaatcc agaatcaaaa ccagaaccag 1020
agcttctttc caagagaact gaatttttca ggttctttca aaccggaatc cggcgagatt 1080
ctgaactttg gggagagtaa aaagagttct tacagctctg ccaatggtaa tttcttttcc 1140
ggtccgtcac cattcgctgc taatgaagaa aacagaaaaa gaagatcccc ggtgtctaga 1200
agtagtatcg aggacggaat tctttcattc agttctggca aactgttaca tggttcaact 1260
ataaaatccg gtggcggaga ttccgatcat tcagatctgg aagtttctgt ggtgaagaaa 1320
actgtgagca gcagagttat cgaaccagag aagcggcctc ggaagcgagg tagaaaacca 1380
gccaacggaa gagaagaacc cttgaaccac gtggaagcag agaggcagcg acgggagaaa 1440
ctgaaccaga gattctacgc tttacgagct gtggttccta atgtttctaa aatggacaaa 1500
gcttcgcttc ttggagacgc gatttcttac ataaacgagt tgaaattgaa gctgcaaggg 1560
cttgaatcgt caaaagatga gttggagaaa gaactagata caacccgaaa ggaactagaa 1620
attgcaacta aaaaaccagt tcggttgaac gaagaagaaa aagagaaacc agaaaacaac 1680
tctaagttga ttgatttgga catagatgtg aaaatcatgg gatgggatgc tatgattagg 1740
attcagtgta gcaagaagaa tcaccctgct gcgaaattaa tggcggcttt aaaagaattg 1800
gatcttgatg tgaatcatgc tagtgtttct gttgttaatg acttaatgat tcaacaggct 1860
tctattaaca tgggaagtag attttacaca caagaacagc ttttatctgt tctttcttcc 1920
aaaattggtg atacacaatg a 1941
<210>20
<211>646
<212>PRT
<213>豌豆
<400>20
Met Thr Asp Tyr Arg Ser Leu Pro Thr Met Asn Asn Ser Ile Trp Thr
1 5 10 15
Asp Asp Asn Ser Ser Val Met Glu Ala Phe Met Ser Thr Thr Ala Asp
20 25 30
Leu Ser Ser Ile Trp Leu Pro Pro Pro Asn Ser Ala Ala Ser Thr Thr
35 40 45
Thr Pro Gly Pro Asp Thr Thr Lys Pro Pro Pro Gln Gln Gln Pro Leu
50 55 60
Phe Asn Gln Glu Thr Leu Gln His Arg Leu Gln Ala Leu Ile Glu Asp
65 70 75 80
Ala Lys Glu Asn Trp Thr Tyr Ala Ile Phe Trp Gln Thr Ser Tyr Asp
85 90 95
Tyr Ser Thr Ser Arg Gln Leu Leu Gly Trp Gly Asp Gly Tyr Tyr Lys
100 105 110
Gly Glu Asp Asp Lys Glu Lys Ala Lys Lys Val Ile Leu Pro Glu Gln
115 120 125
Gln Ala His Arg Asn Lys Val Leu Arg Glu Leu Asn Ala Leu Ile Ser
130 135 140
Gly Ser Ser Ser Ser Asp Asp Val Val Asp Glu Asp Val Thr Asp Thr
145 150 155 160
Glu Trp Phe Phe Leu Thr Ser Met Thr His Ser Phe Val Asn Gly Ser
165 170 175
Gly Leu Leu Ser Gln Ala Tyr Phe Asn Ser Ser Pro Val Trp Ile Asn
180 185 190
Asp Arg Leu Ser Met Ser Thr Cys Glu Arg Thr Arg Ala Ala His Val
195 200 205
His Gly Leu Gln Thr Leu Val Tyr Ile Pro Ala Pro Ser Ser Asn Gly
210 215 220
Val Val Glu Leu Ala Ser Thr Glu Ile Ile Pro His Ser Ala Gly Ile
225 230 235 240
Met Glu Lys Val Arg Phe Leu Phe Asp Phe Asn Asn Pro Glu Ala Arg
245 250 255
Ser Trp Pro Leu Asn Ser Ala Asp Asn Asp Pro Ser Ser Met Trp Leu
260 265 270
Asp Ile Pro Gly Ser Gly Gly Ile Glu Ile Arg Asp Ser Ile Asn Thr
275 280 285
Val Ser Ala Val Ser Val Thr Ala Ser Ala Asn Ala Thr Ile Pro Lys
290 295 300
Lys Ser Pro Phe Glu Ile His Gly Ala Ser Thr Thr Leu Pro Glu Ser
305 310 315 320
Ser Thr Thr Val Asn Ile Ser Thr Ala Gln Arg Gln Ile Gln Asn Gln
325 330 335
Asn Gln Asn Gln Ser Phe Phe Pro Arg Glu Leu Asn Phe Ser Gly Ser
340 345 350
Phe Lys Pro Glu Ser Gly Glu Ile Leu Asn Phe Gly Glu Ser Lys Lys
355 360 365
Ser Ser Tyr Ser Ser Ala Asn Gly Asn Phe Phe Ser Gly Pro Ser Pro
370 375 380
Phe Ala Ala Asn Glu Glu Asn Arg Lys Arg Arg Ser Pro Val Ser Arg
385 390 395 400
Ser Ser Ile Glu Asp Gly Ile Leu Ser Phe Ser Ser Gly Lys Leu Leu
405 410 415
His Gly Ser Thr Ile Lys Ser Gly Gly Gly Asp Ser Asp His Ser Asp
420 425 430
Leu Glu Val Ser Val Val Lys Lys Thr Val Ser Ser Arg Val Ile Glu
435 440 445
Pro Glu Lys Arg Pro Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg
450 455 460
Glu Glu Pro Leu Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys
465 470 475 480
Leu Asn Gln Arg Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser
485 490 495
Lys Met Asp Lys Ala Ser Leu Leu Gly Asp Ala Ile Ser Tyr Ile Asn
500 505 510
Glu Leu Lys Leu Lys Leu Gln Gly Leu Glu Ser Ser Lys Asp Glu Leu
515 520 525
Glu Lys Glu Leu Asp Thr Thr Arg Lys Glu Leu Glu Ile Ala Thr Lys
530 535 540
Lys Pro Val Arg Leu Asn Glu Glu Glu Lys Glu Lys Pro Glu Asn Asn
545 550 555 560
Ser Lys Leu Ile Asp Leu Asp Ile Asp Val Lys Ile Met Gly Trp Asp
565 570 575
Ala Met Ile Arg Ile Gln Cys Ser Lys Lys Asn His Pro Ala Ala Lys
580 585 590
Leu Met Ala Ala Leu Lys Glu Leu Asp Leu Asp Val Asn His Ala Ser
595 600 605
Val Ser Val Val Asn Asp Leu Met Ile Gln Gln Ala Ser Ile Asn Met
610 615 620
Gly Ser Arg Phe Tyr Thr Gln Glu Gln Leu Leu Ser Val Leu Ser Ser
625 630 635 640
Lys Ile Gly Asp Thr Gln
645
<210>21
<211>1761
<212>DNA
<213>甘蓝(Brassica oleracea)
<400>21
tcaaactctc tccattagag cagccttgag ctgatcctgc gtgaaaaact gattccccat 60
cttcacagtc gcttgttgga tcatgaactc attcactacc gataaactcg cgtgattcac 120
ttccaattcc agctccttga gtgcttccat gaacttagca ccaggatgat tcttcttagc 180
gcattggatc ctaatcatcg catcccaacc aatgatcttc acatctatct ccacctctat 240
ggacacacct gaatcttgat ccaaacactt ttgatcttta accaaacttt tcacattccc 300
atcccccacc tctttgctca tcccatcaat ctgcttctgc aactcctctt tatcagcttc 360
agccttttgc agcttagctt taagctcatt gatatacgag atcgcgtctc ctagaagaga 420
agctttatcc atcttagaca cattaggaac cacagctctc agagagtaga atctctggtt 480
cagcttctct cttctctgtc tctctgcctc cacgtgattc aacggctcct ctcttccgtt 540
agccggtttc ctccctcgtt tcctcggttt cttctccgtc tcagccacga ttctaccact 600
ctccgcttct ttaacaaccg aagcttcgag atcagagcga ttcgagtcgt tcgatttcgt 660
aggaagtgga agaacagaag tgaaagacag catctcttct tccttgtcgg aaaccaaaca 720
tctcttcttc ttgttgctgt ctccctccac aaacccagaa ctcgagattt gcgggttctg 780
ctgctgctta gggtgttcca ctgagcttcc attacaaagc ttcgaagccg tctgagaatc 840
agagttagaa gtcgccggag ccccaagaac cggttcgatc ccggttacaa tcggttcatt 900
aatccacgtg gcggaatcat tctctccttg atccgggttc aaattaaact cccaagaacc 960
cgactcgcct ccaccaccgc caccgttgaa actgaaaaag ctgttgactt tctcaacgag 1020
atccgagctc tgatgtataa tctccaacga accaagctca acgacgccgt tttgcgtcgg 1080
tatacaaacc atcgtctcca acccgtaaac ctgaccctgg cgagctctct cgcagctcga 1140
tccagccaag gcgttcgagc cagagagcca aatggtccgc gagctcgaga aagctcggcc 1200
gggcaaacca gagccgttga cgaagctctg cgtcatcgaa accaagaaga accattccgt 1260
atccgacacg tcttcgtctc ccgcctcgtc ggaggagccg ccgctgctgc tgactgtccc 1320
tcctccgccg gagatcagag agttgagctc tcgaatcact ctcttccgat gctcttgctc 1380
cgccgcgctg acgggattgg gcttcctctt cctcgacttc ctctcctcct cgcctttgta 1440
gtagccatcg ccccaggtta gcagcgccgc cgtgttgctg atgtcttctc cggcgaagtc 1500
gtgggatagt tgccagaaca cggcgtacgt ccagctttct ctagctcctt cgatcaatgc 1560
ttggagtcgt tgctggagag tgtcttcggt gacgtgagga ggaggaggag tgagaggggg 1620
ttgaggccag agagaagagt gttcggagcc gatgagaggt tccattacag acgcattgtc 1680
ttcgattgtt gaccagaggt ttgtgccgtt tgttgactgg ttgaggtggt ggtcggttag 1740
ttgaacattt gtcgaagaca t 1761
<210>22
<211>586
<212>PRT
<213>甘蓝
<400>22
Met Ser Ser Thr Asn Val Gln Leu Thr Asp His His Leu Asn Gln Ser
1 5 10 15
Thr Asn Gly Thr Asn Leu Trp Ser Thr Ile Glu Asp Asn Ala Ser Val
20 25 30
Met Glu Pro Leu Ile Gly Ser Glu His Ser Ser Leu Trp Pro Gln Pro
35 40 45
Pro Leu Thr Pro Pro Pro Pro His Val Thr Glu Asp Thr Leu Gln Gln
50 55 60
Arg Leu Gln Ala Leu Ile Glu Gly Ala Arg Glu Ser Trp Thr Tyr Ala
65 70 75 80
Val Phe Trp Gln Leu Ser His Asp Phe Ala Gly Glu Asp Ile Ser Asn
85 90 95
Thr Ala Ala Leu Leu Thr Trp Gly Asp Gly Tyr Tyr Lys Gly Glu Glu
100 105 110
Glu Arg Lys Ser Arg Lys Arg Lys Pro Asn Pro Val Ser Ala Ala Glu
115 120 125
Gln Glu His Arg Lys Arg Val Ile Arg Glu Leu Asn Ser Leu Ile Ser
130 135 140
Gly Gly Gly Gly Thr Val Ser Ser Ser Gly Gly Ser Ser Asp Glu Ala
145 150 155 160
Gly Asp Glu Asp Val Ser Asp Thr Glu Trp Phe Phe Leu Val Ser Met
165 170 175
Thr Gln Ser Phe Val Asn Gly Ser Gly Leu Pro Gly Arg Ala Phe Ser
180 185 190
Ser Ser Arg Thr Ile Trp Leu Ser Gly Ser Asn Ala Leu Ala Gly Ser
195 200 205
Ser Cys Glu Arg Ala Arg Gln Gly Gln Val Tyr Gly Leu Glu Thr Met
210 215 220
Val Cys Ile Pro Thr Gln Asn Gly Val Val Glu Leu Gly Ser Leu Glu
225 230 235 240
Ile Ile His Gln Ser Ser Asp Leu Val Glu Lys Val Asn Ser Phe Phe
245 250 255
Ser Phe Asn Gly Gly Gly Gly Gly Gly Glu Ser Gly Ser Trp Glu Phe
260 265 270
Asn Leu Asn Pro Asp Gln Gly Glu Asn Asp Ser Ala Thr Trp Ile Asn
275 280 285
Glu Pro Ile Val Thr Gly Ile Glu Pro Val Leu Gly Ala Pro Ala Thr
290 295 300
Ser Asn Ser Asp Ser Gln Thr Ala Ser Lys Leu Cys Asn Gly Ser Ser
305 310 315 320
Val Glu His Pro Lys Gln Gln Gln Asn Pro Gln Ile Ser Ser Ser Gly
325 330 335
Phe Val Glu Gly Asp Ser Asn Lys Lys Lys Arg Cys Leu Val Ser Asp
340 345 350
Lys Glu Glu Glu Met Leu Ser Phe Thr Ser Val Leu Pro Leu Pro Thr
355 360 365
Lys Ser Asn Asp Ser Asn Arg Ser Asp Leu Glu Ala Ser Val Val Lys
370 375 380
Glu Ala Glu Ser Gly Arg Ile Val Ala Glu Thr Glu Lys Lys Pro Arg
385 390 395 400
Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu Asn His
405 410 415
Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg Phe Tyr
420 425 430
Ser Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys Ala Ser
435 440 445
Leu Leu Gly Asp Ala Ile Ser Tyr Ile Asn Glu Leu Lys Ala Lys Leu
450 455 460
Gln Lys Ala Glu Ala Asp Lys Glu Glu Leu Gln Lys Gln Ile Asp Gly
465 470 475 480
Met Ser Lys Glu Val Gly Asp Gly Asn Val Lys Ser Leu Val Lys Asp
485 490 495
Gln Lys Cys Leu Asp Gln Asp Ser Gly Val Ser Ile Glu Val Glu Ile
500 505 510
Asp Val Lys Ile Ile Gly Trp Asp Ala Met Ile Arg Ile Gln Cys Ala
515 520 525
Lys Lys Asn His Pro Gly Ala Lys Phe Met Glu Ala Leu Lys Glu Leu
530 535 540
Glu Leu Glu Val Asn His Ala Ser Leu Ser Val Val Asn Glu Phe Met
545 550 555 560
Ile Gln Gln Ala Thr Val Lys Met Gly Asn Gln Phe Phe Thr Gln Asp
565 570 575
Gln Leu Lys Ala Ala Leu Met Glu Arg Val
580 585
<210>23
<211>2100
<212>DNA
<213>稻
<400>23
atgaaccttt ggacggacga caacgcgtcg atgatggagg cgttcatggc ctccgccgac 60
ctcccggcct tcccgtgggg ggcggcctcc accccgccgc cgccgccgcc gccgcctcac 120
caccaccacc aacagcagca gcagcaggtc ctgccgccgc ctgcagcagc tccggcggcg 180
gcggcgttca accaggacac gctgcagcag cggctgcagt cgatcatcga ggggtctcgg 240
gagacgtgga cgtacgccat cttctggcag tcctccatcg acgtctccac cggcgcctcc 300
ctcctcggct ggggcgacgg ctactacaag ggctgcgacg acgacaagcg caagcagcgc 360
tcctccaccc ccgccgccgc cgccgagcag gagcaccgca agcgcgtcct ccgcgagctc 420
aactccctca tcgccggcgc aggcgccgcc cccgacgagg ccgtcgagga ggaggtcacc 480
gacaccgagt ggttcttcct cgtctccatg acccagtcct tccccaacgg cctcggcctc 540
cccggccagg ccctcttcgc cgcccagccc acctggatcg ccaccggctt gtcctccgcc 600
ccctgtgacc gcgccaggca ggcctacacc ttcggcctcc gcaccatggt ctgcctcccc 660
ctcgccaccg gcgtcctcga gctcggctcc accgacgtca tcttccagac cggggacagc 720
atccccagga tccgcgccct cttcaacctc agcgccgccg ccgcctcctc ctggcccccc 780
caccccgacg ccgcctccgc cgatccctcc gtgctctggc tcgccgacgc gccccccatg 840
gacatgaagg actccatctc cgccgcagac atctccgtct ccaagccacc acccccgccg 900
ccgcaccaga tccagcactt cgagaacggg agcaccagca cgctcacgga gaatcccagc 960
ccgtcggtgc acgcgccgac gccctcgcag ccggccgcgc cgccccagcg gcagcagcag 1020
cagcagcaga gcagccaggc tcagcagggc cccttccgcc gggagctcaa cttctccgac 1080
ttcgcgtcca acggcggcgc cgcggccccg cctttcttca agcccgagac cggcgagatc 1140
ctaaacttcg gcaacgacag cagcagtggc cggaggaatc cgtcgccggc gcccccggcc 1200
gccaccgcca gcctcaccac cgcgccgggg agcctgttct cgcagcacac gccgacgctg 1260
acggcggcgg cgaacgacgc caagagcaac aaccagaaga ggtccatgga ggccacctcc 1320
cgcgccagca acaccaacaa ccacccggcg gcgacggcga acgaggggat gctgtccttc 1380
tcgtcggcgc cgacgacgcg gccgtcgacg gggacgggcg ccccggccaa gtcggagtcg 1440
gaccactcgg acctggaggc gtcggtgcgg gaggtggaga gcagccgcgt ggtggcgccg 1500
ccgccggagg cggagaagcg gccgcggaag cgcgggcgga agccggcgaa cgggcgggag 1560
gagccgctga accacgtgga ggcggagcgg cagcggcggg agaagctcaa ccagcgcttc 1620
tacgcgctgc gcgccgtggt gcccaacgtg tccaagatgg acaaggcgtc gctgctgggc 1680
gacgccatct cctacatcaa cgagctccgg gggaagctca cggcgctgga gacggacaag 1740
gagacgctgc agtcgcagat ggagtcgctc aagaaggagc gggacgcgcg gccgccggcg 1800
ccgtcgggcg gcggcggaga cggcggggcg cggtgccacg cggtggagat cgaggccaag 1860
atccttgggc tggaggccat gatccgcgtg cagtgccaca agcggaacca cccggcggcg 1920
cggctgatga cggcgctgcg ggagctggac ctggacgtgt accatgccag cgtctccgtg 1980
gtcaaggacc tcatgatcca gcaggtggcc gtcaagatgg ccagccgcgt ctactcgcag 2040
gaccagctca acgccgcgct ctacacccgc atcgccgagc ctggcaccgc cgcccggtaa 2100
<210>24
<211>699
<212>PRT
<213>稻
<400>24
Met Asn Leu Trp Thr Asp Asp Asn Ala Ser Met Met Glu Ala Phe Met
1 5 10 15
Ala Ser Ala Asp Leu Pro Ala Phe Pro Trp Gly Ala Ala Ser Thr Pro
20 25 30
Pro Pro Pro Pro Pro Pro Pro His His His His Gln Gln Gln Gln Gln
35 40 45
Gln Val Leu Pro Pro Pro Ala Ala Ala Pro Ala Ala Ala Ala Phe Asn
50 55 60
Gln Asp Thr Leu Gln Gln Arg Leu Gln Ser Ile Ile Glu Gly Ser Arg
65 70 75 80
Glu Thr Trp Thr Tyr Ala Ile Phe Trp Gln Ser Ser Ile Asp Val Ser
85 90 95
Thr Gly Ala Ser Leu Leu Gly Trp Gly Asp Gly Tyr Tyr Lys Gly Cys
100 105 110
Asp Asp Asp Lys Arg Lys Gln Arg Ser Ser Thr Pro Ala Ala Ala Ala
115 120 125
Glu Gln Glu His Arg Lys Arg Val Leu Arg Glu Leu Asn Ser Leu Ile
130 135 140
Ala Gly Ala Gly Ala Ala Pro Asp Glu Ala Val Glu Glu Glu Val Thr
145 150 155 160
Asp Thr Glu Trp Phe Phe Leu Val Ser Met Thr Gln Ser Phe Pro Asn
165 170 175
Gly Leu Gly Leu Pro Gly Gln Ala Leu Phe Ala Ala Gln Pro Thr Trp
180 185 190
Ile Ala Thr Gly Leu Ser Ser Ala Pro Cys Asp Arg Ala Arg Gln Ala
195 200 205
Tyr Thr Phe Gly Leu Arg Thr Met Val Cys Leu Pro Leu Ala Thr Gly
210 215 220
Val Leu Glu Leu Gly Ser Thr Asp Val Ile Phe Gln Thr Gly Asp Ser
225 230 235 240
Ile Pro Arg Ile Arg Ala Leu Phe Asn Leu Ser Ala Ala Ala Ala Ser
245 250 255
Ser Trp Pro Pro His Pro Asp Ala Ala Ser Ala Asp Pro Ser Val Leu
260 265 270
Trp Leu Ala Asp Ala Pro Pro Met Asp Met Lys Asp Ser Ile Ser Ala
275 280 285
Ala Asp Ile Ser Val Ser Lys Pro Pro Pro Pro Pro Pro His Gln Ile
290 295 300
Gln His Phe Glu Asn Gly Ser Thr Ser Thr Leu Thr Glu Asn Pro Ser
305 310 315 320
Pro Ser Val His Ala Pro Thr Pro Ser Gln Pro Ala Ala Pro Pro Gln
325 330 335
Arg Gln Gln Gln Gln Gln Gln Ser Ser Gln Ala Gln Gln Gly Pro Phe
340 345 350
Arg Arg Glu Leu Asn Phe Ser Asp Phe Ala Ser Asn Gly Gly Ala Ala
355 360 365
Ala Pro Pro Phe Phe Lys Pro Glu Thr Gly Glu Ile Leu Asn Phe Gly
370 375 380
Asn Asp Ser Ser Ser Gly Arg Arg Asn Pro Ser Pro Ala Pro Pro Ala
385 390 395 400
Ala Thr Ala Ser Leu Thr Thr Ala Pro Gly Ser Leu Phe Ser Gln His
405 410 415
Thr Pro Thr Leu Thr Ala Ala Ala Asn Asp Ala Lys Ser Asn Asn Gln
420 425 430
Lys Arg Ser Met Glu Ala Thr Ser Arg Ala Ser Asn Thr Asn Asn His
435 440 445
Pro Ala Ala Thr Ala Asn Glu Gly Met Leu Ser Phe Ser Ser Ala Pro
450 455 460
Thr Thr Arg Pro Ser Thr Gly Thr Gly Ala Pro Ala Lys Ser Glu Ser
465 470 475 480
Asp His Ser Asp Leu Glu Ala Ser Val Arg Glu Val Glu Ser Ser Arg
485 490 495
Val Val Ala Pro Pro Pro Glu Ala Glu Lys Arg Pro Arg Lys Arg Gly
500 505 510
Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu Asn His Val Glu Ala
515 520 525
Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg Phe Tyr Ala Leu Arg
530 535 540
Ala Val Val Pro Asn Val Ser Lys Met Asp Lys Ala Ser Leu Leu Gly
545 550 555 560
Asp Ala Ile Ser Tyr Ile Asn Glu Leu Arg Gly Lys Leu Thr Ala Leu
565 570 575
Glu Thr Asp Lys Glu Thr Leu Gln Ser Gln Met Glu Ser Leu Lys Lys
580 585 590
Glu Arg Asp Ala Arg Pro Pro Ala Pro Ser Gly Gly Gly Gly Asp Gly
595 600 605
Gly Ala Arg Cys His Ala Val Glu Ile Glu Ala Lys Ile Leu Gly Leu
610 615 620
Glu Ala Met Ile Arg Val Gln Cys His Lys Arg Asn His Pro Ala Ala
625 630 635 640
Arg Leu Met Thr Ala Leu Arg Glu Leu Asp Leu Asp Val Tyr His Ala
645 650 655
Ser Val Ser Val Val Lys Asp Leu Met Ile Gln Gln Val Ala Val Lys
660 665 670
Met Ala Ser Arg Val Tyr Ser Gln Asp Gln Leu Asn Ala Ala Leu Tyr
675 680 685
Thr Arg Ile Ala Glu Pro Gly Thr Ala Ala Arg
690 695
<210>25
<211>2163
<212>DNA
<213>藏边大黄(Rheum australe)
<400>25
atgatgaacc tctggagttc cgatgataac gttgctttcg ccgacgcttt tatgtccttg 60
gactcttcct ccgccgccgc ctggcctccg gcgccttcct cccaccaata caaccaccag 120
tacaacctcc aacaccagca acaactgcag catcaaccac aacaacaaca acaacaacaa 180
cagatggcca attcggccgg cggtggttgg caacaagcga tggccggcgg cgctcagatg 240
aatccggcgc agatgatgaa ccaggacagc ctacagcagc ggctgcaggc gctgatcgac 300
gacgccaggg agagctggac ctacgccatc ttctggcagt gcaacgtcga gcccaccggc 360
cagtctctcc ttggctgggg cgacggatac tataagggcg atgactccgc caataagaac 420
gcctcctccg ccgcccccgc cgctggatcc aggccgccga agaaccccgc agaacaggag 480
cacaggagga gagtcctccg ggaactcaat tccctgatct ccggctcctc ttcccctcaa 540
aacgacgccg ttgacgacga cgtcaccgac accgagtggt tcttccttat ctccatgacg 600
caggctttcc ccttcggcgt cgatctcccc ggccaagcca tcctcggatc caaccctatc 660
tgggcgtacg gctccgaccg tctcgccggc tccccgtggg atcgggccag acaaggggct 720
gcgttcgggt tgcagacgat cgtctgcatc cccagcggca ccggcgtcct cgaattaggc 780
tccaccgaac tcgtcttcaa cagttccgtt ttgatgaata aggttagggt tttgttcaat 840
ttcggatctg gagatgcgag tctcctgacc gccgcagcct cctcctccgc ccctgccgcc 900
gctcctccac cgccgatctc aacggcgacg accgatgagg cggagaacga ccccgccgcg 960
ctgtggatca gcgatccgtc ttcctccgca gccgaggtga aggaggcatt gaaccctagg 1020
atcaccgtcc gtgagagctc gattccgatc ggatcgaatt cgattcccgt ccaccagccg 1080
gccaaaccgc cgcaattgga cgttcaaagc tcaatcggat tgacggagaa ttcaattggt 1140
atccatagcc agaagagtca caatcagcca ctccaacatc aaggattttt caccaaagag 1200
ttgaatttct ccgagtttgc gatgaagcca gaatccggag agatcctcaa ctttggggag 1260
agtaagagga attccctcgg caacggaaac ggattgaatt cgcaattcct tgtggaagag 1320
agcaacaaaa acatcatcag caagaagcga tctccgacct caagaggaag cgcagaggaa 1380
ggcatgcttt cattcacttc aagcgtggtc ttgccttctt ccatggcggt gaagtcaagc 1440
gccaccggcg caggggactc cgaccactct gacctggaag cttcggtggt gaaggaagcc 1500
gacagcagcc gggtggtgga ccccgagaag cggccccgaa agcgtggccg gaagccagca 1560
aacggcaggg aggagcccct gaaccatgtc gaagcggaga ggcagaggag ggagaagctc 1620
aaccagagat tctacgccct cagggcggtt gtccccaatg tgtcaaaaat ggacaaagca 1680
tcactcttag gagacgcaat ctccttcatt aacgagctaa aatcgaagct ccaaaacgtg 1740
gaatcagaga aggaaacatt gctgagccag gtggagtgtt tgaagacaga ggtgttagca 1800
agcagagatc atcaatcaag gtcctccaat ggaggaggag gagtacagaa ccaccaccat 1860
ccaagcctag aacaggacat gaatatgctg aatggaagct gtaagcagtc agatttggac 1920
gtggacgtca agatcattgg aagggatgcc atggttagag tgaactgcag caagagcaac 1980
cacccagctg caaggctaat ggtggcattg aaggagcttg acttggaagt tacgcacgcg 2040
agcgtttcgg ttgtcaatga tctgatgatc cagcaggcga cggtgaggat ggggagccgg 2100
tattacagcc cggatcatct taggatggtc ttagaagcca aggtttctga tatcagggga 2160
tga 2163
<210>26
<211>720
<212>PRT
<213>藏边大黄
<400>26
Met Met Asn Leu Trp Ser Ser Asp Asp Asn Val Ala Phe Ala Asp Ala
1 5 10 15
Phe Met Ser Leu Asp Ser Ser Ser Ala Ala Ala Trp Pro Pro Ala Pro
20 25 30
Ser Ser His Gln Tyr Asn His Gln Tyr Asn Leu Gln His Gln Gln Gln
35 40 45
Leu Gln His Gln Pro Gln Gln Gln Gln Gln Gln Gln Gln Met Ala Asn
50 55 60
Ser Ala Gly Gly Gly Trp Gln Gln Ala Met Ala Gly Gly Ala Gln Met
65 70 75 80
Asn Pro Ala Gln Met Met Asn Gln Asp Ser Leu Gln Gln Arg Leu Gln
85 90 95
Ala Leu Ile Asp Asp Ala Arg Glu Ser Trp Thr Tyr Ala Ile Phe Trp
100 105 110
Gln Cys Asn Val Glu Pro Thr Gly Gln Ser Leu Leu Gly Trp Gly Asp
115 120 125
Gly Tyr Tyr Lys Gly Asp Asp Ser Ala Asn Lys Asn Ala Ser Ser Ala
130 135 140
Ala Pro Ala Ala Gly Ser Arg Pro Pro Lys Asn Pro Ala Glu Gln Glu
145 150 155 160
His Arg Arg Arg Val Leu Arg Glu Leu Asn Ser Leu Ile Ser Gly Ser
165 170 175
Ser Ser Pro Gln Asn Asp Ala Val Asp Asp Asp Val Thr Asp Thr Glu
180 185 190
Trp Phe Phe Leu Ile Ser Met Thr Gln Ala Phe Pro Phe Gly Val Asp
195 200 205
Leu Pro Gly Gln Ala Ile Leu Gly Ser Asn Pro Ile Trp Ala Tyr Gly
210 215 220
Ser Asp Arg Leu Ala Gly Ser Pro Trp Asp Arg Ala Arg Gln Gly Ala
225 230 235 240
Ala Phe Gly Leu Gln Thr Ile Val Cys Ile Pro Ser Gly Thr Gly Val
245 250 255
Leu Glu Leu Gly Ser Thr Glu Leu Val Phe Asn Ser Ser Val Leu Met
260 265 270
Asn Lys Val Arg Val Leu Phe Asn Phe Gly Ser Gly Asp Ala Ser Leu
275 280 285
Leu Thr Ala Ala Ala Ser Ser Ser Ala Pro Ala Ala Ala Pro Pro Pro
290 295 300
Pro Ile Ser Thr Ala Thr Thr Asp Glu Ala Glu Asn Asp Pro Ala Ala
305 310 315 320
Leu Trp Ile Ser Asp Pro Ser Ser Ser Ala Ala Glu Val Lys Glu Ala
325 330 335
Leu Asn Pro Arg Ile Thr Val Arg Glu Ser Ser Ile Pro Ile Gly Ser
340 345 350
Asn Ser Ile Pro Val His Gln Pro Ala Lys Pro Pro Gln Leu Asp Val
355 360 365
Gln Ser Ser Ile Gly Leu Thr Glu Asn Ser Ile Gly Ile His Ser Gln
370 375 380
Lys Ser His Asn Gln Pro Leu Gln His Gln Gly Phe Phe Thr Lys Glu
385 390 395 400
Leu Asn Phe Ser Glu Phe Ala Met Lys Pro Glu Ser Gly Glu Ile Leu
405 410 415
Asn Phe Gly Glu Ser Lys Arg Asn Ser Leu Gly Asn Gly Asn Gly Leu
420 425 430
Asn Ser Gln Phe Leu Val Glu Glu Ser Asn Lys Asn Ile Ile Ser Lys
435 440 445
Lys Arg Ser Pro Thr Ser Arg Gly Ser Ala Glu Glu Gly Met Leu Ser
450 455 460
Phe Thr Ser Ser Val Val Leu Pro Ser Ser Met Ala Val Lys Ser Ser
465 470 475 480
Ala Thr Gly Ala Gly Asp Ser Asp His Ser Asp Leu Glu Ala Ser Val
485 490 495
Val Lys Glu Ala Asp Ser Ser Arg Val Val Asp Pro Glu Lys Arg Pro
500 505 510
Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu Asn
515 520 525
His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg Phe
530 535 540
Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys Ala
545 550 555 560
Ser Leu Leu Gly Asp Ala Ile Ser Phe Ile Asn Glu Leu Lys Ser Lys
565 570 575
Leu Gln Asn Val Glu Ser Glu Lys Glu Thr Leu Leu Ser Gln Val Glu
580 585 590
Cys Leu Lys Thr Glu Val Leu Ala Ser Arg Asp His Gln Ser Arg Ser
595 600 605
Ser Asn Gly Gly Gly Gly Val Gln Asn His His His Pro Ser Leu Glu
610 615 620
Gln Asp Met Asn Met Leu Asn Gly Ser Cys Lys Gln Ser Asp Leu Asp
625 630 635 640
Val Asp Val Lys Ile Ile Gly Arg Asp Ala Met Val Arg Val Asn Cys
645 650 655
Ser Lys Ser Asn His Pro Ala Ala Arg Leu Met ValAla Leu Lys Glu
660 665 670
Leu Asp Leu Glu Val Thr His Ala Ser Val Ser Val Val Asn Asp Leu
675 680 685
Met Ile Gln Gln Ala Thr Val Arg Met Gly Ser Arg Tyr Tyr Ser Pro
690 695 700
Asp His Leu Arg Met Val Leu Glu Ala Lys Val Ser Asp Ile Arg Gly
705 710 715 720
<210>27
<211>2109
<212>DNA
<213>玉米(Zea mays)
<400>27
ggcacgaggg acgacaacgc ctccatgatg gaggccttca tggcttctgc cgacctcccc 60
accttcccct ggggagcgcc ggccgggggc ggcaactcgt cggccgccgc ggcgtcgccg 120
ccgccgcaga tgccagcggc gatggctccc gggttcaacc aggacacgct gcagcagagg 180
ctacaagcca tgatagaggg gtcgagggag acctggacct acgccatctt ctggcagtcc 240
tcccttgact ccgccaccgg cgcctcgctg ctcggctggg gggacggcta ctacaagggc 300
tgcgacgaag acaagcgcaa gcagaagccg ctcacgccct ccgcccaggc cgagcaggag 360
caccgcaagc gcgtgctccg cgagctcaac tccctcatct ccggcgcggc ggcggctccc 420
gacgaggccg tcgaggagga ggtcaccgat accgagtggt tcttcctcgt ctccatgacg 480
cagtcgtttc tcaacggttc gggcctcccc gggcaggcgc tcttcgccgg gcagcccaca 540
tggatcgcct ctggcctctc ctccgcgccg tgcgagcgcg cgcgtcaggc ctacaacttc 600
ggcctccgca ccatggtatg cttccccgtc ggcaccgggg tgctcgagct cggctccacc 660
gacgtcgtgt tcaagaccgc cgagagcatg gctaagatcc gctcgctctt tgggggcgga 720
gcagggggtg gctcgtggcc gcccgtgcag cctcaggcgc cgtcgtcgca gcagcccgcc 780
gccggagccg accacgcgga gacggacccg tccatgctat ggctcgccga cgcgccggtc 840
atggacatca aggattcctt gtcgcacccg tcggccgaga tctccgtctc caagcctccg 900
ccgcatccgc cgcagatcca ttttgagaac gggagcacga gcacgctcac ggagaacccc 960
agcccctccg tgcacgcgcc gccacccccg ccggcgccgg ctgctccaca gcagcggcag 1020
caccagcacc agaatcaggc gcaccagggc ccgttccgcc gggagctcaa tttctcggac 1080
ttcgcgtcca ctccttcctt ggcggcgacc ccgccgttct tcaagcccga gtccggcgag 1140
atcctcagct tcggcgccga cagcaacgcc cggaggaacc cgtcgccggt acctcccgcc 1200
gccaccgcca gcctcaccac cgctcccggg agcctcttct cgcagcacac ggcgaccatg 1260
acggccgccg cggcgaacga cgcgaagaac aacaacaagc gctcaatgga ggccacctcc 1320
cgggcgagca acaccaacca ccacccggcg gcgacggcga acgagggcat gctgtccttc 1380
tcgtcggcgc cgactacgcg gccgtcgacg ggcacgggcg cgccggccaa gtcggagtcc 1440
gaccactcgg acctggacgc gtctgtgcgc gaggtggaga gcagccgcgt ggtggcgccg 1500
ccaccggagg cggagaagcg gccgcgaaag cgcgggcgga agcccgcgaa cgggcgcgag 1560
gagccgctga accacgtgga ggcggagcgg cagcggcggg agaagctgaa ccagcgcttc 1620
tacgcgctgc gcgccgtggt gcccaacgtg tcgaagatgg acaaggcgtc gctgctcggc 1680
gacgccatct cctacatcaa cgagctccgg ggcaagctga cgtcgctgga gaccgacaag 1740
gagacgctgc agacccaggt ggaggcgctc aagaaggagc gcgacgcgcg gccgccctcg 1800
cactccgctg ggctcggcgg gcacgacggc gggccgcgct gccacgcggt ggagatcgac 1860
gccaagatcc tggggctgga ggccatgatc cgcgtgcagt gccacaagcg caaccacccg 1920
tcggcgcggc tgatgacagc gctccgcgag ctcgacctgg acgtgtacca cgccagcgtg 1980
tccgtcgtca aggacctcat gatccagcag gtcgccgtca agatggccag ccgcgtgtac 2040
acgcaggacc agctcagcgc cgcgctctac agccgcctcg cggagcccgg gtctgccatg 2100
ggcaggtaa 2109
<210>28
<211>702
<212>PRT
<213>玉米
<400>28
Gly Thr Arg Asp Asp Asn Ala Ser Met Met Glu Ala Phe Met Ala Ser
1 5 10 15
Ala Asp Leu Pro Thr Phe Pro Trp Gly Ala Pro Ala Gly Gly Gly Asn
20 25 30
Ser Ser Ala Ala Ala Ala Ser Pro Pro Pro Gln Met Pro Ala Ala Met
35 40 45
Ala Pro Gly Phe Asn Gln Asp Thr Leu Gln Gln Arg Leu Gln Ala Met
50 55 60
Ile Glu Gly Ser Arg Glu Thr Trp Thr Tyr Ala Ile Phe Trp Gln Ser
65 70 75 80
Ser Leu Asp Ser Ala Thr Gly Ala Ser Leu Leu Gly Trp Gly Asp Gly
85 90 95
Tyr Tyr Lys Gly Cys Asp Glu Asp Lys Arg Lys Gln Lys Pro Leu Thr
100 105 110
Pro Ser Ala Gln Ala Glu Gln Glu His Arg Lys Arg Val Leu Arg Glu
115 120 125
Leu Asn Ser Leu Ile Ser Gly Ala Ala Ala Ala Pro Asp Glu Ala Val
130 135 140
Glu Glu Glu Val Thr Asp Thr Glu Trp Phe Phe Leu Val Ser Met Thr
145 150 155 160
Gln Ser Phe Leu Asn Gly Ser Gly Leu Pro Gly Gln Ala Leu Phe Ala
165 170 175
Gly Gln Pro Thr Trp Ile Ala Ser Gly Leu Ser Ser Ala Pro Cys Glu
180 185 190
Arg Ala Arg Gln Ala Tyr Asn Phe Gly Leu Arg Thr Met Val Cys Phe
195 200 205
Pro Val Gly Thr Gly Val Leu Glu Leu Gly Ser Thr Asp Val Val Phe
210 215 220
Lys Thr Ala Glu Ser Met Ala Lys Ile Arg Ser Leu Phe Gly Gly Gly
225 230 235 240
Ala Gly Gly Gly Ser Trp Pro Pro Val Gln Pro Gln Ala Pro Ser Ser
245 250 255
Gln Gln Pro Ala Ala Gly Ala Asp His Ala Glu Thr Asp Pro Ser Met
260 265 270
Leu Trp Leu Ala Asp Ala Pro Val Met Asp Ile Lys Asp Ser Leu Ser
275 280 285
His Pro Ser Ala Glu Ile Ser Val Ser Lys Pro Pro Pro His Pro Pro
290 295 300
Gln Ile His Phe Glu Asn Gly Ser Thr Ser Thr Leu Thr Glu Asn Pro
305 310 315 320
Ser Pro Ser Val His Ala Pro Pro Pro Pro Pro Ala Pro Ala Ala Pro
325 330 335
Gln Gln Arg Gln His Gln His Gln Asn Gln Ala His Gln Gly Pro Phe
340 345 350
Arg Arg Glu Leu Asn Phe Ser Asp Phe Ala Ser Thr Pro Ser Leu Ala
355 360 365
Ala Thr Pro Pro Phe Phe Lys Pro Glu Ser Gly Glu Ile Leu Ser Phe
370 375 380
Gly Ala Asp Ser Asn Ala Arg Arg Asn Pro Ser Pro Val Pro Pro Ala
385 390 395 400
Ala Thr Ala Ser Leu Thr Thr Ala Pro Gly Ser Leu Phe Ser Gln His
405 410 415
Thr Ala Thr Met Thr Ala Ala Ala Ala Asn Asp Ala Lys Asn Asn Asn
420 425 430
Lys Arg Ser Met Glu Ala Thr Ser Arg Ala Ser Asn Thr Asn His His
435 440 445
Pro Ala Ala Thr Ala Asn Glu Gly Met Leu Ser Phe Ser Ser Ala Pro
450 455 460
Thr Thr Arg Pro Ser Thr Gly Thr Gly Ala Pro Ala Lys Ser Glu Ser
465 470 475 480
Asp His Ser Asp Leu Asp Ala Ser Val Arg Glu Val Glu Ser Ser Arg
485 490 495
Val Val Ala Pro Pro Pro Glu Ala Glu Lys Arg Pro Arg Lys Arg Gly
500 505 510
Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu Asn His Val Glu Ala
515 520 525
Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg Phe Tyr Ala Leu Arg
530 535 540
Ala Val Val Pro Asn Val Ser Lys Met Asp Lys Ala Ser Leu Leu Gly
545 550 555 560
Asp Ala Ile Ser Tyr Ile Asn Glu Leu Arg Gly Lys Leu Thr Ser Leu
565 570 575
Glu Thr Asp Lys Glu Thr Leu Gln Thr Gln Val Glu Ala Leu Lys Lys
580 585 590
Glu Arg Asp Ala Arg Pro Pro Ser His Ser Ala Gly Leu Gly Gly His
595 600 605
Asp Gly Gly Pro Arg Cys His Ala Val Glu Ile Asp Ala Lys Ile Leu
610 615 620
Gly Leu Glu Ala Met Ile Arg Val Gln Cys His Lys Arg Asn His Pro
625 630 635 640
Ser Ala Arg Leu Met Thr Ala Leu Arg Glu Leu Asp Leu Asp Val Tyr
645 650 655
His Ala Ser Val Ser Val Val Lys Asp Leu Met Ile Gln Gln Val Ala
660 665 670
Val Lys Met Ala Ser Arg Val Tyr Thr Gln Asp Gln Leu Ser Ala Ala
675 680 685
Leu Tyr Ser Arg Leu Ala Glu Pro Gly Ser Ala Met Gly Arg
690 695 700
<210>29
<211>1731
<212>DNA
<213>展叶剑叶藓(Physcomitrella patens)
<400>29
atgtcgcagt tattgaatgc gtgggaagta gcggactcag ctatgatcga ggcgttcatg 60
ggaacggggt ataactgcgt ggaaggcttc gaagtgcagg atgatccgga cgggcagctc 120
cacttgaacg agtcggtgtt gctgcggagg ctgcactcgc tggtcgaaga gagtaccgtg 180
gattggacgt atgcaatctt ttggcagctg tcagccttac gtgaagggga gatgatgctc 240
ggttggggtg atgggtactt caggagtgct aaggagaatg aaatcaacga cgcgaggaac 300
atgaagggtg gttctcaaga ggaggatcaa cagatgaggc gaaaggtgtt gcgagagctg 360
caggctctag tcaatggctc tgaagatgat gttagcgact atgtcacgga tacggaatgg 420
ttttaccttg tttcgatgtc tcattcttat gcagccggag tggggactcc tggacgagca 480
ttagcatctg acagacctgt gtggctaatt ggagcgaaca aagctcctga taataactgc 540
agtcgtgttc aattggctaa ggtacacagt tcaatgatcc ttcagacaat cctttgtatt 600
ccgtcgaaat ctggtgtcgt tgagcttgga tcgacagatc tggcaaaaag ctgggaagtt 660
gttcagaatg tcaagatggt ttttgatgaa ccaatgatgt gggcagccca tgaaatccaa 720
gcggtggcgc attccttgcc tttgagtagc gacgcgacta gtatgcgacc gtcaagccca 780
agtcttatgt caatagcaac aataagtgct tcaatttcaa atgcaagtca gattggcaga 840
tgttcaaatc caagtcaaga tcatgaagca cattttgttg gaaggaagaa tccaccctcg 900
tcaagacccc cgatgaggtt ctacaaacca cgggtggaag aattgagctc ggacactcca 960
gaaacaaact tggttgataa taaatatatt gtagggaagt cagtatcttt ccaccacctt 1020
tctaagatag gtcagagagg aatgcctgga cctcctacca ctgcaaatag gttaccatgt 1080
ttcgctccgt ccgaggtaga ttgtcatgaa tcagaagccg acgtttccgt caaagaaaat 1140
gttgtggaat caagtacaaa tctcgagcct aaaccacgca aaagagggcg caagccggca 1200
aacgataggg aagagccact aaatcatgtg caagctgaac ggcagcggcg agaaaaactc 1260
aatcagaaat tttatgctct acggtctgta gtgccaaacg tgtccaagat ggataaggca 1320
tccttattag aagatgccat tacctacatt aatgagcttc aagaaaagct acaaaaagca 1380
gaggctgaat tgaaggtttt ccaaaggcaa gtgcttgcat caactggcga atctaaaaaa 1440
cctaatccat ctcgcaggga ttcgaccgaa agttctgatg aagaacgttt cagacttcaa 1500
gagagtggtc agagatcggc acctcttgtt cacacttctg aaaataaacc tgtaattagt 1560
gtttttgttc ttggagaaga agctatgatt cgagtttatt gcacaagaca ctctaacttt 1620
atagttcata tgatgtcggc attggaaaag ctacgcttag aggttataca ttcaaacact 1680
tcatccatga aggatatgct tcttcacgtc gtgattgtca aggtgcgctg a 1731
<210>30
<211>576
<212>PRT
<213>展叶剑叶藓
<400>30
Met Ser Gln Leu Leu Asn Ala Trp Glu Val Ala Asp Ser Ala Met Ile
1 5 10 15
Glu Ala Phe Met Gly Thr Gly Tyr Asn Cys Val Glu Gly Phe Glu Val
20 25 30
Gln Asp Asp Pro Asp Gly Gln Leu His Leu Asn Glu Ser Val Leu Leu
35 40 45
Arg Arg Leu His Ser Leu Val Glu Glu Ser Thr Val Asp Trp Thr Tyr
50 55 60
Ala Ile Phe Trp Gln Leu Ser Ala Leu Arg Glu Gly Glu Met Met Leu
65 70 75 80
Gly Trp Gly Asp Gly Tyr Phe Arg Ser Ala Lys Glu Asn Glu Ile Asn
85 90 95
Asp Ala Arg Asn Met Lys Gly Gly Ser Gln Glu Glu Asp Gln Gln Met
100 105 110
Arg Arg Lys Val Leu Arg Glu Leu Gln Ala Leu Val Asn Gly Ser Glu
115 120 125
Asp Asp Val Ser Asp Tyr Val Thr Asp Thr Glu Trp Phe Tyr Leu Val
130 135 140
Ser Met Ser His Ser Tyr Ala Ala Gly Val Gly Thr Pro Gly Arg Ala
145 150 155 160
Leu Ala Ser Asp Arg Pro Val Trp Leu Ile Gly Ala Asn Lys Ala Pro
165 170 175
Asp Asn Asn Cys Ser Arg Val Gln Leu Ala Lys Val His Ser Ser Met
180 185 190
Ile Leu Gln Thr Ile Leu Cys Ile Pro Ser Lys Ser Gly Val Val Glu
195 200 205
Leu Gly Ser Thr Asp Leu Ala Lys Ser Trp Glu Val Val Gln Asn Val
210 215 220
Lys Met Val Phe Asp Glu Pro Met Met Trp Ala Ala His Glu Ile Gln
225 230 235 240
Ala Val Ala His Ser Leu Pro Leu Ser Ser Asp Ala Thr Ser Met Arg
245 250 255
Pro Ser Ser Pro Ser Leu Met Ser Ile Ala Thr Ile Ser Ala Ser Ile
260 265 270
Ser Asn Ala Ser Gln Ile Gly Arg Cys Ser Asn Pro Ser Gln Asp His
275 280 285
Glu Ala His Phe Val Gly Arg Lys Asn Pro Pro Ser Ser Arg Pro Pro
290 295 300
Met Arg Phe Tyr Lys Pro Arg Val Glu Glu Leu Ser Ser Asp Thr Pro
305 310 315 320
Glu Thr Asn Leu Val Asp Asn Lys Tyr Ile Val Gly Lys Ser Val Ser
325 330 335
Phe His His Leu Ser Lys Ile Gly Gln Arg Gly Met Pro Gly Pro Pro
340 345 350
Thr Thr Ala Asn Arg Leu Pro Cys Phe Ala Pro Ser Glu Val Asp Cys
355 360 365
His Glu Ser Glu Ala Asp Val Ser Val Lys Glu Asn Val Val Glu Ser
370 375 380
Ser Thr Asn Leu Glu Pro Lys Pro Arg Lys Arg Gly Arg Lys Pro Ala
385 390 395 400
Asn Asp Arg Glu Glu Pro Leu Asn His Val Gln Ala Glu Arg Gln Arg
405 410 415
Arg Glu Lys Leu Asn Gln Lys Phe Tyr Ala Leu Arg Ser Val Val Pro
420 425 430
Asn Val Ser Lys Met Asp Lys Ala Ser Leu Leu Glu Asp Ala Ile Thr
435 440 445
Tyr Ile Asn Glu Leu Gln Glu Lys Leu Gln Lys Ala Glu Ala Glu Leu
450 455 460
Lys Val Phe Gln Arg Gln Val Leu Ala Ser Thr Gly Glu Ser Lys Lys
465 470 475 480
Pro Asn Pro Ser Arg Arg Asp Ser Thr Glu Ser Ser Asp Glu Glu Arg
485 490 495
Phe Arg Leu Gln Glu Ser Gly Gln Arg Ser Ala Pro Leu Val His Thr
500 505 510
Ser Glu Asn Lys Pro Val Ile Ser Val Phe Val Leu Gly Glu Glu Ala
515 520 525
Met Ile Arg Val Tyr Cys Thr Arg His Ser Asn Phe Ile Val His Met
530 535 540
Met Ser Ala Leu Glu Lys Leu Arg Leu Glu Val Ile His Ser Asn Thr
545 550 555 560
Ser Ser Met Lys Asp Met Leu Leu His Val Val Ile Val Lys Val Arg
565 570 575
<210>31
<211>981
<212>DNA
<213>番茄(Lycopersicon esculentum)
<400>31
agtggaaatg gtcagagttg ttacaatcag caacaacaga agaatcctcc tcagcaacaa 60
acacaaggat tcttcacgag ggagttgaat ttttcggaat tcggtttcga tggaagtagt 120
aataggaatg gaaattcatc ggtttcttgc aagcctgaat caggagaaat cttgaatttt 180
ggtgatagta ctaaaaaaag tgcttccagt gccaatgtga acttgtttac aggtcagtcc 240
caattttggg gcctggggga ggagaataat aacaagaacc aagaaaagat cagctacttc 300
aggggaagca atgaagaagg aatgctttca tttgtttcag gtacagtttg cttcttcggg 360
catgaagtca ggtggaggcg gaggcaagac tctgaacatt cagatctcga ggcttcagtg 420
gtgaaagaag ctgatagtag tagagtggta gagcctgaaa agaggccaag gaagcgaggt 480
agaaagccag cgaatggacg ggaggagcca ttgaatcacg tcgaggcaga gaggcaaagg 540
agggagaaat tgaaccaaag attcttctct cttagagctg ttgtaccaaa tgtgtctaag 600
atggacaagg catcactcct tggagatgct atttcctata taaacgagtt gaaatcgaag 660
cttcaaaata cagagtcaga taaagaagac ttgaagagcc aaatagaaga tttaaagaaa 720
gaatcaaggc gccccggtcc tcctccacca ccaaatcaag atctcaagat gtctagccac 780
actggaggca agattgtaga cgtggatata gacgttaaga tcatcggatg ggatgcaatg 840
attcgtatac aatgtaataa aaagaatcat ccagcgaagg ctaatggcag cgctcatgga 900
attagaccta gacgtgcatc atgccagtgt ttcagttgtc aacgatttga tgatccaaca 960
agccacagtg aaaatgggta g 981
<210>32
<211>326
<212>PRT
<213>番茄
<400>32
Ser Gly Asn Gly Gln Ser Cys Tyr Asn Gln Gln Gln Gln Lys Asn Pro
1 5 10 15
Pro Gln Gln Gln Thr Gln Gly Phe Phe Thr Arg Glu Leu Asn Phe Ser
20 25 30
Glu Phe Gly Phe Asp Gly Ser Ser Asn Arg Asn Gly Asn Ser Ser Val
35 40 45
Ser Cys Lys Pro Glu Ser Gly Glu Ile Leu Asn Phe Gly Asp Ser Thr
50 55 60
Lys Lys Ser Ala Ser Ser Ala Asn Val Asn Leu Phe Thr Gly Gln Ser
65 70 75 80
Gln Phe Trp Gly Leu Gly Glu Glu Asn Asn Asn Lys Asn Gln Glu Lys
85 90 95
Ile Ser Tyr Phe Arg Gly Ser Asn Glu Glu Gly Met Leu Ser Phe Val
100 105 110
Ser Gly Thr Val Cys Phe Phe Gly His Glu Val Arg Trp Arg Arg Arg
115 120 125
Gln Asp Ser Glu His Ser Asp Leu Glu Ala Ser Val Val Lys Glu Ala
130 135 140
Asp Ser Ser Arg Val Val Glu Pro Glu Lys Arg Pro Arg Lys Arg Gly
145 150 155 160
Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu Asn His Val Glu Ala
165 170 175
Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg Phe Phe Ser Leu Arg
180 185 190
Ala Val Val Pro Asn Val Ser Lys Met Asp Lys Ala Ser Leu Leu Gly
195 200 205
Asp Ala Ile Ser Tyr Ile Asn Glu Leu Lys Ser Lys Leu Gln Asn Thr
210 215 220
Glu Ser Asp Lys Glu Asp Leu Lys Ser Gln Ile Glu Asp Leu Lys Lys
225 230 235 240
Glu Ser Arg Arg Pro Gly Pro Pro Pro Pro Pro Asn Gln Asp Leu Lys
245 250 255
Met Ser Ser His Thr Gly Gly Lys Ile Val Asp Val Asp Ile Asp Val
260 265 270
Lys Ile Ile Gly Trp Asp Ala Met Ile Arg Ile Gln Cys Asn Lys Lys
275 280 285
Asn His Pro Ala Lys Ala Asn Gly Ser Ala His Gly Ile Arg Pro Arg
290 295 300
Arg Ala Ser Cys Gln Cys Phe Ser Cys Gln Arg Phe Asp Asp Pro Thr
305 310 315 320
Ser His Ser Glu Asn Gly
325
<210>33
<211>1476
<212>DNA
<213>Populus trichocarpa
<400>33
atggaggaac tcattatttc tccatcttca tcatcttcac cggtctcctt atcccaagaa 60
accccaccga ctctccaaca aaggcttcaa ttcatagtcc aaaaccaacc agattggtgg 120
tcttatgcca tattttggca aacatcaaac gatgacagcg gccgaatctt cctaggctgg 180
ggtgatggcc attttcaagg ctctaaagat acttctccca aaccaaacac cttcagcaat 240
agccgcatga cgatatcaaa ctccgagagg aaaagggtca tgatgaaggg aatccaatcc 300
ctgatcggtg aatgtcacga tcttgatatg tctctgatgg atggtaacga tgctaccgac 360
tctgagtggt tctatgtcat gtcccttact cgatctttct cacctggaga tggcatcctt 420
ggcaaagctt atacaactgg ttctttgatt tggttaactg gtggccatga acttcaattc 480
tacaactgtg aaagagtcaa agaagcacaa atgcatggca ttgagaccct ggtttgcata 540
cctacatcgt gtggggttct tgaattagga tcctcttctg tgatcagaga aaattggggt 600
cttgttcaac aagccaagtc tctttttggg tcagatctta gcgcttattt ggtgcccaaa 660
ggccctaata actccagtga agaaccgacc cagtttcttg acaggagcat ttcttttgcg 720
gatatgggca taatagctgg acttcaagaa gattgtgcag ttgatcgtga acagaagaac 780
gctcgtgaaa cagaagaagc aaataaacgt aacgctaata aaccaggcct gtcttatttg 840
aactcagagc attcagactc ggactttcct ctacttgcta tgcatatgga gaaaagaatt 900
ccaaagaaaa gagggagaaa gcctggcctg ggcagagacg ccccactgaa ccatgtagag 960
gctgagaggc agcggagaga gaagttgaac caccggtttt acgcgctgcg tgcggtggtc 1020
ccaaacgtgt ctagaatgga caaagcatca ctattatctg atgctgtatc ctacatcaat 1080
gaattgaagg cgaaggttga tgaattagag tcacaactag aaagggaatc caagaaagtg 1140
aaattggaag ttgccgataa tttggacaat caaagcacca ccacttctgt ggaccaatca 1200
gcctgcaggc cgaatagtgc tggtggcgct gggcttgcac ttgaagttga gatcaagttt 1260
gtgggtaatg atgcaatgat tagagtccaa tcggagaatg tgaactatcc agcttccagg 1320
ttaatgtgtg cgctccgtga actggagttt caggttcacc atgctagtat gtcctgtgtt 1380
aacgagctta tgctccaaga tgtggtagtt agggttcctg atggactgag aaccgaagag 1440
gccttgaaat ctgctcttct tggaagacta gaataa 1476
<210>34
<211>491
<212>PRT
<213>Populus trichocarpa
<400>34
Met Glu Glu Leu Ile Ile Ser Pro Ser Ser Ser Ser Ser Pro Val Ser
1 5 10 15
Leu Ser Gln Glu Thr Pro Pro Thr Leu Gln Gln Arg Leu Gln Phe Ile
20 25 30
Val Gln Asn Gln Pro Asp Trp Trp Ser Tyr Ala Ile Phe Trp Gln Thr
35 40 45
Ser Asn Asp Asp Ser Gly Arg Ile Phe Leu Gly Trp Gly Asp Gly His
50 55 60
Phe Gln Gly Ser Lys Asp Thr Ser Pro Lys Pro Asn Thr Phe Ser Asn
65 70 75 80
Ser Arg Met Thr Ile Ser Asn Ser Glu Arg Lys Arg Val Met Met Lys
85 90 95
Gly Ile Gln Ser Leu Ile Gly Glu Cys His Asp Leu Asp Met Ser Leu
100 105 110
Met Asp Gly Asn Asp Ala Thr Asp Ser Glu Trp Phe Tyr Val Met Ser
115 120 125
Leu Thr Arg Ser Phe Ser Pro Gly Asp Gly Ile Leu Gly Lys Ala Tyr
130 135 140
Thr Thr Gly Ser Leu Ile Trp Leu Thr Gly Gly His Glu Leu Gln Phe
145 150 155 160
Tyr Asn Cys Glu Arg Val Lys Glu Ala Gln Met His Gly Ile Glu Thr
165 170 175
Leu Val Cys Ile Pro Thr Ser Cys Gly Val Leu Glu Leu Gly Ser Ser
180 185 190
Ser Val Ile Arg Glu Asn Trp Gly Leu Val Gln Gln Ala Lys Ser Leu
195 200 205
Phe Gly Ser Asp Leu Ser Ala Tyr Leu Val Pro Lys Gly Pro Asn Asn
210 215 220
Ser Ser Glu Glu Pro Thr Gln Phe Leu Asp Arg Ser Ile Ser Phe Ala
225 230 235 240
Asp Met Gly Ile Ile Ala Gly Leu Gln Glu Asp Cys Ala Val Asp Arg
245 250 255
Glu Gln Lys Asn Ala Arg Glu Thr Glu Glu Ala Asn Lys Arg Asn Ala
260 265 270
Asn Lys Pro Gly Leu Ser Tyr Leu Asn Ser Glu His Ser Asp Ser Asp
275 280 285
Phe Pro Leu Leu Ala Met His Met Glu Lys Arg Ile Pro Lys Lys Arg
290 295 300
Gly Arg Lys Pro Gly Leu Gly Arg Asp Ala Pro Leu Asn His Val Glu
305 310 315 320
Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn His Arg Phe Tyr Ala Leu
325 330 335
Arg Ala Val Val Pro Asn Val Ser Arg Met Asp Lys Ala Ser Leu Leu
340 345 350
Ser Asp Ala Val Ser Tyr Ile Asn Glu Leu Lys Ala Lys Val Asp Glu
355 360 365
Leu Glu Ser Gln Leu Glu Arg Glu Ser Lys Lys Val Lys Leu Glu Val
370 375 380
Ala Asp Asn Leu Asp Asn Gln Ser Thr Thr Thr Ser Val Asp Gln Ser
385 390 395 400
Ala Cys Arg Pro Asn Ser Ala Gly Gly Ala Gly Leu Ala Leu Glu Val
405 410 415
Glu Ile Lys Phe Val Gly Asn Asp Ala Met Ile Arg Val Gln Ser Glu
420 425 430
Asn Val Asn Tyr Pro Ala Ser Arg Leu Met Cys Ala Leu Arg Glu Leu
435 440 445
Glu Phe Gln Val His His Ala Ser Met Ser Cys Val Asn Glu Leu Met
450 455 460
Leu Gln Asp Val Val Val Arg Val Pro Asp Gly Leu Arg Thr Glu Glu
465 470 475 480
Ala Leu Lys Ser Ala Leu Leu Gly Arg Leu Glu
485 490
<210>35
<211>878
<212>DNA
<213>普通小麦(Triticum aestivum)
<400>35
atgaaaggcc gtgggaacag aggactgctg gtggagggag ctcattgctt cccaatgtcc 60
agaaaggatt gcagagtttc acttggagtc aggcccgggg cctgaattct caccagcaga 120
agtttggcaa tggtatactg atagtgagta atgaagctac acacggcaac aatagaaccg 180
cggacagctc cactacaaca cagtttcagc ttcagaaagc acctcagctc cagaaactac 240
cacttcttca gaaaccacca cagctagtga agccgctgca gatggtcaac cagcaacagc 300
tgcagccaca ggcgcctagg caaatagatt ttagtgcagg gaccagttcc aagtctggtg 360
tcctggttac aagagcagct gttcttgatg gagatagttc agaggtgaat ggcttgtgta 420
aagaggaagg gacaacacct gtcatagagg accgacggcc aaggaagagg ggaagaaagc 480
ctgcgaatgg gagagaggag ccgctgaatc atgttgaggc tgagcgtcaa aggagggaga 540
agctcaacca gcggttctat gcgttgagag ccgttgtgcc caacatctcg aaaatggaca 600
aggcttccct gctgggcgat gcaatagcat acatcactga ccttcagaag aagctcaaag 660
atatggagac ggagagagaa cgatttcttg agtctggtat ggtggatcca agggagcgag 720
cccctagacc agaggttgac atccaggtgg tgcaagacga ggttctggtt cgagttatgt 780
ctccattgga gaaccatccg gtaaagaagg tctttgaagc gtttgaagag gcggacgtcc 840
gggtagggga gtcgaaactc acaggcaaca atggaacg 878
<210>36
<211>292
<212>PRT
<213>普通小麦
<400>36
Glu Arg Pro Trp Glu Gln Arg Thr Ala Gly Gly Gly Ser Ser Leu Leu
1 5 10 15
Pro Asn Val Gln Lys Gly Leu Gln Ser Phe Thr Trp Ser Gln Ala Arg
20 25 30
Gly Leu Asn Ser His Gln Gln Lys Phe Gly Asn Gly Ile Leu Ile Val
35 40 45
Ser Asn Glu Ala Thr His Gly Asn Asn Arg Thr Ala Asp Ser Ser Thr
50 55 60
Thr Thr Gln Phe Gln Leu Gln Lys Ala Pro Gln Leu Gln Lys Leu Pro
65 70 75 80
Leu Leu Gln Lys Pro Pro Gln Leu Val Lys Pro Leu Gln Met Val Asn
85 90 95
Gln Gln Gln Leu Gln Pro Gln Ala Pro Arg Gln Ile Asp Phe Ser Ala
100 105 110
Gly Thr Ser Ser Lys Ser Gly Val Leu Val Thr Arg Ala Ala Val Leu
115 120 125
Asp Gly Asp Ser Ser Glu Val Asn Gly Leu Cys Lys Glu Glu Gly Thr
130 135 140
Thr Pro Val Ile Glu Asp Arg Arg Pro Arg Lys Arg Gly Arg Lys Pro
145 150 155 160
Ala Asn Gly Arg Glu Glu Pro Leu Asn His Val Glu Ala Glu Arg Gln
165 170 175
Arg Arg Glu Lys Leu Asn Gln Arg Phe Tyr Ala Leu Arg Ala Val Val
180 185 190
Pro Asn Ile Ser Lys Met Asp Lys Ala Ser Leu Leu Gly Asp Ala Ile
195 200 205
Ala Tyr Ile Thr Asp Leu Gln Lys Lys Leu Lys Asp Met Glu Thr Glu
210 215 220
Arg Glu Arg Phe Leu Glu Ser Gly Met Val Asp Pro Arg Glu Arg Ala
225 230 235 240
Pro Arg Pro Glu Val Asp Ile Gln Val Val Gln Asp Glu Val Leu Val
245 250 255
Arg Val Met Ser Pro Leu Glu Asn His Pro Val Lys Lys Val Phe Glu
260 265 270
Ala Phe Glu Glu Ala Asp Val Arg Val Gly Glu Ser Lys Leu Thr Gly
275 280 285
Asn Asn Gly Thr
290
<210>37
<211>2054
<212>DNA
<213>杨属物种(Populus sp.)
<400>37
tgaaaaaaaa aaacacatct gctttctggg atgactgatt accgactacc gccgacaatg 60
aatctatgga cggacgacaa cgcgtctgta atggaagcat ttatgaactc ctccgatctc 120
tcttctcttt gggcaccgcc tccgcaatct tccgcctcca cttccacgcc atcagcagca 180
gcacagccat ctgagaaaac tatgttgaac caagaaacac tccagcaacg ccttcagaca 240
ttaattgaag gcgcgtgtga gggctgggct tatgctattt tctggcaatc ctcttatgat 300
tattctggcg cctccgtcct aggatggggc gacggttatt ataaagggga ggaagataaa 360
ggaaaaacta gaacgagaaa ttcggcatca tcagctgttg aacaggagca tcgtaaaacg 420
gtgctccgta agctgaattc gttgattgct ggacctaatt ctgttactga tgatgctatc 480
gatgaagagg ttactgatac tgagtggttt tttcttgtta gcatgactca gtctttcgtt 540
aatggaagtg ggttacctgg tcaagctctt ttcaatggga gtccggtttg ggttgctggg 600
tcggagaggt tgggggcttc gccgtgtgaa agagccaggc agggtcaggt ttttgggtta 660
cagactttag tttgtatacc gtctgccagt ggtgttgttg aattgggttc tactgaattg 720
atttttcaaa gctcggatct gatgaataag gttagggttt tgttcgattt taatagtttg 780
gaggtggttt cttggccgat tggaactaca aatactgatc agggtgagaa cgacccgtct 840
tcgttttggc ttactgatcc agaaactaaa gatggaaatg gtgggattcc ttggaatctg 900
aacgggagtg atcaaaacaa gaacaatcat catagttcta atcagagttc gagtagcttg 960
actgatcatc tgggtggaat tcatcatgct cagaatcatc aacagcagcc gattcatgct 1020
cgaagtcttt tcactcgaga gttgaatttt ggggagtgca gcacatatga tgggagtagt 1080
gttagaaatg gaaattccca tttgacgaag ccagaatctg gagagatatt gaattttggg 1140
gagagtaaga ggactgcttc cagtgcaaat gggaatttct attcgggttt ggtgacagag 1200
gagaataata agaagaagag atcagttggt aatgaagaag ggatgctttc atttacttct 1260
ggtgtgattt taccttcttc ttgtatcctg aaatccagtg gcggtacagg aggggattca 1320
gatcactctg atcttgaggc ttcggttgta aaagaggcgg atagcagcag ggttgtggaa 1380
ccagaaaaga ggccacgaaa acgagggaga aaacctgcca atggaagaga agagcctttg 1440
aatcatgttg aagcagagag gcaaagaaga gagaaactta atcagaggtt ttatgcactg 1500
cgagctgtgg ttcctaatgt atcaaagatg gacaaagctt cacttcttgg ggatgccata 1560
tcatatatcg acgagcttag aacgaagctg caatctgccg agtctagcaa ggaggagttg 1620
gagaagcaag tggaatcaat gaagagggag ttagtaagca aggattcaag tcctccacct 1680
aaagaggagc tcaagatgtc aaataacgaa ggagttaaac tgatagacat ggatatcgat 1740
gtgaagataa gtggatggga tgcgatgata cgaatccaat gttgtaaaaa gaaccaccct 1800
gctgctaggc taatgtcggc tttgagagac ctggaccttg atgttcagta tgccaatgtg 1860
tctgtgatga atgatttgat gatccagcaa gccacggtga agatggggag tcggttttac 1920
acgcaagaag agcttagggt agccatatca acaaatgttg gtggcgtcca ttaggcattg 1980
aacagaacaa caaatgcaat tagcagttgg gatagatcct ggtaaagatt acaggttccg 2040
actttattta ttaa 2054
<210>38
<211>647
<212>PRT
<213>杨属物种
<400>38
Met Thr Asp Tyr Arg Leu Pro Pro Thr Met Asn Leu Trp Thr Asp Asp
1 5 10 15
Asn Ala Ser Val Met Glu Ala Phe Met Asn Ser Ser Asp Leu Ser Ser
20 25 30
Leu Trp Ala Pro Pro Pro Gln Ser Ser Ala Ser Thr Ser Thr Pro Ser
35 40 45
Ala Ala Ala Gln Pro Ser Glu Lys Thr Met Leu Asn Gln Glu Thr Leu
50 55 60
Gln Gln Arg Leu Gln Thr Leu Ile Glu Gly Ala Cys Glu Gly Trp Ala
65 70 75 80
Tyr Ala Ile Phe Trp Gln Ser Ser Tyr Asp Tyr Ser Gly Ala Ser Val
85 90 95
Leu Gly Trp Gly Asp Gly Tyr Tyr Lys Gly Glu Glu Asp Lys Gly Lys
100 105 110
Thr Arg Thr Arg Asn Ser Ala Ser Ser Ala Val Glu Gln Glu His Arg
115 120 125
Lys Thr Val Leu Arg Lys Leu Asn Ser Leu Ile Ala Gly Pro Asn Ser
130 135 140
Val Thr Asp Asp Ala Ile Asp Glu Glu Val Thr Asp Thr Glu Trp Phe
145 150 155 160
Phe Leu Val Ser Met Thr Gln Ser Phe Val Asn Gly Ser Gly Leu Pro
165 170 175
Gly Gln Ala Leu Phe Asn Gly Ser Pro Val Trp Val Ala Gly Ser Glu
180 185 190
Arg Leu Gly Ala Ser Pro Cys Glu Arg Ala Arg Gln Gly Gln Val Phe
195 200 205
Gly Leu Gln Thr Leu Val Cys Ile Pro Ser Ala Ser Gly Val Val Glu
210 215 220
Leu Gly Ser Thr Glu Leu Ile Phe Gln Ser Ser Asp Leu Met Asn Lys
225 230 235 240
Val Arg Val Leu Phe Asp Phe Asn Ser Leu Glu Val Val Ser Trp Pro
245 250 255
Ile Gly Thr Thr Asn Thr Asp Gln Gly Glu Asn Asp Pro Ser Ser Phe
260 265 270
Trp Leu Thr Asp Pro Glu Thr Lys Asp Gly Asn Gly Gly Ile Pro Trp
275 280 285
Asn Leu Asn Gly Ser Asp Gln Asn Lys Asn Asn His His Ser Ser Asn
290 295 300
Gln Ser Ser Ser Ser Leu Thr Asp His Leu Gly Gly Ile His His Ala
305 310 315 320
Gln Asn His Gln Gln Gln Pro Ile His Ala Arg Ser Leu Phe Thr Arg
325 330 335
Glu Leu Asn Phe Gly Glu Cys Ser Thr Tyr Asp Gly Ser Ser Val Arg
340 345 350
Asn Gly Asn Ser His Leu Thr Lys Pro Glu Ser Gly Glu Ile Leu Asn
355 360 365
Phe Gly Glu Ser Lys Arg Thr Ala Ser Ser Ala Asn Gly Asn Phe Tyr
370 375 380
Ser Gly Leu Val Thr Glu Glu Asn Asn Lys Lys Lys Arg Ser Val Gly
385 390 395 400
Phe Leu Val Ser Met Thr Gln Ser Phe Val Asn Gly Ser Gly Leu Pro
165 170 175
Gly Gln Ala Leu Phe Asn Gly Ser Pro Val Trp Val Ala Gly Ser Glu
180 185 190
Arg Leu Gly Ala Ser Pro Cys Glu Arg Ala Arg Gln Gly Gln Val Phe
195 200 205
Gly Leu Gln Thr Leu Val Cys Ile Pro Ser Ala Ser Gly Val Val Glu
210 215 220
Leu Gly Ser Thr Glu Leu Ile Phe Gln Ser Ser Asp Leu Met Asn Lys
225 230 235 240
Val Arg Val Leu Phe Asp Phe Asn Ser Leu Glu Val Val Ser Trp Pro
245 250 255
Ile Gly Thr Thr Asn Thr Asp Gln Gly Glu Asn Asp Pro Ser Ser Phe
260 265 270
Trp Leu Thr Asp Pro Glu Thr Lys Asp Gly Asn Gly Gly Ile Pro Trp
275 280 285
Asn Leu Asn Gly Ser Asp Gln Asn Lys Asn Asn His His Ser Ser Asn
290 295 300
Gln Ser Ser Ser Ser Leu Thr Asp His Leu Gly Gly Ile His His Ala
305 310 315 320
Gln Asn His Gln Gln Gln Pro Ile His Ala Arg Ser Leu Phe Thr Arg
325 330 335
Glu Leu Asn Phe Gly Glu Cys Ser Thr Tyr Asp Gly Ser Ser Val Arg
340 345 350
Asn Gly Asn Ser His Leu Thr Lys Pro Glu Ser Gly Glu Ile Leu Asn
355 360 365
Phe Gly Glu Ser Lys Arg Thr Ala Ser Ser Ala Asn Gly Asn Phe Tyr
370 375 380
Ser Gly Leu Val Thr Glu Glu Asn Asn Lys Lys Lys Arg Ser Val Gly
385 390 395 400
Thr Asn ValGly Gly Val His
645
<210>39
<211>1827
<212>DNA
<213>葡萄(Vitis vinifera)
<400>39
atgaaaactg aaatgggtat gggaggaggg gcttggacgg aggaggataa agcgatggtg 60
gcggctgttt tgggaactcg agcatttgat tacttgatga ccagctccgt tgtgagtgag 120
aatctgttaa tggcagtggg gagtgatgaa aatttgcaga caaagctttc ggatctcgta 180
gaccgaccaa atgcatccaa tttcagttgg aattatgcaa ttttctggca aatttcacag 240
tccaagtctg gggattgggt gcttggatgg ggagatgggt cttgtaggga gcccagggaa 300
ggggaggaat ccgaagtgac ccgaatttta aatattcggc tcgaggatgc aacccagcag 360
aggatgagga aaagggtgct tcagaagctg catacattgt ttggaggctc ggatgaggac 420
agttatgctt ttggattgga ccgagtcact gatactgaaa tgttttttct cgcttccatg 480
tacttctcat ttaccagagg agaaggtggc ccagggaaat cttttggatc tgggaagcat 540
ttgtggctgt ctgatgcatt gaaatctcca tcagattatt gtgttcgatc attccttgcc 600
aaatctgctg gaattcagac cattgtgtta atcccaactg atgttggggt tgtagagctg 660
ggttctgtga ggtcattacc tgaaagctta gagatgttgc agactataag atcatcattc 720
tcgatgtatt tgccattcat caggggcaag ccagccttac cagtgttgaa cgagaagaaa 780
aatgaaagtg ctcctttttc caatctgggg actggggagc gagtagaggg aattccaaag 840
atttttgggc aggatttgaa ctcaggtcat tcccatttta gggagaaact tgctgttcga 900
aaggcagaag agaggccatg ggacagctac caaaacggga acaggcttcc ttttacgaac 960
actagaaatg gttttcatgg ttcgggctgg ccacacatgc agggtgtgaa accagcaagt 1020
acggcagaaa tgtacagtcc tcaggtccca atcaataatc tacatgagat ggttaatggg 1080
gttagagagg agtttcggct tagccagttc cagcctccca agcaggtgca gatgcaaatt 1140
gattttgcag gggctgcttc aaggtctacc atgttggctc ggccaattag tgtggagtct 1200
gagcattcag atgtcgaggc ttcatgcaag gatgagcggc caggcccagc tgatgaaagg 1260
aggccccgga aaaggggcag aaagcctgca aatggaagag aagaacccct caatcatgtg 1320
gaagcagaga ggcagaggcg tgagaaactg aaccagcggt tttatgcatt gcgagctgtt 1380
gtgcccaaca tctccaagat ggacaaagcc tccttgctgg gagatgcaat tacttacatc 1440
accgagctcc agaagaaact caaggacatg gaatcagagc gggagaaatt tgggagcact 1500
tcaagagatg cattatcttt ggaaactaac accgaggcag aaactcatat acaggcgtct 1560
gatgtcgata tccaagcagc caatgatgaa gttattgtga gagtaagctg cccactggat 1620
acccaccctg tatcaagagt catccaaaca ttcaaggagg cacagatcac agtgatcgag 1680
tcgaaacttg ctacagacaa tgatactgtg ttacatactt ttgtaatcaa gtcccaggga 1740
tccgagcagc tgatgaagga aaagctcaca gctgcatttt cgcgcgaatc caattcttta 1800
cagcctttgt catcatcagt tgggtaa 1827
<210>40
<211>608
<212>PRT
<213>葡萄
<400>40
Met Lys Thr Glu Met Gly Met Gly Gly Gly Ala Trp Thr Glu Glu Asp
1 5 10 15
Lys Ala Met Val Ala Ala Val Leu Gly Thr Arg Ala Phe Asp Tyr Leu
20 25 30
Met Thr Ser Ser Val Val Ser Glu Asn Leu Leu Met Ala Val Gly Ser
35 40 45
Asp Glu Asn Leu Gln Thr Lys Leu Ser Asp Leu Val Asp Arg Pro Asn
50 55 60
Ala Ser Asn Phe Ser Trp Asn Tyr Ala Ile Phe Trp Gln Ile Ser Gln
65 70 75 80
Ser Lys Ser Gly Asp Trp Val Leu Gly Trp Gly Asp Gly Ser Cys Arg
85 90 95
Glu Pro Arg Glu Gly Glu Glu Ser Glu Val Thr Arg Ile Leu Asn Ile
100 105 110
Arg Leu Glu Asp Ala Thr Gln Gln Arg Met Arg Lys Arg Val Leu Gln
115 120 125
Lys Leu His Thr Leu Phe Gly Gly Ser Asp Glu Asp Ser Tyr Ala Phe
130 135 140
Gly Leu Asp Arg Val Thr Asp Thr Glu Met Phe Phe Leu Ala Ser Met
145 150 155 160
Tyr Phe Ser Phe Thr Arg Gly Glu Gly Gly Pro Gly Lys Ser Phe Gly
165 170 175
Ser Gly Lys His Leu Trp Leu Ser Asp Ala Leu Lys Ser Pro Ser Asp
180 185 190
Tyr Cys Val Arg Ser Phe Leu Ala Lys Ser Ala Gly Ile Gln Thr Ile
195 200 205
Val Leu Ile Pro Thr Asp Val Gly Val Val Glu Leu Gly Ser Val Arg
210 215 220
Ser Leu Pro Glu Ser Leu Glu Met Leu Gln Thr Ile Arg Ser Ser Phe
225 230 235 240
Ser Met Tyr Leu Pro Phe Ile Arg Gly Lys Pro Ala Leu Pro Val Leu
245 250 255
Asn Glu Lys Lys Asn Glu Ser Ala Pro Phe Ser Asn Leu Gly Thr Gly
260 265 270
Glu Arg Val Glu Gly Ile Pro Lys Ile Phe Gly Gln Asp Leu Asn Ser
275 280 285
Gly His Ser His Phe Arg Glu Lys Leu Ala Val Arg Lys Ala Glu Glu
290 295 300
Arg Pro Trp Asp Ser Tyr Gln Asn Gly Asn Arg Leu Pro Phe Thr Asn
305 310 315 320
Thr Arg Asn Gly Phe His Gly Ser Gly Trp Pro His Met Gln Gly Val
325 330 335
Lys Pro Ala Ser Thr Ala Glu Met Tyr Ser Pro Gln Val Pro Ile Asn
340 345 350
Asn Leu His Glu Met Val Asn Gly Val Arg Glu Glu Phe Arg Leu Ser
355 360 365
Gln Phe Gln Pro Pro Lys Gln Val Gln Met Gln Ile Asp Phe Ala Gly
370 375 380
Ala Ala Ser Arg Ser Thr Met Leu Ala Arg Pro Ile Ser Val Glu Ser
385 390 395 400
Glu His Ser Asp Val Glu Ala Ser Cys Lys Asp Glu Arg Pro Gly Pro
405 410 415
Ala Asp Glu Arg Arg Pro Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly
420 425 430
Arg Glu Glu Pro Leu Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu
435 440 445
Lys Leu Asn Gln Arg Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Ile
450 455 460
Ser Lys Met Asp Lys Ala Ser Leu Leu Gly Asp Ala Ile Thr Tyr Ile
465 470 475 480
Thr Glu Leu Gln Lys Lys Leu Lys Asp Met Glu Ser Glu Arg Glu Lys
485 490 495
Phe Gly Ser Thr Ser Arg Asp Ala Leu Ser Leu Glu Thr Asn Thr Glu
500 505 510
Ala Glu Thr His Ile Gln Ala Ser Asp Val Asp Ile Gln Ala Ala Asn
515 520 525
Asp Glu Val Ile Val Arg Val Ser Cys Pro Leu Asp Thr His Pro Val
530 535 540
Ser Arg Val Ile Gln Thr Phe Lys Glu Ala Gln Ile Thr Val Ile Glu
545 550 555 560
Ser Lys Leu Ala Thr Asp Asn Asp Thr Val Leu His Thr Phe Val Ile
565 570 575
Lys Ser Gln Gly Ser Glu Gln Leu Met Lys Glu Lys Leu Thr Ala Ala
580 585 590
Phe Ser Arg Glu Ser Asn Ser Leu Gln Pro Leu Ser Ser Ser Val Gly
595 600 605
<210>41
<211>663
<212>PRT
<213>稻
<400>41
Met Glu Ala Phe Met Ala Ser Ala Asp Leu Pro Ala Phe Pro Trp Gly
1 5 10 15
Ala Ala Ser Thr Pro Pro Pro Pro Pro Pro Pro Pro His His His His
20 25 30
Gln Gln Gln Gln Gln Gln Val Leu Pro Pro Pro Ala Ala Ala Pro Ala
35 40 45
Ala Ala Ala Phe Asn Gln Asp Thr Leu Gln Gln Arg Leu Gln Ser Ile
50 55 60
Ile Glu Gly Ser Arg Glu Thr Trp Thr Tyr Ala Ile Phe Trp Gln Ser
65 70 75 80
Ser Ile Asp Val Ser Thr Gly Ala Ser Leu Leu Gly Trp Gly Asp Gly
85 90 95
Tyr Tyr Lys Gly Cys Asp Asp Asp Lys Arg Lys Gln Arg Ser Ser Thr
100 105 110
Pro Ala Ala Ala Ala Glu Gln Glu His Arg Lys Arg Val Leu Arg Glu
115 120 125
Leu Asn Ser Leu Ile Ala Gly Ala Gly Ala Ala Pro Asp Glu Ala Val
130 135 140
Glu Glu Glu Ala Leu Phe Ala Ala Gln Pro Thr Trp Ile Ala Thr Gly
145 150 155 160
Leu Ser Ser Ala Pro Cys Asp Arg Ala Arg Gln Ala Tyr Thr Phe Gly
165 170 175
Leu Arg Thr Met Val Cys Leu Pro Leu Ala Thr Gly Val Leu Glu Leu
180 185 190
Gly Ser Thr Asp Val Ile Phe Gln Thr Gly Asp Ser Ile Pro Arg Ile
195 200 205
Arg Ala Leu Phe Asn Leu Ser A1a Ala Ala Ala Ser Ser Trp Pro Pro
210 215 220
His Pro Asp Ala Ala Ser Ala Asp Pro Ser Val Leu Trp Leu Ala Asp
225 230 235 240
Ala Pro Pro Met Asp Met Lys Asp Ser Ile Ser Ala Ala Asp Ile Ser
245 250 255
Val Ser Lys Pro Pro Pro Pro Pro Pro His Gln Ile Gln His Phe Glu
260 265 270
Asn Gly Ser Thr Ser Thr Leu Thr Glu Asn Pro Ser Pro Ser Val His
275 280 285
Ala Pro Thr Pro Ser Gln Pro Ala Ala Pro Pro Gln Arg Gln Gln Gln
290 295 300
Gln Gln Gln Ser Ser Gln Ala Gln Gln Gly Pro Phe Arg Arg Glu Leu
305 310 315 320
Asn Phe Ser Asp Phe Ala Ser Asn Gly Gly Ala Ala Ala Pro Pro Phe
325 330 335
Phe Lys Pro Glu Thr Gly Glu Ile Leu Asn Phe Gly Asn Asp Ser Ser
340 345 350
Thr Gly Arg Arg Asn Pro Ser Pro Ala Pro Pro Ala Ala Thr Ala Ser
355 360 365
Leu Thr Thr Ala Pro Gly Ser Leu Phe Ser Gln His Thr Pro Thr Leu
370 375 380
Thr Ala Ala Ala Asn Asp Ala Lys Ser Asn Asn Gln Lys Arg Ser Met
385 390 395 400
Glu Ala Thr Ser Arg Ala Ser Asn Thr Asn Asn His Pro Ala Ala Thr
405 410 415
Ala Asn Glu Gly Met Leu Ser Phe Ser Ser Ala Pro Thr Thr Arg Pro
420 425 430
Ser Thr Gly Thr Gly Ala Pro Ala Lys Ser Glu Ser Asp His Ser Asp
435 440 445
Leu Glu Ala Ser Val Arg Glu Val Glu Ser Ser Arg Val Val Ala Pro
450 455 460
Pro Pro Glu Ala Glu Lys Arg Pro Arg Lys Arg Gly Arg Lys Pro Ala
465 470 475 480
Asn Gly Arg Glu Glu Pro Leu Asn His Val Glu Ala Glu Arg Gln Arg
485 490 495
Arg Glu Lys Leu Asn Gln Arg Phe Tyr Ala Leu Arg Ala Val Val Pro
500 505 510
Asn Val Ser Lys Met Asp Lys Ala Ser Leu Leu Gly Asp Ala Ile Ser
515 520 525
Tyr Ile Asn Glu Leu Arg Gly Lys Leu Thr Ala Leu Glu Thr Asp Lys
530 535 540
Glu Thr Leu Gln Ser Gln Met Glu Ser Leu Lys Lys Glu Arg Asp Ala
545 550 555 560
Arg Pro Pro Ala Pro Ser Gly Gly Gly Gly Asp Gly Gly Ala Arg Cys
565 570 575
His Ala Val Glu Ile Glu Ala Lys Ile Leu Gly Leu Glu Ala Met Ile
580 585 590
Arg Val Gln Cys His Lys Arg Asn His Pro Ala Ala Arg Leu Met Thr
595 600 605
Ala Leu Arg Glu Leu Asp Leu Asp Val Tyr His Ala Ser Val Ser Val
610 615 620
Val Lys Asp Leu Met Ile Gln Gln Val Ala Val Lys Met Ala Ser Arg
625 630 635 640
Val Tyr Ser Gln Asp Gln Leu Asn Ala Ala Leu Tyr Thr Arg Ile Ala
645 650 655
Glu Pro Gly Thr Ala Ala Arg
660
<210>42
<211>70
<212>PRT
<213>人工序列
<220>
<223>在下述中对应于基序7的肽序列:NP_001065478
<400>42
Pro Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu
1 5 10 15
Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg
20 25 30
Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys
35 40 45
Ala Ser Leu Leu Gly Asp Ala Ile Ser Tyr Ile Asn Glu Leu Arg Gly
50 55 60
Lys Leu Thr Ala Leu Glu
65 70
<210>43
<211>70
<212>PRT
<213>人工序列
<220>
<223>在下述中对应于基序7的肽序列:EAY79619
<400>43
Pro Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu
1 5 10 15
Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg
20 25 30
Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys
35 40 45
Ala Ser Leu Leu Gly Asp Ala Ile Ser Tyr Ile Asn Glu Leu Arg Gly
50 55 60
Lys Leu Thr Ala Leu Glu
65 70
<210>44
<211>70
<212>PRT
<213>人工序列
<220>
<223>在下述中对应于基序7的肽序列:AAD15818
<400>44
Pro Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu
1 5 10 15
Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg
20 25 30
Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys
35 40 45
Ala Ser Leu Leu Gly Asp Ala Ile Ser Tyr Ile Asn Glu Leu Arg Gly
50 55 60
Lys Leu Thr Ser Leu Glu
65 70
<210>45
<211>70
<212>PRT
<213>人工序列
<220>
<223>在下述中对应于基序7的肽序列:AAB00686
<400>45
Pro Arg Lys Arg Gly Arg Lys Pro Gly Asn Gly Arg Glu Glu Pro Leu
1 5 10 15
Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg
20 25 30
Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys
35 40 45
Ala Ser Leu Leu Gly Asp Ala Ile Ser Tyr Ile Asn Glu Leu Lys Ser
50 55 60
Lys Leu Ser Glu Leu Glu
65 70
<210>46
<211>70
<212>PRT
<213>人工序列
<220>
<223>在下述中对应于基序7的肽序列:ABD59338
<400>46
Pro Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu
1 5 10 15
Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg
20 25 30
Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys
35 40 45
Ala Ser Leu Leu Gly Asp Ala Ile Ser Tyr Ile Asn Glu Leu Lys Leu
50 55 60
Lys Leu Gln Gly Leu Glu
65 70
<210>47
<211>70
<212>PRT
<213>人工序列
<220>
<223>在下述中对应于基序7的肽序列:Pt29.195#1
<400>47
Pro Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu
1 5 10 15
Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg
20 25 30
Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys
35 40 45
Ala Ser Leu Leu Gly Asp Ala Ile Ser Tyr Ile Asp Glu Leu Arg Thr
50 55 60
Lys Leu Gln Ser Ala Glu
65 70
<210>48
<211>70
<212>PRT
<213>人工序列
<220>
<223>在下述中对应于基序7的肽序列:CAF74710
<400>48
Pro Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu
1 5 10 15
Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg
20 25 30
Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys
35 40 45
Ala Ser Leu Leu Gly Asp Ala Ile Ser Tyr Ile Asn Glu Leu Lys Ser
50 55 60
Lys Leu Gln Asn Thr Glu
65 70
<210>49
<211>70
<212>PRT
<213>人工序列
<220>
<223>在下述中对应于基序7的肽序列:AAF04917
<400>49
Pro Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu
1 5 10 15
Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg
20 25 30
Phe Phe Ser Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys
35 40 45
Ala Ser Leu Leu Gly Asp Ala Ile Ser Tyr Ile Asn Glu Leu Lys Ser
50 55 60
Lys Leu Gln Asn Thr Glu
65 70
<210>50
<211>70
<212>PRT
<213>人工序列
<220>
<223>在下述中对应于基序7的肽序列:AAQ14332
<400>50
Pro Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu
1 5 10 15
Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg
20 25 30
Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys
35 40 45
Ala Ser Leu Leu Gly Asp Ala Ile Ser Tyr Ile Asn Glu Leu Lys Ala
50 55 60
Lys Leu Gln Thr Thr Glu
65 70
<210>51
<211>70
<212>PRT
<213>人工序列
<220>
<223>在下述中对应于基序7的肽序列:AAY90122
<400>51
Pro Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu
1 5 10 15
Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg
20 25 30
Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys
35 40 45
Ala Ser Leu Leu Gly Asp Ala Ile Ser Phe Ile Asn Glu Leu Lys Ser
50 55 60
Lys Leu Gln Asn Val Glu
65 70
<210>52
<211>70
<212>PRT
<213>人工序列
<220>
<223>在下述中对应于基序7的肽序列:AAL55713
<400>52
Pro Lys Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu
1 5 10 15
Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg
20 25 30
Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys
35 40 45
Ala Ser Leu Leu Gly Asp Ala Ile Ala Tyr Ile Asn Glu Leu Lys Ser
50 55 60
Lys Val Val Lys Thr Glu
65 70
<210>53
<211>70
<212>PRT
<213>人工序列
<220>
<223>在下述中对应于基序7的肽序列:ABD65632
<400>53
Pro Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu
1 5 10 15
Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg
20 25 30
Phe Tyr Ser Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys
35 40 45
Ala Ser Leu Leu Gly Asp Ala Ile Ser Tyr Ile Asn Glu Leu Lys Ala
50 55 60
Lys Leu Gln Lys Ala Glu
65 70
<210>54
<211>70
<212>PRT
<213>人工序列
<220>
<223>在下述中对应于基序7的肽序列:ABK94979
<400>54
Pro Lys Lys Arg Gly Arg Lys Pro Gly Leu Gly Arg Asp Ala Pro Leu
1 5 10 15
Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn His Arg
20 25 30
Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Arg Met Asp Lys
35 40 45
Ala Ser Leu Leu Ser Asp Ala Val Ser Tyr Ile Asn Glu Leu Lys Ala
50 55 60
Lys Val Asp Glu Leu Glu
65 70
<210>55
<211>70
<212>PRT
<213>人工序列
<220>
<223>在下述中对应于基序7的肽序列:EDQ91347
<400>55
Pro Arg Lys Arg Gly Arg Lys Pro Ala Asn Asp Arg Glu Glu Pro Leu
1 5 10 15
Asn His Val Gln Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Lys
20 25 30
Phe Tyr Ala Leu Arg Ser Val Val Pro Asn Val Ser Lys Met Asp Lys
35 40 45
Ala Ser Leu Leu Glu Asp Ala Ile Thr Tyr Ile Asn Glu Leu Gln Glu
50 55 60
Lys Leu Gln Lys Ala Glu
65 70
<210>56
<211>4120
<212>DNA
<213>人工序列
<220>
<223>表达盒
<400>56
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140
cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200
tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260
gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320
ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380
gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440
aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500
ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560
atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620
acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680
cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740
ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800
gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860
tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920
attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980
tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040
cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100
agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160
tggtgtagct tgccactttc accagcaaag ttcatttaaa tcaactaggg atatcacaag 2220
tttgtacaaa aaagcaggct taaacaatga ctgattaccg gctacaacca acgatgaatc 2280
tttggaccac cgacgacaac gcttctatga tggaagcttt catgagctct tccgatatct 2340
caactttatg gcctccggcg tcgacgacaa ccacgacggc gacgactgaa acaactccga 2400
cgccggcgat ggagattccg gcacaggcgg gatttaatca agagactctt cagcaacgtt 2460
tacaagcttt gattgaagga acacacgaag gttggaccta cgctatattc tggcaaccgt 2520
cgtatgattt ctccggcgcc tccgtgctcg gatggggaga tggttattac aaaggtgaag 2580
aagataaagc aaacccgaga cggagatcga gttcgccgcc gttttctact ccggcggatc 2640
aggagtacag gaaaaaagtg ttgagagagc ttaactcgtt gatctccggt ggtgttgctc 2700
cgtcggatga cgctgttgat gaggaggtga cggatacgga atggtttttc ttggtttcga 2760
tgacgcagag cttcgcttgc ggtgcgggat tagctggtaa agcgtttgca acgggtaacg 2820
cggtttgggt ttccgggtca gatcaattat ccgggtcggg ttgtgaacgg gctaagcaag 2880
gaggagtgtt tgggatgcat actattgcgt gtattccttc ggcgaacgga gttgtggaag 2940
tcgggtcaac ggagccgatc cgacagagtt cggaccttat taacaaggtt cgaattcttt 3000
tcaatttcga cggcggagct ggagatttat cgggtcttaa ttggaatctt gacccggatc 3060
aaggtgagaa cgacccgtct atgtggatta atgacccgat tggaacacct ggatctaacg 3120
aaccgggtaa cggagctcca agttctagct cccagctttt ttcaaagtct attcagtttg 3180
agaacggtag ctcaagcaca ataaccgaaa acccgaatct ggatccgact ccgagtccgg 3240
ttcattctca gacccagaat ccgaaattca ataacacttt ctcccgagaa cttaattttt 3300
cgacgtcaag ttctacttta gtgaaaccaa gatccggcga gatattaaac ttcggcgatg 3360
aaggtaaacg aagctccgga aacccggatc caagttctta ttcgggtcaa acacaattcg 3420
aaaacaaaag aaagaggtcg atggttttga acgaagataa agttctatca ttcggagata 3480
aaaccgccgg agaatcagat cactccgatc tagaagcttc cgtcgtgaaa gaagtagcag 3540
tagagaaacg tccaaagaaa cgaggaagaa agccagcaaa cggtagagaa gagccactaa 3600
accacgtcga agcagagaga caaagacgcg agaaactaaa ccaaagattc tacgcgttac 3660
gagcggttgt accaaacgtt tcaaaaatgg ataaagcttc gttactcggt gacgcaatcg 3720
cttacatcaa cgagcttaaa tccaaagtag tcaaaacaga gtcagagaaa ctccaaatca 3780
agaaccagct cgaggaagtg aaactcgagc tcgccggaag aaaagcgagt gctagtggag 3840
gagatatgtc gtcttcgtgt tcttcgatta aaccggtggg gatggagatt gaagtgaaga 3900
taattggttg ggacgcaatg attagagttg aatctagtaa gaggaatcat ccggcggcga 3960
ggttgatgtc ggcgttgatg gatttggagt tggaagtgaa tcacgcgagt atgtcggtgg 4020
ttaacgattt gatgattcaa caagcgacgg tgaagatggg ttttaggatc tatacgcaag 4080
aacagctcag agcaagtttg atttcaaaaa tcggttaaaa 4120
<210>57
<211>687
<212>DNA
<213>烟草(Nicotiana tabacum)
<400>57
atggctccca ttgaaggtgt tattcaagta cagggtgata taacaaatgc taaaacagct 60
gaagtggtta ttagacattt tgacggatgc aaggctgaca ttgttgtctg tgatggtgca 120
cctgatgtaa cgggacttca tgacatggat gaatttgttc agtcccagct gatattggcg 180
ggcctaacca ttgtcactca catactaaaa ggaggcggaa agttcatagc aaaaattttt 240
cgaggaaaag acacaagcct tctttactgt cagctaaaac tatttttcac agaagtgact 300
tttgctaagc caaaaagcag tcggaattct agcatagagg catttgcagt ttgcgagaat 360
tactctccac ctgaaggatt taatgagaaa gatcttcatc gccttcttga aaagattgga 420
agtccatctg gcacagagga cctagattgc agtagtgcat ggctggaagg tcctaataag 480
gtgtatattc catttctggc ttgtggagac cttagcgggt acgattcaga ccgttcatat 540
ccacttccta aagctgcaga tggaacctat cagtgtttag atcctgtaca acctccaatt 600
gcaccgccat ataaacgagc tcttgaaatg aagaaagcgt cgaatcaagg aatccaaaac 660
ctagacaagc tttctcttag ctcctaa 687
<210>58
<211>228
<212>PRT
<213>烟草
<400>58
Met Ala Pro Ile Glu Gly Val Ile Gln Val Gln Gly Asp Ile Thr Asn
1 5 10 15
Ala Lys Thr Ala Glu Val Val Ile Arg His Phe Asp Gly Cys Lys Ala
20 25 30
Asp Ile Val Val Cys Asp Gly Ala Pro Asp Val Thr Gly Leu His Asp
35 40 45
Met Asp Glu Phe Val Gln Ser Gln Leu Ile Leu Ala Gly Leu Thr Ile
50 55 60
Val Thr His Ile Leu Lys Gly Gly Gly Lys Phe Ile Ala Lys Ile Phe
65 70 75 80
Arg Gly Lys Asp Thr Ser Leu Leu Tyr Cys Gln Leu Lys Leu Phe Phe
85 90 95
Thr Glu Val Thr Phe Ala Lys Pro Lys Ser Ser Arg Asn Ser Ser Ile
100 105 110
Glu Ala Phe Ala Val Cys Glu Asn Tyr Ser Pro Pro Glu Gly Phe Asn
115 120 125
Glu Lys Asp Leu His Arg Leu Leu Glu Lys Ile Gly Ser Pro Ser Gly
130 135 140
Thr Glu Asp Leu Asp Cys Ser Ser Ala Trp Leu Glu Gly Pro Asn Lys
145 150 155 160
Val Tyr Ile Pro Phe Leu Ala Cys Gly Asp Leu Ser Gly Tyr Asp Ser
165 170 175
Asp Arg Ser Tyr Pro Leu Pro Lys Ala Ala Asp Gly Thr Tyr Gln Cys
180 185 190
Leu Asp Pro Val Gln Pro Pro Ile Ala Pro Pro Tyr Lys Arg Ala Leu
195 200 205
Glu Met Lys Lys Ala Ser Asn Gln Gly Ile Gln Asn Leu Asp Lys Leu
210 215 220
Ser Leu Ser Ser
225
<210>59
<211>951
<212>DNA
<213>烟草
<400>59
atgggaaaag catcgaggga caaaagagat atttactatc ggaaagcaaa ggaagaagga 60
tggcgtgccc gaagtgcctt caagctcctt cagattgatg aggaatttaa catctttgaa 120
ggtgtgaagc gagttgtgga tttgtgtgca gcaccaggca gctggagtca ggttttaagc 180
cggaagttat atctcccagc aaagttgtca cctgatacca aggacgacga tctaccactt 240
attgtggcta ttgacttaca gcctatggct cccattgaag gtgttattca agtacagggt 300
gatataacaa atgctaaaac agctgaagtg gttattagac attttgacgg atgcaaggct 360
gacattgttg tctgtgatgg tgcacctgat gtaacgggac ttcatgacat ggatgaattt 420
gttcagtccc agctgatatt ggcgggccta accattgtca ctcacatact aaaaggaggc 480
ggaaagttca tagcaaaaat ttttcgagga aaagacacaa gccttcttta ctgtcagcta 540
aaactatttt tcacagaagt gacttttgct aagccaaaaa gcagtcggaa ttctagcata 600
gaggcatttg cagtttgcga gaattactct ccacctgaag gatttaatga gaaagatctt 660
catcgccttc ttgaaaagat tggaagtcca tctggcacag aggacctaga ttgcagtagt 720
gcatggctgg aaggtcctaa taaggtgtat attccatttc tggcttgtgg agaccttagc 780
gggtacgatt cagaccgttc atatccactt cctaaagctg cagatggaac ctatcagtgt 840
ttagatcctg tacaacctcc aattgcaccg ccatataaac gagctcttga aatgaagaaa 900
gcgtcgaatc aaggaatcca aaacctagac aagctttctc ttagctccta a 951
<210>60
<211>316
<212>PRT
<213>烟草
<400>60
Met Gly Lys Ala Ser Arg Asp Lys Arg Asp Ile Tyr Tyr Arg Lys Ala
1 5 10 15
Lys Glu Glu Gly Trp Arg Ala Arg Ser Ala Phe Lys Leu Leu Gln Ile
20 25 30
Asp Glu Glu Phe Asn Ile Phe Glu Gly Val Lys Arg Val Val Asp Leu
35 40 45
Cys Ala Ala Pro Gly Ser Trp Ser Gln Val Leu Ser Arg Lys Leu Tyr
50 55 60
Leu Pro Ala Lys Leu Ser Pro Asp Thr Lys Asp Asp Asp Leu Pro Leu
65 70 75 80
Ile Val Ala Ile Asp Leu Gln Pro Met Ala Pro Ile Glu Gly Val Ile
85 90 95
Gln Val Gln Gly Asp Ile Thr Asn Ala Lys Thr Ala Glu Val Val Ile
100 105 110
Arg His Phe Asp Gly Cys Lys Ala Asp Ile Val Val Cys Asp Gly Ala
115 120 125
Pro Asp Val Thr Gly Leu His Asp Met Asp Glu Phe Val Gln Ser Gln
130 135 140
Leu Ile Leu Ala Gly Leu Thr Ile Val Thr His Ile Leu Lys Gly Gly
145 150 155 160
Gly Lys Phe Ile Ala Lys Ile Phe Arg Gly Lys Asp Thr Ser Leu Leu
165 170 175
Tyr Cys Gln Leu Lys Leu Phe Phe Thr Glu Val Thr Phe Ala Lys Pro
180 185 190
Lys Ser Ser Arg Asn Ser Ser Ile Glu Ala Phe Ala Val Cys Glu Asn
195 200 205
Tyr Ser Pro Pro Glu Gly Phe Asn Glu Lys Asp Leu His Arg Leu Leu
210 215 220
Glu Lys Ile Gly Ser Pro Ser Gly Thr Glu Asp Leu Asp Cys Ser Ser
225 230 235 240
Ala Trp Leu Glu Gly Pro Asn Lys Val Tyr Ile Pro Phe Leu Ala Cys
245 250 255
Gly Asp Leu Ser Gly Tyr Asp Ser Asp Arg Ser Tyr Pro Leu Pro Lys
260 265 270
Ala Ala Asp Gly Thr Tyr Gln Cys Leu Asp Pro Val Gln Pro Pro Ile
275 280 285
Ala Pro Pro Tyr Lys Arg Ala Leu Glu Met Lys Lys Ala Ser Asn Gln
290 295 300
Gly Ile Gln Asn Leu Asp Lys Leu Ser Leu Ser Ser
305 310 315
<210>61
<211>1128
<212>DNA
<213>拟南芥
<400>61
gaatttctac tttggtgctg ctcttcttca catacctagc tgctgtatac tatacgtgaa 60
ccaactccgt attctacttt agaggccatg ggaaaagctt ctcgagacaa aagggatatc 120
tattatcgta aagctaaaga agaaggatgg cgtgcaagaa gtgcttttaa gcttcttcag 180
attgatgaag aatttaatat ttttgaaggt gtgaagaggg tcgtagattt atgtgctgca 240
cctggtagct ggagtcaggt cttgagtcgt caattatatc ttcctgcaaa gtcctcagct 300
gagtcaaaag atggggatct tcctcttata gtagccatcg atttgcagcc tatggctcca 360
attgaaggtg tcatccaggt tcaaggggac ataactaatg ctcggacaga agtggtcatt 420
agacactttg acggctgcaa agcggacctg gttgtctgtg atggtgctcc agatgttact 480
ggtttgcatg acatggatga atttgtccag tcccaactca tactagcagg attaacgatt 540
gtaactcata ttcttaaaga aggtggaaaa tttattgcaa agatattccg tggaaaagat 600
acaagtctct tgtactgtca actgaaattg tttttcccaa ccgtaacttt tgcgaaaccg 660
aaaagcagcc gcaattcaag tatagaggct tttgcagtct gcgagaatta ctctccgcca 720
gaaggattta acccgagaga tctgcatcgt ctcttggaga aagtcggaag cccttcaggt 780
ggaagcgatc tcgattgcag tagtggttgg cttgaaggac ccaacaaagt ttatatacca 840
ttcttggcat gtggtgactt aaccggttat gactcagacc ggtcttaccc actccctaga 900
gaagcagatg gatcatcata ccagagtttg gacccgattc aacctcccat cgcaccgcct 960
tataaacgag ctcttgagct caagaaagct tcagcacaaa gcttcaactc ttgaagaagg 1020
tgataccaaa aaagaaaaag gaacaaactt ttcattggat tctgtagcct gtcgtaatga 1080
tatattcagg gacctacaat ttctataacg cttaatgttt ttgttatg 1128
<210>62
<211>309
<212>PRT
<213>拟南芥
<400>62
Met Gly Lys Ala Ser Arg Asp Lys Arg Asp Ile Tyr Tyr Arg Lys Ala
1 5 10 15
Lys Glu Glu Gly Trp Arg Ala Arg Ser Ala Phe Lys Leu Leu Gln Ile
20 25 30
Asp Glu Glu Phe Asn Ile Phe Glu Gly Val Lys Arg Val Val Asp Leu
35 40 45
Cys Ala Ala Pro Gly Ser Trp Ser Gln Val Leu Ser Arg Gln Leu Tyr
50 55 60
Leu Pro Ala Lys Ser Ser Ala Glu Ser Lys Asp Gly Asp Leu Pro Leu
65 70 75 80
Ile Val Ala Ile Asp Leu Gln Pro Met Ala Pro Ile Glu Gly Val Ile
85 90 95
Gln Val Gln Gly Asp Ile Thr Asn Ala Arg Thr Ala Glu Val Val Ile
100 105 110
Arg His Phe Asp Gly Cys Lys Ala Asp Leu Val Val Cys Asp Gly Ala
115 120 125
Pro Asp Val Thr Gly Leu His Asp Met Asp Glu Phe Val Gln Ser Gln
130 135 140
Leu Ile Leu Ala Gly Leu Thr Ile Val Thr His Ile Leu Lys Glu Gly
145 150 155 160
Gly Lys Phe Ile Ala Lys Ile Phe Arg Gly Lys Asp Thr Ser Leu Leu
165 170 175
Tyr Cys Gln Leu Lys Leu Phe Phe Pro Thr Val Thr Phe Ala Lys Pro
180 185 190
Lys Ser Ser Arg Asn Ser Ser Ile Glu Ala Phe Ala Val Cys Glu Asn
195 200 205
Tyr Ser Pro Pro Glu Gly Phe Asn Pro Arg Asp Leu His Arg Leu Leu
210 215 220
Glu Lys Val Gly Ser Pro Ser Gly Gly Ser Asp Leu Asp Cys Ser Ser
225 230 235 240
Gly Trp Leu Glu Gly Pro Asn Lys Val Tyr Ile Pro Phe Leu Ala Cys
245 250 255
Gly Asp Leu Thr Gly Tyr Asp Ser Asp Arg Ser Tyr Pro Leu Pro Arg
260 265 270
Glu Ala Asp Gly Ser Ser Tyr Gln Ser Leu Asp Pro Ile Gln Pro Pro
275 280 285
Ile Ala Pro Pro Tyr Lys Arg Ala Leu Glu Leu Lys Lys Ala Ser Ala
290 295 300
Gln Ser Phe Asn Ser
305
<210>63
<211>951
<212>DNA
<213>番茄
<400>63
atgggaaaag catctaggga taagagggat atttactacc ggaaagcaaa ggaagaaggg 60
tggcgtgccc gaagtgcctt caagctcctt cagatagatg aggagtttaa tatctttgaa 120
ggtgcgaagc gcgttgtgga tttatgtgct gctccaggca gctggagtca ggttttaagc 180
cggaagttat atctcccagc aaagctgtca ccgggtacca aggatgatga tctaccactt 240
atcgtggcta ttgacttaca gcctatggct ccaattgaag gtgttattca agtacagggt 300
gatataacaa atgctaaaac agttgaagtg gttattagac attttgatgg atgcaaagct 360
gaccttgttg tctgtgatgg tgcacctgat gtaacgggac ttcatgacat ggatgaattt 420
gttcaatccc aactgatatt ggcgggccta accatagtca ctcacatact aaaagaaggt 480
ggaaagttca tagcaaaaat ttttcgagga aaagacacaa gtctccttta ctgtcaacta 540
aaactatttt tcacggaagt gacttttgct aagccaaaaa gtagtcgcaa ttctagcata 600
gaggcatttg cagtttgtga aaactactct ccacctgaag gattcaatga gaaagacctt 660
tatcgccttc ttgaacaagt tggaagtcca tcaggcgctg aggacttaga ttgcagtagt 720
ggatggcttg aaggtcgtaa caaggtgtat atcccatttc tggcttgcgg agacctgagt 780
ggatatgatt cagatcgttc atatccgctt cctaaatctg cagatggaac ctatcaatgt 840
ttagatcctg tacaacctcc gattgcacca ccgtataaac gagctcttga aatgaaaaaa 900
gcttcaagtc aaggaattca taatctagac aaactttctc ttgacccctg a 951
<210>64
<211>316
<212>PRT
<213>番茄
<400>64
Met Gly Lys Ala Ser Arg Asp Lys Arg Asp Ile Tyr Tyr Arg Lys Ala
1 5 10 15
Lys Glu Glu Gly Trp Arg Ala Arg Ser Ala Phe Lys Leu Leu Gln Ile
20 25 30
Asp Glu Glu Phe Asn Ile Phe Glu Gly Ala Lys Arg Val Val Asp Leu
35 40 45
Cys Ala Ala Pro Gly Ser Trp Ser Gln Val Leu Ser Arg Lys Leu Tyr
50 55 60
Leu Pro Ala Lys Leu Ser Pro Gly Thr Lys Asp Asp Asp Leu Pro Leu
65 70 75 80
Ile Val Ala Ile Asp Leu Gln Pro Met Ala Pro Ile Glu Gly Val Ile
85 90 95
Gln Val Gln Gly Asp Ile Thr Asn Ala Lys Thr Val Glu Val Val Ile
100 105 110
Arg His Phe Asp Gly Cys Lys Ala Asp Leu Val Val Cys Asp Gly Ala
115 120 125
Pro Asp Val Thr Gly Leu His Asp Met Asp Glu Phe Val Gln Ser Gln
130 135 140
Leu Ile Leu Ala Gly Leu Thr Ile Val Thr His Ile Leu Lys Glu Gly
145 150 155 160
Gly Lys Phe Ile Ala Lys Ile Phe Arg Gly Lys Asp Thr Ser Leu Leu
165 170 175
Tyr Cys Gln Leu Lys Leu Phe Phe Thr Glu Val Thr Phe Ala Lys Pro
180 185 190
Lys Ser Ser Arg Asn Ser Ser Ile Glu Ala Phe Ala Val Cys Glu Asn
195 200 205
Tyr Ser Pro Pro Glu Gly Phe Asn Glu Lys Asp Leu Tyr Arg Leu Leu
210 215 220
Glu Gln Val Gly Ser Pro Ser Gly Ala Glu Asp Leu Asp Cys Ser Ser
225 230 235 240
Gly Trp Leu Glu Gly Arg Asn Lys Val Tyr Ile Pro Phe Leu Ala Cys
245 250 255
Gly Asp Leu Ser Gly Tyr Asp Ser Asp Arg Ser Tyr Pro Leu Pro Lys
260 265 270
Ser Ala Asp Gly Thr Tyr Gln Cys Leu Asp Pro Val Gln Pro Pro Ile
275 280 285
Ala Pro Pro Tyr Lys Arg Ala Leu Glu Met Lys Lys Ala Ser Ser Gln
290 295 300
Gly Ile His Asn Leu Asp Lys Leu Ser Leu Asp Pro
305 310 315
<210>65
<211>951
<212>DNA
<213>蒺藜苜蓿(Medicago truncatula)
<400>65
atgggcaaag cttcaaggga taagagggat atatattacc gaaaagcgaa agaagaaggt 60
tggcgtgctc gaagtgcttt taaacttctt cagatagatg aggaatttaa catttttgaa 120
ggggtgaaac gtgttgtaga tttatgtgct gccccaggca gttggagtca ggttttgagt 180
cgaaaactgt accttccagc caagcttgca cctgatgcaa aggatgaaaa tcttcctctt 240
attgtagcta ttgatttgca gccaatggct ccgattgaag gtgttatcca ggtgcagggt 300
gatataacta atgctcggac cgctgaagtg gtcattagac atttcgatgg ttgcaaggcc 360
aaccttgttg tgtgtgatgg tgctcctgat gttaccggac ttcatgacat ggatgaattt 420
gttcaatccc aactcatact tgcagggttg acaattgtta ctcatgtact gaaggaagga 480
gggaagttca ttgcgaagat atttagagga aaggacacaa gccttctata ctgtcagcta 540
aaattatttt tccctgtggt gactttcgca aagccaaaaa gtagccgtaa ttccagcata 600
gaggcatttg cagtttgtga aaactactcc cctcctgaag gattcaaccc gaaagatctt 660
caccgacttc ttgagaaggt tggaagtcca tcaggcgtag atgatacaga ttgtgttagt 720
gggtggttgg aaggccctaa taaggtgtat atcccatttc tagcttgcgg ggacctcact 780
ggatatgatt ctgataggtc atatccactg cctaaagttg ctgggggaac atatcagagc 840
ttggatccag tacaacctcc tattgcccct ccttacaaga gagctctaga gttaaaaaaa 900
gcatcacctc aaggattccg agaacttgaa aatctctccc tggattcctg a 951
<210>66
<211>316
<212>PRT
<213>蒺藜苜蓿
<220>
<221>UNSURE
<222>(236)..(236)
<223>Xaa可以是任何天然存在的氨基酸
<400>66
Met Gly Lys Ala Ser Arg Asp Lys Arg Asp Ile Tyr Tyr Arg Lys Ala
1 5 10 15
Lys Glu Glu Gly Trp Arg Ala Arg Ser Ala Phe Lys Leu Leu Gln Ile
20 25 30
Asp Glu Glu Phe Asn Ile Phe Glu Gly Val Lys Arg Val Val Asp Leu
35 40 45
Cys Ala Ala Pro Gly Ser Trp Ser Gln Val Leu Ser Arg Lys Leu Tyr
50 55 60
Leu Pro Ala Lys Leu Ala Pro Asp Ala Lys Asp Glu Asn Leu Pro Leu
65 70 75 80
Ile Val Ala Ile Asp Leu Gln Pro Met Ala Pro Ile Glu Gly Val Ile
85 90 95
Gln Val Gln Gly Asp Ile Thr Asn Ala Arg Thr Ala Glu Val Val Ile
100 105 110
Arg His Phe Asp Gly Cys Lys Ala Asn Leu Val Val Cys Asp Gly Ala
115 120 125
Pro Asp Val Thr Gly Leu His Asp Met Asp Glu Phe Val Gln Ser Gln
130 135 140
Leu Ile Leu Ala Gly Leu Thr Ile Val Thr His Val Leu Lys Glu Gly
145 150 155 160
Gly Lys Phe Ile Ala Lys Ile Phe Arg Gly Lys Asp Thr Ser Leu Leu
165 170 175
Tyr Cys Gln Leu Lys Leu Phe Phe Pro Val Val Thr Phe Ala Lys Pro
180 185 190
Lys Ser Ser Arg Asn Ser Ser Ile Glu Ala Phe Ala Val Cys Glu Asn
195 200 205
Tyr Ser Pro Pro Glu Gly Phe Asn Pro Lys Asp Leu His Arg Leu Leu
2l0 215 220
Glu Lys Val Gly Ser Pro Ser Gly Val Asp Asp Xaa Asp Cys Val Ser
225 230 235 240
Gly Trp Leu Glu Gly Pro Asn Lys Val Tyr Ile Pro Phe Leu Ala Cys
245 250 255
Gly Asp Leu Thr Gly Tyr Asp Ser Asp Arg Ser Tyr Pro Leu Pro Lys
260 265 270
Val Ala Gly Gly Thr Tyr Gln Ser Leu Asp Pro Val Gln Pro Pro Ile
275 280 285
Ala Pro Pro Tyr Lys Arg Ala Leu Glu Leu Lys Lys Ala Ser Pro Gln
290 295 300
Gly Phe Arg Glu Leu Glu Asn Leu Ser Leu Asp Ser
305 310 315
<210>67
<211>1018
<212>DNA
<213>稻
<400>67
atgggcaagg cctccaaaga caagagggac atctactacc gcaaggcgaa ggaggagggg 60
tggagagctc gtagcgcctt caagcttctg cagatcgacc aggagttcaa catcttccac 120
ggagtgaagc gtgttgttga tctgtgcgct gctcccggaa gctggagtca ggttttgagt 180
cggaacctgt atgttccagc aaaacaatct cctgattgca aagaaggtga ccttcctctt 240
attgttgcca ttgatttgca accaatggct ccgatagaag gcgttataca agttcaaggg 300
gacatcacta atgctcgaac agcagaagtg gttattaggc attttgatgg atgcaaagca 360
gatttggttg tctgcgatgg tgctcctgat gttaccggcc ttcatgatat ggacgagttt 420
gttcagtccc agcttatact ggcggcattg acaattgtga ctcacgtact taaagttggt 480
gggaaatttg ttgcgaagat tttccgtgga aaagatacaa gtctgttgta ttgccagctg 540
aaactattct tctcacaagt tacctttgca aagcccaaaa gtagccggaa ctcaagcatc 600
gaggcgtttg cagtttgtga gaattattcg cctcccgaag gatttaagga aaaagattta 660
tatcacctgc tagagaaagt ggggactcct tctggggctg atgatttaga ctgcagaagt 720
ggatggttag agggaccaaa caaggtctac atcccatttc tggcttgcgg tgacctcagt 780
ggttacgatt cggatcgttc ttacccacta acaagcacag agggaggatc ctaccagagc 840
ttggatccag tccagcctcc aattgctcca ccttacaaaa ccgcactgga gatgaaaaag 900
gtcgccagcc atggcattgg agcagatatc agcaaattat ccctcgactc ctgaactaca 960
ctctggatcg ctgtttgtgt tcttgtaact gccaaccctg tggaatttgc aaattgta 1018
<210>68
<211>317
<212>PRT
<213>稻
<400>68
Met Gly Lys Ala Ser Lys Asp Lys Arg Asp Ile Tyr Tyr Arg Lys Ala
1 5 10 15
Lys Glu Glu Gly Trp Arg Ala Arg Ser Ala Phe Lys Leu Leu Gln Ile
20 25 30
Asp Gln Glu Phe Asn Ile Phe His Gly Val Lys Arg Val Val Asp Leu
35 40 45
Cys Ala Ala Pro Gly Ser Trp Ser Gln Val Leu Ser Arg Asn Leu Tyr
50 55 60
Val Pro Ala Lys Gln Ser Pro Asp Cys Lys Glu Gly Asp Leu Pro Leu
65 70 75 80
Ile Val Ala Ile Asp Leu Gln Pro Met Ala Pro Ile Glu Gly Val Ile
85 90 95
Gln Val Gln Gly Asp Ile Thr Asn Ala Arg Thr Ala Glu Val Val Ile
100 105 110
Arg His Phe Asp Gly Cys Lys Ala Asp Leu Val Val Cys Asp Gly Ala
115 120 125
Pro Asp Val Thr Gly Leu His Asp Met Asp Glu Phe Val Gln Ser Gln
130 135 140
Leu Ile Leu Ala Ala Leu Thr Ile Val Thr His Val Leu Lys Val Gly
145 150 155 160
Gly Lys Phe Val Ala Lys Ile Phe Arg Gly Lys Asp Thr Ser Leu Leu
165 170 175
Tyr Cys Gln Leu Lys Leu Phe Phe Ser Gln Val Thr Phe Ala Lys Pro
180 185 190
Lys Ser Ser Arg Asn Ser Ser Ile Glu Ala Phe Ala Val Cys Glu Asn
195 200 205
Tyr Ser Pro Pro Glu Gly Phe Lys Glu Lys Asp Leu Tyr His Leu Leu
210 215 220
Glu Lys Val Gly Thr Pro Ser Gly Ala Asp Asp Leu Asp Cys Arg Ser
225 230 235 240
Gly Trp Leu Glu Gly Pro Asn Lys Val Tyr Ile Pro Phe Leu Ala Cys
245 250 255
Gly Asp Leu Ser Gly Tyr Asp Ser Asp Arg Ser Tyr Pro Leu Thr Ser
260 265 270
Thr Glu Gly Gly Ser Tyr Gln Ser Leu Asp Pro Val Gln Pro Pro Ile
275 280 285
Ala Pro Pro Tyr Lys Thr Ala Leu Glu Met Lys Lys Val Ala Ser His
290 295 300
Gly Ile Gly Ala Asp Ile Ser Lys Leu Ser Leu Asp Ser
305 310 315
<210>69
<211>894
<212>DNA
<213>Ostreococcus lucimarinus
<400>69
atggggaagt cgagcaagga taagcgcgat atatactacc gcaaggcgaa agaggaggga 60
tggcgcgcga ggtcggcgtt caagttgctg caaattgacg agtcgttcga tatttttcga 120
gacgtgcgac acgtcgtgga tctgtgcgcg gcgcccgggt cgtggtcgca ggttttgagt 180
cgaaagttgt acctacccgc gttggcgcga ggggtcgagg aggaagagct gccgaagatt 240
gtcgccatcg acttgcaacc gatggcgccg atcgagggcg tgacgacgat acagggcgat 300
atcacgtcga tggacaaagt gcgcgaggtc ctgtcgcatt tcgatgggaa acacgcggat 360
ttgatcgtcg gcgatggagc gcccgacgtc acgggtttgc acgatttgga tgagtttatg 420
caggcgcagc tcatactcgc cggcttgacg gtggcgacgc acatattgaa accaggcgga 480
acgttcatag cgaagatatt tcgggggaaa gacatcagtt tgctctactc acaactgaaa 540
attttcttcc ccgaagtcac gtgcgccaag ccgaaaagta gccggaattc tagcatagaa 600
gcattcatag tgtgtcaggg ttactcccct ccagagggat tcgaaccaca tcaattgact 660
cgtattttag aagcgcgtgc gacgtctcac gccgctggag acgagggcgc ggccgtggga 720
accaagtcct ggccgaacaa tgtgctcgtg ccgtttttgg cgtgcggcga tttgtcggga 780
tacgacgccg atcagagcta tgcgttggat gacaccaaag tcagactaaa accggtgcaa 840
ccgccgacaa caccggcgta tatgaacgca atcaagctct taaagagaaa gtga 894
<210>70
<211>297
<212>PRT
<213>Ostreococcus lucimarinus
<400>70
Met Gly Lys Ser Ser Lys Asp Lys Arg Asp Ile Tyr Tyr Arg Lys Ala
1 5 10 15
Lys Glu Glu Gly Trp Arg Ala Arg Ser Ala Phe Lys Leu Leu Gln Ile
20 25 30
Asp Glu Ser Phe Asp Ile Phe Arg Asp Val Arg His Val Val Asp Leu
35 40 45
Cys Ala Ala Pro Gly Ser Trp Ser Gln Val Leu Ser Arg Lys Leu Tyr
50 55 60
Leu Pro Ala Leu Ala Arg Gly Val Glu Glu Glu Glu Leu Pro Lys Ile
65 70 75 80
Val Ala Ile Asp Leu Gln Pro Met Ala Pro Ile Glu Gly Val Thr Thr
85 90 95
Ile Gln Gly Asp Ile Thr Ser Met Asp Lys Val Arg Glu Val Leu Ser
100 105 110
His Phe Asp Gly Lys His Ala Asp Leu Ile Val Gly Asp Gly Ala Pro
115 120 125
Asp Val Thr Gly Leu His Asp Leu Asp Glu Phe Met Gln Ala Gln Leu
130 135 140
Ile Leu Ala Gly Leu Thr Val Ala Thr His Ile Leu Lys Pro Gly Gly
145 150 155 160
Thr Phe Ile Ala Lys Ile Phe Arg Gly Lys Asp Ile Ser Leu Leu Tyr
165 170 175
Ser Gln Leu Lys Ile Phe Phe Pro Glu Val Thr Cys Ala Lys Pro Lys
180 185 190
Ser Ser Arg Asn Ser Ser Ile Glu Ala Phe Ile Val Cys Gln Gly Tyr
195 200 205
Ser Pro Pro Glu Gly Phe Glu Pro His Gln Leu Thr Arg Ile Leu Glu
210 215 220
Ala Arg Ala Thr Ser His Ala Ala Gly Asp Glu Gly Ala Ala Val Gly
225 230 235 240
Thr Lys Ser Trp Pro Asn Asn Val Leu Val Pro Phe Leu Ala Cys Gly
245 250 255
Asp Leu Ser Gly Tyr Asp Ala Asp Gln Ser Tyr Ala Leu Asp Asp Thr
260 265 270
Lys Val Arg Leu Lys Pro Val Gln Pro Pro Thr Thr Pro Ala Tyr Met
275 280 285
Asn Ala Ile Lys Leu Leu Lys Arg Lys
290 295
<210>71
<211>951
<212>DNA
<213>Populus tremuloides
<400>71
atggggagag cttcaaggga taaaagggat atatactata gaaaagcaaa ggaagaaggt 60
tggcgtgctc gaagtgcctt taagctcatt cagatagatg aggaattcaa tatttttgaa 120
ggagtgaagc gtgtggtgga tttatgtgct gcacctggta gctggagtca ggttttgagc 180
cgtaaactat atttaccagc aaaactttca cctgattcaa gggataatga tcttcctctt 240
attgtggcca ttgatttgca acctatggct ctcattgaag gtgttatcca agtccagggt 300
gatattacca atgcccgaac tgctgaagtg gtcattagac attttgatgg cagcaaggct 360
gacttggttg tgtgtgatgg tgcccctgat gttaccggac tccatgacat ggatgaattt 420
gttcagtctc aactcatact agcgggttta acaattgtca cacatgtact caaagaaggt 480
ggaaaattta ttgcgaagat atttcgtgga aaagatacaa gtcttctgta ttgccagctc 540
aaattatttt ttcctgtggt gacttttgcc aaaccaaaaa gtagccgcaa ttccagcata 600
gaggcatttg cagtttgtga gaattactct cctcctgagg gatttgatcc gaaagacttg 660
cgtcgccttt tggaaaaggt gggaagcccc tctggtgcag atgacctaga ttgcagtagc 720
gggtggttag aaggggcaag taaggtgtat attccatttc tagcttgcgg tgaccttagt 780
gggtatgact ctgaccgatc atatccacta ccaaaagatg ccgatggcac atatcagagc 840
ttggatcctg tacaaccccc aattgcccct ccttataaaa gagcccttga aatgaagaaa 900
gcttctagtc atggtgtaaa agagcttgaa aagctctctt tggattcttg a 951
<210>72
<211>316
<212>PRT
<213>Populus tremuloides
<400>72
Met Gly Arg Ala Ser Arg Asp Lys Arg Asp Ile Tyr Tyr Arg Lys Ala
1 5 10 15
Lys Glu Glu Gly Trp Arg Ala Arg Ser Ala Phe Lys Leu Ile Gln Ile
20 25 30
Asp Glu Glu Phe Asn Ile Phe Glu Gly Val Lys Arg Val Val Asp Leu
35 40 45
Cys Ala Ala Pro Gly Ser Trp Ser Gln Val Leu Ser Arg Lys Leu Tyr
50 55 60
Leu Pro Ala Lys Leu Ser Pro Asp Ser Arg Asp Asn Asp Leu Pro Leu
65 70 75 80
Ile Val Ala Ile Asp Leu Gln Pro Met Ala Leu Ile Glu Gly Val Ile
85 90 95
Gln Val Gln Gly Asp Ile Thr Asn Ala Arg Thr Ala Glu Val Val Ile
100 105 110
Arg His Phe Asp Gly Ser Lys Ala Asp Leu Val Val Cys Asp Gly Ala
115 120 125
Pro Asp Val Thr Gly Leu His Asp Met Asp Glu Phe Val Gln Ser Gln
130 135 140
Leu Ile Leu Ala Gly Leu Thr Ile Val Thr His Val Leu Lys Glu Gly
145 150 155 160
Gly Lys Phe Ile Ala Lys Ile Phe Arg Gly Lys Asp Thr Ser Leu Leu
165 170 175
Tyr Cys Gln Leu Lys Leu Phe Phe Pro Val Val Thr Phe Ala Lys Pro
180 185 190
Lys Ser Ser Arg Asn Ser Ser Ile Glu Ala Phe Ala Val Cys Glu Asn
195 200 205
Tyr Ser Pro Pro Glu Gly Phe Asp Pro Lys Asp Leu Arg Arg Leu Leu
210 215 220
Glu Lys Val Gly Ser Pro Ser Gly Ala Asp Asp Leu Asp Cys Ser Ser
225 230 235 240
Gly Trp Leu Glu Gly Ala Ser Lys Val Tyr Ile Pro Phe Leu Ala Cys
245 250 255
Gly Asp Leu Ser Gly Tyr Asp Ser Asp Arg Ser Tyr Pro Leu Pro Lys
260 265 270
Asp Ala Asp Gly Thr Tyr Gln Ser Leu Asp Pro Val Gln Pro Pro Ile
275 280 285
Ala Pro Pro Tyr Lys Arg Ala Leu Glu Met Lys Lys Ala Ser Ser His
290 295 300
Gly Val Lys Glu Leu Glu Lys Leu Ser Leu Asp Ser
305 310 315
<210>73
<211>954
<212>DNA
<213>甘蔗(Saccharum officinarum)
<400>73
atgggcaagg cctccaagga caagagggac atctattacc ggaaggccaa agaggaaggg 60
tggagagctc gcagcgcctt caagctcctc cagatagacc aggagttcaa catattccat 120
ggagtgaagc gtgtggttga cctgtgtgct gctcccggaa gctggagcca ggttttgagc 180
cggaacctgt atgtaccagc aaaacaatct cctgattgca aggaaggcga ccttcctctc 240
atcgtcgcaa ttgacttgca accaatggcc ccgatagaag gtgttataca agtgcagggc 300
gacatcacca atgctcggac agcggaagtg gttattaggc attttgatgg atgcaaagca 360
gacttggttg tttgcgatgg agctccggat gttactggcc ttcatgatat ggacgaattt 420
gttcagtccc agcttatact cgcggcattg actatcgtga ctcatgtact caaagttggt 480
ggaaaatttg tcgcgaagat atttcggggt aaagatacaa gtctactgta ctgccagcta 540
aaactgttct tctcacaagt tacatttgcg aaaccaaaaa gtagccggaa ctcaagcatt 600
gaggcgtttg cagtttgtga gaactattca cctccagaag gtttcaagga ggaagatcta 660
taccacctgc tagagaaagt ggggactcct tcaggaggtg acgatttaga ttgcagaagc 720
ggatggctcg agggaccaaa caaggtgtac atcccgttcc ttgcctgcgg ggatctcagc 780
ggctacgact ctgatcgctc ataccggctc ccgagcacgg aaggtgggtc ctaccggagc 840
ttggaccccg tccagcctcc catcgccccg ccttacaaaa ccgctctgca gatgaagaag 900
gtttccagcc acagcgccag cgcggacgcc atgaaaccat ccacagattc ttga 954
<210>74
<211>317
<212>PRT
<213>甘蔗
<400>74
Met Gly Lys Ala Ser Lys Asp Lys Arg Asp Ile Tyr Tyr Arg Lys Ala
1 5 10 15
Lys Glu Glu Gly Trp Arg Ala Arg Ser Ala Phe Lys Leu Leu Gln Ile
20 25 30
Asp Gln Glu Phe Asn Ile Phe His Gly Val Lys Arg Val Val Asp Leu
35 40 45
Cys Ala Ala Pro Gly Ser Trp Ser Gln Val Leu Ser Arg Asn Leu Tyr
50 55 60
Val Pro Ala Lys Gln Ser Pro Asp Cys Lys Glu Gly Asp Leu Pro Leu
65 70 75 80
Ile Val Ala Ile Asp Leu Gln Pro Met Ala Pro Ile Glu Gly Val Ile
85 90 95
Gln Val Gln Gly Asp Ile Thr Asn Ala Arg Thr Ala Glu Val Val Ile
100 105 110
Arg His Phe Asp Gly Cys Lys Ala Asp Leu Val Val Cys Asp Gly Ala
115 120 125
Pro Asp Val Thr Gly Leu His Asp Met Asp Glu Phe Val Gln Ser Gln
130 135 140
Leu Ile Leu Ala Ala Leu Thr Ile Val Thr His Val Leu Lys Val Gly
145 150 155 160
Gly Lys Phe Val Ala Lys Ile Phe Arg Gly Lys Asp Thr Ser Leu Leu
165 170 175
Tyr Cys Gln Leu Lys Leu Phe Phe Ser Gln Val Thr Phe Ala Lys Pro
180 185 190
Lys Ser Ser Arg Asn Ser Ser Ile Glu Ala Phe Ala Val Cys Glu Asn
195 200 205
Tyr Ser Pro Pro Glu Gly Phe Lys Glu Glu Asp Leu Tyr His Leu Leu
210 215 220
Glu Lys Val Gly Thr Pro Ser Gly Gly Asp Asp Leu Asp Cys Arg Ser
225 230 235 240
Gly Trp Leu Glu Gly Pro Asn Lys Val Tyr Ile Pro Phe Leu Ala Cys
245 250 255
Gly Asp Leu Ser Gly Tyr Asp Ser Asp Arg Ser Tyr Arg Leu Pro Ser
260 265 270
Thr Glu Gly Gly Ser Tyr Arg Ser Leu Asp Pro Val Gln Pro Pro Ile
275 280 285
Ala Pro Pro Tyr Lys Thr Ala Leu Gln Met Lys Lys Val Ser Ser His
290 295 300
Ser Ala Ser Ala Asp Ala Met Lys Pro Ser Thr Asp Ser
305 310 315
<210>75
<211>945
<212>DNA
<213>普通小麦
<220>
<221>misc_feature
<222>(637)..(637)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(673)..(673)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(775)..(775)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(829)..(829)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(837)..(837)
<223>n是a、c、g或t
<400>75
atgggcaagg cttcgaaaga caagcgggac atctactacc ggaaggccaa ggaggagggg 60
tggagggctc gcagcgcctt caagctcatg cagatcgacc aggagttcaa catcttccac 120
ggagtgaagc gtgccgttga cctgtgcgcc gctcctggga gctggagcca ggttttgagc 180
cgcaatttgt atttaccggc gaagctatca tctgacggca aagatggtgg ccttcctctc 240
atcgtcgcaa tcgatctgca acctatggct ccgatagaag gtgtcataca agtgcagggc 300
gacatcacca atgctcgaac agcggaagtg gttatcaggc actttgatgg atgcaaagcg 360
gacttggttg tctgtgatgg tgcccctgat gttactggac ttcatgatat ggacgagttt 420
gttcagtccc agcttatatt ggcggcactg acaattgtga ctcatgtact taaagttggt 480
ggaaaatttg ttgcgaagat tttccggggt aaagatacaa gtctcctgta ttgccagtta 540
aagctgttct tctcacaagt tacatttgca aagccaaaaa gcagccgcaa ctcaagtatc 600
gaggcatttg cagtttgcga gaactactca cctccangag ggcttcaaga gaaagattta 660
tatcacctgt tgnagaaagt gggaactcct tctggggctg atgatttaga ttgcagaagc 720
ggatggttgg aggggaccaa acaggtctac atcccgtttc tggcttgtgg cgacntcagg 780
ggttacgatc ggaccgttca tacccccctc cgagcacaga ggcggcaant accagancta 840
gatccagtca gccctccatt gcccggccgt aaaaactgcg ttgaaattag aaagggtcta 900
accagggtct ggcgcaatac agcaattatc ttcgacctta aataa 945
<210>76
<211>314
<212>PRT
<213>普通小麦
<220>
<221>UNSURE
<222>(213)..(213)
<223>Xaa可以是任何天然存在的氨基酸
<220>
<221>UNSURE
<222>(225)..(225)
<223>Xaa可以是任何天然存在的氨基酸
<220>
<221>UNSURE
<222>(259)..(259)
<223>Xaa可以是任何天然存在的氨基酸
<220>
<221>UNSURE
<222>(277)..(277)
<223>Xaa可以是任何天然存在的氨基酸
<220>
<221>UNSURE
<222>(279)..(279)
<223>Xaa可以是任何天然存在的氨基酸
<400>76
Met Gly Lys Ala Ser Lys Asp Lys Arg Asp Ile Tyr Tyr Arg Lys Ala
1 5 10 15
Lys Glu Glu Gly Trp Arg Ala Arg Ser Ala Phe Lys Leu Met Gln Ile
20 25 30
Asp Gln Glu Phe Asn Ile Phe His Gly Val Lys Arg Ala Val Asp Leu
35 40 45
Cys Ala Ala Pro Gly Ser Trp Ser Gln Val Leu Ser Arg Asn Leu Tyr
50 55 60
Leu Pro Ala Lys Leu Ser Ser Asp Gly Lys Asp Gly Gly Leu Pro Leu
65 70 75 80
Ile Val Ala Ile Asp Leu Gln Pro Met Ala Pro Ile Glu Gly Val Ile
85 90 95
Gln Val Gln Gly Asp Ile Thr Asn Ala Arg Thr Ala Glu Val Val Ile
100 105 110
Arg His Phe Asp Gly Cys Lys Ala Asp Leu Val Val Cys Asp Gly Ala
115 120 125
Pro Asp Val Thr Gly Leu His Asp Met Asp Glu Phe Val Gln Ser Gln
130 135 140
Leu Ile Leu Ala Ala Leu Thr Ile Val Thr His Val Leu Lys Val Gly
145 150 155 160
Gly Lys Phe Val Ala Lys Ile Phe Arg Gly Lys Asp Thr Ser Leu Leu
165 170 175
Tyr Cys Gln Leu Lys Leu Phe Phe Ser Gln Val Thr Phe Ala Lys Pro
180 185 190
Lys Ser Ser Arg Asn Ser Ser Ile Glu Ala Phe Ala Val Cys Glu Asn
195 200 205
Tyr Ser Pro Pro Xaa Gly Leu Gln Glu Lys Asp Leu Tyr His Leu Leu
210 215 220
Xaa Lys Val Gly Thr Pro Ser Gly Ala Asp Asp Leu Asp Cys Arg Ser
225 230 235 240
Gly Trp Leu Glu Gly Thr Lys Gln Val Tyr Ile Pro Phe Leu Ala Cys
245 250 255
Gly Asp Xaa Arg Gly Tyr Asp Arg Thr Val His Thr Pro Leu Arg Ala
260 265 270
Gln Arg Arg Gln Xaa Pro Xaa Leu Asp Pro Val Ser Pro Pro Leu Pro
275 280 285
Gly Arg Lys Asn Cys Val Glu Ile Arg Lys Gly Leu Thr Arg Val Trp
290 295 300
Arg Asn Thr Ala Ile Ile Phe Asp Leu Lys
305 310
<210>77
<211>1246
<212>DNA
<213>蜜蜂(Apis mellifera)
<400>77
taaagctaac caaaacgtat aacaacaata aacaacaagc attgtacatt agtcaataat 60
gggaaaaaca tcaaaagata aacgagatat atattatcga cgagcaaaag aagaaggatg 120
gagagcaagg agtgctttta aattgcttca aatagataac gaatgtcata ttttagatgg 180
agtaaacaaa gctgtggatt tgtgcgctgc acccgggagc tggagtcaag ttttatcacg 240
aagattaaat gagaattata aaaaagcttt ggaaacagga aatgcaatac ctccaaaaat 300
agttgcagtt gatttacaag ctatggcacc attggaagga gtgattcaaa ttcaaggaga 360
cattacgaat attgatactg caaaacaaat tatctctcat tttgataatg aacaagctga 420
tttagtagtt tgcgatggag cacctgatgt gacaggttta catgatatgg atatttatat 480
ccaatctcag ttattattag cagctctgaa tattactact catatattaa agcaaggagg 540
cacatttgtt gcaaaaatat ttagagctaa agatgtgact ttgctctatg ctcaactaaa 600
aatatttttc ccctatgtct attgtacgaa acctagcagt tctcgtaact ctagtattga 660
agcatttgta gtttgtaaag attactcacc accagaaggt tataaacctc atatgatgaa 720
tcctctttta acacataaac catgtgattt taatgacctt acaggaatta atagagttat 780
tgttccattt gttgtttgtg gtgatcttag tcagcctgat tccgatacgt gttatccatt 840
ggattttgaa ggaaaaacat atacttatca cgaaccggtc caaacaccga tttcaccacc 900
ttacaaagaa gcactcagtt tgatggaaga tagagatacc gatttcagaa gattcgatgt 960
taatgtagtt gtagataatt taagttcatt gactattgag gactttaaaa aacaagcgaa 1020
gcaaaaacat aaagagataa atgaaactaa aaggatcgaa ttgcaagata ataaaaaaga 1080
tgatagcgag gaagatatat tgggacttga caagttaatg cccaccgaat tatttgatga 1140
atctgaaaat aaaaataatg ataatatgta aaaatgttat gattttatat tatacatata 1200
atttgagtta taaatgtttt taatatatta ataataactt ataaat 1246
<210>78
<211>370
<212>PRT
<213>蜜蜂
<400>78
Met Gly Lys Thr Ser Lys Asp Lys Arg Asp Ile Tyr Tyr Arg Arg Ala
1 5 10 15
Lys Glu Glu Gly Trp Arg Ala Arg Ser Ala Phe Lys Leu Leu Gln Ile
20 25 30
Asp Asn Glu Cys His Ile Leu Asp Gly Val Asn Lys Ala Val Asp Leu
35 40 45
Cys Ala Ala Pro Gly Ser Trp Ser Gln Val Leu Ser Arg Arg Leu Asn
50 55 60
Glu Asn Tyr Lys Lys Ala Leu Glu Thr Gly Asn Ala Ile Pro Pro Lys
65 70 75 80
Ile Val Ala Val Asp Leu Gln Ala Met Ala Pro Leu Glu Gly Val Ile
85 90 95
Gln Ile Gln Gly Asp Ile Thr Asn Ile Asp Thr Ala Lys Gln Ile Ile
100 105 110
Ser His Phe Asp Asn Glu Gln Ala Asp Leu Val Val Cys Asp Gly Ala
115 120 125
Pro Asp Val Thr Gly Leu His Asp Met Asp Ile Tyr Ile Gln Ser Gln
130 135 140
Leu Leu Leu Ala Ala Leu Asn Ile Thr Thr His Ile Leu Lys Gln Gly
145 150 155 160
Gly Thr Phe Val Ala Lys Ile Phe Arg Ala Lys Asp Val Thr Leu Leu
165 170 175
Tyr Ala Gln Leu Lys Ile Phe Phe Pro Tyr Val Tyr Cys Thr Lys Pro
180 185 190
Ser Ser Ser Arg Asn Ser Ser Ile Glu Ala Phe Val Val Cys Lys Asp
195 200 205
Tyr Ser Pro Pro Glu Gly Tyr Lys Pro His Met Met Asn Pro Leu Leu
210 215 220
Thr His Lys Pro Cys Asp Phe Asn Asp Leu Thr Gly Ile Asn Arg Val
225 230 235 240
Ile Val Pro Phe Val Val Cys Gly Asp Leu Ser Gln Pro Asp Ser Asp
245 250 255
Thr Cys Tyr Pro Leu Asp Phe Glu Gly Lys Thr Tyr Thr Tyr His Glu
260 265 270
Pro Val Gln Thr Pro Ile Ser Pro Pro Tyr Lys Glu Ala Leu Ser Leu
275 280 285
Met Glu Asp Arg Asp Thr Asp Phe Arg Arg Phe Asp Val Asn Val Val
290 295 300
Val Asp Asn Leu Ser Ser Leu Thr Ile Glu Asp Phe Lys Lys Gln Ala
305 310 315 320
Lys Gln Lys His Lys Glu Ile Asn Glu Thr Lys Arg Ile Glu Leu Gln
325 330 335
Asp Asn Lys Lys Asp Asp Ser Glu Glu Asp Ile Leu Gly Leu Asp Lys
340 345 350
Leu Met Pro Thr Glu Leu Phe Asp Glu Ser Glu Asn Lys Asn Asn Asp
355 360 365
Asn Met
370
<210>79
<211>1093
<212>DNA
<213>漂亮新小杆线虫(Caenorhabditis elegans)
<400>79
atgggaaaaa catctcgtga caaaagggac atttactatc gtctggcaaa ggagaacaaa 60
tggcgagcac ggagtgcatt caaattgatg cagattgatg atgaatttca gattctgaaa 120
ggagtccgtc gagctgtaga tttgtgtgca gcacctggaa gttggtcaca agtgctatcg 180
aaaaggttat acgaggaaga tcaagaggca aaaattgttg cgattgatct tcagccgatg 240
gcaccgattc caggagttat tcaacttcaa ggagatatta cttccgttga tacagctaat 300
caggtcatca aacacttttc cggagaaaaa tcagatattg tgatttgcga cggagcccca 360
gatgtaaccg gaattcattc tctggacgaa ttcatgcaag ccgaactaat cctcgctgcc 420
ttcaacatca caagtcacgt tctcaaagaa ggcggcaact ttctcgcgaa aattttccga 480
tcccgaaact cctctcttct ctatgcacaa atgaagaagt attttaaaaa agtatatcta 540
gccaaaccac gaagttcccg tcaatccagt tgtgaagctt ttgtcctgtg tctcgactat 600
tcaccgcccg agggatttgt tccaacaatg ggaaagactt cattagacgc aactgatgct 660
tctgctattt cacctgatat tatcgatgga ttcgtgactt gtggcgatct aagtggatgg 720
gacagcgaga agtcttatcc gttggatatt gatgcttgtt ttcccaaagg agagattgat 780
gaagagcaga aaaaacgata cgagttcaaa gacgtcgttc agccaccaac agatcctgcc 840
tacaaagcag ctctcgataa gaagaaaagt ggagtttttg caaaaatgtc tgcagatttg 900
aacagacagc tgaaagctga acttagtcgt ggaaaggatc agaagaagac tccagcagag 960
aatgttccaa gcgtagaaga attggagaaa gctgctgaaa aatttcaact ataatttggt 1020
tatttttgtt ctcattgtca gttaattgat tttttttcac ttttttcgag tctcattatt 1080
agtatttgtt ttg 1093
<210>80
<211>337
<212>PRT
<213>漂亮新小杆线虫
<400>80
Met Gly Lys Thr Ser Arg Asp Lys Arg Asp Ile Tyr Tyr Arg Leu Ala
1 5 10 15
Lys Glu Asn Lys Trp Arg Ala Arg Ser Ala Phe Lys Leu Met Gln Ile
20 25 30
Asp Asp Glu Phe Gln Ile Leu Lys Gly Val Arg Arg Ala Val Asp Leu
35 40 45
Cys Ala Ala Pro Gly Ser Trp Ser Gln Val Leu Ser Lys Arg Leu Tyr
50 55 60
Glu Glu Asp Gln Glu Ala Lys Ile Val Ala Ile Asp Leu Gln Pro Met
65 70 75 80
Ala Pro Ile Pro Gly Val Ile Gln Leu Gln Gly Asp Ile Thr Ser Val
85 90 95
Asp Thr Ala Asn Gln Val Ile Lys His Phe Ser Gly Glu Lys Ser Asp
100 105 110
Ile Val Ile Cys Asp Gly Ala Pro Asp Val Thr Gly Ile His Ser Leu
115 120 125
Asp Glu Phe Met Gln Ala Glu Leu Ile Leu Ala Ala Phe Asn Ile Thr
130 135 140
Ser His Val Leu Lys Glu Gly Gly Asn Phe Leu Ala Lys Ile Phe Arg
145 150 155 160
Ser Arg Asn Ser Ser Leu Leu Tyr Ala Gln Met Lys Lys Tyr Phe Lys
165 170 175
Lys Val Tyr Leu Ala Lys Pro Arg Ser Ser Arg Gln Ser Ser Cys Glu
180 185 190
Ala Phe Val Leu Cys Leu Asp Tyr Ser Pro Pro Glu G1y Phe Val Pro
195 200 205
Thr Met Gly Lys Thr Ser Leu Asp Ala Thr Asp Ala Ser Ala Ile Ser
210 215 220
Pro Asp Ile Ile Asp Gly Phe Val Thr Cys Gly Asp Leu Ser Gly Trp
225 230 235 240
Asp Ser Glu Lys Ser Tyr Pro Leu Asp Ile Asp Ala Cys Phe Pro Lys
245 250 255
Gly Glu Ile Asp Glu Glu Gln Lys Lys Arg Tyr Glu Phe Lys Asp Val
260 265 270
Val Gln Pro Pro Thr Asp Pro Ala Tyr Lys Ala Ala Leu Asp Lys Lys
275 280 285
Lys Ser Gly Val Phe Ala Lys Met Ser Ala Asp Leu Asn Arg Gln Leu
290 295 300
Lys Ala Glu Leu Ser Arg Gly Lys Asp Gln Lys Lys Thr Pro Ala Glu
305 310 315 320
Asn Val Pro Ser Val Glu Glu Leu Glu Lys Ala Ala Glu Lys Phe Gln
325 330 335
Leu
<210>81
<211>1433
<212>DNA
<213>鲐(Danio rerio)
<400>81
gaagaagaag aactgtcacg ttgcggcgaa aacaagcagc agtccaacaa taagtgagtg 60
aaggtgaaat ggggcgctca tccaaagaca aacgagatat ttactacaga cttgcgaagg 120
aggaaggatg gagggcgaga agtgccttca aactcctgca gctggatgag gagttcaagc 180
tgtttagagg tgttagtcgt gctgtggatc tgtgtgcagc acctggcagc tggagtcaag 240
tcctcagccg caaactacgt ggaaaagaca agagtgaaga ggtcaagatt gtggcagttg 300
atctgcaagc catggcacct ttaccgggcg tcacacaaat tcaaggagac atcaccaaga 360
tttctacagc agaggaaatt attcgacatt ttgaaggaga gtctgcagac ttggttgtgt 420
gtgacggtgc tcctgatgtg acagggcttc atgatgtaga tgagtatatt caggcacagc 480
tcctgttggc agctctcaat atcaccacac atgttctcaa accaggcggc aactttgttg 540
caaaaatttt caggggaaaa gatgtgaccc tgctgtactc gcagctaaag atcttcttca 600
gctttgtgac ctgtgccaaa ccacccagca gccgcaactc tagcattgag gcatttgtgg 660
tgtgtcagaa ttactctcca cctgagggtt acgttcccaa catgtccaac cctttactgg 720
atcactccta tgatgtcgac tttaaccagt tagagggacc aaaccgaata atagtccctt 780
tccttgcttg tggagatctc agtgggtttg attcagacag aacgtatcct cttcagcttg 840
attctagcaa agagtatcag tatttaccac caacccaacc tccaattcgg cctccctacc 900
agcaagcctg tcaattgcgc aagagtaacc tgcttgccaa agaggactcg ccgtccggtg 960
cgctggatga agccttgacc gctttagatc tcaacacaaa accagacaca agcacgacta 1020
caccaggagc ctcagaataa tggaattgta cagcttcaag ttttgcttga cactgtcaag 1080
aatgtgtttg tcacgggaac atctttgtac tttatttaca cctacatttt gatagtatta 1140
acaaacccac agaaattttt actcctagaa gatatttatt tagaggtaaa taaggtacaa 1200
aggtttctat gattctgtct ctgtgtaaag cttttattta atttttcatg catttctgga 1260
ttgtaattaa tgtaactttt aggcatttta ttctttctga ctgtattaca tttaccattc 1320
acaggattgt ttcagtaagt cgccgaaaca acctgatgac ttttaacctc agctttacat 1380
ggtaataaaa cactcaaatc taaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 1433
<210>82
<211>323
<212>PRT
<213>鲐
<400>82
Met Gly Arg Ser Ser Lys Asp Lys Arg Asp Ile Tyr Tyr Arg Leu Ala
1 5 10 15
Lys Glu Glu Gly Trp Arg Ala Arg Ser Ala Phe Lys Leu Leu Gln Leu
20 25 30
Asp Glu Glu Phe Lys Leu Phe Arg Gly Val Ser Arg Ala Val Asp Leu
35 40 45
Cys Ala Ala Pro Gly Ser Trp Ser Gln Val Leu Ser Arg Lys Leu Arg
50 55 60
Gly Lys Asp Lys Ser Glu Glu Val Lys Ile Val Ala Val Asp Leu Gln
65 70 75 80
Ala Met Ala Pro Leu Pro Gly Val Thr Gln Ile Gln Gly Asp Ile Thr
85 90 95
Lys Ile Ser Thr Ala Glu Glu Ile Ile Arg His Phe Glu Gly Glu Ser
100 105 110
Ala Asp Leu Val Val Cys Asp Gly Ala Pro Asp Val Thr Gly Leu His
115 120 125
Asp Val Asp Glu Tyr Ile Gln Ala Gln Leu Leu Leu Ala Ala Leu Asn
130 135 140
Ile Thr Thr His Val Leu Lys Pro Gly Gly Asn Phe Val Ala Lys Ile
145 150 155 160
Phe Arg Gly Lys Asp Val Thr Leu Leu Tyr Ser Gln Leu Lys Ile Phe
165 170 175
Phe Ser Phe Val Thr Cys Ala Lys Pro Pro Ser Ser Arg Asn Ser Ser
180 185 190
Ile Glu Ala Phe Val Val Cys Gln Asn Tyr Ser Pro Pro Glu Gly Tyr
195 200 205
Val Pro Asn Met Ser Asn Pro Leu Leu Asp His Ser Tyr Asp Val Asp
210 215 220
Phe Asn Gln Leu Glu Gly Pro Asn Arg Ile Ile Val Pro Phe Leu Ala
225 230 235 240
Cys Gly Asp Leu Ser Gly Phe Asp Ser Asp Arg Thr Tyr Pro Leu Gln
245 250 255
Leu Asp Ser Ser Lys Glu Tyr Gln Tyr Leu Pro Pro Thr Gln Pro Pro
260 265 270
Ile Arg Pro Pro Tyr Gln Gln Ala Cys Gln Leu Arg Lys Ser Asn Leu
275 280 285
Leu Ala Lys Glu Asp Ser Pro Ser Gly Ala Leu Asp Glu Ala Leu Thr
290 295 300
Ala Leu Asp Leu Asn Thr Lys Pro Asp Thr Ser Thr Thr Thr Pro Gly
305 310 315 320
Ala Ser Glu
<210>83
<211>1984
<212>DNA
<213>人(Homo sapiens)
<400>83
ggatacgtcg acaatagatg acggggctca cgttgtacgt tcacatcagg tcccggcccg 60
ccggaacctg ggcgatccac gatgccgagt ttgccacgct gcgacagccc ataggcttgc 120
ccccccgggc attcgggtgg actacgaaca caaactgaag ccctaggact tgtcgcccgt 180
ttgcgctctc gccgaggcac aggctgctcg cggaccaccc tgctccgaaa actaagaagg 240
ggaccagtag acggggtgga ttcgaggtgg ggacatggga cgcagcggtc ggagccgcct 300
ggaggggtac ccggtggtcc cgatggagct atcatctttg agaggtaggt ggtagcccat 360
tcatctggtt actgatactg gccggcatca gtggactgtc ggcaggtcct tgagcaactg 420
gtgtgtgaaa tgggacggac gtcaaaggac aagcgggatg tctactaccg cctggccaag 480
gagaatggct ggcgtgctcg cagcgccttc aaactgctac aactggataa ggaattccaa 540
ctcttccaag gcgtgacacg ggcagttgac ctgtgtgcag ccccaggcag ctggagccag 600
gtgctgagcc ggaagatcgg gggccaaggg tccggccacg tggtggctgt ggacctgcag 660
gctatggctc cactaccagg tgtggtacag atccaggggg acatcaccca gctgtccact 720
gccaaggaga tcatccagca ctttaagggc tgccctgcgg acctagtggt gtgtgacggg 780
gctcctgatg taaccggtct ccatgatgtt gatgagtata tgcaggccca gctcctccta 840
gctgctctga acattgctac acatgtcctg aagccagggg gctgctttgt ggccaagata 900
ttccgaggcc gggatgtgac gctcctctac agccagctgc aggtcttctt ctccagcgtg 960
ctgtgtgcca agcccaggag cagccggaac tctagcatcg aggccttcgc tgtctgtcag 1020
ggctatgacc ctcccgaggg cttcatcccg gacctgagca aacccctgct ggaccattct 1080
tacgatttca accagctgga tggtcccacc cgcatcattg tgccttttgt gacctgtggg 1140
gacctgagct cctatgattc ggaccgcagt tacccactgg acctagaggg cggctcagag 1200
tacaagtaca ctccacccac acagcccccc atctcgccac cataccagga ggcctgcacg 1260
ttgaagagga aggggcagct ggccaaggag atccgccccc aggactgccc catcagcaga 1320
gtggacacgt ttccccagcc cctggccgcc cctcagtgcc acaccctgct ggcccctgag 1380
atggaagaca atgaaatgag ttgttcacct taacccatta cgctggcaaa ctgatacaac 1440
tcagaaactg ctcaatgtca ggaaaaccgg aacttgttga tgaacttgtt ttcaaaatat 1500
catctcatca acgaggcctg gacaaacaag ccctgaggag ggatctgcaa caaccctgaa 1560
gacaacaagg aaagaaacca tgaaagtctg tctgtactgc agtgggaatt cttgagtgag 1620
gtcttacctc ttctttaaac ctcttcagga gtgtcctgat tatgtccaga attttcccta 1680
aaggcaggga ttcttaacct ggatagaagc caggggtaac catgaacttg atggaagaaa 1740
atgttacatc tttattttca gcaatgaaac tgaaatttag ccttactccc aagttataaa 1800
tgctggcaac aaatcacagt agtaaaagca gtacctggga ttttcccacc aatacaaacc 1860
agttacagca actgtaatgt aacataaaaa gggcatcttg aagtattgtt catatttgtc 1920
acctcttgga atgatagcag atcctgtaag ttgatgtatt aattaaaagc ccatatatta 1980
ctgc 1984
<210>84
<211>327
<212>PRT
<213>人
<400>84
Met Gly Arg Thr Ser Lys Asp Lys Arg Asp Val Tyr Tyr Arg Leu Ala
1 5 10 15
Lys Glu Asn Gly Trp Arg Ala Arg Ser Ala Phe Lys Leu Leu Gln Leu
20 25 30
Asp Lys Glu Phe Gln Leu Phe Gln Gly Val Thr Arg Ala Val Asp Leu
35 40 45
Cys Ala Ala Pro Gly Ser Trp Ser Gln Val Leu Ser Arg Lys Ile Gly
50 55 60
Gly Gln Gly Ser Gly His Val Val Ala Val Asp Leu Gln Ala Met Ala
65 70 75 80
Pro Leu Pro Gly Val Val Gln Ile Gln Gly Asp Ile Thr Gln Leu Ser
85 90 95
Thr Ala Lys Glu Ile Ile Gln His Phe Lys Gly Cys Pro Ala Asp Leu
100 105 110
Val Val Cys Asp Gly Ala Pro Asp Val Thr Gly Leu His Asp Val Asp
115 120 125
Glu Tyr Met Gln Ala Gln Leu Leu Leu Ala Ala Leu Asn Ile Ala Thr
130 135 140
His Val Leu Lys Pro Gly Gly Cys Phe Val Ala Lys Ile Phe Arg Gly
145 150 155 160
Arg Asp Val Thr Leu Leu Tyr Ser Gln Leu Gln Val Phe Phe Ser Ser
165 170 175
Val Leu Cys Ala Lys Pro Arg Ser Ser Arg Asn Ser Ser Ile Glu Ala
180 185 190
Phe Ala Val Cys Gln Gly Tyr Asp Pro Pro Glu Gly Phe Ile Pro Asp
195 200 205
Leu Ser Lys Pro Leu Leu Asp His Ser Tyr Asp Phe Asn Gln Leu Asp
210 215 220
Gly Pro Thr Arg Ile Ile Val Pro Phe Val Thr Cys Gly Asp Leu Ser
225 230 235 240
Ser Tyr Asp Ser Asp Arg Ser Tyr Pro Leu Asp Leu Glu Gly Gly Ser
245 250 255
Glu Tyr Lys Tyr Thr Pro Pro Thr Gln Pro Pro Ile Ser Pro Pro Tyr
260 265 270
Gln Glu Ala Cys Thr Leu Lys Arg Lys Gly Gln Leu Ala Lys Glu Ile
275 280 285
Arg Pro Gln Asp Cys Pro Ile Ser Arg Val Asp Thr Phe Pro Gln Pro
290 295 300
Leu Ala Ala Pro Gln Cys His Thr Leu Leu Ala Pro Glu Met G1u Asp
305 310 315 320
Asn Glu Met Ser Cys Ser Pro
325
<210>85
<211>2466
<212>DNA
<213>拟南芥
<400>85
atgggtaagg tcaaaggaaa gcatcgtttg gataagtact atcgtctcgc taaggaacgt 60
ggattccgtt ctcgagcttc ctacaagctt cttcagctcg acgccaagta ctctcttctc 120
cactcagctc atgccgttct cgatctctgc gccgcccctg gtggttggat gcaagtcgcc 180
gtcgagaaag ttcccgtcgg cagcctcgtt ctcggtatcg atcttgtccc gattctccct 240
gttcgtggct gtgttactat gacgcaagat atcacaagga ctgagtgtaa atcgaagatc 300
aagcaagtga tggagcagca tggtgttagt gcttttaatt tggttctgca cgatgggtct 360
ccaaatgttg gtggtgcgtg ggcacaagag gctatgagcc agaacgcttt ggttattgat 420
tctgttagat tagccactga gttcttagct cgcaacggga atttagtcac caaggttttc 480
aggtctcgag actacaactc tgtgctctac tgtcttggga ggctgtttga aaaagttgaa 540
gtgtttaagc cgccggctag tcgttcagca tctgcagaaa catatcttgt gggtttgaaa 600
tacttagccc ctgccaagat tgatccccgt cttcttgatt atagacatct ctttaaggag 660
tcagcagaac ccacgagaaa ggtggtggat gtgcttggag gatcaaaaca aaagagaaac 720
cgtgatgggt atgaagatgg ggagtccatt ttgagaagag ttgcatctgc tgctgatttc 780
atttggtctg aaaatcctct tgacgttctt ggcacgacta cttccatatc atttgatgat 840
caagcctctc tacctttaaa ggaacatgat ttgacgacag aggagattaa aattctatgc 900
gatgatcttc ctgtcttggg gaagaatgac ttcaagcata tcctaaaatg gcgaatgcaa 960
atcaggaaag ctctgactcc tgagaaaaag gaagttgcta aacctgagcc tgatgtggga 1020
aaggaagatg aggaaaatga agatgataaa ctactcaatg aattggaaga gctgacaaac 1080
acagttgacc gcaagaagaa acaggcaaag aagattcttg caaaacgaag ggctaaggac 1140
aaggcgcgga aggcgactgg tccacagatg gatgtacttg aagatggttt cgtcgacaat 1200
gaattgttct ctcttaatgc tatcaaggga aagaaagatc taatggcagt tgacaatgat 1260
gaagatgata atggcaatgc cgttgacagt gagaacgaag accatggcga aggagcttca 1320
gatgactcca aagacagtga cagagattct gatgaagaac gtcagaaata cactgaacaa 1380
atggaagaga tttttgagca ggcatatgag cggtatatgg tgaagaaaga aggaagcgca 1440
aagcaaagga agcgggctag gcaggcccat gctgaaaagc tggaggaagg tgatggagat 1500
gaagaaatga agatcgatta cgattcagat atgaatgaag aaaaggatga ggcaaaccct 1560
cttgttgtac cacttgatga tggagtggtc caaacaaagg aggaaatatc caaccagtgg 1620
ttcagtcaga atatatttgc agaagccgtg gaagaaggag acttgggaaa agatgacagt 1680
gaagacgaaa tagcaaataa gaaaaagagc aaaaatctgt ctaaaccaga caagtcaaag 1740
cagaaggctt caaaagcaag tgtgttgtct gatcagagct tgcccaatag ctccaagaag 1800
gaagatgagt ttgaggtagt ccctgcacca gccacagatt ctgactcaga ttcatcctct 1860
gaagatgatg ttcataccaa ggccgagata ctggcatgtg ccaaaaaaat gctgaggaag 1920
aagcagagag aacagatgct tgatgatgca tataacaaac acatgtttgt agatgaaggt 1980
ttaccaaaat ggtttgtgga tgacgagaag cagcacagac aaccaatgaa acctgttacg 2040
aaagatgaag ttaatgcaat gaaagcacag ttcaaagaga tcaatgctcg tccagccaag 2100
aaggtggcag aggccaaggc acggaagaag cgagctgccc agaaaagatt ggagaaagtg 2160
aggaagaagg caaacacaat atctgacaca gcagatatat cagaccgttc aaaggacaag 2220
atgatagaca agctatacaa gaaagcagca gagccaagaa agccaaggaa agaactggtt 2280
gtgtctaaga aaggagttgg ggttaaagtt ggtaagggac agaagagagt ggataggagg 2340
atgaagagtg atgataggaa acgtggggga ggaaagcccg gtaggaacgg gcagaagggc 2400
actggtaaag caggccagaa aggaaaaagg cctgctggga aacctcgggg aaggaaaccc 2460
gggtaa 2466
<210>86
<211>821
<212>PRT
<213>拟南芥
<400>86
Met Gly Lys Val Lys Gly Lys His Arg Leu Asp Lys Tyr Tyr Arg Leu
1 5 10 15
Ala Lys Glu Arg Gly Phe Arg Ser Arg Ala Ser Tyr Lys Leu Leu Gln
20 25 30
Leu Asp Ala Lys Tyr Ser Leu Leu His Ser Ala His Ala Val Leu Asp
35 40 45
Leu Cys Ala Ala Pro Gly Gly Trp Met Gln Val Ala Val Glu Lys Val
50 55 60
Pro Val Gly Ser Leu Val Leu Gly Ile Asp Leu Val Pro Ile Leu Pro
65 70 75 80
Val Arg Gly Cys Val Thr Met Thr Gln Asp Ile Thr Arg Thr Glu Cys
85 90 95
Lys Ser Lys Ile Lys Gln Val Met Glu Gln His Gly Val Ser Ala Phe
100 105 110
Asn Leu Val Leu His Asp Gly Ser Pro Asn Val Gly Gly Ala Trp Ala
115 120 125
Gln Glu Ala Met Ser Gln Asn Ala Leu Val Ile Asp Ser Val Arg Leu
130 135 140
Ala Thr Glu Phe Leu Ala Arg Asn Gly Asn Leu Val Thr Lys Val Phe
145 150 155 160
Arg Ser Arg Asp Tyr Asn Ser Val Leu Tyr Cys Leu Gly Arg Leu Phe
165 170 175
Glu Lys Val Glu Val Phe Lys Pro Pro Ala Ser Arg Ser Ala Ser Ala
180 185 190
Glu Thr Tyr Leu Val Gly Leu Lys Tyr Leu Ala Pro Ala Lys Ile Asp
195 200 205
Pro Arg Leu Leu Asp Tyr Arg His Leu Phe Lys Glu Ser Ala Glu Pro
210 215 220
Thr Arg Lys Val Val Asp Val Leu Gly Gly Ser Lys Gln Lys Arg Asn
225 230 235 240
Arg Asp Gly Tyr Glu Asp Gly Glu Ser Ile Leu Arg Arg Val Ala Ser
245 250 255
Ala Ala Asp Phe Ile Trp Ser Glu Asn Pro Leu Asp Val Leu Gly Thr
260 265 270
Thr Thr Ser Ile Ser Phe Asp Asp Gln Ala Ser Leu Pro Leu Lys Glu
275 280 285
His Asp Leu Thr Thr Glu Glu Ile Lys Ile Leu Cys Asp Asp Leu Pro
290 295 300
Val Leu Gly Lys Asn Asp Phe Lys His Ile Leu Lys Trp Arg Met Gln
305 310 315 320
Ile Arg Lys Ala Leu Thr Pro Glu Lys Lys Glu Val Ala Lys Pro Glu
325 330 335
Pro Asp Val Gly Lys Glu Asp Glu Glu Asn Glu Asp Asp Lys Leu Leu
340 345 350
Asn Glu Leu Glu Glu Leu Thr Asn Thr Val Asp Arg Lys Lys Lys Gln
355 360 365
Ala Lys Lys Ile Leu Ala Lys Arg Arg Ala Lys Asp Lys Ala Arg Lys
370 375 380
Ala Thr Gly Pro Gln Met Asp Val Leu Glu Asp Gly Phe Val Asp Asn
385 390 395 400
Glu Leu Phe Ser Leu Asn Ala Ile Lys Gly Lys Lys Asp Leu Met Ala
405 410 415
Val Asp Asn Asp Glu Asp Asp Asn Gly Asn Ala Val Asp Ser Glu Asn
420 425 430
Glu Asp His Gly Glu Gly Ala Ser Asp Asp Ser Lys Asp Ser Asp Arg
435 440 445
Asp Ser Asp Glu Glu Arg Gln Lys Tyr Thr Glu Gln Met Glu Glu Ile
450 455 460
Phe Glu Gln Ala Tyr Glu Arg Tyr Met Val Lys Lys Glu Gly Ser Ala
465 470 475 480
Lys Gln Arg Lys Arg Ala Arg Gln Ala His Ala Glu Lys Leu Glu Glu
485 490 495
Gly Asp Gly Asp Glu Glu Met Lys Ile Asp Tyr Asp Ser Asp Met Asn
500 505 510
Glu Glu Lys Asp Glu Ala Asn Pro Leu Val Val Pro Leu Asp Asp Gly
515 520 525
Val Val Gln Thr Lys Glu Glu Ile Ser Asn Gln Trp Phe Ser Gln Asn
530 535 540
Ile Phe Ala Glu Ala Val Glu Glu Gly Asp Leu Gly Lys Asp Asp Ser
545 550 555 560
Glu Asp Glu Ile Ala Asn Lys Lys Lys Ser Lys Asn Leu Ser Lys Pro
565 570 575
Asp Lys Ser Lys Gln Lys Ala Ser Lys Ala Ser Val Leu Ser Asp Gln
580 585 590
Ser Leu Pro Asn Ser Ser Lys Lys Glu Asp Glu Phe Glu Val Val Pro
595 600 605
Ala Pro Ala Thr Asp Ser Asp Ser Asp Ser Ser Ser Glu Asp Asp Val
610 615 620
His Thr Lys Ala Glu Ile Leu Ala Cys Ala Lys Lys Met Leu Arg Lys
625 630 635 640
Lys Gln Arg Glu Gln Met Leu Asp Asp Ala Tyr Asn Lys His Met Phe
645 650 655
Val Asp Glu Gly Leu Pro Lys Trp Phe Val Asp Asp Glu Lys Gln His
660 665 670
Arg Gln Pro Met Lys Pro Val Thr Lys Asp Glu Val Asn Ala Met Lys
675 680 685
Ala Gln Phe Lys Glu Ile Asn Ala Arg Pro Ala Lys Lys Val Ala Glu
690 695 700
Ala Lys Ala Arg Lys Lys Arg Ala Ala Gln Lys Arg Leu Glu Lys Val
705 710 715 720
Arg Lys Lys Ala Asn Thr Ile Ser Asp Thr Ala Asp Ile Ser Asp Arg
725 730 735
Ser Lys Asp Lys Met Ile Asp Lys Leu Tyr Lys Lys Ala Ala Glu Pro
740 745 750
Arg Lys Pro Arg Lys Glu Leu Val Val Ser Lys Lys Gly Val Gly Val
755 760 765
Lys Val Gly Lys Gly Gln Lys Arg Val Asp Arg Arg Met Lys Ser Asp
770 775 780
Asp Arg Lys Arg Gly Gly Gly Lys Pro Gly Arg Asn Gly Gln Lys Gly
785 790 795 800
Thr Gly Lys Ala Gly Gln Lys Gly Lys Arg Pro Ala Gly Lys Pro Arg
805 810 815
Gly Arg Lys Pro Gly
820
<210>87
<211>675
<212>DNA
<213>拟南芥
<400>87
atgagtgggg caggtgtacc ggactttttc tacagagaag ctcaacgtct tggctatgtt 60
gctcgctcag ctttcaagct tctacagatt caaaaacagt acaagctcat caaaccaggc 120
tcctctgttc ttgacctagg ttgcgcgcct ggtgcttggc ttcaggttgc ttgccaaagc 180
ttaggcccac ttagaagtgg tggaattgtc gttggtatgg atataaagaa ggtgaaggtt 240
cctccacagt gtgattctcg agtgcaaacc attgctgctg atgttttaaa ctttcccaga 300
caaaagattc gggagttatc acctcagcaa ttgggatttt cagtcattct ttcagatatg 360
tgtcactcag tatctggaat aaccactaga gatgcagctc tgtctgctga attgggaatg 420
cgagcacttg atttggctgt tggtcaagct gccatctctc agtcacctaa tgatgatgat 480
ggaggcccaa acgaaagtcg tcctggtgta cttaggcatg gtggccatct tgtgatcaag 540
cttctagaaa gcgaggatgc tcaagatttt gctcgaattt gcaagcctat cttcaacaag 600
gcatcttggt tgaggccaaa agctacaaga ccatcatctc gagaaattta cttgatttgc 660
cagggatttc gataa 675
<210>88
<211>224
<212>PRT
<213>拟南芥
<400>88
Met Ser Gly Ala Gly Val Pro Asp Phe Phe Tyr Arg Glu Ala Gln Arg
1 5 10 15
Leu Gly Tyr Val Ala Arg Ser Ala Phe Lys Leu Leu Gln Ile Gln Lys
20 25 30
Gln Tyr Lys Leu Ile Lys Pro Gly Ser Ser Val Leu Asp Leu Gly Cys
35 40 45
Ala Pro Gly Ala Trp Leu Gln Val Ala Cys Gln Ser Leu Gly Pro Leu
50 55 60
Arg Ser Gly Gly Ile Val Val Gly Met Asp Ile Lys Lys Val Lys Val
65 70 75 80
Pro Pro Gln Cys Asp Ser Arg Val Gln Thr Ile Ala Ala Asp Val Leu
85 90 95
Asn Phe Pro Arg Gln Lys Ile Arg Glu Leu Ser Pro Gln Gln Leu Gly
100 105 110
Phe Ser Val Ile Leu Ser Asp Met Cys His Ser Val Ser Gly Ile Thr
115 120 125
Thr Arg Asp Ala Ala Leu Ser Ala Glu Leu Gly Met Arg Ala Leu Asp
130 135 140
Leu Ala Val Gly Gln Ala Ala Ile Ser Gln Ser Pro Asn Asp Asp Asp
145 150 155 160
Gly Gly Pro Asn Glu Ser Arg Pro Gly Val Leu Arg His Gly Gly His
165 170 175
Leu Val Ile Lys Leu Leu Glu Ser Glu Asp Ala Gln Asp Phe Ala Arg
180 185 190
Ile Cys Lys Pro Ile Phe Asn Lys Ala Ser Trp Leu Arg Pro Lys Ala
195 200 205
Thr Arg Pro Ser Ser Arg Glu Ile Tyr Leu Ile Cys Gln Gly Phe Arg
210 215 220
<210>89
<211>1212
<212>DNA
<213>稻
<400>89
atgagcggcg cgggcggcac cgccgacttc ttctaccgcg aggcgcagcg cctcggctac 60
gtcgcccgct ccgcgttcaa gctgatccag atacagaagc agcacaagct catcgccccc 120
ggcgccgccg tcctcgacct cggctgcgcc cccggcgcgt ggctccaggt ggcgtgccag 180
aacctgggtc cgctcgagaa gggcggggtg atcgtcggcg tcgatgtcaa gaaggtgaag 240
gttccatctg cgcactgtga ctcgagggtc aggaccgttt gcgccgatgt gatggctctg 300
atgaagcagc aagctcgggc aatgtcgcca caggaacgag gattctctgt aatattgtca 360
gacatgtgcc cagtagtttc tggaattaca accaaagatg cggctatatc ttgcgagctg 420
ggcatgcgtg ctctttcatt ggcagttggt aagatgaaag caaaagattc agattgcatt 480
gcaattttag agaagtttca gagctccact gagccagatc ctgatgaaga tggcattctc 540
cgtcgtggag gcagccttgt aattaagttt cttgagaatg aggatatacc aggttttggc 600
aaattttgca aagagaagtt caagaaagtg tccttattga gacccaaggc gacaagatct 660
agttcgaggg agattttcat ggtctgtgaa ggccgcggct tctcggtcgc gccacgctgg 720
catccacttt ctcatggccc ggcgacgtac gggacgggct ccacgtgtca cgccgccgcc 780
cacagcttgg tcgaattgag aactgttggg cttcaaagag aggctcccaa gtgcagtgac 840
ctgaaagctc aagctcaacc tgcggcgttc gtgcggattc cgcggggcgc gtcccttccc 900
gccacccgca acgccgctgg actccactcc actctcctcg tcgcttcgtt gctgcacatc 960
accacccacc gcggtggcac tcacttctat attagcttaa gcgtggggtg ggagacgccg 1020
aggagggagg agtgccgcat cccggtggtg ccgccgcagt gcccggcgcc gccgaggaag 1080
aggccggtgg cgctgccgga gctggggaag gagcggcggg agccgcccaa gggcgggtac 1140
ttccagccgc cggacctcga gtcgctcttc gtgctcgcgc cgccgcggag gcaggcgtcc 1200
agctgcgcgt ag 1212
<210>90
<211>403
<212>PRT
<213>稻
<400>90
Met Ser Gly Ala Gly Gly Thr Ala Asp Phe Phe Tyr Arg Glu Ala Gln
1 5 10 15
Arg Leu Gly Tyr Val Ala Arg Ser Ala Phe Lys Leu Ile Gln Ile Gln
20 25 30
Lys Gln His Lys Leu Ile Ala Pro Gly Ala Ala Val Leu Asp Leu Gly
35 40 45
Cys Ala Pro Gly Ala Trp Leu Gln Val Ala Cys Gln Asn Leu Gly Pro
50 55 60
Leu Glu Lys Gly Gly Val Ile Val Gly Val Asp Val Lys Lys Val Lys
65 70 75 80
Val Pro Ser Ala His Cys Asp Ser Arg Val Arg Thr Val Cys Ala Asp
85 90 95
Val Met Ala Leu Met Lys Gln Gln Ala Arg Ala Met Ser Pro Gln Glu
100 105 110
Arg Gly Phe Ser Val Ile Leu Ser Asp Met Cys Pro Val Val Ser Gly
115 120 125
Ile Thr Thr Lys Asp Ala Ala Ile Ser Cys Glu Leu Gly Met Arg Ala
130 135 140
Leu Ser Leu Ala Val Gly Lys Met Lys Ala Lys Asp Ser Asp Cys Ile
145 150 155 160
Ala Ile Leu Glu Lys Phe Gln Ser Ser Thr Glu Pro Asp Pro Asp Glu
165 170 175
Asp Gly Ile Leu Arg Arg Gly Gly Ser Leu Val Ile Lys Phe Leu Glu
180 185 190
Asn Glu Asp Ile Pro Gly Phe Gly Lys Phe Cys Lys Glu Lys Phe Lys
195 200 205
Lys Val Ser Leu Leu Arg Pro Lys Ala Thr Arg Ser Ser Ser Arg Glu
210 215 220
Ile Phe Met Val Cys Glu Gly Arg Gly Phe Ser Val Ala Pro Arg Trp
225 230 235 240
His Pro Leu Ser His Gly Pro Ala Thr Tyr Gly Thr Gly Ser Thr Cys
245 250 255
His Ala Ala Ala His Ser Leu Val Glu Leu Arg Thr Val Gly Leu Gln
260 265 270
Arg Glu Ala Pro Lys Cys Ser Asp Leu Lys Ala Gln Ala Gln Pro Ala
275 280 285
Ala Phe Val Arg Ile Pro Arg Gly Ala Ser Leu Pro Ala Thr Arg Asn
290 295 300
Ala Ala Gly Leu His Ser Thr Leu Leu Val Ala Ser Leu Leu His Ile
305 310 315 320
Thr Thr His Arg Gly Gly Thr His Phe Tyr Ile Ser Leu Ser Val Gly
325 330 335
Trp Glu Thr Pro Arg Arg Glu Glu Cys Arg Ile Pro Val Val Pro Pro
340 345 350
Gln Cys Pro Ala Pro Pro Arg Lys Arg Pro Val Ala Leu Pro Glu Leu
355 360 365
Gly Lys Glu Arg Arg Glu Pro Pro Lys Gly Gly Tyr Phe Gln Pro Pro
370 375 380
Asp Leu Glu Ser Leu Phe Val Leu Ala Pro Pro Arg Arg Gln Ala Ser
385 390 395 400
Ser Cys Ala
<210>91
<211>1187
<212>DNA
<213>稻
<400>91
ggtcagccaa tacattgatc cgttgccaat catgcaaagt attttggctg tggccgagtg 60
ccggaattga taattgtgtt ctgactaaat taaatgacca gaagtcgcta tcttccaatg 120
tatccgaaac ctggattaaa caatcctgtt ctgttctcta gcccctcctg catggccgga 180
ttgttttttt gacatgtttt cttgactgag gcctgtttgt tctaaacttt ttcttcaaac 240
ttttaacttt ttcatcacat cagaactttt ctacacacat aaacttttaa cttttctgtc 300
acatcgttcc aatttcaatc aaacttttaa ttttggcttg aactaaacac accctgagtc 360
ttttattgct cctccatacg ggttggctgg ttgagaatag gtattttcag agagaaaatc 420
tggatattgg gaggaggaac ttggcatgaa tggccactat atttagagca attctacggt 480
ctttgaggag gtaccatgag gtaccaaaat tttagtgtaa attttagtat cttcttaagg 540
accgtaaaat tgctcctata tttaagggat gtttatatct atccatatcc ataatttgat 600
tttgataaga aaaaatgtga gcacaccaag catgtccatg accttgcact cttggctcac 660
tcgtcaactg tgaagaacct aaaaaatgct caatatagct acaggtgcct gaaaaaataa 720
ctttaaagtt ttgaacatcg atttcactaa acaacaatta ttatctccct ctgaaatgtt 780
gctacctaag atgatagttt agaactctag aatcattgtc ggcggagaaa gtaaattatt 840
ttccccaaat ttccagctat gaaaaaaccc tcaccaaaca ccatcaaaca agagttcacc 900
aaaccgccca tgcggccatg ctgtcacgca acgcaccgca ttgcctgatg gccgctcgat 960
gcatgcatgc ttccccgtgc acatatccga cagacgcgcc gtgtcagcga gctcctcgac 1020
cgacctgtgt agcccatgca agcatccacc cccgccacgt acaccccctc ctcctcccta 1080
cgtgtcaccg ctctctccac ctatatatgc ccacctggcc cctctcctcc catctccact 1140
tcacccgatc gcttcttctt cttcttcgtt gcattcatct tgctagc 1187
<210>92
<211>951
<212>DNA
<213>大麦(Hordeum vulgare)
<400>92
atgggcaagg cctccaaaga caagcgggac atatactatc ggaaggccaa ggaggagggg 60
tggagggctc gcagcgcctt caagctaatg cagatcgacc aggagttcaa catcttccac 120
ggagtgaagc gcgccgttga cctgtgcgct gcccctggga gctggagcca ggttttgagc 180
cgcaatttgt acctgccggc aaagctatca tctgacggca aagatggcgg ccttcctctc 240
atcgtcgcaa tcgatctgca gccgatggct cctatagaag gtgtcataca agtgcagggc 300
gacatcacca atgctcgaac agcggaagtg gttatcaggc acttcgatgg atgcaaagcg 360
gacttggttg tctgtgatgg tgcccctgat gttactgggc ttcatgatat ggatgagttt 420
gttcagtccc agcttatatt ggcggcactg acaattgtga ctcatgtact caaagttggt 480
ggaaaatttg ttgcgaagat tttccggggt aaagatacaa gtctcctgta ttgccagtta 540
aagttgttct tctcacaagt tacatttgca aagccaaaaa gcagccgtaa ctcaagtatc 600
gaggcatttg cagtttgcga gaactactca cctccagagg gcttcaaaga gaaagacttg 660
tatcacctgc tggagaaagt gggaactcct tctggggctg atgatttaga ttgccgaagc 720
ggatggttgg agggaccaaa caaggtctac attccgtttc tggcttgcgg tgacctcagc 780
ggttatgatt cggaccgttc ataccccctc ccgagcacag aaggtggcac ctaccagagc 840
ctagatccag tccagcctcc catcgcgccg ccatacaaaa ctgcgttgga gatgaagaag 900
gcgtctagcc acggcgccgg cgcagatact agcaaatcat atgtcgaccc c 951
<210>93
<211>317
<212>PRT
<213>大麦
<400>93
Met Gly Lys Ala Ser Lys Asp Lys Arg Asp Ile Tyr Tyr Arg Lys Ala
1 5 10 15
Lys Glu Glu Gly Trp Arg Ala Arg Ser Ala Phe Lys Leu Met Gln Ile
20 25 30
Asp Gln Glu Phe Asn Ile Phe His Gly Val Lys Arg Ala Val Asp Leu
35 40 45
Cys Ala Ala Pro Gly Ser Trp Ser Gln Val Leu Ser Arg Asn Leu Tyr
50 55 60
Leu Pro Ala Lys Leu Ser Ser Asp Gly Lys Asp Gly Gly Leu Pro Leu
65 70 75 80
Ile Val Ala Ile Asp Leu Gln Pro Met Ala Pro Ile Glu Gly Val Ile
85 90 95
Gln Val Gln Gly Asp Ile Thr Asn Ala Arg Thr Ala Glu Val Val Ile
100 105 110
Arg His Phe Asp Gly Cys Lys Ala Asp Leu Val Val Cys Asp Gly Ala
115 120 125
Pro Asp Val Thr Gly Leu His Asp Met Asp Glu Phe Val Gln Ser Gln
130 135 140
Leu Ile Leu Ala Ala Leu Thr Ile Val Thr His Val Leu Lys Val Gly
145 150 155 160
Gly Lys Phe Val Ala Lys Ile Phe Arg Gly Lys Asp Thr Ser Leu Leu
165 170 175
Tyr Cys Gln Leu Lys Leu Phe Phe Ser Gln Val Thr Phe Ala Lys Pro
180 185 190
Lys Ser Ser Arg Asn Ser Ser Ile Glu Ala Phe Ala Val Cys Glu Asn
195 200 205
Tyr Ser Pro Pro Glu Gly Phe Lys Glu Lys Asp Leu Tyr His Leu Leu
210 215 220
Glu Lys Val Gly Thr Pro Ser Gly Ala Asp Asp Leu Asp Cys Arg Ser
225 230 235 240
Gly Trp Leu Glu Gly Pro Asn Lys Val Tyr Ile Pro Phe Leu Ala Cys
245 250 255
Gly Asp Leu Ser Gly Tyr Asp Ser Asp Arg Ser Tyr Pro Leu Pro Ser
260 265 270
Thr Glu Gly Gly Thr Tyr Gln Ser Leu Asp Pro Val Gln Pro Pro Ile
275 280 285
Ala Pro Pro Tyr Lys Thr Ala Leu Glu Met Lys Lys Ala Ser Ser His
290 295 300
Gly Ala Gly Ala Asp Thr Ser Lys Ser Tyr Val Asp Pro
305 310 315
<210>94
<211>1414
<212>DNA
<213>两色蜀黍(Sorghum bicolor)
<400>94
gcacgagggc ccagtgggct caaaacactt ggcggcgcca cctcgccctc ctccgactac 60
tcgctcgctc gtcccgcccc gtcttccgcc cccgcctccg cccccgccgc ccttggctcg 120
caccagcgcc acctcgccct cctccgacta ctcgctcgct cgtcccgccc cgtcttccgc 180
ctccgcctcc gccgccgccg cccttggttc gcctcatcgt cgtcgccatg ggcaaggcct 240
ccaaggacaa gagagacatc tactaccgga aggccaaaga ggagggatgg agagctcgca 300
gcgccttcaa gctcctccaa atagaccagg agttcaacat cttccatgga gtgaagcgcg 360
tggttgatct gtgtgctgct cccggaagct ggagccaggt tttgagccgg aacttgtatg 420
taccagcaaa acagtctcct gattgcaagg aaggtgacct tcctctcatc gttgcaattg 480
acttgcaacc aatggccccg atagaaggtg ttatacaagt gcagggtgac atcaccaatg 540
ctcggacagc ggaagtggtt attaggcatt ttgatggatg caaagcagac ttggttgttt 600
gcgatggagc tccggatgtt actggccttc atgatatgga cgaatttgtt cagtcccagc 660
ttatacttgc ggcattgact atcgtgactc atgtactcaa agttggtgga aaatttgtcg 720
caaagatatt tcggggtaaa gatacaagtc tcctgtactg ccagctaaaa ctgttcttct 780
cacaagttac atttgcgaag ccaaaaagta gccggaactc aagcattgag gcatttgcag 840
tttgtgagaa ctattcacct ccagaagggt tcaaggagga agatctatac cacctgctag 900
agaaagtagg gactccttca ggagttgacg atttagattg cagaagcgga tggctcgagg 960
gaccaaacaa ggtgtatatc ccgttccttg cctgtgggga tctcagtggc tacgactccg 1020
accgctcata cccgctccca atcacagacg gtggctccta ccggagcttg gaccccgtcc 1080
agcctcccat cgccccgcct tacaaaaccg cccttcagat gaagaaggcc tccagccaca 1140
gcgccagcag ggacgccatg aaaccatcca cagactcttg agctgcaacc tgggccagcc 1200
tgaaccccca ggcgatgatg tttgtcccac actggtagca tcgctgggtc ctggacctgg 1260
ctctctcctg agcctcgtct attaaaaagg aaaaagaaaa tttgggaaca ttttgtgtcg 1320
aggtgggaca ttttgtggta gttttgagct gtggctccgc agcatgtacc tgatcactac 1380
tgattacgca gagatcctgc ttgtgtcctt gtgc 1414
<210>95
<211>317
<212>PRT
<213>两色蜀黍
<400>95
Met Gly Lys Ala Ser Lys Asp Lys Arg Asp Ile Tyr Tyr Arg Lys Ala
1 5 10 15
Lys Glu Glu Gly Trp Arg Ala Arg Ser Ala Phe Lys Leu Leu Gln Ile
20 25 30
Asp Gln Glu Phe Asn Ile Phe His Gly Val Lys Arg Val Val Asp Leu
35 40 45
Cys Ala Ala Pro Gly Ser Trp Ser Gln Val Leu Ser Arg Asn Leu Tyr
50 55 60
Val Pro Ala Lys Gln Ser Pro Asp Cys Lys Glu Gly Asp Leu Pro Leu
65 70 75 80
Ile Val Ala Ile Asp Leu Gln Pro Met Ala Pro Ile Glu Gly Val Ile
85 90 95
Gln Val Gln Gly Asp Ile Thr Asn Ala Arg Thr Ala Glu Val Val Ile
100 105 110
Arg His Phe Asp Gly Cys Lys Ala Asp Leu Val Val Cys Asp Gly Ala
115 120 125
Pro Asp Val Thr Gly Leu His Asp Met Asp Glu Phe Val Gln Ser Gln
130 135 140
Leu Ile Leu Ala Ala Leu Thr Ile Val Thr His Val Leu Lys Val Gly
145 150 155 160
Gly Lys Phe Val Ala Lys Ile Phe Arg Gly Lys Asp Thr Ser Leu Leu
165 170 175
Tyr Cys Gln Leu Lys Leu Phe Phe Ser Gln Val Thr Phe Ala Lys Pro
180 185 190
Lys Ser Ser Arg Asn Ser Ser Ile Glu Ala Phe Ala Val Cys Glu Asn
195 200 205
Tyr Ser Pro Pro Glu Gly Phe Lys Glu Glu Asp Leu Tyr His Leu Leu
210 215 220
Glu Lys Val Gly Thr Pro Ser Gly Val Asp Asp Leu Asp Cys Arg Ser
225 230 235 240
Gly Trp Leu Glu Gly Pro Asn Lys Val Tyr Ile Pro Phe Leu Ala Cys
245 250 255
Gly Asp Leu Ser Gly Tyr Asp Ser Asp Arg Ser Tyr Pro Leu Pro Ile
260 265 270
Thr Asp Gly Gly Ser Tyr Arg Ser Leu Asp Pro Val Gln Pro Pro Ile
275 280 285
Ala Pro Pro Tyr Lys Thr Ala Leu Gln Met Lys Lys Ala Ser Ser His
290 295 300
Ser Ala Ser Arg Asp Ala Met Lys Pro Ser Thr Asp Ser
305 310 315
<210>96
<211>1008
<212>DNA
<213>欧洲油菜(Brassica napus)
<400>96
atgggaaaag cttctcggga taaaagggat atatactatc ggaaagccaa agaagaaggg 60
tggcgtgcaa gaagtgcctt taagcttctt cagattgatg aggagttcaa catttttcaa 120
ggagtgaaga gggttgtaga tttatgtgct gcacctggta gctggagtca ggttctgagt 180
cgtcaactgt atcttcctgc aaagtattca gctgagtcaa aagaagaaga tcttcctctt 240
attgtggcca tagatttgca gcctatggct ccaatcgaag gtgtaatcca agttcaaggg 300
gacataacta atgctcggac tgccgaagtg gtcattagac attttgacgg ttgcaaggct 360
gacctggttg tgtgtgatgg tgctccagat gttaccggtt tgcatgacat ggatgaattt 420
gtccagtccc aactcatact agcgggctta acgattgtaa cccatattct taaagaaggt 480
ggaaaattca ttgcaaagat attccgtgga aaagatacaa gtctcttgta ctgtcagctg 540
aagttgtttt tcccaactgt gacttttgcg aaacctaaaa gcagccgcaa ttctagtata 600
gaagcttttg ctgtctgcga aaattactcc ccaccagaag gatttaaccc gagagatctg 660
catcttctct tggagaaagt cggaagccct tcaggtggaa gcgatctcga ttgcagtagt 720
ggttggctcg agggacccaa caaagtttat attccattct tggcatgtgg tgacttaagc 780
ggttatgact cggaccggtc ttacccactc ccaaaagagg cagatggatc gtcataccga 840
agcctggacc cgattcagcc tccgatcgca ccgccttata aacgagctat tgagctcaag 900
aaagcttcag cacaaagcct caactcttaa agctaggctc gataacaata ataatgctaa 960
acaaagacac agaaagaagt ttttcattcg attcttagaa ggctgtag 1008
<210>97
<211>309
<212>PRT
<213>欧洲油菜
<400>97
Met Gly Lys Ala Ser Arg Asp Lys Arg Asp Ile Tyr Tyr Arg Lys Ala
1 5 10 15
Lys Glu Glu Gly Trp Arg Ala Arg Ser Ala Phe Lys Leu Leu Gln Ile
20 25 30
Asp Glu Glu Phe Asn Ile Phe Gln Gly Val Lys Arg Val Val Asp Leu
35 40 45
Cys Ala Ala Pro Gly Ser Trp Ser Gln Val Leu Ser Arg Gln Leu Tyr
50 55 60
Leu Pro Ala Lys Tyr Ser Ala Glu Ser Lys Glu Glu Asp Leu Pro Leu
65 70 75 80
Ile Val Ala Ile Asp Leu Gln Pro Met Ala Pro Ile Glu Gly Val Ile
85 90 95
Gln Val Gln Gly Asp Ile Thr Asn Ala Arg Thr Ala Glu Val Val Ile
100 105 110
Arg His Phe Asp Gly Cys Lys Ala Asp Leu Val Val Cys Asp Gly Ala
115 120 125
Pro Asp Val Thr Gly Leu His Asp Met Asp Glu Phe Val Gln Ser Gln
130 135 140
Leu Ile Leu Ala Gly Leu Thr Ile Val Thr His Ile Leu Lys Glu Gly
145 150 155 160
Gly Lys Phe Ile Ala Lys Ile Phe Arg Gly Lys Asp Thr Ser Leu Leu
165 170 175
Tyr Cys Gln Leu Lys Leu Phe Phe Pro Thr Val Thr Phe Ala Lys Pro
180 185 190
Lys Ser Ser Arg Asn Ser Ser Ile Glu Ala Phe Ala Val Cys Glu Asn
195 200 205
Tyr Ser Pro Pro Glu Gly Phe Asn Pro Arg Asp Leu His Leu Leu Leu
210 215 220
Glu Lys Val Gly Ser Pro Ser Gly Gly Ser Asp Leu Asp Cys Ser Ser
225 230 235 240
Gly Trp Leu Glu Gly Pro Asn Lys Val Tyr Ile Pro Phe Leu Ala Cys
245 250 255
Gly Asp Leu Ser Gly Tyr Asp Ser Asp Arg Ser Tyr Pro Leu Pro Lys
260 265 270
Glu Ala Asp Gly Ser Ser Tyr Arg Ser Leu Asp Pro Ile Gln Pro Pro
275 280 285
Ile Ala Pro Pro Tyr Lys Arg Ala Ile Glu Leu Lys Lys Ala Ser Ala
290 295 300
Gln Ser Leu Asn Ser
305
<210>98
<211>1446
<212>DNA
<213>大豆(Glycine max)
<400>98
gagaagcaaa caaaccctag cgcagagaag agatattctt cttcgcagaa tcattgcagt 60
tgcgagcagg ccgaagaaac ctaacctgca ttcgaaaatc agcccccttg gaaatcccaa 120
cactagtgtg gtacctgtgc tcgacgattg ggtgttcaag gggaattagc ttcgtctcgc 180
agaacttcaa cgcatcattc gtgaccttcg caaacgcggg gtttgttctt atttggtttt 240
gccagttgtt gccatcaggg gtttgtttct gaaatttgtg gcagggcaag tgagcgataa 300
accatgggga gagcttcaag ggataagagg gatatctatt accggaaagc aaaagaagaa 360
ggttggcgag ctcgaagtgc gtttaaactc cttcagatag acgaggaatt caaccttttt 420
gatggagtga agcgtgttgt agatttatgt gctgccccag gtagctggag tcaggttttg 480
agtcgtaaat tgtatctccc agccaagctt gcacctgatg caaaggatga aaatcttcct 540
cttattgtag ctattgattt gcaaccaatg gctccaattg aaggtgtcat ccaggtgcag 600
ggtgatataa ctaacgctcg gacagctgaa gtggtcatta gacattttga tggttgcaag 660
gctgacctag ttgtgtgtga tggtgcgcct gatgttactg gccttcatga catggatgaa 720
tttgtacaat cccaactctt acttgcaggg ttgacaattg ttactcatgt acttaaggaa 780
ggagggaagt ttattgcaaa gatatttaga ggaaaggaca caagccttct atattgtcag 840
ctaaaattat ttttccctgt agtgacgttc gcaaaaccaa aaagcagccg taattccagc 900
atagaggcat ttgcagtttg tgaaaactat tcccctcctg aaggattcaa tccaaaagat 960
cttcatcgcc ttcttgagaa ggttggaagt ccctcagggg tagatgatac agattgttgt 1020
agtggttggc tggaaggccc taataaggtg tatatcccat ttctagcttg tggtgacctc 1080
agtgggtatg attctgatcg ctcatatcca ctacctaaag ttgccggggg aacatatcag 1140
agcttggatc ctgtgcagcc ccctattgcc ccaccttaca agagagcttt ggagttaaaa 1200
aaagcttcca gtcaaggatt ccgtgaactt gaaaacctct cattggattc ttgatcgtgc 1260
tatgcactgt ttattcatca tgtcgtttgg aattttagtt tttgttacaa tgatatgatt 1320
tgtgttttga taattattag cgtacgtgtg aactttaaca cttttttctc ttgtaccatc 1380
attgcatgcc tagcgagtct tttgttatcg caattttttg aaatgaatac aactatttta 1440
taaaaa 1446
<210>99
<211>316
<212>PRT
<213>大豆
<400>99
Met Gly Arg Ala Ser Arg Asp Lys Arg Asp Ile Tyr Tyr Arg Lys Ala
1 5 10 15
Lys Glu Glu Gly Trp Arg Ala Arg Ser Ala Phe Lys Leu Leu Gln Ile
20 25 30
Asp Glu Glu Phe Asn Leu Phe Asp Gly Val Lys Arg Val Val Asp Leu
35 40 45
Cys Ala Ala Pro Gly Ser Trp Ser Gln Val Leu Ser Arg Lys Leu Tyr
50 55 60
Leu Pro Ala Lys Leu Ala Pro Asp Ala Lys Asp Glu Asn Leu Pro Leu
65 70 75 80
Ile Val Ala Ile Asp Leu Gln Pro Met Ala Pro Ile Glu Gly Val Ile
85 90 95
Gln Val Gln Gly Asp Ile Thr Asn Ala Arg Thr Ala Glu Val Val Ile
100 105 110
Arg His Phe Asp Gly Cys Lys Ala Asp Leu Val Val Cys Asp Gly Ala
115 120 125
Pro Asp Val Thr Gly Leu His Asp Met Asp Glu Phe Val Gln Ser Gln
130 135 140
Leu Leu Leu Ala Gly Leu Thr Ile Val Thr His Val Leu Lys Glu Gly
145 150 155 160
Gly Lys Phe Ile Ala Lys Ile Phe Arg Gly Lys Asp Thr Ser Leu Leu
165 170 175
Tyr Cys Gln Leu Lys Leu Phe Phe Pro Val Val Thr Phe Ala Lys Pro
180 185 190
Lys Ser Ser Arg Asn Ser Ser Ile Glu Ala Phe Ala Val Cys Glu Asn
195 200 205
Tyr Ser Pro Pro Glu Gly Phe Asn Pro Lys Asp Leu His Arg Leu Leu
210 215 220
Glu Lys Val Gly Ser Pro Ser Gly Val Asp Asp Thr Asp Cys Cys Ser
225 230 235 240
Gly Trp Leu Glu Gly Pro Asn Lys Val Tyr Ile Pro Phe Leu Ala Cys
245 250 255
Gly Asp Leu Ser Gly Tyr Asp Ser Asp Arg Ser Tyr Pro Leu Pro Lys
260 265 270
Val Ala Gly Gly Thr Tyr Gln Ser Leu Asp Pro Val Gln Pro Pro Ile
275 280 285
Ala Pro Pro Tyr Lys Arg Ala Leu Glu Leu Lys Lys Ala Ser Ser Gln
290 295 300
Gly Phe Arg Glu Leu Glu Asn Leu Ser Leu Asp Ser
305 310 315
<210>100
<211>1201
<212>DNA
<213>玉米
<400>100
ccacgtcctc ctccggctac tcgctcgttc cgccccggcg tcccgccctc agccgccgcc 60
gtcgccccct ccctcggttc gcctcgtcgt cgtcatgggc aaggcctcca aggacaagag 120
ggacatctac taccggaagg ccaaagagga aggctggaga gctcgcagcg ccttcaagct 180
cctccagata gaccaggagt tcaacatctt ccatggagtg aagcatgtgg ttgacctgtg 240
tgctgctccc ggaagttgga gccaggtttt gagccggaac ctgtatgtac cagcaaaaca 300
gtcttctgat tgcaaggaag gtgatcttcc tctcatcgtc gcaattgact tgcaaccaat 360
ggccccaata gaaggtgtta tacaagtgca gggcgacatc accaatgctc ggacagcaga 420
cgtggttatt aggcattttg atggatgcaa agcagacttg gttgtttgcg atggagcccc 480
ggatgttact ggccttcatg atatggatga atttgttcag tcccagctta tactcgcggc 540
attggctatc gtgactcatg tactcaaagt tggtggaaaa tttgtggcga agatatttcg 600
gggtaaagat acaagtctcc tgtactgcca gctaaaactg ttcttctcgc aagttacgtt 660
cgccaagcca aaaagtagcc ggaactcaag catcgaggcg tttgcggtct gtgagaacta 720
ctcacctcct gaagggttca aggaggaaga cctataccac ctgctagaga aagtgggtac 780
tccctcagga gctggcgatc tagattgcag aagcggatgg ctggagggac caaacaaggt 840
gtacatcccg ttcctggcct gcggggatct cagcggctac gactccgacc gctcgtaccc 900
gctgcccagc agcacggacg gtggctcgta ccggagcctg gaccccgtgc agcctcccat 960
cgccccgcct tacaagaccg ccctgcagat gaagaaggct tccagccacg gcgccggcgc 1020
ggacgccatc aagccgtccg cagactcctg agccgcagac cgtttccgtt taccaccttg 1080
cgcggtggaa gttgctttcg ctgggtcctg gacctggctc tctagtctct ctctacagaa 1140
acagaacctt catctacgaa actaaaaaaa aaggaaaaag gattggaaaa aaaaaaaaaa 1200
a 1201
<210>101
<211>318
<212>PRT
<213>玉米
<400>101
Met Gly Lys Ala Ser Lys Asp Lys Arg Asp Ile Tyr Tyr Arg Lys Ala
1 5 10 15
Lys Glu Glu Gly Trp Arg Ala Arg Ser Ala Phe Lys Leu Leu Gln Ile
20 25 30
Asp Gln Glu Phe Asn Ile Phe His Gly Val Lys His Val Val Asp Leu
35 40 45
Cys Ala Ala Pro Gly Ser Trp Ser Gln Val Leu Ser Arg Asn Leu Tyr
50 55 60
Val Pro Ala Lys Gln Ser Ser Asp Cys Lys Glu Gly Asp Leu Pro Leu
65 70 75 80
Ile Val Ala Ile Asp Leu Gln Pro Met Ala Pro Ile Glu Gly Val Ile
85 90 95
Gln Val Gln Gly Asp Ile Thr Asn Ala Arg Thr Ala Asp Val Val Ile
100 105 110
Arg His Phe Asp Gly Cys Lys Ala Asp Leu Val Val Cys Asp Gly Ala
115 120 125
Pro Asp Val Thr Gly Leu His Asp Met Asp Glu Phe Val Gln Ser Gln
130 135 140
Leu Ile Leu Ala Ala Leu Ala Ile Val Thr His Val Leu Lys Val Gly
145 150 155 160
Gly Lys Phe Val Ala Lys Ile Phe Arg Gly Lys Asp Thr Ser Leu Leu
165 170 175
Tyr Cys Gln Leu Lys Leu Phe Phe Ser Gln Val Thr Phe Ala Lys Pro
180 185 190
Lys Ser Ser Arg Asn Ser Ser Ile Glu Ala Phe Ala Val Cys Glu Asn
195 200 205
Tyr Ser Pro Pro Glu Gly Phe Lys Glu Glu Asp Leu Tyr His Leu Leu
210 215 220
Glu Lys Val Gly Thr Pro Ser Gly Ala Gly Asp Leu Asp Cys Arg Ser
225 230 235 240
Gly Trp Leu Glu Gly Pro Asn Lys Val Tyr Ile Pro Phe Leu Ala Cys
245 250 255
Gly Asp Leu Ser Gly Tyr Asp Ser Asp Arg Ser Tyr Pro Leu Pro Ser
260 265 270
Ser Thr Asp Gly Gly Ser Tyr Arg Ser Leu Asp Pro Val Gln Pro Pro
275 280 285
Ile Ala Pro Pro Tyr Lys Thr Ala Leu Gln Met Lys Lys Ala Ser Ser
290 295 300
His Gly Ala Gly Ala Asp Ala Ile Lys Pro Ser Ala Asp Ser
305 310 315
<210>102
<211>732
<212>DNA
<213>万寿菊(Tagetes erecta)
<400>102
aaagcaaaag aagaaggttg gcgtgcacga agtgcgttta agctccttca aattgatgag 60
gagtttaaca tctttgaagg agtgaagcgt gtggtcgatt tatgcgcagc acctggtagc 120
tggagtcagg ttttaagtcg taagctgtat ctcccagcta aacagtcatc tgaccttccg 180
cttatcgtgg ctattgattt acaacccatg gctccaattg aaggtgtgat ccaagttcaa 240
ggagatatta caaatgctag aaccgctgaa gtggttatta gacattttga cggatgcaag 300
gctgacctag ttgtctgtga cggtgctcct gatgtaactg gacttcatga catggacgaa 360
tttgttcagt cacaactgat attggcgggg ttgacaattg tcactcacat tctcaagaaa 420
ggtggaaagt ttattgcaaa gatcttcagg ggaaaggata cgagcctctt atattgtcag 480
ctaaaactat ttttcacaga ggttacgctt gcaaaaccaa aaagtagtcg aaattcaagc 540
atagaggcat ttgctgtttg tgagaattat acacctccag aaggattcaa tgaaaaagat 600
ttgcatcgcc tcctagagaa ggtcggaact ccatctggtg cagacaattt agattgtagt 660
agtggatggt tagaagggcc aaacaaggtt tatataccat ttcttgcttg tggggacctt 720
agtggttatg ac 732
<210>103
<211>244
<212>PRT
<213>万寿菊
<400>103
Lys Ala Lys Glu Glu Gly Trp Arg Ala Arg Ser Ala Phe Lys Leu Leu
1 5 10 15
Gln Ile Asp Glu Glu Phe Asn Ile Phe Glu Gly Val Lys Arg Val Val
20 25 30
Asp Leu Cys Ala Ala Pro Gly Ser Trp Ser Gln Val Leu Ser Arg Lys
35 40 45
Leu Tyr Leu Pro Ala Lys Gln Ser Ser Asp Leu Pro Leu Ile Val Ala
50 55 60
Ile Asp Leu Gln Pro Met Ala Pro Ile Glu Gly Val Ile Gln Val Gln
65 70 75 80
Gly Asp Ile Thr Asn Ala Arg Thr Ala Glu Val Val Ile Arg His Phe
85 90 95
Asp Gly Cys Lys Ala Asp Leu Val Val Cys Asp Gly Ala Pro Asp Val
100 105 110
Thr Gly Leu His Asp Met Asp Glu Phe Val Gln Ser Gln Leu Ile Leu
115 120 125
Ala Gly Leu Thr Ile Val Thr His Ile Leu Lys Lys Gly Gly Lys Phe
130 135 140
Ile Ala Lys Ile Phe Arg Gly Lys Asp Thr Ser Leu Leu Tyr Cys Gln
145 150 155 160
Leu Lys Leu Phe Phe Thr Glu Val Thr Leu Ala Lys Pro Lys Ser Ser
165 170 175
Arg Asn Ser Ser Ile Glu Ala Phe Ala Val Cys Glu Asn Tyr Thr Pro
180 185 190
Pro Glu Gly Phe Asn Glu Lys Asp Leu His Arg Leu Leu Glu Lys Val
195 200 205
Gly Thr Pro Ser Gly Ala Asp Asn Leu Asp Cys Ser Ser Gly Trp Leu
210 215 220
Glu Gly Pro Asn Lys Val Tyr Ile Pro Phe Leu Ala Cys Gly Asp Leu
225 230 235 240
Ser Gly Tyr Asp
<210>104
<211>1770
<212>DNA
<213>拟南芥
<400>104
atggctccga cgaatgttca agtaaccgat taccatctca accaatcaaa aacggataca 60
acaaatctct ggtcaaccga cgacgatgca tcggtaatgg aagctttcat cggcggcggc 120
tccgatcatt cttctctttt tcctccactt cctcctcctc ctcttcctca agtcaacgaa 180
gataatctcc agcaacgtct ccaagcttta atcgaaggag caaacgagaa ctggacttac 240
gccgtgttct ggcaatcatc tcacggtttc gccggagaag acaacaacaa caacaacaca 300
gtgttgttag gttggggaga tggttattac aaaggagaag aagagaagtc tagaaagaag 360
aaatcaaatc cagctagtgc agctgaacaa gagcatcgta agagagtgat tagagagctc 420
aactctttaa tctccggtgg tgtaggagga ggagatgaag ctggagatga agaagttaca 480
gatactgaat ggttcttctt agtttcaatg acacagagct ttgtcaaggg tactggttta 540
cctggtcaag ctttctcaaa ttcagacacg atttggttat ctggttctaa tgctttagct 600
ggatcaagtt gtgagagagc tcgtcaaggt cagatttatg ggttacaaac aatggtgtgt 660
gtagcgacag agaatggtgt cgttgagctt ggttcgtcgg agattattca tcaaagttca 720
gatcttgttg ataaagttga cacctttttc aattttaaca atggtggtgg tgaatttggt 780
tcttgggcgt ttaatttgaa tccagatcaa ggagagaatg atccaggttt gtggattagt 840
gaacctaatg gtgttgactc tggtcttgta gctgctccgg tgatgaataa tggtggaaat 900
gactcaactt ctaattctga ttctcaacca atttctaagc tttgtaatgg aagctctgtt 960
gaaaacccta accctaaagt tctgaaatct tgtgaaatgg tgaatttcaa gaatgggatt 1020
gagaatggtc aagaagaaga tagtagtaat aagaagagat caccggtttc gaataatgaa 1080
gaagggatgc tttcttttac ctctgttctt ccatgtgact cgaatcactc tgatcttgaa 1140
gcttcagtgg ctaaagaagc tgagagtaac agagttgtgg ttgaaccgga gaagaaaccg 1200
aggaaacgag ggagaaaacc ggcgaatgga agagaagagc ctttgaatca tgtagaggca 1260
gagagacaga gaagagagaa gttgaatcag agattctatt ctttaagagc tgtggttcct 1320
aatgtgtcta agatggataa agcttctcta ttaggagatg ctatttcgta tatcagtgag 1380
cttaagtcta agttgcaaaa ggctgaatct gataaagaag agttgcagaa gcagattgat 1440
gtgatgaata aagaagcggg aaatgcgaaa agttcggtaa aagatcgaaa atgtttgaat 1500
caagaatcga gtgtgttgat agagatggag gttgatgtga agattattgg ttgggatgca 1560
atgataagga ttcaatgtag taagaggaat catcctggtg ctaagttcat ggaagcactt 1620
aaggagttgg atttggaagt gaatcatgcg agtttatcgg tagtgaatga tcttatgatc 1680
caacaagcga ctgtgaaaat ggggaatcag tttttcacgc aagatcaact caaggttgct 1740
ctaacggaga aagttggaga atgtccatga 1770
<210>105
<211>589
<212>PRT
<213>拟南芥
<400>105
Met Ala Pro Thr Asn Val Gln Val Thr Asp Tyr His Leu Asn Gln Ser
1 5 10 15
Lys Thr Asp Thr Thr Asn Leu Trp Ser Thr Asp Asp Asp Ala Ser Val
20 25 30
Met Glu Ala Phe Ile Gly Gly Gly Ser Asp His Ser Ser Leu Phe Pro
35 40 45
Pro Leu Pro Pro Pro Pro Leu Pro Gln Val Asn Glu Asp Asn Leu Gln
50 55 60
Gln Arg Leu Gln Ala Leu Ile Glu Gly Ala Asn Glu Asn Trp Thr Tyr
65 70 75 80
Ala Val Phe Trp Gln Ser Ser His Gly Phe Ala Gly Glu Asp Asn Asn
85 90 95
Asn Asn Asn Thr Val Leu Leu Gly Trp Gly Asp Gly Tyr Tyr Lys Gly
100 105 110
Glu Glu Glu Lys Ser Arg Lys Lys Lys Ser Asn Pro Ala Ser Ala Ala
115 120 125
Glu Gln Glu His Arg Lys Arg Val Ile Arg Glu Leu Asn Ser Leu Ile
130 135 140
Ser Gly Gly Val Gly Gly Gly Asp Glu Ala Gly Asp Glu Glu Val Thr
145 150 155 160
Asp Thr Glu Trp Phe Phe Leu Val Ser Met Thr Gln Ser Phe Val Lys
165 170 175
Gly Thr Gly Leu Pro Gly Gln Ala Phe Ser Asn Ser Asp Thr Ile Trp
180 185 190
Leu Ser Gly Ser Asn Ala Leu Ala Gly Ser Ser Cys Glu Arg Ala Arg
195 200 205
Gln Gly Gln Ile Tyr Gly Leu Gln Thr Met Val Cys Val Ala Thr Glu
210 215 220
Asn Gly Val Val Glu Leu Gly Ser Ser Glu Ile Ile His Gln Ser Ser
225 230 235 240
Asp Leu Val Asp Lys Val Asp Thr Phe Phe Asn Phe Asn Asn Gly Gly
245 250 255
Gly Glu Phe Gly Ser Trp Ala Phe Asn Leu Asn Pro Asp Gln Gly Glu
260 265 270
Asn Asp Pro Gly Leu Trp Ile Ser Glu Pro Asn Gly Val Asp Ser Gly
275 280 285
Leu Val Ala Ala Pro Val Met Asn Asn Gly Gly Asn Asp Ser Thr Ser
290 295 300
Asn Ser Asp Ser Gln Pro Ile Ser Lys Leu Cys Asn Gly Ser Ser Val
305 310 315 320
Glu Asn Pro Asn Pro Lys Val Leu Lys Ser Cys Glu Met Val Asn Phe
325 330 335
Lys Asn Gly Ile Glu Asn Gly Gln Glu Glu Asp Ser Ser Asn Lys Lys
340 345 350
Arg Ser Pro Val Ser Asn Asn Glu Glu Gly Met Leu Ser Phe Thr Ser
355 360 365
Val Leu Pro Cys Asp Ser Asn His Ser Asp Leu Glu Ala Ser Val Ala
370 375 380
Lys Glu Ala Glu Ser Asn Arg Val Val Val Glu Pro Glu Lys Lys Pro
385 390 395 400
Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu Asn
405 410 415
His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg Phe
420 425 430
Tyr Ser Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys Ala
435 440 445
Ser Leu Leu Gly Asp Ala Ile Ser Tyr Ile Ser Glu Leu Lys Ser Lys
450 455 460
Leu Gln Lys Ala Glu Ser Asp Lys Glu Glu Leu Gln Lys Gln Ile Asp
465 470 475 480
Val Met Asn Lys Glu Ala Gly Asn Ala Lys Ser Ser Val Lys Asp Arg
485 490 495
Lys Cys Leu Asn Gln Glu Ser Ser Val Leu Ile Glu Met Glu Val Asp
500 505 510
Val Lys Ile Ile Gly Trp Asp Ala Met Ile Arg Ile Gln Cys Ser Lys
515 520 525
Arg Asn His Pro Gly Ala Lys Phe Met Glu Ala Leu Lys Glu Leu Asp
530 535 540
Leu Glu Val Asn His Ala Ser Leu Ser Val Val Asn Asp Leu Met Ile
545 550 555 560
Gln Gln Ala Thr Val Lys Met Gly Asn Gln Phe Phe Thr Gln Asp Gln
565 570 575
Leu Lys Val Ala Leu Thr Glu Lys Val Gly Glu Cys Pro
580 585
<210>106
<211>1130
<212>DNA
<213>稻
<400>106
catgcggcta atgtagatgc tcactgcgct agtagtaagg tactccagta cattatggaa 60
tatacaaagc tgtaatactc gtatcagcaa gagagaggca cacaagttgt agcagtagca 120
caggattaga aaaacgggac gacaaatagt aatggaaaaa caaaaaaaaa caaggaaaca 180
catggcaata taaatggaga aatcacaaga ggaacagaat ccgggcaata cgctgcgaaa 240
gtactcgtac gtaaaaaaaa gaggcgcatt catgtgtgga cagcgtgcag cagaagcagg 300
gatttgaaac cactcaaatc caccactgca aaccttcaaa cgaggccatg gtttgaagca 360
tagaaagcac aggtaagaag cacaacgccc tcgctctcca ccctcccacc caatcgcgac 420
gcacctcgcg gatcggtgac gtggcctcgc cccccaaaaa tatcccgcgg cgtgaagctg 480
acaccccggg cccacccacc tgtcacgttg gcacatgttg gttatggttc ccggccgcac 540
caaaatatca acgcggcgcg gcccaaaatt tccaaaatcc cgcccaagcc cctggcgcgt 600
gccgctcttc cacccaggtc cctctcgtaa tccataatgg cgtgtgtacc ctcggctggt 660
tgtacgtggg cgggttaccc tgggggtgtg ggtggatgac gggtgggccc ggaggaggtc 720
cggccccgcg cgtcatcgcg gggcggggtg tagcgggtgc gaaaaggagg cgatcggtac 780
gaaaattcaa attaggaggt ggggggcggg gcccttggag aataagcgga atcgcagata 840
tgcccctgac ttggcttggc tcctcttctt cttatccctt gtcctcgcaa ccccgcttcc 900
ttctctcctc tcctcttctc ttctcttctc tggtggtgtg ggtgtgtccc tgtctcccct 960
ctccttcctc ctctcctttc ccctcctctc ttcccccctc tcacaagaga gagagcgcca 1020
gactctcccc aggtgaggtg agaccagtct ttttgctcga ttcgacgcgc ctttcacgcc 1080
gcctcgcgcg gatctgaccg cttccctcgg ccttctcgca ggattcagcc 1130
<210>107
<211>53
<212>DNA
<213>人工序列
<220>
<223>引物:prm06763
<400>107
ggggacaagt ttgtacaaaa aagcaggctt aaacaatggc tccgacgaat gtt 53
<210>108
<211>50
<212>DNA
<213>人工序列
<220>
<223>引物:prm06764
<400>108
ggggaccact ttgtacaaga aagctgggtt gctgacttca attcatggac 50
<210>109
<211>1779
<212>DNA
<213>拟南芥
<400>109
atgaacggca caacatcatc aatcaacttc ttgacctccg acgatgacgc gtcggcggcg 60
gctatggaag ctttcattgg aacaaaccac cactcatctc tctttcctcc accaccacaa 120
caaccacctc agcctcagtt caacgaagat actcttcaac aacgtctcca agctttaata 180
gaatccgccg gagaaaactg gacttacgct atcttctggc agatctcaca cgacttcgat 240
tcatccaccg gagataacac agtgatcctc ggctggggag atggttacta caaaggagag 300
gaagataaag agaagaagaa gaacaacacc aacacggcgg agcaagagca tcggaaaaga 360
gtaatacgtg agcttaactc gttaatctcc ggcggaattg gggtttccga tgaatcaaac 420
gatgaagaag taacagatac tgaatggttc ttcttagttt cgatgactca aagcttcgtt 480
aacggtgttg gtctccccgg agaatctttc ttaaactctc gtgtgatttg gttatccggg 540
tctggtgctt taaccgggtc gggttgtgaa agagcgggtc aaggtcagat ttacgggtta 600
aagacgatgg tgtgtatcgc gactcaaaac ggcgtcgttg agcttggttc gtcggaggtt 660
ataagtcaaa gctcagatct gatgcataaa gttaacaact tgtttaattt caacaacggt 720
ggtggaaaca atggtgttga agcttcttcg tggggtttta atctgaatcc agatcaagga 780
gagaatgatc cagctttgtg gattagtgaa ccgacgaaca ccggaatcga atctccggcg 840
agggttaata atggtaataa ctcgaattct aattctaagt ctgattctca tcaaatttct 900
aagcttgaga agaatgatat tagctctgta gagaatcaga atcgtcaaag ttcgtgtctt 960
gtcgagaaag atttgacctt tcaaggtggg ttgttgaaat ctaatgagac tttgagtttc 1020
tgtggtaatg agagtagtaa gaagagaact tcggtatcta aagggagtaa taatgatgaa 1080
gggatgcttt cgtttagtac tgtggttaga tcagctgcga atgattcgga tcattctgat 1140
cttgaagcat ctgttgttaa ggaagcgatt gttgttgagc caccggagaa gaagccgagg 1200
aaacggggga ggaaaccggc gaatgggaga gaagagccgt tgaatcatgt tgaagcagag 1260
aggcagagaa gagagaagtt aaaccagaga ttctactctt tgagagctgt tgttcctaac 1320
gtttcgaaga tggataaagc ttcgcttctc ggagacgcga tttcgtatat caatgagctt 1380
aagtcgaagc tgcagcaagc ggagtctgat aaagaggaga ttcagaagaa gctagatggg 1440
atgagtaagg aagggaataa tgggaaaggt tgcgggtcaa gggcaaaaga acggaaaagt 1500
tcgaatcaag attctacggc gagttctata gaaatggaga ttgatgttaa gatcataggt 1560
tgggatgtga tgatacgtgt acaatgcggc aagaaagatc atcccggtgc taggttcatg 1620
gaagcactta aggaattgga tttggaagtg aatcatgcga gtttatccgt tgtgaatgat 1680
ttgatgattc aacaagctac ggtgaagatg gggagccaat ttttcaatca tgaccagctc 1740
aaagttgctt tgatgacgaa agtcggagaa aactattga 1779
<210>110
<211>592
<212>PRT
<213>拟南芥
<400>110
Met Asn Gly Thr Thr Ser Ser Ile Asn Phe Leu Thr Ser Asp Asp Asp
1 5 10 15
Ala Ser Ala Ala Ala Met Glu Ala Phe Ile Gly Thr Asn His His Ser
20 25 30
Ser Leu Phe Pro Pro Pro Pro Gln Gln Pro Pro Gln Pro Gln Phe Asn
35 40 45
Glu Asp Thr Leu Gln Gln Arg Leu Gln Ala Leu Ile Glu Ser Ala Gly
50 55 60
Glu Asn Trp Thr Tyr Ala Ile Phe Trp Gln Ile Ser His Asp Phe Asp
65 70 75 80
Ser Ser Thr Gly Asp Asn Thr Val Ile Leu Gly Trp Gly Asp Gly Tyr
85 90 95
Tyr Lys Gly Glu Glu Asp Lys Glu Lys Lys Lys Asn Asn Thr Asn Thr
100 105 110
Ala Glu Gln Glu His Arg Lys Arg Val Ile Arg Glu Leu Asn Ser Leu
115 120 125
Ile Ser Gly Gly Ile Gly Val Ser Asp Glu Ser Asn Asp Glu Glu Val
130 135 140
Thr Asp Thr Glu Trp Phe Phe Leu Val Ser Met Thr Gln Ser Phe Val
145 150 155 160
Asn Gly Val Gly Leu Pro Gly Glu Ser Phe Leu Asn Ser Arg Val Ile
165 170 175
Trp Leu Ser Gly Ser Gly Ala Leu Thr Gly Ser Gly Cys Glu Arg Ala
180 185 190
Gly Gln Gly Gln Ile Tyr Gly Leu Lys Thr Met Val Cys Ile Ala Thr
195 200 205
Gln Asn Gly Val Val Glu Leu Gly Ser Ser Glu Val Ile Ser Gln Ser
210 215 220
Ser Asp Leu Met His Lys Val Asn Asn Leu Phe Asn Phe Asn Asn Gly
225 230 235 240
Gly Gly Asn Asn Gly Val Glu Ala Ser Ser Trp Gly Phe Asn Leu Asn
245 250 255
Pro Asp Gln Gly Glu Asn Asp Pro Ala Leu Trp Ile Ser Glu Pro Thr
260 265 270
Asn Thr Gly Ile Glu Ser Pro Ala Arg Val Asn Asn Gly Asn Asn Ser
275 280 285
Asn Ser Asn Ser Lys Ser Asp Ser His Gln Ile Ser Lys Leu Glu Lys
290 295 300
Asn Asp Ile Ser Ser Val Glu Asn Gln Asn Arg Gln Ser Ser Cys Leu
305 310 315 320
Val Glu Lys Asp Leu Thr Phe Gln Gly Gly Leu Leu Lys Ser Asn Glu
325 330 335
Thr Leu Ser Phe Cys Gly Asn Glu Ser Ser Lys Lys Arg Thr Ser Val
340 345 350
Ser Lys Gly Ser Asn Asn Asp Glu Gly Met Leu Ser Phe Ser Thr Val
355 360 365
Val Arg Ser Ala Ala Asn Asp Ser Asp His Ser Asp Leu Glu Ala Ser
370 375 380
Val Val Lys Glu Ala Ile Val Val Glu Pro Pro Glu Lys Lys Pro Arg
385 390 395 400
Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu Asn His
405 410 415
Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg Phe Tyr
420 425 430
Ser Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys Ala Ser
435 440 445
Leu Leu Gly Asp Ala Ile Ser Tyr Ile Asn Glu Leu Lys Ser Lys Leu
450 455 460
Gln Gln Ala Glu Ser Asp Lys Glu Glu Ile Gln Lys Lys Leu Asp Gly
465 470 475 480
Met Ser Lys Glu Gly Asn Asn Gly Lys Gly Cys Gly Ser Arg Ala Lys
485 490 495
Glu Arg Lys Ser Ser Asn Gln Asp Ser Thr Ala Ser Ser Ile Glu Met
500 505 510
Glu Ile Asp Val Lys Ile Ile Gly Trp Asp Val Met Ile Arg Val Gln
515 520 525
Cys Gly Lys Lys Asp His Pro Gly Ala Arg Phe Met Glu Ala Leu Lys
530 535 540
Glu Leu Asp Leu Glu Val Asn His Ala Ser Leu Ser Val Val Asn Asp
545 550 555 560
Leu Met Ile Gln Gln Ala Thr Val Lys Met Gly Ser Gln Phe Phe Asn
565 570 575
His Asp Gln Leu Lys Val Ala Leu Met Thr Lys Val Gly Glu Asn Tyr
580 585 590
<210>111
<211>1833
<212>DNA
<213>欧洲油菜
<400>111
atgacggagc cgacgatgaa tctctggacc accgacgata acgcctctat gatggaagct 60
ttcatgagct cctcctccga catctcagcc ttatggccac cggtaacgac gacggcaacg 120
gcgtcgacta cagctccggc accggcggga ttcaacgagg agactctaca gcaaaggcta 180
caagcactga ttgaagggac gaacgaaggc tggacctacg ctatattctg gcagccgtcg 240
tacgacttct ccggtgcctc cgtgctcgga tggggcgatg gttattacaa aggagaagaa 300
gacaaggcaa agcccagaca gagaacgtct ccaccgccgt tttcaactcc ggcggatcag 360
gagtatcgta agaaggtgtt gcgtgagctc aactcgttga tctccggcgg aggtggtccg 420
acggatgatg ccgtcgatga agaggtgacg gatacggagt ggtttttctt ggtttcgatg 480
acgcagagct tcgcttgcgg ttctgggttg gcgggtaagg cgttctcgac gggtaacgca 540
gtttgggttt atgggtcgga tcagttaacc gggtcgggtt gtgagcgggc gaagcaagga 600
ggagtgtttg ggatgcagac catcgcgtgt attccttcgg cgaacggggt tgttgaactc 660
gggccaacgg agcagatccg acagagttcg gatcttatga acaaggtacg agtacttttc 720
aatttcaacg gtggcgctgg agatttatcg tgtcttaact ggaatcttga cccggatcaa 780
ggcgagaacg atccgtctat gtggattaac gacccgattg gagtacccga gcagggtaac 840
ggagctccga gctctagctc ccagcttttt gccaagtcga tccagtttga gaatggtggt 900
agttcaagca ccatcatcga aaacccgaat ccggatccag ctccagctcc gagcccggtt 960
cattcccaga cccagaatcc gaaattcagc aacaatttct cccgcgaatt aaatttctcc 1020
acgtcgagca ccaccttggt gaaaccaaga cccgccgaga tattgagctt cggcgatgag 1080
ggtaaacgga gctccgtgaa cccggatccg agttcttatt cgggtcagac tcagttcgag 1140
aataagagaa agaagtccat aggtatgagc gatgacaagg ttctaacttt cggaaccggc 1200
ggaggagaat ccgatcactc cgatctagaa gcctccgtcg tgaaagagat accggagaaa 1260
cgtcccaaga aacgtggaag aaaaccggcc aacggtagag aagagccgct taaccacgtc 1320
gaagcagaga gacagagacg cgagaaacta aaccagcgat tctacgcgtt acgtgcggtt 1380
gtaccaaacg tctcgaaaat ggataaagct tctttgctcg gagacgcgat tgcttacatc 1440
aacgagctga agtctaaggt gaccaagacg gaatctgaga aaactcagat caaaacccag 1500
ctcgaggaag tgaaaatgga gctcgccgga agaaaagcaa gcgccggtgg agatctatca 1560
tcctcttgct cgttgacagc gatcaaaccc gtggggatgg agatcgaggt gaagattatc 1620
ggttgggatg cgatgataag ggtggaatcg agcaagagga atcatccggc agcgaggttg 1680
atgtcggcgt tgatggatct agagcttgag gtgaatcacg cgagtatgtc ggtggttaac 1740
gatctgatga tacagcaagc gacggtgaag atgggattca gaatatacac gcaggaacag 1800
ctccgggcga gtttaatctc aaagattggt taa 1833
<210>112
<211>610
<212>PRT
<213>欧洲油菜
<400>112
Met Thr Glu Pro Thr Met Asn Leu Trp Thr Thr Asp Asp Asn Ala Ser
1 5 10 15
Met Met Glu Ala Phe Met Ser Ser Ser Ser Asp Ile Ser Ala Leu Trp
20 25 30
Pro Pro Val Thr Thr Thr Ala Thr Ala Ser Thr Thr Ala Pro Ala Pro
35 40 45
Ala Gly Phe Asn Glu Glu Thr Leu Gln Gln Arg Leu Gln Ala Leu Ile
50 55 60
Glu Gly Thr Asn Glu Gly Trp Thr Tyr Ala Ile Phe Trp Gln Pro Ser
65 70 75 80
Tyr Asp Phe Ser Gly Ala Ser Val Leu Gly Trp Gly Asp Gly Tyr Tyr
85 90 95
Lys Gly Glu Glu Asp Lys Ala Lys Pro Arg Gln Arg Thr Ser Pro Pro
100 105 110
Pro Phe Ser Thr Pro Ala Asp Gln Glu Tyr Arg Lys Lys Val Leu Arg
115 120 125
Glu Leu Asn Ser Leu Ile Ser Gly Gly Gly Gly Pro Thr Asp Asp Ala
130 135 140
Val Asp Glu Glu Val Thr Asp Thr Glu Trp Phe Phe Leu Val Ser Met
145 150 155 160
Thr Gln Ser Phe Ala Cys Gly Ser Gly Leu Ala Gly Lys Ala Phe Ser
165 170 175
Thr Gly Asn Ala Val Trp Val Tyr Gly Ser Asp Gln Leu Thr Gly Ser
180 185 190
Gly Cys Glu Arg Ala Lys Gln Gly Gly Val Phe Gly Met Gln ThrIle
195 200 205
Ala Cys Ile Pro Ser Ala Asn Gly Val Val Glu Leu Gly Pro Thr Glu
210 215 220
Gln Ile Arg Gln Ser Ser Asp Leu Met Asn Lys Val Arg Val Leu Phe
225 230 235 240
Asn Phe Asn Gly Gly Ala Gly Asp Leu Ser Cys Leu Asn Trp Asn Leu
245 250 255
Asp Pro Asp Gln Gly Glu Asn Asp Pro Ser Met Trp Ile Asn Asp Pro
260 265 270
Ile Gly Val Pro Glu Gln Gly Asn Gly Ala Pro Ser Ser Ser Ser Gln
275 280 285
Leu Phe Ala Lys Ser Ile Gln Phe Glu Asn Gly Gly Ser Ser Ser Thr
290 295 300
Ile Ile Glu Asn Pro Asn Pro Asp Pro Ala Pro Ala Pro Ser Pro Val
305 310 315 320
His Ser Gln Thr Gln Asn Pro Lys Phe Ser Asn Asn Phe Ser Arg Glu
325 330 335
Leu Asn Phe Ser Thr Ser Ser Thr Thr Leu Val Lys Pro Arg Pro Ala
340 345 350
Glu Ile Leu Ser Phe Gly Asp Glu Gly Lys Arg Ser Ser Val Asn Pro
355 360 365
Asp Pro Ser Ser Tyr Ser Gly Gln Thr Gln Phe Glu Asn Lys Arg Lys
370 375 380
Lys Ser Ile Gly Met Ser Asp Asp Lys Val Leu Thr Phe Gly Thr Gly
385 390 395 400
Gly Gly Glu Ser Asp His Ser Asp Leu Glu Ala Ser Val Val Lys Glu
405 410 415
Ile Pro Glu Lys Arg Pro Lys Lys Arg Gly Arg Lys Pro Ala Asn Gly
420 425 430
Arg Glu Glu Pro Leu Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu
435 440 445
Lys Leu Asn Gln Arg Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val
450 455 460
Ser Lys Met Asp Lys Ala Ser Leu Leu Gly Asp Ala Ile Ala Tyr Ile
465 470 475 480
Asn Glu Leu Lys Ser Lys Val Thr Lys Thr Glu Ser Glu Lys Thr Gln
485 490 495
Ile Lys Thr Gln Leu Glu Glu Val Lys Met Glu Leu Ala Gly Arg Lys
500 505 510
Ala Ser Ala Gly Gly Asp Leu Ser Ser Ser Cys Ser Leu Thr Ala Ile
515 520 525
Lys Pro Val Gly Met Glu Ile Glu Val Lys Ile Ile Gly Trp Asp Ala
530 535 540
Met Ile Arg Val Glu Ser Ser Lys Arg Asn His Pro Ala Ala Arg Leu
545 550 555 560
Met Ser Ala Leu Met Asp Leu Glu Leu Glu Val Asn His Ala Ser Met
565 570 575
Ser Val Val Asn Asp Leu Met Ile Gln Gln Ala Thr Val Lys Met Gly
580 585 590
Phe Arg Ile Tyr Thr Gln Glu Gln Leu Arg Ala Ser Leu Ile Ser Lys
595 600 605
Ile Gly
610
<210>113
<211>1959
<212>DNA
<213>Lotus japonicus
<400>113
atgaatctct ggagcgacga caactcctcc gtcatggagg ccttcatgac ctcctccgac 60
ttatcctccg tctggccacc agcgccgcct cctccctctc aatcctccgt cgccgtcctc 120
aaccaggaca ctctccagca acgcctccag gccctaatcg aaggcgcaag agagacctgg 180
acctacgcca ttttctggca accttcctac gactactccg gcacctccct cctcggctgg 240
ggcgacggtt actacaaagg cgaagaggac aaagccaagg caaaagcaaa agccaaagcc 300
aaagccacct cctccgctga acaagaacac cgccggaagg tgcttcgtga cttgaattcc 360
ctcatctccg gttcctccgc ccccgcttct gatgacgctg tcgacgaaga ggtcaccgac 420
acggaatggt tcttccttgt ttccatgacc cagtcgtttg tcaacggcgg cgggctagct 480
ggtcaggcgt atttcaactc cacccctgtt tgggtcgccg gcgctgatcg cctcgcagcc 540
tccgcctgcg agagggccag gcaggggcag ctcttcggaa tccagacgct cgtctgcgtg 600
ccgtctgcaa acggcgtcgt tgaactcgga tccactgagc tgatttacca gaactccgat 660
ctgatgaaca aggtgaaggt gctgttcaat ttcagcaaca gcaacctcga tttgggttct 720
tcctggacat tgggttccac caccaccgcc gagaatgacc cttccgccct ctggctcgcc 780
gaccccgacc ctgacggcag agattccgtc agcaccgtcg ctcccaccac cgcttccgtt 840
tcgattccca gccaccacaa caacgatcag agcattgcga agacgttgca gttcgaaacc 900
cctgtttcga gtaccttgac tgaaaccccg agtgctgtta atctcacaaa ccagccatcg 960
cagaaccaga gaaaccagag cagcttcttc tccagggaga tgaatttctc cgagtacagt 1020
ttcgatgcga agaacggcag cagtaaccac cagcatctga agccggaatc cggtgagatt 1080
ctgagcttcg gtgacagcaa gagaaccccc aatttcttct ccggccagtc gcagttcgtt 1140
ccggctgtcg aggagaacaa caacgggaag aagaggtcac cgaattcgag aagcagcaac 1200
gacgacggga tgctttcatt cacctccggc gtgattctcc cgtcctcgaa tttgaaatcc 1260
tccaccggcg gcggcgattc ggagcattca gatctggaag cttcggtggt gaaggaagcc 1320
gacagcagca ggttggtgga gccggagaag cgacctagga agagggggag gaaaccggcg 1380
aacggcagag aggaaccgtt gaaccacgtt gaagcagaga ggcagaggag ggagaagctt 1440
aaccagagat tctacgcgct tcgcgcggtg gttccgaacg tgtcgaagat ggacaaagct 1500
tcactgctag gagacgctat atcctacatc acggagctga agaccaagct tcagagttca 1560
gaatcggata aaactgggtt gcagaagcaa tttgatgcga tgaagaagga gctggagaaa 1620
accagtgaac agtcttcttc tccaactcca cctccaccta acaagaacaa gtccttctcc 1680
tcatcctcct cctcttccaa tcagattcta gtggaggaca ttgacgtgaa gatcattggg 1740
tgggatgcaa tgataagggt ccaatgcagc aagaagaacc acccggccgc gattttgatg 1800
gcggcgttga tggagctgga ccttgaggtg aaccatgcta gtgtgtcagt ggtgaatgat 1860
accatgatcc agcaagcaac agtgaagatg ggaagccgct tttacactca ggagcagctt 1920
cgatcagcac tctcttccaa atttggggat gctccttag 1959
<210>114
<211>652
<212>PRT
<213>Lotus japonicus
<400>114
Met Asn Leu Trp Ser Asp Asp Asn Ser Ser Val Met Glu Ala Phe Met
1 5 10 15
Thr Ser Ser Asp Leu Ser Ser Val Trp Pro Pro Ala Pro Pro Pro Pro
20 25 30
Ser Gln Ser Ser Val Ala Val Leu Asn Gln Asp Thr Leu Gln Gln Arg
35 40 45
Leu Gln Ala Leu Ile Glu Gly Ala Arg Glu Thr Trp Thr Tyr Ala Ile
50 55 60
Phe Trp Gln Pro Ser Tyr Asp Tyr Ser Gly Thr Ser Leu Leu Gly Trp
65 70 75 80
Gly Asp Gly Tyr Tyr Lys Gly Glu Glu Asp Lys Ala Lys Ala Lys Ala
85 90 95
Lys Ala Lys Ala Lys Ala Thr Ser Ser Ala Glu Gln Glu His Arg Arg
100 105 110
Lys Val Leu Arg Asp Leu Asn Ser Leu Ile Ser Gly Ser Ser Ala Pro
115 120 125
Ala Ser Asp Asp Ala Val Asp Glu Glu Val Thr Asp Thr Glu Trp Phe
130 135 140
Phe Leu Val Ser Met Thr Gln Ser Phe Val Asn Gly Gly Gly Leu Ala
145 150 155 160
Gly Gln Ala Tyr Phe Asn Ser Thr Pro Val Trp Val Ala Gly Ala Asp
165 170 175
Arg Leu Ala Ala Ser Ala Cys Glu Arg Ala Arg Gln Gly Gln Leu Phe
180 185 190
Gly Ile Gln Thr Leu Val Cys Val Pro Ser Ala Asn Gly Val Val Glu
195 200 205
Leu Gly Ser Thr Glu Leu Ile Tyr Gln Asn Ser Asp Leu Met Asn Lys
210 215 220
Val Lys Val Leu Phe Asn Phe Ser Asn Ser Asn Leu Asp Leu Gly Ser
225 230 235 240
Ser Trp Thr Leu Gly Ser Thr Thr Thr Ala Glu Asn Asp Pro Ser Ala
245 250 255
Leu Trp Leu Ala Asp Pro Asp Pro Asp Gly Arg Asp Ser Val Ser Thr
260 265 270
Val Ala Pro Thr Thr Ala Ser Val Ser Ile Pro Ser His His Asn Asn
275 280 285
Asp Gln Ser Ile Ala Lys Thr Leu Gln Phe Glu Thr Pro Val Ser Ser
290 295 300
Thr Leu Thr Glu Thr Pro Ser Ala Val Asn Leu Thr Asn Gln Pro Ser
305 310 315 320
Gln Asn Gln Arg Asn Gln Ser Ser Phe Phe Ser Arg Glu Met Asn Phe
325 330 335
Ser Glu Tyr Ser Phe Asp Ala Lys Asn Gly Ser Ser Asn His Gln His
340 345 350
Leu Lys Pro Glu Ser Gly Glu Ile Leu Ser Phe Gly Asp Ser Lys Arg
355 360 365
Thr Pro Asn Phe Phe Ser Gly Gln Ser Gln Phe Val Pro Ala Val Glu
370 375 380
Glu Asn Asn Asn Gly Lys Lys Arg Ser Pro Asn Ser Arg Ser Ser Asn
385 390 395 400
Asp Asp Gly Met Leu Ser Phe Thr Ser Gly Val Ile Leu Pro Ser Ser
405 410 415
Asn Leu Lys Ser Ser Thr Gly Gly Gly Asp Ser Glu His Ser Asp Leu
420 425 430
Glu Ala Ser Val Val Lys Glu Ala Asp Ser Ser Arg Leu Val Glu Pro
435 440 445
Glu Lys Arg Pro Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu
450 455 460
Glu Pro Leu Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu
465 470 475 480
Asn Gln Arg Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Lys
485 490 495
Met Asp Lys Ala Ser Leu Leu Gly Asp Ala Ile Ser Tyr Ile Thr Glu
500 505 510
Leu Lys Thr Lys Leu Gln Ser Ser Glu Ser Asp Lys Thr Gly Leu Gln
515 520 525
Lys Gln Phe Asp Ala Met Lys Lys Glu Leu Glu Lys Thr Ser Glu Gln
530 535 540
Ser Ser Ser Pro Thr Pro Pro Pro Pro Asn Lys Asn Lys Ser Phe Ser
545 550 555 560
Ser Ser Ser Ser Ser Ser Asn Gln Ile Leu Val Glu Asp Ile Asp Val
565 570 575
Lys Ile Ile Gly Trp Asp Ala Met Ile Arg Val Gln Cys Ser Lys Lys
580 585 590
Asn His Pro Ala Ala Ile Leu Met Ala Ala Leu Met Glu Leu Asp Leu
595 600 605
Glu Val Asn His Ala Ser Val Ser Val Val Asn Asp Thr Met Ile Gln
610 615 620
Gln Ala Thr Val Lys Met Gly Ser Arg Phe Tyr Thr Gln Glu Gln Leu
625 630 635 640
Arg Ser Ala Leu Ser Ser Lys Phe Gly Asp Ala Pro
645 650
<210>115
<211>2070
<212>DNA
<213>番茄
<400>115
atgactgaat acagcttgcc caccatgaat ttgtggaaca atagtactag cgatgataac 60
gtttctatga tggaagcttt tatgtcttct gatctttctt tttgggctac taataattct 120
acttctgctg ctgcggttgg tgtcaattca aatcttcctc atgctagtag taatactccc 180
tctgtttttg caccatcttc ttctacatct gcatctactt tatccgcagc tgcgactgtg 240
gatgcttcca aatctatgcc gtttttcaac caagaaaccc ttcagcagcg tcttcaagct 300
cttattgatg gtgctagaga gacgtggact tatgctatct tttggcaatc gtcggttgtt 360
gatttctcaa gtccgtctgt gttgggttgg ggagatggtt attacaaagg ggaagaagat 420
aaagcaaaaa ggaaattatc ggtgtcatca cctgcttata ttgctgagca ggagcatcgg 480
aagaaggttc tacgggagct gaattcgttg atttccgggg caccacccgg aacggatgat 540
gcggttgatg aagaagttac cgacaccgaa tggttctttc ttatctccat gacccaatcg 600
tttgttaatg gaagtgggct tcctggtcag gcgttgtata gttccagccc gatttgggtc 660
gccggaactg agaaattggc agcttcacac tgtgaacgtg tgaggcaagc acaagggttc 720
gggctccaga cgattgtctg tattccttca gctaacggcg tggttgaatt gggctcgacg 780
gagttgattg ttcaaagttc tgatcttatg aacaaggtta gagtattgtt taacttcagt 840
aatgatttgg gttctggttc atgggctgtg cagccggaga gcgacccatc ggcgctctgg 900
ctcactgatc catcgtcctc aggtatggaa gttagagagt ctttaaatac agttcaaaca 960
aattcagttc catctagtaa tagtaataag caaattgctt atggaaatga gaataatcat 1020
ccatctggaa atggtcagag ttgttacaat cagcaacaac agaagaatcc tcctcagcaa 1080
caaacacaag gactcttcac gagggagttg aatttttcgg aattcggttt cgatggaagt 1140
agtaatagga atggaaattc atcggtttct tgcaagcctg aatcaggaga aatcttgaat 1200
tttggtgata gtactaaaaa aagtgcttcc agtgccaatg tgaacttgtt tacaggtcag 1260
tcccaatttg gggctgggga ggagaataat aacaagaaca agaaaagatc agctacttcc 1320
aggggaagca atgaagaagg aatgctttca tttgtttcag gtacagtggt gccttcttcg 1380
ggcatgaagt caggtggagg cggaggcgaa gactctgaac attcagatct cgaggcttca 1440
gtggtgaaag aagctgatag tagtagagtg gtagagcctg aaaagaggcc aaggaagcga 1500
ggtagaaagc cagcgaatgg acgggaggag ccattgaatc acgtcgaggc agagaggcaa 1560
aggagggaga aattgaacca aagattctac gcgcttagag ctgttgtacc aaatgtgtct 1620
aagatggaca aggcatcact ccttggagat gctatttcct atataaacga gttgaaatcg 1680
aagcttcaaa atacagagtc agataaagaa gacttgaaga gccaaataga agatttaaag 1740
aaagaatcaa ggcgccccgg tcctcctcca ccaccaaatc aagatctcaa gatgtctagc 1800
cacactggag gcaagattgt agacgtggat atagacgtta agatcatcgg atgggatgca 1860
atgattcgta tacaatgtaa taaaaagaat catccagccg caaggctaat ggcagcgctc 1920
atggaattag acctagacgt gcatcatgcc agtgtttcag ttgtcaacga tttgatgatc 1980
caacaagcca cagtgaaaat gggtagcagg aattacactg aagagcagct tagggtagcg 2040
ttgacatcga aaattgctga aacacactaa 2070
<210>116
<211>689
<212>PRT
<213>番茄
<400>116
Met Thr Glu Tyr Ser Leu Pro Thr Met Asn Leu Trp Asn Asn Ser Thr
1 5 10 15
Ser Asp Asp Asn Val Ser Met Met Glu Ala Phe Met Ser Ser Asp Leu
20 25 30
Ser Phe Trp Ala Thr Asn Asn Ser Thr Ser Ala Ala Ala Val Gly Val
35 40 45
Asn Ser Asn Leu Pro His Ala Ser Ser Asn Thr Pro Ser Val Phe Ala
50 55 60
Pro Ser Ser Ser Thr Ser Ala Ser Thr Leu Ser Ala Ala Ala Thr Val
65 70 75 80
Asp Ala Ser Lys Ser Met Pro Phe Phe Asn Gln Glu Thr Leu Gln Gln
85 90 95
Arg Leu Gln Ala Leu Ile Asp Gly Ala Arg Glu Thr Trp Thr Tyr Ala
100 105 110
Ile Phe Trp Gln Ser Ser Val Val Asp Phe Ser Ser Pro Ser Val Leu
115 120 125
Gly Trp Gly Asp Gly Tyr Tyr Lys Gly Glu Glu Asp Lys Ala Lys Arg
130 135 140
Lys Leu Ser Val Ser Ser Pro Ala Tyr Ile Ala Glu Gln Glu His Arg
145 150 155 160
Lys Lys Val Leu Arg Glu Leu Asn Ser Leu Ile Ser Gly Ala Pro Pro
165 170 175
Gly Thr Asp Asp Ala Val Asp Glu Glu Val Thr Asp Thr Glu Trp Phe
180 185 190
Phe Leu Ile Ser Met Thr Gln Ser Phe Val Asn Gly Ser Gly Leu Pro
195 200 205
Gly Gln Ala Leu Tyr Ser Ser Ser Pro Ile Trp Val Ala Gly Thr Glu
210 215 220
Lys Leu Ala Ala Ser His Cys Glu Arg Val Arg Gln Ala Gln Gly Phe
225 230 235 240
Gly Leu Gln Thr Ile Val Cys Ile Pro Ser Ala Asn Gly Val Val Glu
245 250 255
Leu Gly Ser Thr Glu Leu Ile Val Gln Ser Ser Asp Leu Met Asn Lys
260 265 270
Val Arg Val Leu Phe Asn Phe Ser Asn Asp Leu Gly Ser Gly Ser Trp
275 280 285
Ala Val Gln Pro Glu Ser Asp Pro Ser Ala Leu Trp Leu Thr Asp Pro
290 295 300
Ser Ser Ser Gly Met Glu Val Arg Glu Ser Leu Asn Thr Val Gln Thr
305 310 315 320
Asn Ser Val Pro Ser Ser Asn Ser Asn Lys Gln Ile Ala Tyr Gly Asn
325 330 335
Glu Asn Asn His Pro Ser Gly Asn Gly Gln Ser Cys Tyr Asn Gln Gln
340 345 350
Gln Gln Lys Asn Pro Pro Gln Gln Gln Thr Gln Gly Leu Phe Thr Arg
355 360 365
Glu Leu Asn Phe Ser Glu Phe Gly Phe Asp Gly Ser Ser Asn Arg Asn
370 375 380
Gly Asn Ser Ser Val Ser Cys Lys Pro Glu Ser Gly Glu Ile Leu Asn
385 390 395 400
Phe Gly Asp Ser Thr Lys Lys Ser Ala Ser Ser Ala Asn Val Asn Leu
405 410 415
Phe Thr Gly Gln Ser Gln Phe Gly Ala Gly Glu Glu Asn Asn Asn Lys
420 425 430
Asn Lys Lys Arg Ser Ala Thr Ser Arg Gly Ser Asn Glu Glu Gly Met
435 440 445
Leu Ser Phe Val Ser Gly Thr Val Val Pro Ser Ser Gly Met Lys Ser
450 455 460
Gly Gly Gly Gly Gly Glu Asp Ser Glu His Ser Asp Leu Glu Ala Ser
465 470 475 480
Val Val Lys Glu Ala Asp Ser Ser Arg Val Val Glu Pro Glu Lys Arg
485 490 495
Pro Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu
500 505 510
Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg
515 520 525
Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys
530 535 540
Ala Ser Leu Leu Gly Asp Ala Ile Ser Tyr Ile Asn Glu Leu Lys Ser
545 550 555 560
Lys Leu Gln Asn Thr Glu Ser Asp Lys Glu Asp Leu Lys Ser Gln Ile
565 570 575
Glu Asp Leu Lys Lys Glu Ser Arg Arg Pro Gly Pro Pro Pro Pro Pro
580 585 590
Asn Gln Asp Leu Lys Met Ser Ser His Thr Gly Gly Lys Ile Val Asp
595 600 605
Val Asp Ile Asp Val Lys Ile Ile Gly Trp Asp Ala Met Ile Arg Ile
610 615 620
Gln Cys Asn Lys Lys Asn His Pro Ala Ala Arg Leu Met Ala Ala Leu
625 630 635 640
Met Glu Leu Asp Leu Asp Val His His Ala Ser Val Ser Val Val Asn
645 650 655
Asp Leu Met Ile Gln Gln Ala Thr Val Lys Met Gly Ser Arg Asn Tyr
660 665 670
Thr Glu Glu Gln Leu Arg Val Ala Leu Thr Ser Lys Ile Ala Glu Thr
675 680 685
His
<210>117
<211>1992
<212>DNA
<213>葡萄
<400>117
atgacggaat atcgtgtgcc aaccatgaat ctgtggaccg acgataacgc ttctatgatg 60
gaggctttta taagctctga tctctcttcc tttagttggg ggccatcctc cgctgcttct 120
acgtctactc ctgcgcctga cccgtcaagg aatctcgccc aatctcagcc ttccatggcc 180
gtcttcaacc aggagaccct ccagcagcga cttcaagccc taattgaagg cgcccgagag 240
agctggacct acgcaatttt ttggcagtcc agcgttgatt tctcgggtgc ctctttgtta 300
ggatggggtg acggctacta taaaggtgag gaagataaag ggaagaggaa gatgaccccg 360
tcgtctgttt ccgagcagga gcaccggaag aaagtgctcc gggagctgaa ttcgctcatt 420
tctgggacgg cgtcgtcgtc ggacgacgct gtcgatgagg aggtcaccga caccgagtgg 480
ttcttccttg tatcgatgac tcagtcgttt gtgaacggcg ctgggttgcc gggtcaggcg 540
ctcttcaact cgagtccggt gtgggttgtc ggaaccgaac ggctcatgag ttctccttgc 600
gagagagccc ggcaggcgca ggtgttcggg ttacagacta tggtttgtat accatcggct 660
aacggcgtcg tcgaactggg ctccaccgaa ttgatttacc agagctcaga tctgatgaac 720
aaggttagag ttttgttcaa tttcaataac cttgaagttg gttcatggcc gatcggagcc 780
gccgctcccg accagggcga gagcgatcct tcgtcgctct ggatctccga tccgacctct 840
aatgtcgaaa tcaaggattc tgtgaatgct acagctactg gagcttccaa tcccattggt 900
aatcagcaga attccaagtc aattcaattt gagaacccta gctcaagtag tttaactgaa 960
aaccctagta ttatgcataa tcctcagcag caacagcaga ttcacacgca gggttttttc 1020
actagggagt tgaatttctc agaatttgga tttgatggaa ayaatgggag aaatggtaac 1080
ttgcattccc tgaagcccga gtctggggaa attttgaatt ttggagacag taagaggagt 1140
tcttgtagtg cgaatgggaa tatgttttca ggtcattcac aggtagttgc agaggaaaat 1200
aagaagagga ggtcaccgac ttcaagagga agtgccgaag aaggcatgct ttcgtttact 1260
tcaggtgtga tattgccatc ctcttgtgtg gtgaagtcaa gtggtggtgg tggagattct 1320
gatcactcgg atcttgaagc ttcagtggtt cgggaggcag atagtagtag agtggtggaa 1380
ccagaaaaaa ggcctaggaa gcgtgggaga aaacctgcaa atggaaggga agagccattg 1440
aatcatgtgg aggcagagcg gcagaggagg gagaagctta accagaggtt ttatgccctc 1500
cgagctgtgg ttccaaatgt gtcaaagatg gataaagcct cccttcttgg tgatgcaatt 1560
tcatatatca atgagctcag gacaaagcta caaagtgcag agtcggacaa ggaggacctt 1620
cagaaggaag tgaattcaat gaagaaggag ttggctagta aagatwcaca gtactccggt 1680
tcatctcgac cacctccaga ccaagatctc aagatgtcga atcaccacgg tagcaaattg 1740
gtagaaatgg atattgatgt gaagataatc gggtgggatg ccatgattcg aattcagtgt 1800
agtaaaaaga accatcctgc tgcaaagctt atgggggctc tcaaggagct ggacctagat 1860
gtgaaccacg cgagtgtgtc ggtggtgaat gatttgatga tccaacaggc aaccgtgaag 1920
atgggaagta ggttttacac tcaagatcag ctgaggctag ccctgtcatc caaatttgca 1980
gacagcaggt ag 1992
<210>118
<211>663
<212>PRT
<213>葡萄
<220>
<221>misc_feature
<222>(556)..(556)
<223>Xaa可以是任何天然存在的氨基酸
<400>118
Met Thr Glu Tyr Arg Val Pro Thr Met Asn Leu Trp Thr Asp Asp Asn
1 5 10 15
Ala Ser Met Met Glu Ala Phe Ile Ser Ser Asp Leu Ser Ser Phe Ser
20 25 30
Trp Gly Pro Ser Ser Ala Ala Ser Thr Ser Thr Pro Ala Pro Asp Pro
35 40 45
Ser Arg Asn Leu Ala Gln Ser Gln Pro Ser Met Ala Val Phe Asn Gln
50 55 60
Glu Thr Leu Gln Gln Arg Leu Gln Ala Leu Ile Glu Gly Ala Arg Glu
65 70 75 80
Ser Trp Thr Tyr Ala Ile Phe Trp Gln Ser Ser Val Asp Phe Ser Gly
85 90 95
Ala Ser Leu Leu Gly Trp Gly Asp Gly Tyr Tyr Lys Gly Glu Glu Asp
100 105 110
Lys Gly Lys Arg Lys Met Thr Pro Ser Ser Val Ser Glu Gln Glu His
115 120 125
Arg Lys Lys Val Leu Arg Glu Leu Asn Ser Leu Ile Ser Gly Thr Ala
130 135 140
Ser Ser Ser Asp Asp Ala Val Asp Glu Glu Val Thr Asp Thr Glu Trp
145 150 155 160
Phe Phe Leu Val Ser Met Thr Gln Ser Phe Val Asn Gly Ala Gly Leu
165 170 175
Pro Gly Gln Ala Leu Phe Asn Ser Ser Pro Val Trp Val Val Gly Thr
180 185 190
Glu Arg Leu Met Ser Ser Pro Cys G1u Arg Ala Arg Gln Ala Gln Val
195 200 205
Phe Gly Leu Gln Thr Met Val Cys Ile Pro Ser Ala Asn Gly Val Val
210 215 220
Glu Leu Gly Ser Thr Glu Leu Ile Tyr Gln Ser Ser Asp Leu Met Asn
225 230 235 240
Lys Val Arg Val Leu Phe Asn Phe Asn Asn Leu Glu Val Gly Ser Trp
245 250 255
Pro Ile Gly Ala Ala Ala Pro Asp Gln Gly Glu Ser Asp Pro Ser Ser
260 265 270
Leu Trp Ile Ser Asp Pro Thr Ser Asn Val Glu Ile Lys Asp Ser Val
275 280 285
Asn Ala Thr Ala Thr Gly Ala Ser Asn Pro Ile Gly Asn Gln Gln Asn
290 295 300
Ser Lys Ser Ile Gln Phe Glu Asn Pro Ser Ser Ser Ser Leu Thr Glu
305 310 315 320
Asn Pro Ser Ile Met His Asn Pro Gln Gln Gln Gln Gln Ile His Thr
325 330 335
Gln Gly Phe Phe Thr Arg Glu Leu Asn Phe Ser Glu Phe Gly Phe Asp
340 345 350
Gly Asn Asn Gly Arg Asn Gly Asn Leu His Ser Leu Lys Pro Glu Ser
355 360 365
Gly Glu Ile Leu Asn Phe Gly Asp Ser Lys Arg Ser Ser Cys Ser Ala
370 375 380
Asn Gly Asn Met Phe Ser Gly His Ser Gln Val Val Ala Glu Glu Asn
385 390 395 400
Lys Lys Arg Arg Ser Pro Thr Ser Arg Gly Ser Ala Glu Glu Gly Met
405 410 415
Leu Ser Phe Thr Ser Gly Val Ile Leu Pro Ser Ser Cys Val Val Lys
420 425 430
Ser Ser Gly Gly Gly Gly Asp Ser Asp His Ser Asp Leu Glu Ala Ser
435 440 445
Val Val Arg Glu Ala Asp Ser Ser Arg Val Val Glu Pro Glu Lys Arg
450 455 460
Pro Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu
465 470 475 480
Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg
485 490 495
Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys
500 505 510
Ala Ser Leu Leu Gly Asp Ala Ile Ser Tyr Ile Asn Glu Leu Arg Thr
515 520 525
Lys Leu Gln Ser Ala Glu Ser Asp Lys Glu Asp Leu Gln Lys Glu Val
530 535 540
Asn Ser Met Lys Lys Glu Leu Ala Ser Lys Asp Xaa Gln Tyr Ser Gly
545 550 555 560
Ser Ser Arg Pro Pro Pro Asp Gln Asp Leu Lys Met Ser Asn His His
565 570 575
Gly Ser Lys Leu Val Glu Met Asp Ile Asp Val Lys Ile Ile Gly Trp
580 585 590
Asp Ala Met Ile Arg Ile Gln Cys Ser Lys Lys Asn His Pro Ala Ala
595 600 605
Lys Leu Met Gly Ala Leu Lys Glu Leu Asp Leu Asp Val Asn His Ala
610 615 620
Ser Val Ser Val Val Asn Asp Leu Met Ile Gln Gln Ala Thr Val Lys
625 630 635 640
Met Gly Ser Arg Phe Tyr Thr Gln Asp Gln Leu Arg Leu Ala Leu Ser
645 650 655
Ser Lys Phe Ala Asp Ser Arg
660
<210>119
<211>2145
<212>DNA
<213>玉米
<400>119
atgaacctgt ggacggacga caacgcctcc atgatggagg ccttcatggc ttctgccgac 60
ctccccacct tcccctgggg agcgccggcc gggggcggca actcgtcggc cgccgcggcg 120
tcgccgccgc cgcagatgcc agcggcgatg gctcccgggt tcaaccagga cacgctgcag 180
cagaggctac aagccatgat agaggggtcg agggagacct ggacctacgc catcttctgg 240
cagtcctccc ttgactccgc caccggcgcc tcgctgctcg gctgggggga cggctactac 300
aagggctgcg acgaagacaa gcgcaagcag aagccgctca cgccctccgc ccaggccgag 360
caggagcacc gcaagcgcgt gctccgcgag ctcaactccc tcatctccgg cgcggcggcg 420
gctcccgacg aggccgtcga ggaggaggtc accgataccg agtggttctt cctcgtctcc 480
atgacgcagt cgtttctcaa cggttcgggc ctccccgggc aggcgctctt cgccgggcag 540
cccacatgga tcgcctctgg cctctcctcc gcgccgtgcg agcgcgcgcg tcaggcctac 600
aacttcggcc tccgcaccat ggtatgcttc cccgtcggca ccggggtgct cgagctcggc 660
tccaccgacg tcgtgttcaa gaccgccgag agcatggcta agatccgctc gctctttggg 720
ggcggagcag ggggtggctc gtggccgccc gtgcagcctc aggcgccgtc gtcgcagcag 780
cccgccgccg gagccgacca cgcggagacg gacccgtcca tgctatggct cgccgacgcg 840
ccggtcatgg acatcaagga ttccttgtcg cacccgtcgg ccgagatctc cgtctccaag 900
cctccgccgc atccgccgca gatccatttt gagaacggga gcacgagcac gctcacggag 960
aaccccagcc cctccgtgca cgcgccgcca cccccgccgg cgccggctgc tccacagcag 1020
cggcagcacc agcaccagaa tcaggcgcac cagggcccgt tccgccggga gctcaatttc 1080
tcggacttcg cgtccactcc ttccttggcg gcgaccccgc cgttcttcaa gcccgagtcc 1140
ggcgagatcc tcagcttcgg cgccgacagc aacgcccgga ggaacccgtc gccggtacct 1200
cccgccgcca ccgccagcct caccaccgct cccgggagcc tcttctcgca gcacacggcg 1260
accatgacgg ccgccgcggc gaacgacgcg aagaacaaca acaagcgctc aatggaggcc 1320
acctcccggg cgagcaacac caaccaccac ccggcggcga cggcgaacga gggcatgctg 1380
tccttctcgt cggcgccgac tacgcggccg tcgacgggca cgggcgcgcc ggccaagtcg 1440
gagtccgacc actcggacct ggacgcgtct gtgcgcgagg tggagagcag ccgcgtggtg 1500
gcgccgccac cggaggcgga gaagcggccg cgaaagcgcg ggcggaagcc cgcgaacggg 1560
cgcgaggagc cgctgaacca cgtggaggcg gagcggcagc ggcgggagaa gctgaaccag 1620
cgcttctacg cgctgcgcgc cgtggtgccc aacgtgtcga agatggacaa ggcgtcgctg 1680
ctcggcgacg ccatctccta catcaacgag ctccggggca agctgacgtc gctggagacc 1740
gacaaggaga cgctgcagac ccaggtggag gcgctcaaga aggagcgcga cgcgcggccg 1800
ccctcgcact ccgctgggct cggcgggcac gacggcgggc cgcgctgcca cgcggtggag 1860
atcgacgcca agatcctggg gctggaggcc atgatccgcg tgcagtgcca caagcgcaac 1920
cacccgtcgg cgcggctgat gacagcgctc cgcgagctcg acctggacgt gtaccacgcc 1980
agcgtgtccg tcgtcaagga cctcatgatc cagcaggtcg ccgtcaagat ggccagccgc 2040
gtgtacacgc aggaccagct cagcgccgcg ctctacagcc gcctcgcgga gcccgggtct 2100
gccatgggca ggtaatgaag gaggagagct gctcagctcg gctcg 2145
<210>120
<211>704
<212>PRT
<213>玉米
<400>120
Met Asn Leu Trp Thr Asp Asp Asn Ala Ser Met Met Glu Ala Phe Met
1 5 10 15
Ala Ser Ala Asp Leu Pro Thr Phe Pro Trp Gly Ala Pro Ala Gly Gly
20 25 30
Gly Asn Ser Ser Ala Ala Ala Ala Ser Pro Pro Pro Gln Met Pro Ala
35 40 45
Ala Met Ala Pro Gly Phe Asn Gln Asp Thr Leu Gln Gln Arg Leu Gln
50 55 60
Ala Met Ile Glu Gly Ser Arg Glu Thr Trp Thr Tyr Ala Ile Phe Trp
65 70 75 80
Gln Ser Ser Leu Asp Ser Ala Thr Gly Ala Ser Leu Leu Gly Trp Gly
85 90 95
Asp Gly Tyr Tyr Lys Gly Cys Asp Glu Asp Lys Arg Lys Gln Lys Pro
100 105 110
Leu Thr Pro Ser Ala Gln Ala Glu Gln Glu His Arg Lys Arg Val Leu
115 120 125
Arg Glu Leu Asn Ser Leu Ile Ser Gly Ala Ala Ala Ala Pro Asp Glu
130 135 140
Ala Val Glu Glu Glu Val Thr Asp Thr Glu Trp Phe Phe Leu Val Ser
145 150 155 160
Met Thr Gln Ser Phe Leu Asn Gly Ser Gly Leu Pro Gly Gln Ala Leu
165 170 175
Phe Ala Gly Gln Pro Thr Trp Ile Ala Ser Gly Leu Ser Ser Ala Pro
180 185 190
Cys Glu Arg Ala Arg Gln Ala Tyr Asn Phe Gly Leu Arg Thr Met Val
195 200 205
Cys Phe Pro Val Gly Thr Gly Val Leu Glu Leu Gly Ser Thr Asp Val
210 215 220
Val Phe Lys Thr A1a Glu Ser Met Ala Lys Ile Arg Ser Leu Phe Gly
225 230 235 240
Gly Gly Ala Gly Gly Gly Ser Trp Pro Pro Val Gln Pro Gln Ala Pro
245 250 255
Ser Ser Gln Gln Pro Ala Ala Gly Ala Asp His Ala Glu Thr Asp Pro
260 265 270
Ser Met Leu Trp Leu Ala Asp Ala Pro Val Met Asp Ile Lys Asp Ser
275 280 285
Leu Ser His Pro Ser Ala Glu Ile Ser Val Ser Lys Pro Pro Pro His
290 295 300
Pro Pro Gln Ile His Phe Glu Asn Gly Ser Thr Ser Thr Leu Thr Glu
305 310 315 320
Asn Pro Ser Pro Ser Val His Ala Pro Pro Pro Pro Pro Ala Pro Ala
325 330 335
Ala Pro Gln Gln Arg Gln His Gln His Gln Asn Gln Ala His Gln Gly
340 345 350
Pro Phe Arg Arg Glu Leu Asn Phe Ser Asp Phe Ala Ser Thr Pro Ser
355 360 365
Leu Ala Ala Thr Pro Pro Phe Phe Lys Pro Glu Ser Gly Glu Ile Leu
370 375 380
Ser Phe Gly Ala Asp Ser Asn Ala Arg Arg Asn Pro Ser Pro Val Pro
385 390 395 400
Pro Ala Ala Thr Ala Ser Leu Thr Thr Ala Pro Gly Ser Leu Phe Ser
405 410 415
Gln His Thr Ala Thr Met Thr Ala Ala Ala Ala Asn Asp Ala Lys Asn
420 425 430
Asn Asn Lys Arg Ser Met Glu Ala Thr Ser Arg Ala Ser Asn Thr Asn
435 440 445
His His Pro Ala Ala Thr Ala Asn Glu Gly Met Leu Ser Phe Ser Ser
450 455 460
Ala Pro Thr Thr Arg Pro Ser Thr Gly Thr Gly Ala Pro Ala Lys Ser
465 470 475 480
Glu Ser Asp His Ser Asp Leu Asp Ala Ser Val Arg Glu Val Glu Ser
485 490 495
Ser Arg Val Val Ala Pro Pro Pro Glu Ala Glu Lys Arg Pro Arg Lys
500 505 510
Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu Asn His Val
515 520 525
Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg Phe Tyr Ala
530 535 540
Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys Ala Ser Leu
545 550 555 560
Leu Gly Asp Ala Ile Ser Tyr Ile Asn Glu Leu Arg Gly Lys Leu Thr
565 570 575
Ser Leu Glu Thr Asp Lys Glu Thr Leu Gln Thr Gln Val Glu Ala Leu
580 585 590
Lys Lys Glu Arg Asp Ala Arg Pro Pro Ser His Ser Ala Gly Leu Gly
595 600 605
Gly His Asp Gly Gly Pro Arg Cys His Ala Val Glu Ile Asp Ala Lys
610 615 620
Ile Leu Gly Leu Glu Ala Met Ile Arg Val Gln Cys His Lys Arg Asn
625 630 635 640
His Pro Ser Ala Arg Leu Met Thr Ala Leu Arg Glu Leu Asp Leu Asp
645 650 655
Val Tyr His Ala Ser Val Ser Val Val Lys Asp Leu Met Ile Gln Gln
660 665 670
Val Ala Val Lys Met Ala Ser Arg Val Tyr Thr Gln Asp Gln Leu Ser
675 680 685
Ala Ala Leu Tyr Ser Arg Leu Ala Glu Pro Gly Ser Ala Met Gly Arg
690 695 700
<210>121
<211>1683
<212>DNA
<213>欧洲油菜
<400>121
atggatgatc atcggaatcg tgtctctctc tctccaccgg atgctcacat gagcaactac 60
ttcctcaacc agtcaacagc caccgacgac gataacgcct ccgcctcgat ggaagctttc 120
atcggaacaa atcactggtc acaacaacca tcccttcctc ctcctccgtc attgtctcag 180
ttcaacgaag atactctcca gcaacgtctc caaacgctaa tcgaatccgc gggtgagaga 240
tggacgtacg cgatcttctg gcagatctcg cacgatttcg actctcccgc cggagagagc 300
acggtgattc tcgggtgggg agacgggtac tacagaggag aggaagacaa agagaagaag 360
aagaaacaga gctcgagctc gaatccggcg gagcaggagc atcggaaaag agtaatccgg 420
gagcttaact cgttaatcgc cggcggagcc ggagtttccg acgaagccaa cgacgaggaa 480
gttacggata cagagtggtt cttcttggtt tcgatgactc agagcttcgt aaacggcgtt 540
gggctccccg gagagtcttt tttaaactcc cgcgtgattt ggttatccgg gtcgggtgcg 600
ttaaccgggt caggctgcga gcgggcgagg caaggggagg tttacgggtt gcagacgata 660
gtgtgtatcg ctgcggaaaa cggcgtcgtt gagcttggtt cgtcggaggt gataagtcaa 720
agctcagatc tgatggataa agtcaacggt cttttcaacg gtaacggtaa cggggaagct 780
tcttcttggg ggtttaatct caatcctgat caaggtgaga acgatcctgc tttgtggtta 840
tctgaaccga acataaccgg aatcgaaccg gttcaggaaa cgcccgcgat tgagaacgcc 900
gctgatttga acttctcgag ctcagggctg aaccaaaacg gtaactttaa acaagggtcg 960
tcaagcaaca agaagagatc tccggttggg aaagacgaag aaatgctttc tttcagcacg 1020
gtggttcgat ccgcggcgaa gtcagtggac tctgatcatt ccgatatcga agcatcggtg 1080
gttaaggagg cgattatcgt cgaaccggag aagaaaccga ggaaacgggg gagaaaaccg 1140
gctaacggga gagaagagcc gttgaaccat gtggaagcag agaggcagcg aagggagaag 1200
ctaaaccaga gattctactc gttgagagct gtggttccca acgtttcgaa aatggacaag 1260
gcttctcttc ttggagacgc catttcgtat atcaacgagc tgaaaacgaa gctgcagcaa 1320
gcggagaccg ataaggaaga ggttcagaag cagctagatc ggatgagcaa ggaaggtggc 1380
gggtctagga gggcgaaaga gcgaaaatcg aacctagatt ccgcgagttc tgtggaaatg 1440
gagattgatg tgaagatcat aggttgggat gtgatgatac gtgtacaatg cggcaagaag 1500
aatcatcctg gtgcgaggtt catggaagcg cttaaggagt tggatttgga agtgaatcat 1560
gctagtttat ctatggtgaa tgatttgatg attcaacaag ctactgtgaa gatgggaagc 1620
cagtttttca atcatgatca gctcaaggct gctttaatgt tgaaagttgg agaagacagt 1680
tga 1683
<210>122
<211>560
<212>PRT
<213>欧洲油菜
<400>122
Met Asp Asp His Arg Asn Arg Val Ser Leu Ser Pro Pro Asp Ala His
1 5 10 15
Met Ser Asn Tyr Phe Leu Asn Gln Ser Thr Ala Thr Asp Asp Asp Asn
20 25 30
Ala Ser Ala Ser Met Glu Ala Phe Ile Gly Thr Asn His Trp Ser Gln
35 40 45
Gln Pro Ser Leu Pro Pro Pro Pro Ser Leu Ser Gln Phe ASn Glu Asp
50 55 60
Thr Leu Gln Gln Arg Leu Gln Thr Leu Ile Glu Ser Ala Gly Glu Arg
65 70 75 80
Trp Thr Tyr Ala Ile Phe Trp Gln Ile Ser His Asp Phe Asp Ser Pro
85 90 95
Ala Gly Glu Ser Thr Val Ile Leu Gly Trp Gly Asp Gly Tyr Tyr Arg
100 105 110
Gly Glu Glu Asp Lys Glu Lys Lys Lys Lys Gln Ser Ser Ser Ser Asn
115 120 125
Pro Ala Glu Gln Glu His Arg Lys Arg Val Ile Arg Glu Leu Asn Ser
130 135 140
Leu Ile Ala Gly Gly Ala Gly Val Ser Asp Glu Ala Asn Asp Glu Glu
145 150 155 160
Val Thr Asp Thr Glu Trp Phe Phe Leu Val Ser Met Thr Gln Ser Phe
165 170 175
Val Asn Gly Val Gly Leu Pro Gly Glu Ser Phe Leu Asn Ser Arg Val
180 185 190
Ile Trp Leu Ser Gly Ser Gly Ala Leu Thr Gly Ser Gly Cys Glu Arg
195 200 205
Ala Arg Gln Gly Glu Val Tyr Gly Leu Gln Thr Ile Val Cys Ile Ala
210 215 220
Ala Glu Asn Gly Val Val Glu Leu Gly Ser Ser Glu Val Ile Ser Gln
225 230 235 240
Ser Ser Asp Leu Met Asp Lys Val Asn Gly Leu Phe Asn Gly Asn Gly
245 250 255
Asn Gly Glu Ala Ser Ser Trp Gly Phe Asn Leu Asn Pro Asp Gln Gly
260 265 270
Glu Asn Asp Pro Ala Leu Trp Leu Ser Glu Pro Asn Ile Thr Gly Ile
275 280 285
Glu Pro Val Gln Glu Thr Pro Ala Ile Glu Asn Ala Ala Asp Leu Asn
290 295 300
Phe Ser Ser Ser Gly Leu Asn Gln Asn Gly Asn Phe Lys Gln Gly Ser
305 310 315 320
Ser Ser Asn Lys Lys Arg Ser Pro Val Gly Lys Asp Glu Glu Met Leu
325 330 335
Ser Phe Ser Thr Val Val Arg Ser Ala Ala Lys Ser Val Asp Ser Asp
340 345 350
His Ser Asp Ile Glu Ala Ser Val Val Lys Glu Ala Ile Ile Val Glu
355 360 365
Pro Glu Lys Lys Pro Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg
370 375 380
Glu Glu Pro Leu Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys
385 390 395 400
Leu Asn Gln Arg Phe Tyr Ser Leu Arg Ala Val Val Pro Asn Val Ser
405 410 415
Lys Met Asp Lys Ala Ser Leu Leu Gly Asp Ala Ile Ser Tyr Ile Asn
420 425 430
Glu Leu Lys Thr Lys Leu Gln Gln Ala Glu Thr Asp Lys Glu Glu Val
435 440 445
Gln Lys Gln Leu Asp Arg Met Ser Lys Glu Gly Gly Gly Ser Arg Arg
450 455 460
Ala Lys Glu Arg Lys Ser Asn Leu Asp Ser Ala Ser Ser Val Glu Met
465 470 475 480
Glu Ile Asp Val Lys Ile Ile Gly Trp Asp Val Met Ile Arg Val Gln
485 490 495
Cys Gly Lys Lys Asn His Pro Gly Ala Arg Phe Met Glu Ala Leu Lys
500 505 510
Glu Leu Asp Leu Glu Val Asn His Ala Ser Leu Ser Met Val Asn Asp
515 520 525
Leu Met Ile Gln Gln Ala Thr Val Lys Met Gly Ser Gln Phe Phe Asn
530 535 540
His Asp Gln Leu Lys Ala Ala Leu Met Leu Lys Val Gly Glu Asp Ser
545 550 555 560
<210>123
<211>1899
<212>DNA
<213>大豆
<400>123
atgaatctgt ggacggacga gaactcctcg gtgatggagg ccttcatgag ctcctccgac 60
ctctcctccc tctggctccc cacgccgcaa tccgccgcct ctactaccac tcctggactg 120
gaaaccaccc gagcaccgcc gcctcagtcc cactccctcc tcaaccagga gaccctccag 180
cagcgcctcc agacacttat cgaaggcgcc cgagagagct ggacctacgc aatcttctgg 240
cagtcttcct acgactattc ctccggcacc tcccttctcg gctggggaga cggttattac 300
aagggtgagg aggacaaagt caaagccaaa ggcaaaaccc ccaaaacgac gtcgtccgcg 360
gagcaggacc accgcaaaaa agtcctccgc gaactcaatt ccttaatctc tggcccctcc 420
gcttccgttg acgacgtcga cgaagaagtc accgacaccg agtggttctt cctcgtgtcg 480
atgactcagt ccttcgtcaa cggaagcggc ctcccgggtc aggctttttt taactcgagc 540
ccggtctggg ttgccgggcc ggaccggctg tccgagtcgg tctgcgaacg ggcccaccag 600
gggcagatgt tcgggctcca gactctggtc tgcataccgt ccgcaaatgg cgtcgttgag 660
ctcgcctcca cggaggtgat tttccagaac cctgatctga tgaacaaggt gcgcgatttg 720
ttcaacttca acaacaaccc tgaaactggt tcctgggcgt tgaattgcgt tgccaccacc 780
gatcaggggg agaacgaccc ttcctcactc tggctcaacc ctgaaatcag agactcctct 840
accgttgcgc cgccgaattc aacggttaac aagactctgc agttcgaaac ccctggttcc 900
agtaccttaa ccgatacccc tagtgctgct gctgttcatg tacctaaatc taatggccag 960
ggtttcttct cgagggaatt gaacttttcg aattcattga agcctgaatc tggtgaaatt 1020
ctgagctttg gagagagcaa gaagagctct tacaacggga gtttctttcc cggtgttgtt 1080
gcaattgagg agaacaacaa gaagaggtct cccgtttctc ggagcagcat tgacgatggg 1140
atgctgtcct tcacatccct gccggctgca aatataaaat ctggtagtgg tggtgccggt 1200
gccggtggtg gtgattcgga tcactcggat ctggaagctt ccatggtgaa acaggcagac 1260
agcagagtga tggagccgga gaaacggcct cggaagaggg ggcgaaagcc ggccaacggc 1320
agagaggagc cgctgaatca cgtggaagcc gagagacaaa ggagagaaaa gctgaatcaa 1380
agattctatg ctctacgagc tgtagttcca aatgtatcca agatggacaa ggcatcgttg 1440
ttaggtgacg ccatatcgta cataaatgag ctgaaattga agctcaacgg gctggattca 1500
gagaaagggg aattggagaa gcaattggat tcagccaaga aggaacttga gctcgcgacc 1560
aaaaaccctc ctcctcctcc accaccacca cctggactac ctccatctaa taacgaagaa 1620
gcaaagaaga caacgaccaa gctcgctgat ttggagatag aggtgaagat aattggttgg 1680
gatgcgatga taagaatcca atgcagcaag aagaaccacc ctgcagcaag gttgatggca 1740
gcattgaagg acctggactt ggaagtgcat cacgcaagcg tgtccgtggt gaatgattta 1800
atgatccaac aagccacggt gaacatggga aacaagtttt acacgcagga gcagcttctg 1860
tcggcactct cgtccaaagt tggcgatgaa ctacgatag 1899
<210>124
<211>632
<212>PRT
<213>大豆
<400>124
Met Asn Leu Trp Thr Asp Glu Asn Ser Ser Val Met Glu Ala Phe Met
1 5 10 15
Ser Ser Ser Asp Leu Ser Ser Leu Trp Leu Pro Thr Pro Gln Ser Ala
20 25 30
Ala Ser Thr Thr Thr Pro Gly Leu Glu Thr Thr Arg Ala Pro Pro Pro
35 40 45
Gln Ser His Ser Leu Leu Asn Gln Glu Thr Leu Gln Gln Arg Leu Gln
50 55 60
Thr Leu Ile Glu Gly Ala Arg Glu Ser Trp Thr Tyr Ala Ile Phe Trp
65 70 75 80
Gln Ser Ser Tyr Asp Tyr Ser Ser Gly Thr Ser Leu Leu Gly Trp Gly
85 90 95
Asp Gly Tyr Tyr Lys Gly Glu Glu Asp Lys Val Lys Ala Lys Gly Lys
100 105 110
Thr Pro Lys Thr Thr Ser Ser Ala Glu Gln Asp His Arg Lys Lys Val
115 120 125
Leu Arg Glu Leu Asn Ser Leu Ile Ser Gly Pro Ser Ala Ser Val Asp
130 135 140
Asp Val Asp Glu Glu Val Thr Asp Thr Glu Trp Phe Phe Leu Val Ser
145 150 155 160
Met Thr Gln Ser Phe Val Asn Gly Ser Gly Leu Pro Gly Gln Ala Phe
165 170 175
Phe Asn Ser Ser Pro Val Trp Val Ala Gly Pro Asp Arg Leu Ser Glu
180 185 190
Ser Val Cys Glu Arg Ala His Gln Gly Gln Met Phe Gly Leu Gln Thr
195 200 205
Leu Val Cys Ile Pro Ser Ala Asn Gly Val Val Glu Leu Ala Ser Thr
210 215 220
Glu Val Ile Phe Gln Asn Pro Asp Leu Met Asn Lys Val Arg Asp Leu
225 230 235 240
Phe Asn Phe Asn Asn Asn Pro Glu Thr Gly Ser Trp Ala Leu Asn Cys
245 250 255
Val Ala Thr Thr Asp Gln Gly Glu Asn Asp Pro Ser Ser Leu Trp Leu
260 265 270
Asn Pro Glu Ile Arg Asp Ser Ser Thr Val Ala Pro Pro Asn Ser Thr
275 280 285
Val Asn Lys Thr Leu Gln Phe Glu Thr Pro Gly Ser Ser Thr Leu Thr
290 295 300
Asp Thr Pro Ser Ala Ala Ala Val His Val Pro Lys Ser Asn Gly Gln
305 310 315 320
Gly Phe Phe Ser Arg Glu Leu Asn Phe Ser Asn Ser Leu Lys Pro Glu
325 330 335
Ser Gly Glu Ile Leu Ser Phe Gly Glu Ser Lys Lys Ser Ser Tyr Asn
340 345 350
Gly Ser Phe Phe Pro Gly Val Val Ala Ile Glu Glu Asn Asn Lys Lys
355 360 365
Arg Ser Pro Val Ser Arg Ser Ser Ile Asp Asp Gly Met Leu Ser Phe
370 375 380
Thr Ser Leu Pro Ala Ala Asn Ile Lys Ser Gly Ser Gly Gly Ala Gly
385 390 395 400
Ala Gly Gly Gly Asp Ser Asp His Ser Asp Leu Glu Ala Ser Met Val
405 410 415
Lys Gln Ala Asp Ser Arg Val Met Glu Pro Glu Lys Arg Pro Arg Lys
420 425 430
Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu Asn His Val
435 440 445
Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg Phe Tyr Ala
450 455 460
Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys Ala Ser Leu
465 470 475 480
Leu Gly Asp Ala Ile Ser Tyr Ile Asn Glu Leu Lys Leu Lys Leu Asn
485 490 495
Gly Leu Asp Ser Glu Lys Gly Glu Leu Glu Lys Gln Leu Asp Ser Ala
500 505 510
Lys Lys Glu Leu Glu Leu Ala Thr Lys Asn Pro Pro Pro Pro Pro Pro
515 520 525
Pro Pro Pro Gly Leu Pro Pro Ser Asn Asn Glu Glu Ala Lys Lys Thr
530 535 540
Thr Thr Lys Leu Ala Asp Leu Glu Ile Glu Val Lys Ile Ile Gly Trp
545 550 555 560
Asp Ala Met Ile Arg Ile Gln Cys Ser Lys Lys Asn His Pro Ala Ala
565 570 575
Arg Leu Met Ala Ala Leu Lys Asp Leu Asp Leu Glu Val His His Ala
580 585 590
Ser Val Ser Val Val Asn Asp Leu Met Ile Gln Gln Ala Thr Val Asn
595 600 605
Met Gly Asn Lys Phe Tyr Thr Gln Glu Gln Leu Leu Ser Ala Leu Ser
610 615 620
Ser Lys Val Gly Asp Glu Leu Arg
625 630
<210>125
<211>1457
<212>DNA
<213>大豆
<400>125
atgaccgagt accggatgaa cctgtggacc gacgacaact cctccgtcat ggaggccttc 60
atgagctcct ccgacctctc ctccctctgg cttgccacgc cgcagtccgc cacctccacc 120
acaactccag gcacggcaaa agcccctcct cctcctcctc ctcctccgcc gccgccggcg 180
cagtcccagt ccctcctcaa ccaggagact ctccagcaac gcctccagac tctcatcgaa 240
ggcgcctgcg agagctggac ctacgcaatc ttctggcaat cttcctacga ctattcctcc 300
ggcacctccc ttctcggctg gggagacggt tactacaagg gcgaggagga caaagacaaa 360
gtcaaaacca aagcccccaa aacgaggtcg tccgcagagc aggaccatcg taagaaggtc 420
ctccgcgaac ttaattcctt aatttccggc ccttccgctt cagctgacga cattgacgaa 480
gaagtcaccg acaccgagtg gttcttcctg gtgtcgatga ctcagtcctt cgtcaacggt 540
agcgggctgc cgggccaggc tttttttaac tcgagcccgg tctgggtcgc cgggcccgaa 600
agactttccg aatcggcctg cgaacgggcc cgccaggggc agctcttcgg gctccagact 660
cttgtctgta taccgtccgc aaacggcgtc gtcgagctcg cctccgcgga ggtcattttt 720
cagaaccccg atctgatgaa caaggtgcgt gatttgttca acttcaacaa caacaacaac 780
aacaacaacc ctgaaacgtg ttcctgggcg ttgaattgcg ttgccaccac cgatcaaggc 840
gagaacgacc cttcctcgct ctggctcaac cctgaaatca aagactcctc caccgtctcg 900
ccgccgaatt ccacggttaa taagacgatg catttcgaaa cccctggttc cagtacccta 960
accgaaaccc ctagcgctgc tgctgctgtt cacgtcccca attctaaaag ccagggattc 1020
ttcccgaggg aattgaactt ttcgaattca ttgaaacctg aatccggtga aattctgagc 1080
tttggggaga gcaagaagag ctcttacaat ggggctttct ttcccggtgt tgttgcggtt 1140
gaggagaaca acaacaataa caagaacaag aagaagaggt ccccggtggt ttctcggagc 1200
agcattgacg atggaatgct ttccttcact tccctgccgg ctgcaaatat aaaatcagtt 1260
aacggtgctt gtgtcggtgc cggtgattcg gatcactcgg atctggaagc ttccgtggcg 1320
aaacaggtgg tggagcccga gaaacggccc cggaagagag ggcgaaagcc ggctaacgga 1380
agagaggaac cactaaatca tgtggaagcc gagagacaga ggagagaaaa gctgaaccaa 1440
agattctatg ctctacg 1457
<210>126
<211>654
<212>PRT
<213>大豆
<400>126
Met Thr Glu Tyr Arg Met Asn Leu Trp Thr Asp Asp Asn Ser Ser Val
1 5 10 15
Met Glu Ala Phe Met Ser Ser Ser Asp Leu Ser Ser Leu Trp Leu Ala
20 25 30
Thr Pro Gln Ser Ala Thr Ser Thr Thr Thr Pro Gly Thr A1a Lys Ala
35 40 45
Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Pro Ala Gln Ser Gln Ser
50 55 60
Leu Leu Asn Gln Glu Thr Leu Gln Gln Arg Leu Gln Thr Leu Ile Glu
65 70 75 80
Gly Ala Cys Glu Ser Trp Thr Tyr Ala Ile Phe Trp Gln Ser Ser Tyr
85 90 95
Asp Tyr Ser Ser Gly Thr Ser Leu Leu Gly Trp Gly Asp Gly Tyr Tyr
100 105 110
Lys Gly Glu Glu Asp Lys Asp Lys Val Lys Thr Lys Ala Pro Lys Thr
115 120 125
Arg Ser Ser Ala Glu Gln Asp His Arg Lys Lys Val Leu Arg Glu Leu
130 135 140
Asn Ser Leu Ile Ser Gly Pro Ser Ala Ser Ala Asp Asp Ile Asp Glu
145 150 155 160
Glu Val Thr Asp Thr Glu Trp Phe Phe Leu Val Ser Met Thr Gln Ser
165 170 175
Phe Val Asn Gly Ser Gly Leu Pro Gly Gln Ala Phe Phe Asn Ser Ser
180 185 190
Pro Val Trp Val Ala Gly Pro Glu Arg Leu Ser Glu Ser Ala Cys Glu
195 200 205
Arg Ala Arg Gln Gly Gln Leu Phe Gly Leu Gln Thr Leu Val Cys Ile
210 215 220
Pro Ser Ala Asn Gly Val Val Glu Leu Ala Ser Ala Glu Val Ile Phe
225 230 235 240
Gln Asn Pro Asp Leu Met Asn Lys Val Arg Asp Leu Phe Asn Phe Asn
245 250 255
Asn Asn Asn Asn Asn Asn Asn Pro Glu Thr Cys Ser Trp Ala Leu Asn
260 265 270
Cys Val Ala Thr Thr Asp Gln Gly Glu Asn Asp Pro Ser Ser Leu Trp
275 280 285
Leu Asn Pro Glu Ile Lys Asp Ser Ser Thr Val Ser Pro Pro Asn Ser
290 295 300
Thr Val Asn Lys Thr Met His Phe Glu Thr Pro Gly Ser Ser Thr Leu
305 310 315 320
Thr Glu Thr Pro Ser Ala Ala Ala Ala Val His Val Pro Asn Ser Lys
325 330 335
Ser Gln Gly Phe Phe Pro Arg Glu Leu Asn Phe Ser Asn Ser Leu Lys
340 345 350
Pro Glu Ser Gly Glu Ile Leu Ser Phe Gly Glu Ser Lys Lys Ser Ser
355 360 365
Tyr Asn Gly Ala Phe Phe Pro Gly Val Val Ala Val Glu Glu Asn Asn
370 375 380
Asn Asn Asn Lys Asn Lys Lys Lys Arg Ser Pro Val Val Ser Arg Ser
385 390 395 400
Ser Ile Asp Asp Gly Met Leu Ser Phe Thr Ser Leu Pro Ala Ala Asn
405 410 415
Ile Lys Ser Val Asn Gly Ala Cys Val Gly Ala Gly Asp Ser Asp His
420 425 430
Ser Asp Leu Glu Ala Ser Val Ala Lys Gln Val Val Glu Pro Glu Lys
435 440 445
Arg Pro Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro
450 455 460
Leu Asn His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln
465 470 475 480
Arg Phe Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp
485 490 495
Lys Ala Ser Leu Leu Gly Asp Ala Ile Leu Tyr Ile Asn Glu Leu Lys
500 505 510
Ser Lys Leu Asn Val Leu Asp Ser Glu Lys Thr Glu Leu Glu Lys Gln
515 520 525
Leu Asp Ser Thr Lys Lys Glu Leu Glu Leu Ala Thr Lys Asn Pro Pro
530 535 540
Pro Pro Pro Pro Pro Pro Pro Pro Pro Gly Pro Pro Pro Ser Asn Ser
545 550 555 560
Val Glu Pro Lys Lys Thr Thr Ser Lys Leu Ala Asp Leu Glu Leu Glu
565 570 575
Val Lys Ile Ile Gly Trp Asp Ala Met Val Arg Ile Gln Cys Ser Lys
580 585 590
Lys Asn His Pro Ala Ala Arg Leu Met Ala Ala Leu Lys Asp Leu Asp
595 600 605
Leu Glu Val His His Ala Ser Val Ser Val Val Asn Asp Leu Met Ile
610 615 620
Gln Gln Ala Thr Val Asn Met Gly Asn Lys Phe Tyr Thr Gln Glu Gln
625 630 635 640
Leu Leu Ser Ala Leu Ser Ser Lys Val Gly Asp Glu Leu Arg
645 650
<210>127
<211>2025
<212>DNA
<213>大麦
<400>127
atgatggagg ccctcatggc ctccgccgac atgccggcgt tcccctgggg cgcggcggcc 60
accccgccgc cgccggccgc cgtgccggcc ttcaaccagg acacgctcca gcagcgcctg 120
caggccatca tcgagggctc cagggagacc tggacctacg ccatcttctg gcagtcctcc 180
accgacgccg gcgcctcgct cctcggctgg ggcgacggct attacaaggg ctgcgacgac 240
gccgacaagc gccgccagca gcccaccccg gcctccgccg ccgagcagga gcaccgcaag 300
cgcgtcctca gggagctcaa ctcgctcata gccgggggcg gcgccgccgc gcccgacgag 360
gccgtcgagg aggagggcac ggacaccgag tgggtcttcc tcgtctccat gacccagtcc 420
ttccccaacg ggatgggctt gccgggccag gctctcttcg ccggccagcc tatctggatc 480
gccaccgggc tcgccagcgc gccctgcgag cgggccaagc aggcctacac cttcggcctc 540
cgcaccatgg tctgcatccc cctcggcacc ggcgtgctcg agctcggcgc caccgaggtc 600
atcttccaga ccaccgatag cttggggcgg atccgctcgc tcttcagcct caacggcgga 660
ggagggggct ctggatcctg gccgcccgtg gcgccgccgc cccaggaggc ggagacggat 720
ccgtccgtgc tctggctcgc cgacgcgccg gccggggaca tgaaggagtc gccgccgtcc 780
gtcgagatct ccgtctccaa gccgccgccg tcacagccgc cgcagatcca tcacttcgag 840
aacgggagca ccagcacgct cacggagaac cccagcctct ccgtgcacgc gcagcagcct 900
ctgccgcagc agcaggcggc ggcggcggcg cagaggcaga accagctcca gctccagcac 960
cagcacaacc agggtccttt ccgccgggag ctcaatttct cagatttcgc gtccaaccca 1020
tccgtcacgg tgaccccgcc tttcttcaag cctgagtctg gtgagatcct aaactttggc 1080
gctgacagca ccagccggag gaacccttcg ccggcgcccc ccgccgcgac ggccagcctc 1140
accaccgcgc cggggagcct cttctcccag cacacggcga cggtgacggc cccatcaaac 1200
gacgccaaga acaacccgaa gcggtccatg gaggccacct cccgcgcgag caacaccaac 1260
caccaccaga ccgcgacagc caacgagggg atgctgtcct tctcgtccgc gccgacgacg 1320
cggccgtcca ccggcacggg cgcaccagcc aagtcggagt ccgaccattc cgacctggag 1380
gcgtcggtcc gcgaggtgga gagcagccgc gtggtgcctc cgccggagga gaagcggccg 1440
cgcaagcgcg ggcgcaagcc ggcgaacggg cgcgaggagc cactgaacca cgtggaggcg 1500
gagcggcagc ggcgggagaa gctgaaccag cggttctacg cgctccgcgc cgtggtgccc 1560
aacgtgtcca agatggacaa ggcctcactg ctgggcgacg ccatctccta catcaacgag 1620
ctccgcggta agatgacggc gctggagtcg gacaaggaga cgctccactc ccaaattgag 1680
gcgctgaaga aggagcgcga cgcccggccg gccgcgccgt cgtcgtcggg aatgcacgac 1740
aacggggcgc ggtgccacgc ggtggagatc gaggccaaga tcctggggct ggaggcgatg 1800
atccgcgtgc agtgccacaa gcgcaaccac ccggcggcga agctgatgac ggcgctgcgg 1860
gagctggacc tggacgtgta ccacgccagc gtctcggtgg tgaaggacat catgatccag 1920
caggtggcgg tgaagatggc cacccgggtc tactcccagg aacagctcaa cgcggcgctc 1980
tacggccgcc tcgccgagcc gggcgccgcg atgcaaatcc ggtaa 2025
<210>128
<211>674
<212>PRT
<213>大麦
<400>128
Met Met Glu Ala Leu Met Ala Ser Ala Asp Met Pro Ala Phe Pro Trp
1 5 10 15
Gly Ala Ala Ala Thr Pro Pro Pro Pro Ala Ala Val Pro Ala Phe Asn
20 25 30
Gln Asp Thr Leu Gln Gln Arg Leu Gln Ala Ile Ile Glu Gly Ser Arg
35 40 45
Glu Thr Trp Thr Tyr Ala Ile Phe Trp Gln Ser Ser Thr Asp Ala Gly
50 55 60
Ala Ser Leu Leu Gly Trp Gly Asp Gly Tyr Tyr Lys Gly Cys Asp Asp
65 70 75 80
Ala Asp Lys Arg Arg Gln Gln Pro Thr Pro Ala Ser Ala Ala Glu Gln
85 90 95
Glu His Arg Lys Arg Val Leu Arg Glu Leu Asn Ser Leu Ile Ala Gly
100 105 110
Gly Gly Ala Ala Ala Pro Asp Glu Ala Val Glu Glu Glu Gly Thr Asp
115 120 125
Thr Glu Trp Val Phe Leu Val Ser Met Thr Gln Ser Phe Pro Asn Gly
130 135 140
Met Gly Leu Pro Gly Gln Ala Leu Phe Ala Gly Gln Pro Ile Trp Ile
145 150 155 160
Ala Thr Gly Leu Ala Ser Ala Pro Cys Glu Arg Ala Lys Gln Ala Tyr
165 170 175
Thr Phe Gly Leu Arg Thr Met Val Cys Ile Pro Leu Gly Thr Gly Val
180 185 190
Leu Glu Leu Gly Ala Thr Glu Val Ile Phe Gln Thr Thr Asp Ser Leu
195 200 205
Gly Arg Ile Arg Ser Leu Phe Ser Leu Asn Gly Gly Gly Gly Gly Ser
210 215 220
Gly Ser Trp Pro Pro Val Ala Pro Pro Pro Gln Glu Ala Glu Thr Asp
225 230 235 240
Pro Ser Val Leu Trp Leu Ala Asp Ala Pro Ala Gly Asp Met Lys Glu
245 250 255
Ser Pro Pro Ser Val Glu Ile Ser Val Ser Lys Pro Pro Pro Ser Gln
260 265 270
Pro Pro Gln Ile His His Phe Glu Asn Gly Ser Thr Ser Thr Leu Thr
275 280 285
Glu Asn Pro Ser Leu Ser Val His Ala Gln Gln Pro Leu Pro Gln Gln
290 295 300
Gln Ala Ala Ala Ala Ala Gln Arg Gln Asn Gln Leu Gln Leu Gln His
305 310 315 320
Gln His Asn Gln Gly Pro Phe Arg Arg Glu Leu Asn Phe Ser Asp Phe
325 330 335
Ala Ser Asn Pro Ser Val Thr Val Thr Pro Pro Phe Phe Lys Pro Glu
340 345 350
Ser Gly Glu Ile Leu Asn Phe Gly Ala Asp Ser Thr Ser Arg Arg Asn
355 360 365
Pro Ser Pro Ala Pro Pro Ala Ala Thr Ala Ser Leu Thr Thr Ala Pro
370 375 380
Gly Ser Leu Phe Ser Gln His Thr Ala Thr Val Thr Ala Pro Ser Asn
385 390 395 400
Asp Ala Lys Asn Asn Pro Lys Arg Ser Met Glu Ala Thr Ser Arg Ala
405 410 415
Ser Asn Thr Asn His His Gln Thr Ala Thr Ala Asn Glu Gly Met Leu
420 425 430
Ser Phe Ser Ser Ala Pro Thr Thr Arg Pro Ser Thr Gly Thr Gly Ala
435 440 445
Pro Ala Lys Ser Glu Ser Asp His Ser Asp Leu Glu Ala Ser Val Arg
450 455 460
Glu Val Glu Ser Ser Arg Val Val Pro Pro Pro Glu Glu Lys Arg Pro
465 470 475 480
Arg Lys Arg Gly Arg Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu Asn
485 490 495
His Val Glu Ala Glu Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg Phe
500 505 510
Tyr Ala Leu Arg Ala Val Val Pro Asn Val Ser Lys Met Asp Lys Ala
515 520 525
Ser Leu Leu Gly Asp Ala Ile Ser Tyr Ile Asn Glu Leu Arg Gly Lys
530 535 540
Met Thr Ala Leu Glu Ser Asp Lys Glu Thr Leu His Ser Gln Ile Glu
545 550 555 560
Ala Leu Lys Lys Glu Arg Asp Ala Arg Pro Ala Ala Pro Ser Ser Ser
565 570 575
Gly Met His Asp Asn Gly Ala Arg Cys His Ala Val Glu Ile Glu Ala
580 585 590
Lys Ile Leu Gly Leu Glu Ala Met Ile Arg Val Gln Cys His Lys Arg
595 600 605
Asn His Pro Ala Ala Lys Leu Met Thr Ala Leu Arg Glu Leu Asp Leu
610 615 620
Asp Val Tyr His Ala Ser Val Ser Val Val Lys Asp Ile Met Ile Gln
625 630 635 640
Gln Val Ala Val Lys Met Ala Thr Arg Val Tyr Ser Gln Glu Gln Leu
645 650 655
Asn Ala Ala Leu Tyr Gly Arg Leu Ala Glu Pro Gly Ala Ala Met Gln
660 665 670
Ile Arg
<210>129
<211>2112
<212>DNA
<213>玉米
<400>129
atgaacctgt ggacggacga caacgcctcc atgatggagg ccttcatggc ctccgccgac 60
ctccccgcct acccctgggg ggcgccggcc gggggcggca acccgccgcc gccgcagatg 120
ccgccggcga tggcgatggc gccggggttc aaccaggaca cgctgcagca gcggctgcag 180
gccatgatcg aggggtccag ggagacctgg acctacgcca tcttctggca gtcctccctg 240
gacgccgcca ccggcgcgtc gctgctaggc tggggcgacg gctactacaa gggctgcgac 300
gacgacaagc gcaggcaccg cccgccgctc acgcccgccg cgcaggccga gcaggagcac 360
cgcaagcgcg tgctccgcga gctcaactcc ctcatctccg gcggcgcctc cgccgcgccc 420
gcgcccgcgc ccgacgaggc cgtcgaggag gaggtcaccg acaccgagtg gttcttcctc 480
gtctccatga cgcagtcctt cctcaacggc tcgggcctcc ccggccaggc gctcttcgcg 540
ggccaccaca cctggatcgc cgccggcctc tcctccgcgc cgtgcgaccg cgcgcgccag 600
gcctacaact tcggcctccg caccatggtc tgcttccccg tcggcacggg cgtgctcgag 660
ctcggctcca ccgacgtcgt gttccagacc gccgagacca tggccaagat ccgctcgctc 720
ttcgggggcg ggccgggggg tggctcgtgg ccgcccgtgc agccccaggc ggcgccgcag 780
cagcagcacg ccgccgaagc cgaccaggcg gcggagacgg acccatccgt gctgtggctc 840
gccgacgcgc cggtcgtgga catcaaggat tcctactcgc acccgtcggc ggccgagatc 900
tccgtctcca aaccgcctcc gcctccgcct ccgccgcaga ttcacttcga gaacgggagc 960
acgagcacgc tcacggagaa ccccagcccc tccgtgcacg cgccgccagc cccgccggcg 1020
ccaccgcagc ggcagcagca gaatcagggc ccgttccgcc gggagctcaa cttctcggat 1080
ttcgcgtcca atccttcctt ggcggcggcc ccgccgttct tcaagcccga gtccggcgag 1140
atcctcagct tcggcgtcga cagcaacgcc cagaggaacc cgtcgccggc gcctcccgcc 1200
agcctcacca ccgctcccgg cagcctattc tcgcagtcgc agcacacggc gaccgccgcg 1260
gcgaacgacg cgaagaacaa caacaacaac aacaagcgtt cgatggaagc cacctccctg 1320
gcgagcaaca ccaaccacca cccggcggcg gcggcgaacg agggcatgct gtccttctcg 1380
tcggcgccga ccgcgcggcc gtcggcaggc acgggcgcgc cggccaagtc ggagtccgac 1440
cactcggacc tggacgcgtc cgtgcgcgag gtggagagca gccgcgtcgt ggcgccgccg 1500
ccggaggcgg agaagcggcc gcggaagcgc gggcggaagc ccgcgaacgg gcgcgaggag 1560
ccgctgaacc acgtggaggc ggagcggcag cggcgggaga agctgaacca gcgcttctac 1620
gcgctgcgcg ccgtggtgcc caacgtgtcc aagatggaca aggcgtcgct gctcggcgac 1680
gccatctcct acatcaacga gctccgcggc aagctgacgt cgctggagtc ggacagggag 1740
acgctgcagg cccaggtcga ggcgctcaag aaggagcgcg acgcgcggcc gcacccgcac 1800
cccgctgccg ggctcggcgg gcacgacgcc ggcgggccgc gctgccacgc ggtagagatc 1860
gacgccaaga tcctggggct ggaggccatg atccgcgtgc agtgccacaa gcgcaaccac 1920
ccgtcggcgc ggctgatgac ggcgctccgc gagctcgacc tggacgtgta ccacgccagc 1980
gtctccgtcg tcaaggacct catgatccag caggtcgccg tcaagatggc cagccgcatg 2040
tactcgcagg accagctcag cgccgcgctc tacagccgcc ttgcggagcc cgggtctgtc 2100
atgggcaggt aa 2112
<210>130
<211>703
<212>PRT
<213>玉米
<400>130
Met Asn Leu Trp Thr Asp Asp Asn Ala Ser Met Met Glu Ala Phe Met
1 5 10 15
Ala Ser Ala Asp Leu Pro Ala Tyr Pro Trp Gly Ala Pro Ala Gly Gly
20 25 30
Gly Asn Pro Pro Pro Pro Gln Met Pro Pro Ala Met Ala Met Ala Pro
35 40 45
Gly Phe Asn Gln Asp Thr Leu Gln Gln Arg Leu Gln Ala Met Ile Glu
50 55 60
Gly Ser Arg Glu Thr Trp Thr Tyr Ala Ile Phe Trp Gln Ser Ser Leu
65 70 75 80
Asp Ala Ala Thr Gly Ala Ser Leu Leu Gly Trp Gly Asp Gly Tyr Tyr
85 90 95
Lys Gly Cys Asp Asp Asp Lys Arg Arg His Arg Pro Pro Leu Thr Pro
100 105 110
Ala Ala Gln Ala Glu Gln Glu His Arg Lys Arg Val Leu Arg Glu Leu
115 120 125
Asn Ser Leu Ile Ser Gly Gly Ala Ser Ala Ala Pro Ala Pro Ala Pro
130 135 140
Asp Glu Ala Val Glu Glu Glu Val Thr Asp Thr Glu Trp Phe Phe Leu
145 150 155 160
Val Ser Met Thr Gln Ser Phe Leu Asn Gly Ser Gly Leu Pro Gly Gln
165 170 175
Ala Leu Phe Ala Gly His His Thr Trp Ile Ala Ala Gly Leu Ser Ser
180 185 190
Ala Pro Cys Asp Arg Ala Arg Gln Ala Tyr Asn Phe Gly Leu Arg Thr
195 200 205
Met Val Cys Phe Pro Val Gly Thr Gly Val Leu Glu Leu Gly Ser Thr
210 215 220
Asp Val Val Phe Gln Thr Ala Glu Thr Met Ala Lys Ile Arg Ser Leu
225 230 235 240
Phe Gly Gly Gly Pro Gly Gly Gly Ser Trp Pro Pro Val Gln Pro Gln
245 250 255
Ala Ala Pro Gln Gln Gln His Ala Ala Glu Ala Asp Gln Ala Ala Glu
260 265 270
Thr Asp Pro Ser Val Leu Trp Leu Ala Asp Ala Pro Val Val Asp Ile
275 280 285
Lys Asp Ser Tyr Ser His Pro Ser Ala Ala Glu Ile Ser Val Ser Lys
290 295 300
Pro Pro Pro Pro Pro Pro Pro Pro Gln Ile His Phe Glu Asn Gly Ser
305 310 315 320
Thr Ser Thr Leu Thr Glu Asn Pro Ser Pro Ser Val His Ala Pro Pro
325 330 335
Ala Pro Pro Ala Pro Pro Gln Arg Gln Gln Gln Asn Gln Gly Pro Phe
340 345 350
Arg Arg Glu Leu Asn Phe Ser Asp Phe Ala Ser Asn Pro Ser Leu Ala
355 360 365
Ala Ala Pro Pro Phe Phe Lys Pro Glu Ser Gly Glu Ile Leu Ser Phe
370 375 380
Gly Val Asp Ser Asn Ala Gln Arg Asn Pro Ser Pro Ala Pro Pro Ala
385 390 395 400
Ser Leu Thr Thr Ala Pro Gly Ser Leu Phe Ser Gln Ser Gln His Thr
405 410 415
Ala Thr Ala Ala Ala Asn Asp Ala Lys Asn Asn Asn Asn Asn Asn Lys
420 425 430
Arg Ser Met Glu Ala Thr Ser Leu Ala Ser Asn Thr Asn His His Pro
435 440 445
Ala Ala Ala Ala Asn Glu Gly Met Leu Ser Phe Ser Ser Ala Pro Thr
450 455 460
Ala Arg Pro Ser Ala Gly Thr Gly Ala Pro Ala Lys Ser Glu Ser Asp
465 470 475 480
His Ser Asp Leu Asp Ala Ser Val Arg Glu Val Glu Ser Ser Arg Val
485 490 495
Val Ala Pro Pro Pro Glu Ala Glu Lys Arg Pro Arg Lys Arg Gly Arg
500 505 510
Lys Pro Ala Asn Gly Arg Glu Glu Pro Leu Asn His Val Glu Ala Glu
515 520 525
Arg Gln Arg Arg Glu Lys Leu Asn Gln Arg Phe Tyr Ala Leu Arg Ala
530 535 540
Val Val Pro Asn Val Ser Lys Met Asp Lys Ala Ser Leu Leu Gly Asp
545 550 555 560
Ala Ile Ser Tyr Ile Asn Glu Leu Arg Gly Lys Leu Thr Ser Leu Glu
565 570 575
Ser Asp Arg Glu Thr Leu Gln Ala Gln Val Glu Ala Leu Lys Lys Glu
580 585 590
Arg Asp Ala Arg Pro His Pro His Pro Ala Ala Gly Leu Gly Gly His
595 600 605
Asp Ala Gly Gly Pro Arg Cys His Ala Val Glu Ile Asp Ala Lys Ile
610 615 620
Leu Gly Leu Glu Ala Met Ile Arg Val Gln Cys His Lys Arg Asn His
625 630 635 640
Pro Ser Ala Arg Leu Met Thr Ala Leu Arg Glu Leu Asp Leu Asp Val
645 650 655
Tyr His Ala Ser Val Ser Val Val Lys Asp Leu Met Ile Gln Gln Val
660 665 670
Ala Val Lys Met Ala Ser Arg Met Tyr Ser Gln Asp Gln Leu Ser Ala
675 680 685
Ala Leu Tyr Ser Arg Leu Ala Glu Pro Gly Ser Val Met Gly Arg
690 695 700
<210>131
<211>1074
<212>DNA
<213>拟南芥
<400>131
atgacagaac tcaacttcca cctcctccca ataatctccg atcgcttcac gacgacgacg 60
acaacatcac cgtcgttctc gtcacattct tcttcttctt cttctcttct ctctttcacc 120
aaacgaagac gaaaacacca acctttagta tcatccatac gcatggaaca gtcacggtca 180
cggaatcgga aagacaaagt cgtcgtcatt ttaggagcaa ccggcgccgg aaaatcaaga 240
ctttccgtcg atctcgctac tcgtttccct tcagagatca taaactccga taaaatccaa 300
gtctacgaag gattagagat cacaacgaat cagattacgt tacaagaccg tcgcggcgtt 360
cctcaccatc tcctcggcgt catcaacccc gaacacggcg aactaaccgc cggagagttt 420
cgctccgccg cttcaaacgt cgtcaaagtg ataacttctc gtcaaaaggt tccgattatc 480
gccggtggat ctaactcttt cgtccacgca ctcttagctc aacgattcga cccaaagttc 540
gatccttttt catccgggtc gtgtttaatc agctccgatt tgcgttacga gtgttgtttc 600
atctgggtcg atgtatcgga gactgttctc tacgagtatc ttctcagaag agtcgacgaa 660
atgatggatt caggtatgtt cgaagagctg tctagattct acgacccggt taaatccggt 720
ttagaaaccc ggtttgggat taggaaagct ataggtgtac cggagtttga cggttacttc 780
aaagagtatc caccggagaa gaagatgata aagtgggacg ctttaagaaa agcggcgtac 840
gataaggcgg ttgatgatat caaaaggaac acgtggacgt tagcgaagag acaagtgaag 900
aagattgaga tgctaaaaga cgctggttgg gaaatagaaa gagttgatgc aacggcgtcg 960
tttaaagcag tgatgatgaa gagttcgtcg gagaagaagt ggagagagaa ttgggaagag 1020
caagtgttgg agccaagcgt aaagattgtg aagcggcatt tggtgcaaaa ttag 1074
<210>132
<211>357
<212>PRT
<213>拟南芥
<400>132
Met Thr Glu Leu Asn Phe His Leu Leu Pro Ile Ile Ser Asp Arg Phe
1 5 10 15
Thr Thr Thr Thr Thr Thr Ser Pro Ser Phe Ser Ser His Ser Ser Ser
20 25 30
Ser Ser Ser Leu Leu Ser Phe Thr Lys Arg Arg Arg Lys His Gln Pro
35 40 45
Leu Val Ser Ser Ile Arg Met Glu Gln Ser Arg Ser Arg Asn Arg Lys
50 55 60
Asp Lys Val Val Val Ile Leu Gly Ala Thr Gly Ala Gly Lys Ser Arg
65 70 75 80
Leu Ser Val Asp Leu Ala Thr Arg Phe Pro Ser Glu Ile Ile Asn Ser
85 90 95
Asp Lys Ile Gln Val Tyr Glu Gly Leu Glu Ile Thr Thr Asn Gln Ile
100 105 110
Thr Leu Gln Asp Arg Arg Gly Val Pro His His Leu Leu Gly Val Ile
115 120 125
Asn Pro Glu His Gly Glu Leu Thr Ala Gly Glu Phe Arg Ser Ala Ala
130 135 140
Ser Asn Val Val Lys Val Ile Thr Ser Arg Gln Lys Val Pro Ile Ile
145 150 155 160
Ala Gly Gly Ser Asn Ser Phe Val His Ala Leu Leu Ala Gln Arg Phe
165 170 175
Asp Pro Lys Phe Asp Pro Phe Ser Ser Gly Ser Cys Leu Ile Ser Ser
180 185 190
Asp Leu Arg Tyr Glu Cys Cys Phe Ile Trp Val Asp Val Ser Glu Thr
195 200 205
Val Leu Tyr Glu Tyr Leu Leu Arg Arg Val Asp Glu Met Met Asp Ser
210 215 220
Gly Met Phe Glu Glu Leu Ser Arg Phe Tyr Asp Pro Val Lys Ser Gly
225 230 235 240
Leu Glu Thr Arg Phe Gly Ile Arg Lys Ala Ile Gly Val Pro Glu Phe
245 250 255
Asp Gly Tyr Phe Lys Glu Tyr Pro Pro Glu Lys Lys Met Ile Lys Trp
260 265 270
Asp Ala Leu Arg Lys Ala Ala Tyr Asp Lys Ala Val Asp Asp Ile Lys
275 280 285
Arg Asn Thr Trp Thr Leu Ala Lys Arg Gln Val Lys Lys Ile Glu Met
290 295 300
Leu Lys Asp Ala Gly Trp Glu Ile Glu Arg Val Asp Ala Thr Ala Ser
305 310 315 320
Phe Lys Ala Val Met Met Lys Ser Ser Ser Glu Lys Lys Trp Arg Glu
325 330 335
Asn Trp Glu Glu Gln Val Leu Glu Pro Ser Val Lys Ile Val Lys Arg
340 345 350
His Leu Val Gln Asn
355
<210>133
<211>654
<212>DNA
<213>稻
<400>133
cttctacatc ggcttaggtg tagcaacacg actttattat tattattatt attattatta 60
ttattttaca aaaatataaa atagatcagt ccctcaccac aagtagagca agttggtgag 120
ttattgtaaa gttctacaaa gctaatttaa aagttattgc attaacttat ttcatattac 180
aaacaagagt gtcaatggaa caatgaaaac catatgacat actataattt tgtttttatt 240
attgaaatta tataattcaa agagaataaa tccacatagc cgtaaagttc tacatgtggt 300
gcattaccaa aatatatata gcttacaaaa catgacaagc ttagtttgaa aaattgcaat 360
ccttatcaca ttgacacata aagtgagtga tgagtcataa tattattttt cttgctaccc 420
atcatgtata tatgatagcc acaaagttac tttgatgatg atatcaaaga acatttttag 480
gtgcacctaa cagaatatcc aaataatatg actcacttag atcataatag agcatcaagt 540
aaaactaaca ctctaaagca accgatggga aagcatctat aaatagacaa gcacaatgaa 600
aatcctcatc atccttcacc acaattcaaa tattatagtt gaagcatagt agta 654
<210>134
<211>55
<212>DNA
<213>人工序列
<220>
<223>引物:prm03095
<400>134
ggggacaagt ttgtacaaaa aagcaggctt cacaatgaca gaactcaact tccac 55
<210>135
<211>49
<212>DNA
<213>人工序列
<220>
<223>引物:prm03096
<400>135
ggggaccact ttgtacaaga aagctgggta actaattttg caccaaatg 49
<210>136
<211>957
<212>DNA
<213>拟南芥
<400>136
atgaagtgta atgacaaaat ggttgtgatc atgggtgcca ccggttctgg caagtcatca 60
ctctctgttg atctcgcttt acattttaaa gccgagatca tcaactctga caaaatgcag 120
ttctacgatg gcttgaagat caccacgaat caatcgacca ttgaagatcg acgtggagtg 180
ccacatcacc ttctcggtga actaaacccg gaggctggag aagtcacagc ggcagaattt 240
cgcgttatgg cggctgaagc catctccgag attactcaac gtaaaaagct cccaatcctt 300
gccggtggat ccaactcata cattcatgct ctccttgcaa aatcttatga ccctgaaaac 360
tatccgtttt ctgatcacaa gggctcaatc tgctccgagt tgaaatatga ttgttgtttc 420
atttggatag atgtggatca gtctgtgtta ttcgagtatc tttctttacg tttggatctt 480
atgatgaagt caggtatgtt cgaggagatc gctgagttcc accgctctaa gaaggccccg 540
aaagagccat tggggatatg gaaggctata ggagtgcaag agtttgatga ctacctcaaa 600
atgtacaagt gggacaatga catggataaa tgggacccta tgagaaagga ggcttatgag 660
aaggcggtga gagccatcaa agaaaacaca tttcagctca caaaggatca aatcacgaag 720
atcaacaagc tgagaaatgc cgggtgggac ataaagaagg tggatgctac agcatcgttt 780
cgagaggcaa ttagggcagc caaggaaggc gaaggtgtag ccgagatgca gagaaagata 840
tggaacaagg aagtgttgga accgtgtgtg aagattgtca ggagccactt ggaccaaccg 900
atcaactatt attattatta cttttattta ctaaaaagat ttttaagtct taactag 957
<210>137
<211>318
<212>PRT
<213>拟南芥
<400>137
Met Lys Cys Asn Asp Lys Met Val Val Ile Met Gly Ala Thr Gly Ser
1 5 10 15
Gly Lys Ser Ser Leu Ser Val Asp Leu Ala Leu His Phe Lys Ala Glu
20 25 30
Ile Ile Asn Ser Asp Lys Met Gln Phe Tyr Asp Gly Leu Lys Ile Thr
35 40 45
Thr Asn Gln Ser Thr Ile Glu Asp Arg Arg Gly Val Pro His His Leu
50 55 60
Leu Gly Glu Leu Asn Pro Glu Ala Gly Glu Val Thr Ala Ala Glu Phe
65 70 75 80
Arg Val Met Ala Ala Glu Ala Ile Ser Glu Ile Thr Gln Arg Lys Lys
85 90 95
Leu Pro Ile Leu Ala Gly Gly Ser Asn Ser Tyr Ile His Ala Leu Leu
100 105 110
Ala Lys Ser Tyr Asp Pro Glu Asn Tyr Pro Phe Ser Asp His Lys Gly
115 120 125
Ser Ile Cys Ser Glu Leu Lys Tyr Asp Cys Cys Phe Ile Trp Ile Asp
130 135 140
Val Asp Gln Ser Val Leu Phe Glu Tyr Leu Ser Leu Arg Leu Asp Leu
145 150 155 160
Met Met Lys Ser Gly Met Phe Glu Glu Ile Ala Glu Phe His Arg Ser
165 170 175
Lys Lys Ala Pro Lys Glu Pro Leu Gly Ile Trp Lys Ala Ile Gly Val
180 185 190
Gln Glu Phe Asp Asp Tyr Leu Lys Met Tyr Lys Trp Asp Asn Asp Met
195 200 205
Asp Lys Trp Asp Pro Met Arg Lys Glu Ala Tyr Glu Lys Ala Val Arg
210 215 220
Ala Ile Lys Glu Asn Thr Phe Gln Leu Thr Lys Asp Gln Ile Thr Lys
225 230 235 240
Ile Asn Lys Leu Arg Asn Ala Gly Trp Asp Ile Lys Lys Val Asp Ala
245 250 255
Thr Ala Ser Phe Arg Glu Ala Ile Arg Ala Ala Lys Glu Gly Glu Gly
260 265 270
Val Ala Glu Met Gln Arg Lys Ile Trp Asn Lys Glu Val Leu Glu Pro
275 280 285
Cys Val Lys Ile Val Arg Ser His Leu Asp Gln Pro Ile Asn Tyr Tyr
290 295 300
Tyr Tyr Tyr Phe Tyr Leu Leu Lys Arg Phe Leu Ser Leu Asn
305 310 315
<210>138
<211>1029
<212>DNA
<213>拟南芥
<400>138
atgcaacaac tcatgacctt gttatcacca ccactctctc attcttctct ccttcccacc 60
gtcactacca aattcgggtc accacgatta gtcactacgt gcatgggcca tgcagggcgt 120
aaaaatatca aggataaggt ggttctcatc acaggtacaa caggcacagg caagtcacgc 180
ctctcagtcg atcttgccac ccgttttttt cccgccgaga tcataaactc ggacaaaatg 240
caaatctaca agggattcga gattgtcaca aatctaatcc cactgcatga gcaaggagga 300
gtcccgcacc atcttctagg tcagttccac ccacaagacg gtgaactcac ccctgcagag 360
ttccgttctt tggcgacact gtccatctct aaactaattt ctagcaagaa actcccgatt 420
gtagttggtg gatccaactc cttcaatcac gctctactcg ccgagcgttt tgacccggat 480
attgatccat tctctcccgg atcgagtctt tcaacgatct gctctgacct aaggtacaaa 540
tgttgcatct tatgggttga tgttttagag ccggttctgt tccaacactt gtgcaatcgt 600
gtcgaccaaa tgatcgagtc gggattggtc gagcagcttg ccgaattgta cgaccctgtt 660
gtagattcgg gtcgacgact aggggttcgg aagacgatag gagtagagga gttcgaccga 720
tactttagag tataccctaa ggagatggac aagggaattt gggacttagc gagaaaggcg 780
gcgtacgagg agacagtgaa ggggatgaaa gagaggacat gtcggttggt gaagaagcag 840
aaagagaaga tcatgaagct gataagaggt ggttgggaga ttaagaggct tgacgctacg 900
gcggcaatta tggctgagct gaatcaaagt acggcaaagg gagaaggaaa gaatgggaga 960
gagatttggg aaaaacacat tgtggatgaa agtgtcgaga ttgtcaagaa gtttttgttg 1020
gaagtttag 1029
<210>139
<211>342
<212>PRT
<213>拟南芥
<400>139
Met Gln Gln Leu Met Thr Leu Leu Ser Pro Pro Leu Ser His Ser Ser
1 5 10 15
Leu Leu Pro Thr Val Thr Thr Lys Phe Gly Ser Pro Arg Leu Val Thr
20 25 30
Thr Cys Met Gly His Ala Gly Arg Lys Asn Ile Lys Asp Lys Val Val
35 40 45
Leu Ile Thr Gly Thr Thr Gly Thr Gly Lys Ser Arg Leu Ser Val Asp
50 55 60
Leu Ala Thr Arg Phe Phe Pro Ala Glu Ile Ile Asn Ser Asp Lys Met
65 70 75 80
Gln Ile Tyr Lys Gly Phe Glu Ile Val Thr Asn Leu Ile Pro Leu His
85 90 95
Glu Gln Gly Gly Val Pro His His Leu Leu Gly Gln Phe His Pro Gln
100 105 110
Asp Gly Glu Leu Thr Pro Ala Glu Phe Arg Ser Leu Ala Thr Leu Ser
115 120 125
Ile Ser Lys Leu Ile Ser Ser Lys Lys Leu Pro Ile Val Val Gly Gly
130 135 140
Ser Asn Ser Phe Asn His Ala Leu Leu Ala Glu Arg Phe Asp Pro Asp
145 150 155 160
Ile Asp Pro Phe Ser Pro Gly Ser Ser Leu Ser Thr Ile Cys Ser Asp
165 170 175
Leu Arg Tyr Lys Cys Cys Ile Leu Trp Val Asp Val Leu Glu Pro Val
180 185 190
Leu Phe Gln His Leu Cys Asn Arg Val Asp Gln Met Ile Glu Ser Gly
195 200 205
Leu Val Glu Gln Leu Ala Glu Leu Tyr Asp Pro Val Val Asp Ser Gly
210 215 220
Arg Arg Leu Gly Val Arg Lys Thr Ile Gly Val Glu Glu Phe Asp Arg
225 230 235 240
Tyr Phe Arg Val Tyr Pro Lys Glu Met Asp Lys Gly Ile Trp Asp Leu
245 250 255
Ala Arg Lys Ala Ala Tyr Glu Glu Thr Val Lys Gly Met Lys Glu Arg
260 265 270
Thr Cys Arg Leu Val Lys Lys Gln Lys Glu Lys Ile Met Lys Leu Ile
275 280 285
Arg Gly Gly Trp Glu Ile Lys Arg Leu Asp Ala Thr Ala Ala Ile Met
290 295 300
Ala Glu Leu Asn Gln Ser Thr Ala Lys Gly Glu Gly Lys Asn Gly Arg
305 310 315 320
Glu Ile Trp Glu Lys His Ile Val Asp Glu Ser Val Glu Ile Val Lys
325 330 335
Lys Phe Leu Leu Glu Val
340
<210>140
<211>1137
<212>DNA
<213>蛇麻草(Humulus lupulus)
<400>140
agccggaaga agaccagggt gggcacgcat ggactacgca tccgttgcca tggctgccgc 60
gcccaccaca acaaccacta ccaacgtatc actccgtcgc cagcgacacc ggaaagagaa 120
gcttctcgtt ctaatgggcg ccaccggtac cgggaagtcc cgtctctcca tcgacctcgc 180
ggcgcacttc cctctcgaag tcataaactc ggataaaatg caggtttata aaggactgga 240
tatcacgacg aacaagatat cggtaccgga ccggggcggc gtgccacacc atctcctcgg 300
tgaggttgac ccggctcgag gtgagttgac tcctgccgat ttcaggtctt tggctggaaa 360
agccgtgtct gaaatcactg ggaggagaaa gcttcccgtc ctggtgggtg ggtccaactc 420
gttcatacat gcgctgttgg tggaccggtt tgactcgtcg ggcccgggcg tgttcgagga 480
agggtcccac tcggtggtgt cttctgagtt gagatacgac tgttgctttc tctgggttga 540
cgtgtcggta aaggtattga ccgattactt ggcgaagcga gtcgacgaca tgttggagct 600
ggggatgttc gatgagttgg ccgagttcta tagcccggag gacgaggacc acgacgaaga 660
ctctgcgact cggaccgggt tgagaaaagc catcggagtt cccgagtttg accggtattt 720
cgaaaagttc agacctggcg acgtggaggg ggaggacccc gggagggatc gggtgcggag 780
gggcgcattc gaagaggcgg tgagggcgat caaggagaac acgtgtcatc tagcgaagag 840
acaaataggg aagatcttac gattaaaagg cgctgggtgg gacctacggc ggctggacgc 900
aacagagtcg ttccgggcgg cgatgacgtc agactccggc gagaagtgca cggagatttg 960
ggagaagcag gtattggaac caagcgtgaa gattgtgagt cgcttcttgg acgagtaggt 1020
tttgccagca atttccagct cattttttct tttatttttt tgagtttgtt aaaaaaaaat 1080
tttggtagtt agttttccca cggaaaaatt ttcaacttgt cacaattaca aattaat 1137
<210>141
<211>329
<212>PRT
<213>蛇麻草
<400>141
Met Asp Tyr Ala Ser Val Ala Met Ala Ala Ala Pro Thr Thr Thr Thr
1 5 10 15
Thr Thr Asn Val Ser Leu Arg Arg Gln Arg His Arg Lys Glu Lys Leu
20 25 30
Leu Val Leu Met Gly Ala Thr Gly Thr Gly Lys Ser Arg Leu Ser Ile
35 40 45
Asp Leu Ala Ala His Phe Pro Leu Glu Val Ile Asn Ser Asp Lys Met
50 55 60
Gln Val Tyr Lys Gly Leu Asp Ile Thr Thr Asn Lys Ile Ser Val Pro
65 70 75 80
Asp Arg Gly Gly Val Pro His His Leu Leu Gly Glu Val Asp Pro Ala
85 90 95
Arg Gly Glu Leu Thr Pro Ala Asp Phe Arg Ser Leu Ala Gly Lys Ala
100 105 110
Val Ser Glu Ile Thr Gly Arg Arg Lys Leu Pro Val Leu Val Gly Gly
115 120 125
Ser Asn Ser Phe Ile His Ala Leu Leu Val Asp Arg Phe Asp Ser Ser
130 135 140
Gly Pro Gly Val Phe Glu Glu Gly Ser His Ser Val Val Ser Ser Glu
145 150 155 160
Leu Arg Tyr Asp Cys Cys Phe Leu Trp Val Asp Val Ser Val Lys Val
165 170 175
Leu Thr Asp Tyr Leu Ala Lys Arg Val Asp Asp Met Leu Glu Leu Gly
180 185 190
Met Phe Asp Glu Leu Ala Glu Phe Tyr Ser Pro Glu Asp Glu Asp His
195 200 205
Asp Glu Asp Ser Ala Thr Arg Thr Gly Leu Arg Lys Ala Ile Gly Val
210 215 220
Pro Glu Phe Asp Arg Tyr Phe Glu Lys Phe Arg Pro Gly Asp Val Glu
225 230 235 240
Gly Glu Asp Pro Gly Arg Asp Arg Val Arg Arg Gly Ala Phe Glu Glu
245 250 255
Ala Val Arg Ala Ile Lys Glu Asn Thr Cys His Leu Ala Lys Arg Gln
260 265 270
Ile Gly Lys Ile Leu Arg Leu Lys Gly Ala Gly Trp Asp Leu Arg Arg
275 280 285
Leu Asp Ala Thr Glu Ser Phe Arg Ala Ala Met Thr Ser Asp Ser Gly
290 295 300
Glu Lys Cys Thr Glu Ile Trp Glu Lys Gln Val Leu Glu Pro Ser Val
305 310 315 320
Lys Ile Val Ser Arg Phe Leu Asp Glu
325
<210>142
<211>1335
<212>DNA
<213>Lotus japonicus
<400>142
ctctctttct tcttcttcct atgagacttt cctctctctc acctcacccc caccaccacc 60
accactacac cacacactac cattaccatt accaccaccc ctcttcactc gccatggacg 120
gccaccgccg catagacaag gtggttgtca tcatgggcgc caccggctcc ggcaaatccc 180
gcctctccat cgacctcgcc accctctttc ccttctcaga gatcatcaac tccgataaaa 240
tgcaagtcta caaaggactc gacaccacca ccaacaagat cccacctcac caacgcaaca 300
acgtccccca ccacctcctc ggcgacgtcg acccttctct cggtgatttc accccctccg 360
acttccgccg ccgcgccggt gacctcatct ccgacatcac ccgccgcaga aagctcccca 420
tcttcgtcgg cggctccaac tccttcgtcc acgccctcct tgtcgaccga ttcgaccccg 480
agtccaacgt cttccgcgac gattcaccct cgccggtttc ctccgagttg agataccggt 540
gctgcttcct ctggatggac attgcgttcc ccgtgctgtc ggagtatttg ctgaagcgag 600
tcgacgacat gcttgactcg ggaatggtgg acgagttggc tcagttcttc gactcggaca 660
cagcgaacca gaccgggttg agaaaagcca tcggtgtacc cgagttcgac cggtttttca 720
aggatccggt gcgggagggt gcagcgtacg aggaagcggt gagggcgatt aaggagaaca 780
cgtgtcagct agcgaagagg cagattggga agatcatgcg gttaaaaaga gcagggtggg 840
acttacggag gatcgacgcc acggaagcgt tccgggtggc gcttgtggca gacggcggcg 900
gagagagatt ttccgatgaa tggaagaggc aagtgttgga accaagcgtg aagattgtga 960
agcggttctt gatggagtag gtttgggttt tccagctaaa tccagctatt ccacttcctc 1020
tttaaatttt tctttttttt ttcttcttct ctttttttgc gtttatttca cccccaaata 1080
agacaaaaaa tgaaagtggg aaattggggg gaaaatgtac aaaaatggga gtggaaattg 1140
ttaatttgaa tccactagtt tggttgagtg agtgatttca gagagggaat gagcatggat 1200
cattaaattt ttggtcttgg agttactagc aactagcaac tagcaactag caacaaggct 1260
tggctcatgt gagattccac aatttttctc aaggcaatag aaatggatat ttagtataaa 1320
aaaaaaaaaa aaaaa 1335
<210>143
<211>319
<212>PRT
<213>Lotus japonicus
<400>143
Met Arg Leu Ser Ser Leu Ser Pro His Pro His His His His His Tyr
1 5 10 15
Thr Thr His Tyr His Tyr His Tyr His His Pro Ser Ser Leu Ala Met
20 25 30
Asp Gly His Arg Arg Ile Asp Lys Val Val Val Ile Met Gly Ala Thr
35 40 45
Gly Ser Gly Lys Ser Arg Leu Ser Ile Asp Leu Ala Thr Leu Phe Pro
50 55 60
Phe Ser Glu Ile Ile Asn Ser Asp Lys Met Gln Val Tyr Lys Gly Leu
65 70 75 80
Asp Thr Thr Thr Asn Lys Ile Pro Pro His Gln Arg Asn Asn Val Pro
85 90 95
His His Leu Leu Gly Asp Val Asp Pro Ser Leu Gly Asp Phe Thr Pro
100 105 110
Ser Asp Phe Arg Arg Arg Ala Gly Asp Leu Ile Ser Asp Ile Thr Arg
115 120 125
Arg Arg Lys Leu Pro Ile Phe Val Gly Gly Ser Asn Ser Phe Val His
130 135 140
Ala Leu Leu Val Asp Arg Phe Asp Pro Glu Ser Asn Val Phe Arg Asp
145 150 155 160
Asp Ser Pro Ser Pro Val Ser Ser Glu Leu Arg Tyr Arg Cys Cys Phe
165 170 175
Leu Trp Met Asp Ile Ala Phe Pro Val Leu Ser Glu Tyr Leu Leu Lys
180 185 190
Arg Val Asp Asp Met Leu Asp Ser Gly Met Val Asp Glu Leu Ala Gln
195 200 205
Phe Phe Asp Ser Asp Thr Ala Asn Gln Thr Gly Leu Arg Lys Ala Ile
210 215 220
Gly Val Pro Glu Phe Asp Arg Phe Phe Lys Asp Pro Val Arg Glu Gly
225 230 235 240
Ala Ala Tyr Glu Glu Ala Val Arg Ala Ile Lys Glu Asn Thr Cys Gln
245 250 255
Leu Ala Lys Arg Gln Ile Gly Lys Ile Met Arg Leu Lys Arg Ala Gly
260 265 270
Trp Asp Leu Arg Arg Ile Asp Ala Thr Glu Ala Phe Arg Val Ala Leu
275 280 285
Val Ala Asp Gly Gly Gly Glu Arg Phe Ser Asp Glu Trp Lys Arg Gln
290 295 300
Val Leu Glu Pro Ser Val Lys Ile Val Lys Arg Phe Leu Met Glu
305 310 315
<210>144
<211>1120
<212>DNA
<213>蒺藜苜蓿
<400>144
atgccaacaa caacaacaac accttcattt ctctcacctc ctcactctca acgtcattat 60
cataaaccca ttcaatttca ccactattca cacacccttt ttactccttc ctcttcctcc 120
gccacccaca ccaggcggcg gccccactgc cctcgcatgg aaatctcccc ctcacgccac 180
cgtcggaaag acaaagtcct cattatagtc ggtgcaaccg gctccggaaa atcacgtctc 240
tccgttgaac tcgccaccct cttcccttac tcagaaataa ttaattccga caaaatccaa 300
gtgtacagag gactcgatat caccaccaac aagatcccat ttcatcaacg caacaacgtt 360
ccacatcatc ttctcggcga cattgatcct tctcacggtg agttctcacc ttcagatttc 420
cgccgccacg ccggagatat catctccgat attacttccc ggagaaaact tcccattatc 480
gttggtgggt ccaactcatt cattcacgct cttcttgtag aacgattcga ccctgagtca 540
aacgttttcg acgagtcatc atcattgtca acatcgatat cctcggattt aaggtacaaa 600
tgttgttttc tttggatgga tatttcgttt cctgtgttgt cggaatattt gctgaaacga 660
gtcgatgata tgtttgactc gggaatggtg aacgagttag ctgagtttta tgaaccggat 720
gcagataacc aaaccggttt aagaaaagca atcggtgtac ccgagttcga ccggtttttt 780
aaacaatatc caccacaggt tggaccagat gaatctgaac gtcataatcc aatgcgggaa 840
ggtgcatata ttgaagcagt gaaggcgatt aaagataaca cgtgtcagtt agctaagaga 900
cagataggga agatcttacg gttaaaaaga gctgggtggg acctacaacg gattgatgcc 960
acggaggcgt ttagggcggt gctgacgtca gagtctaacg gcggtggaga agaatttacc 1020
ggtgtatgga aaaaacaagt attggaacca agcgtgaaga ttgtgaagcg tttcttgatg 1080
gagtaggtct tccagctaaa tccagcttag ctaatccaac 1120
<210>145
<211>361
<212>PRT
<213>蒺藜苜蓿
<400>145
Met Pro Thr Thr Thr Thr Thr Pro Ser Phe Leu Ser Pro Pro His Ser
1 5 10 15
Gln Arg His Tyr His Lys Pro Ile Gln Phe His His Tyr Ser His Thr
20 25 30
Leu Phe Thr Pro Ser Ser Ser Ser Ala Thr His Thr Arg Arg Arg Pro
35 40 45
His Cys Pro Arg Met Glu Ile Ser Pro Ser Arg His Arg Arg Lys Asp
50 55 60
Lys Val Leu Ile Ile Val Gly Ala Thr Gly Ser Gly Lys Ser Arg Leu
65 70 75 80
Ser Val Glu Leu Ala Thr Leu Phe Pro Tyr Ser Glu Ile Ile Asn Ser
85 90 95
Asp Lys Ile Gln Val Tyr Arg Gly Leu Asp Ile Thr Thr Asn Lys Ile
100 105 110
Pro Phe His Gln Arg Asn Asn Val Pro His His Leu Leu Gly Asp Ile
115 120 125
Asp Pro Ser His Gly Glu Phe Ser Pro Ser Asp Phe Arg Arg His Ala
130 135 140
Gly Asp Ile Ile Ser Asp Ile Thr Ser Arg Arg Lys Leu Pro Ile Ile
145 150 155 160
Val Gly Gly Ser Asn Ser Phe Ile His Ala Leu Leu Val Glu Arg Phe
165 170 175
Asp Pro Glu Ser Asn Val Phe Asp Glu Ser Ser Ser Leu Ser Thr Ser
180 185 190
Ile Ser Ser Asp Leu Arg Tyr Lys Cys Cys Phe Leu Trp Met Asp Ile
195 200 205
Ser Phe Pro Val Leu Ser Glu Tyr Leu Leu Lys Arg Val Asp Asp Met
210 215 220
Phe Asp Ser Gly Met Val Asn Glu Leu Ala Glu Phe Tyr Glu Pro Asp
225 230 235 240
Ala Asp Asn Gln Thr Gly Leu Arg Lys Ala Ile Gly Val Pro Glu Phe
245 250 255
Asp Arg Phe Phe Lys Gln Tyr Pro Pro Gln Val Gly Pro Asp Glu Ser
260 265 270
Glu Arg His Asn Pro Met Arg Glu Gly Ala Tyr Ile Glu Ala Val Lys
275 280 285
Ala Ile Lys Asp Asn Thr Cys Gln Leu Ala Lys Arg Gln Ile Gly Lys
290 295 300
Ile Leu Arg Leu Lys Arg Ala Gly Trp Asp Leu Gln Arg Ile Asp Ala
305 310 315 320
Thr Glu Ala Phe Arg Ala Val Leu Thr Ser Glu Ser Asn Gly Gly Gly
325 330 335
Glu Glu Phe Thr Gly Val Trp Lys Lys Gln Val Leu Glu Pro Ser Val
340 345 350
Lys Ile Val Lys Arg Phe Leu Met Glu
355 360
<210>146
<211>1105
<212>DNA
<213>桑(Morus alba)
<400>146
gcccgggcag gtccggccac tacctctggc ccacgagaca ggtgggcgcg gatggagttt 60
tcctcctccg ccgcccgccg ccaccgccac catcccaagg acaagctcct cgtcatcatg 120
ggcgccaccg gcaccggcaa atcccgactc tccgtcgagc tcgccaccca cttcaacggc 180
gagatcatca actccgacaa aatgcaagtc tacaagggac tcgacacaac gaccaacaag 240
attcccctcg acgaccgcct cggtgtcccc caccaccttc tcggcgaggt cgactcggaa 300
gctcacggcg agttgactcg ctccgagttc cgctccttgg ccggaaaggc cgtgtcggaa 360
atcaccgcca ggaggaaact cccagtcctc gccggcggct ccaactcctt cattcacgcc 420
ctgctcgtgg accggttcga cccggaatac gacgttttcg acgagcggtc cgaccaaccg 480
gcggattcgt cgaaggttct cctccgctac aactgttgct tcctttgggt ggatgtttcg 540
ttgagggttt tggaagatta tttattgaag cgagtcgatg acatgctcaa ctcggggatg 600
ttcgacgagt tggccgagtt ctacgacccg gaggaggatc acggaccggc gaactggacc 660
ggattgagga aggctatagg cgtgcccgag tttgaccggt atttcgagag gtgcagaccg 720
ggggagaaag gagagtggga tcgggtgcgg agggaagcat acgaggaggc ggtgagggaa 780
ataaaggaga acacgtgtca gctggcgaag agacagattg gaaagattct gagattaaag 840
aagttggggt gggacctacg gaggttggac gcgacggagg cgtttagggc ggtgatgacg 900
tcagattccg gtaagaggtg ttcggaaatt tgggagaggc aggtattgga accaagcgtg 960
aagattgtga agcgcttctt ggacgagtag taggttttgc cagcactttc cagctaattt 1020
ttatttttat tatttttttg ttgttttttt aaaaaaattt tggtagttag ttttccaact 1080
tcaacttcag ctcaaaaaaa aaaaa 1105
<210>147
<211>312
<212>PRT
<213>桑
<400>147
Met Glu Phe Ser Ser Ser Ala Ala Arg Arg His Arg His His Pro Lys
1 5 10 15
Asp Lys Leu Leu Val Ile Met Gly Ala Thr Gly Thr Gly Lys Ser Arg
20 25 30
Leu Ser Val Glu Leu Ala Thr His Phe Asn Gly Glu Ile Ile Asn Ser
35 40 45
Asp Lys Met Gln Val Tyr Lys Gly Leu Asp Thr Thr Thr Asn Lys Ile
50 55 60
Pro Leu Asp Asp Arg Leu Gly Val Pro His His Leu Leu Gly Glu Val
65 70 75 80
Asp Ser Glu Ala His Gly Glu Leu Thr Arg Ser Glu Phe Arg Ser Leu
85 90 95
Ala Gly Lys Ala Val Ser Glu Ile Thr Ala Arg Arg Lys Leu Pro Val
100 105 110
Leu Ala Gly Gly Ser Asn Ser Phe Ile His Ala Leu Leu Val Asp Arg
115 120 125
Phe Asp Pro Glu Tyr Asp Val Phe Asp Glu Arg Ser Asp Gln Pro Ala
130 135 140
Asp Ser Ser Lys Val Leu Leu Arg Tyr Asn Cys Cys Phe Leu Trp Val
145 150 155 160
Asp Val Ser Leu Arg Val Leu Glu Asp Tyr Leu Leu Lys Arg Val Asp
165 170 175
Asp Met Leu Asn Ser Gly Met Phe Asp Glu Leu Ala Glu Phe Tyr Asp
180 185 190
Pro Glu Glu Asp His Gly Pro Ala Asn Trp Thr Gly Leu Arg Lys Ala
195 200 205
Ile Gly Val Pro Glu Phe Asp Arg Tyr Phe Glu Arg Cys Arg Pro Gly
210 215 220
Glu Lys Gly Glu Trp Asp Arg Val Arg Arg Glu Ala Tyr Glu Glu Ala
225 230 235 240
Val Arg Glu Ile Lys Glu Asn Thr Cys Gln Leu Ala Lys Arg Gln Ile
245 250 255
Gly Lys Ile Leu Arg Leu Lys Lys Leu Gly Trp Asp Leu Arg Arg Leu
260 265 270
Asp Ala Thr Glu Ala Phe Arg Ala Val Met Thr Ser Asp Ser Gly Lys
275 280 285
Arg Cys Ser Glu Ile Trp Glu Arg Gln Val Leu Glu Pro Ser Val Lys
290 295 300
Ile Val Lys Arg Phe Leu Asp Glu
305 310
<210>148
<211>1083
<212>DNA
<213>稻
<400>148
atgaccagcg ttgccaccag gattgccacg ctcgtgcggg ccgcggcggc ggcgagccgg 60
ccattgcggc tccaccgccg gcccggcggc gaggatacga ggatggtggt gatcgtcggc 120
gccacgggca ccgggaagac caagctgtcc atcgacgccg ccaaggtgat cggcggcgag 180
gttgtcaacg ccgacaagat tcagctctat gacggcctcg acgtgaccac caacaaggtg 240
agcctcgccg accgccgtgg cgtgccgcac cacctcctcg gagccatccg ccccgaggcc 300
ggcgagctcc cgccgtcgtc cttccggtcc ctcgccgccg ccacggccgc gtcgatcgcg 360
gcgaggcggc tcgtgccggt catcgccggt gggtcgaact ccctcatcca cgccctcctc 420
gccgaccact tcgacgcctc cgctggcgat cccttctccc ccgccgccgc cttccgccac 480
taccgcccgg cgctccggtt cccgtgctgc ctgctctggg tccacgtcga tgaggcgctc 540
ctcgacgagt acctcgaccg ccgcgtggac gacatggtgg acgctggcat ggtcgaggag 600
ctccgggagt acttcgccac gacaaccgcc gcggagcgcg ccgcgcactc cgggctgggc 660
aaggccatcg gcgtccccga gctcggcgac tacttcgccg ggcgcaagac cttctccgag 720
gcgatcgacg acatcaaagc caacacccgc gtcctcgccg ccgcgcaggt gtccaagatc 780
cgccgcatgt ccgacgcctg gggctggccc atccaccgcc tcgacgcctc cgacacagtc 840
cgcgccaggc tcacgcgggc gggctccgcc gccgagtccg cctcctggga gcgcgacgtg 900
cgcggcccag gcctcgccac catccgcagc ttcctcgccg atcagtcacc gccaccgcgc 960
agcgagggca ccaacgacta cctgtacgcc atggagacgg aaccagagcc gccgccgccg 1020
ccgacgttgc cgccgcggct gctccggttg ccgcggatgc agtactgcga catggtgggg 1080
tga 1083
<210>149
<211>360
<212>PRT
<213>稻
<400>149
Met Thr Ser Val Ala Thr Arg Ile Ala Thr Leu Val Arg Ala Ala Ala
1 5 10 15
Ala Ala Ser Arg Pro Leu Arg Leu His Arg Arg Pro Gly Gly Glu Asp
20 25 30
Thr Arg Met Val Val Ile Val Gly Ala Thr Gly Thr Gly Lys Thr Lys
35 40 45
Leu Ser Ile Asp Ala Ala Lys Val Ile Gly Gly Glu Val Val Asn Ala
50 55 60
Asp Lys Ile Gln Leu Tyr Asp Gly Leu Asp Val Thr Thr Asn Lys Val
65 70 75 80
Ser Leu Ala Asp Arg Arg Gly Val Pro His His Leu Leu Gly Ala Ile
85 90 95
Arg Pro Glu Ala Gly Glu Leu Pro Pro Ser Ser Phe Arg Ser Leu Ala
100 105 110
Ala Ala Thr Ala Ala Ser Ile Ala Ala Arg Arg Leu Val Pro Val Ile
115 120 125
Ala Gly Gly Ser Asn Ser Leu Ile His Ala Leu Leu Ala Asp His Phe
130 135 140
Asp Ala Ser Ala Gly Asp Pro Phe Ser Pro Ala Ala Ala Phe Arg His
145 150 155 160
Tyr Arg Pro Ala Leu Arg Phe Pro Cys Cys Leu Leu Trp Val His Val
165 170 175
Asp Glu Ala Leu Leu Asp Glu Tyr Leu Asp Arg Arg Val Asp Asp Met
180 185 190
Val Asp Ala Gly Met Val Glu Glu Leu Arg Glu Tyr Phe Ala Thr Thr
195 200 205
Thr Ala Ala Glu Arg Ala Ala His Ser Gly Leu Gly Lys Ala Ile Gly
210 215 220
Val Pro Glu Leu Gly Asp Tyr Phe Ala Gly Arg Lys Thr Phe Ser Glu
225 230 235 240
Ala Ile Asp Asp Ile Lys Ala Asn Thr Arg Val Leu Ala Ala Ala Gln
245 250 255
Val Ser Lys Ile Arg Arg Met Ser Asp Ala Trp Gly Trp Pro Ile His
260 265 270
Arg Leu Asp Ala Ser Asp Thr Val Arg Ala Arg Leu Thr Arg Ala Gly
275 280 285
Ser Ala Ala Glu Ser Ala Ser Trp Glu Arg Asp Val Arg Gly Pro Gly
290 295 300
Leu Ala Thr Ile Arg Ser Phe Leu Ala Asp Gln Ser Pro Pro Pro Arg
305 310 315 320
Ser Glu Gly Thr Asn Asp Tyr Leu Tyr Ala Met Glu Thr Glu Pro Glu
325 330 335
Pro Pro Pro Pro Pro Thr Leu Pro Pro Arg Leu Leu Arg Leu Pro Arg
340 345 350
Met Gln Tyr Cys Asp Met Val Gly
355 360
<210>150
<211>1053
<212>DNA
<213>碧冬茄(Petunia x hybrida)
<400>150
atgttaattg tagtacatat tattagcatc acacgcatca tattcatcac cttaacccat 60
aatcatctcc atttccttat gtttagatca ttatcataca atcacaagca cctcaaattc 120
cttacaaacc cgaccacacg ggtactccga agaaacatgt cgtcatccac tgtagtaaca 180
atacccggcc ccacacaaaa aaacaaaaac aaaatcatag taataatggg tgcaacaggt 240
tcaggaaaat caaaactctc aatagacctc gtcacacgtc actatccttt ttccgaaatc 300
attaactccg acaaaatcca aattaccaaa ggtttaaaca taaccacaaa caaaatcact 360
gtacccgacc gacgtggcgt agttcatcat ttactcggcg agattgaccc cgactttaac 420
ttttctcctt ctcatttccg gtcaattgct ggtcaacgca ttaactccat tattaatcgc 480
cataaactcc cattcctcgt tggtgggtcc aactcatata tctacgcttt attaacaaac 540
cggttcgacc cggattttaa ccctgattca aacccggttc attttatatc caacgagtta 600
cgctacaact gttgttttat ttgggtcgat gtattaaacc cggttttgaa tgagtatttg 660
gataaacggg tcgatgagat gatgaactcg ggtatgtatg aagaactgga acagtttttt 720
aaagaaaaca ggttttcgga tccgggtttg gaaccgggtc gggccaccgg gttgaggaaa 780
gcgatagggg taccggaaat ggagaggtat tttaagaaga gctgtacgta tgaggaagca 840
gtgagggaaa taaaagaaaa cacgtggcgg ttagcgaaga agcagatgtg gaagatccaa 900
cggttgagag aagcagggtg ggacctacaa agagtagatg ccacggaggc atttgtggag 960
gcgatgagta ataagaagga aaagggaatt atttgggaaa aacaagtagt ggaaccaagt 1020
gtcaagattg tgaaccgttt tttgttggac tga 1053
<210>151
<211>350
<212>PRT
<213>碧冬茄
<400>151
Met Leu Ile Val Val His Ile Ile Ser Ile Thr Arg Ile Ile Phe Ile
1 5 10 15
Thr Leu Thr His Asn His Leu His Phe Leu Met Phe Arg Ser Leu Ser
20 25 30
Tyr Asn His Lys His Leu Lys Phe Leu Thr Asn Pro Thr Thr Arg Val
35 40 45
Leu Arg Arg Asn Met Ser Ser Ser Thr Val Val Thr Ile Pro Gly Pro
50 55 60
Thr Gln Lys Asn Lys Asn Lys Ile Ile Val Ile Met Gly Ala Thr Gly
65 70 75 80
Ser Gly Lys Ser Lys Leu Ser Ile Asp Leu Val Thr Arg His Tyr Pro
85 90 95
Phe Ser Glu Ile Ile Asn Ser Asp Lys Ile Gln Ile Thr Lys Gly Leu
100 105 110
Asn Ile Thr Thr Asn Lys Ile Thr Val Pro Asp Arg Arg Gly Val Val
115 120 125
His His Leu Leu Gly Glu Ile Asp Pro Asp Phe Asn Phe Ser Pro Ser
130 135 140
His Phe Arg Ser Ile Ala Gly Gln Arg Ile Asn Ser Ile Ile Asn Arg
145 150 155 160
His Lys Leu Pro Phe Leu Val Gly Gly Ser Asn Ser Tyr Ile Tyr Ala
165 170 175
Leu Leu Thr Asn Arg Phe Asp Pro Asp Phe Asn Pro Asp Ser Asn Pro
180 185 190
Val His Phe Ile Ser Asn Glu Leu Arg Tyr Asn Cys Cys Phe Ile Trp
195 200 205
Val Asp Val Leu Asn Pro Val Leu Asn Glu Tyr Leu Asp Lys Arg Val
210 215 220
Asp Glu Met Met Asn Ser Gly Met Tyr Glu Glu Leu Glu Gln Phe Phe
225 230 235 240
Lys Glu Asn Arg Phe Ser Asp Pro Gly Leu Glu Pro Gly Arg Ala Thr
245 250 255
Gly Leu Arg Lys Ala Ile Gly Val Pro Glu Met Glu Arg Tyr Phe Lys
260 265 270
Lys Ser Cys Thr Tyr Glu Glu Ala Val Arg Glu Ile Lys Glu Asn Thr
275 280 285
Trp Arg Leu Ala Lys Lys Gln Met Trp Lys Ile Gln Arg Leu Arg Glu
290 295 300
Ala Gly Trp Asp Leu Gln Arg Val Asp Ala Thr Glu Ala Phe Val Glu
305 310 315 320
Ala Met Ser Asn Lys Lys Glu Lys Gly Ile Ile Trp Glu Lys Gln Val
325 330 335
Val Glu Pro Ser Val Lys Ile Val Asn Arg Phe Leu Leu Asp
340 345 350
<210>152
<211>1199
<212>DNA
<213>Populus tremuloides
<400>152
cttactctgt tttttttttt ttcgttgcct atgaaaattc ccttcccaaa gagtaccaat 60
cagcctcttt acactgccct taaaacccaa ccacttcacc ccattaacat ttctataccc 120
ttcaataagc cacgcccacc accaatagca gtccgtatgg acacggactc ctctaccacc 180
acctccaccg ccgtctaccg ccataaaaaa gacaagattc tcgtaataat gggagcgact 240
gggtgtggca aaacaagggt atctattgat ctagctacac gcttccaatc cgaaatcatc 300
aactccgaca aaatgcaagt ctacgaaggt cttgacatca ccaccaacaa aatcaccatt 360
caagaccgtc taggtgttcc tcaccattta ctcggtgagt tcgacccgga tgatggtgag 420
ttgactccct ccgagtatcg gttagctggt ggattggcta tctcaggtat tgtttcaagg 480
caaaatcttc ctattgtggt tggtgggtcc aactcactta ttcacgcttt ggttgttgac 540
cggtttaatc ccgagttaaa cgtttttgat gggtgtaacc cagtttcaac ccagttaaga 600
tataactgtt gttttttgtg ggtggatgtg tcattacctg ttttgtgcga ttacttgtgt 660
aagcgagtcg acgaaatgct cgactccggg atgctcgatg agctgtcaga gtattatggc 720
tcagttgatg cagcgagtca aatcgggttg aggaaagcga ttggggtgcc tgagtttgat 780
cggtatttca aaaagtaccc acctgggtct gggtgtggca gaggtattgg tgtggaatgg 840
gatcgggtac ggaggggagt atacgaggtc tgtgtgaggg agataaagga gaacacgtgt 900
cagcttgcga aaaggcagat cggcaagatc ttgagattaa aaggggcagg gtgggaccta 960
aaaagagttg atgcgactga gagctttagg gaggtgatga cggtgacgtc agatgatcat 1020
atcaagaaaa gaaagaagaa gaggtggatg gaggtctggg ggagagatgt gatggagcca 1080
agcatgaaaa ttgtgaaacg cttcttggag gaggagtagg agtaggtttt acagtcagtc 1140
agccagtcaa tccatcaatc aatcaatcca gcttttttcc cgctaccgtt ctggttttc 1199
<210>153
<211>362
<212>PRT
<213>Populus tremuloides
<400>153
Met Lys Ile Pro Phe Pro Lys Ser Thr Asn Gln Pro Leu Tyr Thr Ala
1 5 10 15
Leu Lys Thr Gln Pro Leu His Pro Ile Asn Ile Ser Ile Pro Phe Asn
20 25 30
Lys Pro Arg Pro Pro Pro Ile Ala Val Arg Met Asp Thr Asp Ser Ser
35 40 45
Thr Thr Thr Ser Thr Ala Val Tyr Arg His Lys Lys Asp Lys Ile Leu
50 55 60
Val Ile Met Gly Ala Thr Gly Cys Gly Lys Thr Arg Val Ser Ile Asp
65 70 75 80
Leu Ala Thr Arg Phe Gln Ser Glu Ile Ile Asn Ser Asp Lys Met Gln
85 90 95
Val Tyr Glu Gly Leu Asp Ile Thr Thr Asn Lys Ile Thr Ile Gln Asp
100 105 110
Arg Leu Gly Val Pro His His Leu Leu Gly Glu Phe Asp Pro Asp Asp
115 120 125
Gly Glu Leu Thr Pro Ser Glu Tyr Arg Leu Ala Gly Gly Leu Ala Ile
130 135 140
Ser Gly Ile Val Ser Arg Gln Asn Leu Pro Ile Val Val Gly Gly Ser
145 150 155 160
Asn Ser Leu Ile His Ala Leu Val Val Asp Arg Phe Asn Pro Glu Leu
165 170 175
Asn Val Phe Asp Gly Cys Asn Pro Val Ser Thr Gln Leu Arg Tyr Asn
180 185 190
Cys Cys Phe Leu Trp Val Asp Val Ser Leu Pro Val Leu Cys Asp Tyr
195 200 205
Leu Cys Lys Arg Val Asp Glu Met Leu Asp Ser Gly Met Leu Asp Glu
210 215 220
Leu Ser Glu Tyr Tyr Gly Ser Val Asp Ala Ala Ser Gln Ile Gly Leu
225 230 235 240
Arg Lys Ala Ile Gly Val Pro Glu Phe Asp Arg Tyr Phe Lys Lys Tyr
245 250 255
Pro Pro Gly Ser Gly Cys Gly Arg Gly Ile Gly Val Glu Trp Asp Arg
260 265 270
Val Arg Arg Gly Val Tyr Glu Val Cys Val Arg GluIle Lys Glu Asn
275 280 285
Thr Cys Gln Leu Ala Lys Arg Gln Ile Gly Lys Ile Leu Arg Leu Lys
290 295 300
Gly Ala Gly Trp Asp Leu Lys Arg Val Asp Ala Thr Glu Ser Phe Arg
305 310 315 320
Glu Val Met Thr Val Thr Ser Asp Asp His Ile Lys Lys Arg Lys Lys
325 330 335
Lys Arg Trp Met Glu Val Trp Gly Arg Asp Val Met Glu Pro Ser Met
340 345 350
Lys Ile Val Lys Arg Phe Leu Glu Glu Glu
355 360
<210>154
<211>1094
<212>DNA
<213>Populus tremuloides
<400>154
ctcaacgaca acgtctcagg aaattcaaca atgaccatga ggctttcttt gaccgcctac 60
aaacaagtac agcctcgtgg gaatttccaa ggggggctaa acatgaaacc tttctttcgt 120
cgaaaagata aggttgtgtt cgttgttgga ccgactggca caggcaaatc aaggctggct 180
attgacctgg caacccgttt cccagccgag gttgtcaatt gtgacaaaat gcaagtttat 240
aaaggcctcg atatagtcac aaacaaggtc actgaagagg agtgtcgcgg tgtgcctcat 300
catttacttg gcatagcaga ccctaatgca aatttcactt ccgatgactt caggcaccat 360
gcatcacttg ttgtcgaatc aatcgtcaca cgtgatcggc taccgatcat cgccggtgga 420
tcaaattcct acatcgaggc tttagcaaat gatgatcctg aatttcgatt aaggtatgaa 480
tgttgttttc tttgggtgga cgtgtcactc ccaatacttt attcattcgt atcagagcgg 540
gtcgatcgaa tggtggaagc aggcttgatt gatgaggtga gagatatgtt tgatcctaat 600
aaatttgatg attattcaca aggaatcaaa cgggcaattg gggttcctga attggatcat 660
tttttacgaa atgaggcgat tgtggatgct aaaactcgta gaaagcttct tgatgaggcc 720
attgataaaa ttaaagaaaa tacttgtatg ctagcctctc gacaattaca aaaaatccat 780
cggcttcata gcatatggaa ttggaacgtg caccgaatcg atgccacccc agttttccta 840
acgagtggaa aggaggttga caatctttgg gacaaacttg tggcaggacc aagcaccatg 900
attgtgaacc agtttctttg tgacaaaaat tatgcatctc ccattatacc atcagaatca 960
atcaagatgg agccaatctc tgtcccggcc ctggctgttg gcgccactcg atagaggcct 1020
gtcaggtcat caaaatcacc atcaatcaca ctagtgctat tatgccaatg ggcgcttttg 1080
ccacgtggca gggt 1094
<210>155
<211>327
<212>PRT
<213>Populus tremuloides
<400>155
Met Thr Met Arg Leu Ser Leu Thr Ala Tyr Lys Gln Val Gln Pro Arg
1 5 10 15
Gly Asn Phe Gln Gly Gly Leu Asn Met Lys Pro Phe Phe Arg Arg Lys
20 25 30
Asp Lys Val Val Phe Val Val Gly Pro Thr Gly Thr Gly Lys Ser Arg
35 40 45
Leu Ala Ile Asp Leu Ala Thr Arg Phe Pro Ala Glu Val Val Asn Cys
50 55 60
Asp Lys Met Gln Val Tyr Lys Gly Leu Asp Ile Val Thr Asn Lys Val
65 70 75 80
Thr Glu Glu Glu Cys Arg Gly Val Pro His His Leu Leu Gly Ile Ala
85 90 95
Asp Pro Asn Ala Asn Phe Thr Ser Asp Asp Phe Arg His His Ala Ser
100 105 110
Leu Val Val Glu Ser Ile Val Thr Arg Asp Arg Leu Pro Ile Ile Ala
115 120 125
Gly Gly Ser Asn Ser Tyr Ile Glu Ala Leu Ala Asn Asp Asp Pro Glu
130 135 140
Phe Arg Leu Arg Tyr Glu Cys Cys Phe Leu Trp Val Asp Val Ser Leu
145 150 155 160
Pro Ile Leu Tyr Ser Phe Val Ser Glu Arg Val Asp Arg Met Val Glu
165 170 175
Ala Gly Leu Ile Asp Glu Val Arg Asp Met Phe Asp Pro Asn Lys Phe
180 185 190
Asp Asp Tyr Ser Gln Gly Ile Lys Arg Ala Ile Gly Val Pro Glu Leu
195 200 205
Asp His Phe Leu Arg Asn Glu Ala Ile Val Asp Ala Lys Thr Arg Arg
210 215 220
Lys Leu Leu Asp Glu Ala Ile Asp Lys Ile Lys Glu Asn Thr Cys Met
225 230 235 240
Leu Ala Ser Arg Gln Leu Gln Lys Ile His Arg Leu His Ser Ile Trp
245 250 255
Asn Trp Asn Val His Arg Ile Asp Ala Thr Pro Val Phe Leu Thr Ser
260 265 270
Gly Lys Glu Val Asp Asn Leu Trp Asp Lys Leu Val Ala Gly Pro Ser
275 280 285
Thr Met Ile Val Asn Gln Phe Leu Cys Asp Lys Asn Tyr Ala Ser Pro
290 295 300
Ile Ile Pro Ser Glu Ser Ile Lys Met Glu Pro Ile Ser Val Pro Ala
305 310 315 320
Leu Ala Val Gly Ala Thr Arg
325
<210>156
<211>1094
<212>DNA
<213>Populus tremuloides
<400>156
gtcaacgaca acgtcccagc acattcaaca atgaccatga ggctttcttt gtctgcctac 60
aaacaagtac agcctcgtgt gaatttccaa ggggggctca acatgaaacc tttctttcgt 120
cgaaaagata aggttgtgtt cgttcttgga ccgactggca ctggcaaatc aaggctggct 180
attgacctag caacccactt cccagccgag gttgtcaatt gtgacaaaat gcaagtttat 240
aagggcctag atatagtcac aaacaaggtg acggaagagg agtgtcgagg cgtgccccat 300
catttacttg gcatagcaga ccctaatgca gatttcactt ccgatgactt caggcaccac 360
gcatcacttg ttgtcgaatc aatcgtcaca cgtgatcggc tgccgatcat tgccggcgga 420
tccaattcgt acgtggaggc tttagcaaat gatgatcctg agtttcgatt aaggtatgaa 480
tgttgctttc tttgggtgga tgtgtcacta cctctactcc actcattcgt atcagatcgg 540
gttgatcgaa tggtaagagc aggcttgatt gatgaggtga gagatgtgtt tgatccaaca 600
aaatttgatg attattcaca aggaatcaag cgggcaattg gggttcctga attagatcaa 660
tttctacgaa acgagacgat tgtggatgct aaaacacgta gaaagcttct tgatgaggcc 720
attgaaaaaa tcaaagaaaa tacttgtatg ctagctcgtc gacaattaca aaaaatccgt 780
cgacttcata gcatatggaa ttggaaaatg caccggatcg atgccacacc agttttccta 840
gcaagtggaa aggaggctga caatctttgg gaccaaattg tggcaggacc aagcaccatg 900
attgtgaacc aatttctttg tgaagaaaat catgtatccc ccattgtacc atcagagtcg 960
atcaatatgg tgccaatttc tgtcccggct atggccgccg tggctagtcg atagaggtaa 1020
aggattcttg gttaatacca aaattcatct acaaatcatt accatcatca taatcaccag 1080
ctgtgattat aaat 1094
<210>157
<211>327
<212>PRT
<213>Populus tremuloides
<400>157
Met Thr Met Arg Leu Ser Leu Ser Ala Tyr Lys Gln Val Gln Pro Arg
1 5 10 15
Val Asn Phe Gln Gly Gly Leu Asn Met Lys Pro Phe Phe Arg Arg Lys
20 25 30
Asp Lys Val Val Phe Val Leu Gly Pro Thr Gly Thr Gly Lys Ser Arg
35 40 45
Leu Ala Ile Asp Leu Ala Thr His Phe Pro Ala Glu Val Val Asn Cys
50 55 60
Asp Lys Met Gln Val Tyr Lys Gly Leu Asp Ile Val Thr Asn Lys Val
65 70 75 80
Thr Glu Glu Glu Cys Arg Gly Val Pro His His Leu Leu Gly Ile Ala
85 90 95
Asp Pro Asn Ala Asp Phe Thr Ser Asp Asp Phe Arg His His Ala Ser
100 105 110
Leu Val Val Glu Ser Ile Val Thr Arg Asp Arg Leu Pro Ile Ile Ala
115 120 125
Gly Gly Ser Asn Ser Tyr Val Glu Ala Leu Ala Asn Asp Asp Pro Glu
130 135 140
Phe Arg Leu Arg Tyr Glu Cys Cys Phe Leu Trp Val Asp Val Ser Leu
145 150 155 160
Pro Leu Leu His Ser Phe Val Ser Asp Arg Val Asp Arg Met Val Arg
165 170 175
Ala Gly Leu Ile Asp Glu Val Arg Asp Val Phe Asp Pro Thr Lys Phe
180 185 190
Asp Asp Tyr Ser Gln Gly Ile Lys Arg Ala Ile Gly Val Pro Glu Leu
195 200 205
Asp Gln Phe Leu Arg Asn Glu Thr Ile Val Asp Ala Lys Thr Arg Arg
210 215 220
Lys Leu Leu Asp Glu Ala Ile Glu Lys Ile Lys Glu Asn Thr Cys Met
225 230 235 240
Leu Ala Arg Arg Gln Leu Gln Lys Ile Arg Arg Leu His Ser Ile Trp
245 250 255
Asn Trp Lys Met His Arg Ile Asp Ala Thr Pro Val Phe Leu Ala Ser
260 265 270
Gly Lys Glu Ala Asp Asn Leu Trp Asp Gln Ile Val Ala Gly Pro Ser
275 280 285
Thr Met Ile Val Asn Gln Phe Leu Cys Glu Glu Asn His Val Ser Pro
290 295 300
Ile Val Pro Ser Glu Ser Ile Asn Met Val Pro Ile Ser Val Pro Ala
305 310 315 320
Met Ala Ala Val Ala Ser Arg
325
<210>158
<211>1046
<212>DNA
<213>Populus tremuloides
<400>158
tgtaagtccc tgtgcccaca aacaagtcgg atgcttgata tccctcctgg tatgctcaaa 60
atggacatgc taagtcccag aagccggcaa aaggagaagg ttgtgatagt aatggggcct 120
actggaactg gcaagtctcg gctctctatc gaacttgcaa cccagttccc tgcagaaatc 180
ataaactccg acaaaatgca ggtttacaaa ggacttgaca tcgtcactaa caaagttgct 240
gaggaagaga aatctggtgt ccctcaccat ttgttaggaa tagcaaatcc tactgtggac 300
tttacagcaa caaattactg tcacacggct tccttggcgg tcgaatcaat ttcgactcga 360
ggattgctcc cgatcattgt tggaggttcc aattcataca ttgaggcctt gatggatgat 420
gaggatttta ggttacggtt gaactatgat tgttgcttcc tttgggtaga tgtatcaatg 480
cctgtgctac ataaatttgt ttcgaggcga gtcgagcaga tggttagtgt ggggatgatc 540
gatgaggtca gaaacatttt cgatccctac gctgattatt ctacggggat caggaggtca 600
attggagttc ctgaattcga caagtacttt agagctgaag catttttgga tgaagaaaac 660
cgtgccagac tacttcatga agcaatatgt gatgtcaaaa agaatacatg taagttagct 720
tgccgtcaat gggaaaagat taatcggctt aggaagatca aggggtggga catccataga 780
cttgatgcca ctgaagtatt ccaaaagtcg ggaaaggaag cagatcatgc ctgggaaatg 840
cttgtggcca gacccagcac tgccattgtg ggacaactcc tctgtggtgt tcctgctgat 900
aaggtccccg ccatagctag cgtagcaaaa aacatgggct atattcgaca atgccttgtg 960
gcatagccgt tcaatatggc taattaacga ctttagaaag tggtatcata tacaatatta 1020
tctaagtaga gggc tatcaa ggcagg 1046
<210>159
<211>311
<212>PRT
<213>Populus tremuloides
<400>159
Met Leu Asp Ile Pro Pro Gly Met Leu Lys Met Asp Met Leu Ser Pro
1 5 10 15
Arg Ser Arg Gln Lys Glu Lys Val Val Ile Val Met Gly Pro Thr Gly
20 25 30
Thr Gly Lys Ser Arg Leu Ser Ile Glu Leu Ala Thr Gln Phe Pro Ala
35 40 45
Glu Ile Ile Asn Ser Asp Lys Met Gln Val Tyr Lys Gly Leu Asp Ile
50 55 60
Val Thr Asn Lys Val Ala Glu Glu Glu Lys Ser Gly Val Pro His His
65 70 75 80
Leu Leu Gly Ile Ala Asn Pro Thr Val Asp Phe Thr Ala Thr Asn Tyr
85 90 95
Cys His Thr Ala Ser Leu Ala Val Glu Ser Ile Ser Thr Arg Gly Leu
100 105 110
Leu Pro Ile Ile Val Gly Gly Ser Asn Ser Tyr Ile Glu Ala Leu Met
115 120 125
Asp Asp Glu Asp Phe Arg Leu Arg Leu Asn Tyr Asp Cys Cys Phe Leu
130 135 140
Trp Val Asp Val Ser Met Pro Val Leu His Lys Phe Val Ser Arg Arg
145 150 155 160
Val Glu Gln Met Val Ser Val Gly Met Ile Asp Glu Val Arg Asn Ile
165 170 175
Phe Asp Pro Tyr Ala Asp Tyr Ser Thr Gly Ile Arg Arg Ser Ile Gly
180 185 190
Val Pro Glu Phe Asp Lys Tyr Phe Arg Ala Glu Ala Phe Leu Asp Glu
195 200 205
Glu Asn Arg Ala Arg Leu Leu His Glu Ala Ile Cys Asp Val Lys Lys
210 215 220
Asn Thr Cys Lys Leu Ala Cys Arg Gln Trp Glu Lys Ile Asn Arg Leu
225 230 235 240
Arg Lys Ile Lys Gly Trp Asp Ile His Arg Leu Asp Ala Thr Glu Val
245 250 255
Phe Gln Lys Ser Gly Lys Glu Ala Asp His Ala Trp Glu Met Leu Val
260 265 270
Ala Arg Pro Ser Thr Ala Ile Val Gly Gln Leu Leu Cys Gly Val Pro
275 280 285
Ala Asp Lys Val Pro Ala Ile Ala Ser Val Ala Lys Asn Met Gly Tyr
290 295 300
Ile Arg Gln Cys Leu Val Ala
305 310
<210>160
<211>1112
<212>DNA
<213>Populus tremuloides
<400>160
ttacaccatt ctcaaataat tacacgaatt atggaaatga ttcctctaca accaaagctt 60
gcctcaagta tgagaactat gccaatggct gcctctctcc ccttaagaat ggagcgggaa 120
atcaggcacc gcaacaacct ccaacagatc actagttcac tttattccat tgacgacaag 180
aagaagcaaa aagctttgtt cgtaatggga acaactgcca ctggaaaatc aaaactctcc 240
attgatttag ccactcattt tcaaggtgaa atcatcaatt cagacaaaat tcaggtttac 300
aagggccttg acatgttgac caacaaaatt tcggaaattg aacgccgagg tgtgcctcac 360
catttgctag gatttgtgga acctggagaa gagtttacca cacaagattt ttgcaatcat 420
gtacacaagg ccatgaaaca tattacaggg gatggaagca tccccattat cgccggcggc 480
tcgaatagat acatcgaagc actcgtcgag gatccgcttt tcaacttcaa ggatagttat 540
gatacttgtt ttctatgggt ggatgttgcc ttgccaatct tatttgatcg cgcagcaaaa 600
agggttgatg agatgcttga tgctggtctt gttgaagagg ttcgaggtat gtttattcca 660
gggatagatc acaatagcgg gatttggcgg gctattggga ttgcagagat ggaaccatat 720
tttcaagctg aaatggaaat ggctgatgag gtcaccatga aaatattgct tgaaactggt 780
attaaagaaa tgaaagaaaa taccaagaag ctaatcaata aacaactaac gaaaatcaaa 840
tatttggcta acaagaaagg atggaaattc catcggattg atgctacttg tgtgtatgag 900
agaagtgcaa aagttgatga agatgtttgg gacaagaagg ttttgagacc tagcttggag 960
atagttacta attttctccg ggaagacgag aaagcagaag aagtggcaga cagttttcta 1020
gttacaagct agcagctgca tctaatcaat tgagatatac cgattagttc aattttctat 1080
cgcatcttta cttctcagca cacatcaaaa ta 1112
<210>161
<211>333
<212>PRT
<213>Populus tremuloides
<400>161
Met Glu Met Ile Pro Leu Gln Pro Lys Leu Ala Ser Ser Met Arg Thr
1 5 10 15
Met Pro Met Ala Ala Ser Leu Pro Leu Arg Met Glu Arg Glu Ile Arg
20 25 30
His Arg Asn Asn Leu Gln Gln Ile Thr Ser Ser Leu Tyr Ser Ile Asp
35 40 45
Asp Lys Lys Lys Gln Lys Ala Leu Phe Val Met Gly Thr Thr Ala Thr
50 55 60
Gly Lys Ser Lys Leu Ser Ile Asp Leu Ala Thr His Phe Gln Gly Glu
65 70 75 80
Ile Ile Asn Ser Asp Lys Ile Gln Val Tyr Lys Gly Leu Asp Met Leu
85 90 95
Thr Asn Lys Ile Ser Glu Ile Glu Arg Arg Gly Val Pro His His Leu
100 105 110
Leu Gly Phe Val Glu Pro Gly Glu Glu Phe Thr Thr Gln Asp Phe Cys
115 120 125
Asn His Val His Lys Ala Met Lys His Ile Thr Gly Asp Gly Ser Ile
130 135 140
Pro Ile Ile Ala Gly Gly Ser Asn Arg Tyr Ile Glu Ala Leu Val Glu
145 150 155 160
Asp Pro Leu Phe Asn Phe Lys Asp Ser Tyr Asp Thr Cys Phe Leu Trp
165 170 175
Val Asp Val Ala Leu Pro Ile Leu Phe Asp Arg Ala Ala Lys Arg Val
180 185 190
Asp Glu Met Leu Asp Ala Gly Leu Val Glu Glu Val Arg Gly Met Phe
195 200 205
Ile Pro Gly Ile Asp His Asn Ser Gly Ile Trp Arg Ala Ile Gly Ile
210 215 220
Ala Glu Met Glu Pro Tyr Phe Gln Ala Glu Met Glu Met Ala Asp Glu
225 230 235 240
Val Thr Met Lys Ile Leu Leu Glu Thr Gly Ile Lys Glu Met Lys Glu
245 250 255
Asn Thr Lys Lys Leu Ile Asn Lys Gln Leu Thr Lys Ile Lys Tyr Leu
260 265 270
Ala Asn Lys Lys Gly Trp Lys Phe His Arg Ile Asp Ala Thr Cys Val
275 280 285
Tyr Glu Arg Ser Ala Lys Val Asp Glu Asp Val Trp Asp Lys Lys Val
290 295 300
Leu Arg Pro Ser Leu Glu Ile Val Thr Asn Phe Leu Arg Glu Asp Glu
305 310 315 320
Lys Ala Glu Glu Val Ala Asp Ser Phe Leu Val Thr Ser
325 330
<210>162
<211>1325
<212>DNA
<213>Populus tremuloides
<400>162
ggcagtacaa agcaaaaagc tttgttcgta atgggaacaa ctgccactgg aaaatcaaaa 60
ctctccatcg atttagccac tcattttcaa ggtgagatca tcaactcgga caaaattcag 120
gtttacaagg gccttgacat attgaccaac aaagtttcgg aagatgaaag ccgaggtgtg 180
cctcaccact tgctaggatt tgtggaacct ggggaagagt ttaccacaca agatttttgc 240
aaccatgtac atatggccat gagacatatt atagggaatg gaaacatccc cattattgcc 300
ggcggctcaa atagatacat cgaagcactc gtcgaggatc cactgttcaa ggataattac 360
gatacttgtt ttctatgggt ggatgttgcc ttgccaattt tatttgttcg cgcagcaaag 420
agggttgata agatgctcga tgctggtctt gtcgacgagg tccgaggcat gtttattcca 480
gggatagatc acaatagcgg gatttggcgg gctattggga ttccagagct ggaaccatat 540
tttcaagctg aaatggaaat ggccgatgag gtgaccagaa aaatgttact tgacactggt 600
atcaaggaaa tgaaagaaaa taccaagaag ctaatcaata aacaactgag gaaaatcaaa 660
tatttggcga atgagaaagg atggaaatta catcggattg atgctacttt tgtgtacgag 720
agaagtggaa acgtagatga agatgtttgg gacgacaagg ttttgagacc tagcctggag 780
atgctcacta actttctcca ggaagatggg aaagcagaag aatttgtgga tgctagtggt 840
ttgcctggta gctttgaatg gagagagaaa ggagttgtca ctgatgtcaa gattcagggt 900
gcttgtggat catgctgggc ttttagcacc actggatctg ttgaaggagc aaattttatt 960
gcaacaagga agcttctcaa ccttagtgaa caacagcttg ttgattgtga cagtgtgaca 1020
gacaagactt cctgtggtga tggttgcggt ggagggttca tgaccaatgc ctacaggtgt 1080
ttgatcgagg caggggcgtt acaagaggag actggattga atgcaatatt aatgcaaact 1140
tgtattagag gggtctcgtg cccagttatt cgcggcaaga aatggctcaa ccgtggtgtt 1200
ctacttgttg ggaatggtgc aagaggttac tccattctta attaggtctg gctacaagcc 1260
gtactggatc atcaggaact catggggtga gcattgggga gagaagggac atcaccttct 1320
ttgca 1325
<210>163
<211>404
<212>PRT
<213>Populus tremuloides
<400>163
Met Gly Thr Thr Ala Thr Gly Lys Ser Lys Leu Ser Ile Asp Leu Ala
1 5 10 15
Thr His Phe Gln Gly Glu Ile Ile Asn Ser Asp Lys Ile Gln Val Tyr
20 25 30
Lys Gly Leu Asp Ile Leu Thr Asn Lys Val Ser Glu Asp Glu Ser Arg
35 40 45
Gly Val Pro His His Leu Leu Gly Phe Val Glu Pro Gly Glu Glu Phe
50 55 60
Thr Thr Gln Asp Phe Cys Asn His Val His Met Ala Met Arg His Ile
65 70 75 80
Ile Gly Asn Gly Asn Ile Pro Ile Ile Ala Gly Gly Ser Asn Arg Tyr
85 90 95
Ile Glu Ala Leu Val Glu Asp Pro Leu Phe Lys Asp Asn Tyr Asp Thr
100 105 110
Cys Phe Leu Trp Val Asp Val Ala Leu Pro Ile Leu Phe Val Arg Ala
115 120 125
Ala Lys Arg Val Asp Lys Met Leu Asp Ala Gly Leu Val Asp Glu Val
130 135 140
Arg Gly Met Phe Ile Pro Gly Ile Asp His Asn Ser Gly Ile Trp Arg
145 150 155 160
Ala Ile Gly Ile Pro Glu Leu Glu Pro Tyr Phe Gln Ala Glu Met Glu
165 170 175
Met Ala Asp Glu Val Thr Arg Lys Met Leu Leu Asp Thr Gly Ile Lys
180 185 190
Glu Met Lys Glu Asn Thr Lys Lys Leu Ile Asn Lys Gln Leu Arg Lys
195 200 205
Ile Lys Tyr Leu Ala Asn Glu Lys Gly Trp Lys Leu His Arg Ile Asp
210 215 220
Ala Thr Phe Val Tyr Glu Arg Ser Gly Asn Val Asp Glu Asp Val Trp
225 230 235 240
Asp Asp Lys Val Leu Arg Pro Ser Leu Glu Met Leu Thr Asn Phe Leu
245 250 255
Gln Glu Asp Gly Lys Ala Glu Glu Phe Val Asp Ala Ser Gly Leu Pro
260 265 270
Gly Ser Phe Glu Trp Arg Glu Lys Gly Val Val Thr Asp Val Lys Ile
275 280 285
Gln Gly Ala Cys Gly Ser Cys Trp Ala Phe Ser Thr Thr Gly Ser Val
290 295 300
Glu Gly Ala Asn Phe Ile Ala Thr Arg Lys Leu Leu Asn Leu Ser Glu
305 310 315 320
Gln Gln Leu Val Asp Cys Asp Ser Val Thr Asp Lys Thr Ser Cys Gly
325 330 335
Asp Gly Cys Gly Gly Gly Phe Met Thr Asn Ala Tyr Arg Cys Leu Ile
340 345 350
Glu Ala Gly Ala Leu Gln Glu Glu Thr Gly Leu Asn Ala Ile Leu Met
355 360 365
Gln Thr Cys Ile Arg Gly Val Ser Cys Pro Val Ile Arg Gly Lys Lys
370 375 380
Trp Leu Asn Arg Gly Val Leu Leu Val Gly Asn Gly Ala Arg Gly Tyr
385 390 395 400
Ser Ile Leu Asn
<210>164
<211>1233
<212>DNA
<213>葡萄
<400>164
atgccatctc tgtcgkaatg tgaygtatct gtgcaggact gcacaaacca ccccaccaaa 60
acgaccgtca cttctattcc tatgaaactc cccgtcccca ccggttatca tccatattgc 120
agcaaagttc aaacgctccc actcataccg gcgataaagc ccaccttccg aagatccggg 180
tgggctcgca tggattccac ggyccgccgt aatcgcmcca agcacaaggt cgtcgttatc 240
atgggagcca ccggcaccgg aaaatccaaa ctctccatcg acctcgccac acgcttcccc 300
gccgagatca tcaactctga caaaatacaa atctacagtg gccttgacat caccactaac 360
aagatccaaa tgcacgagcg acaaggtgta ccccaccacc tgctcggaga tttcgactcc 420
tcccacgctg agataacccc ttcccagttc cgctcggtgg ctgccgctgc tatctcagac 480
atctcttctc gccgcaaact gccagtcctc gctggtgggt ccaattcctt tattcacgca 540
ctcctcgtcg accggtttga ctccgagtct gaccccttya atggttcgga ctcggtctcc 600
accgaattac gttaccgctg ttgtttccta tgggttgacg tttcatttgc tgttctctcc 660
gactacttgt cgaagcgagt cgatgaaatg cttggctcag ggatgcttga agagttagct 720
aagttctacg acccggatga agacgagtct agacccaaaa ctgggttgag aaaagcgata 780
ggagtccccg agttcgacag gcatttccga aagtaccctc ccgtcgacca aggaataatc 840
gctggaaatc ccaagaagaa gaaggatgat ccagaaatgg aaagttttga agaggcagtg 900
aaggccatca aggacaacac gtgtcatcta gcgaagaagc agatagagaa gatcctacgg 960
atgaggggag ccgggtggga cctcaagaga ctggacgcca cagaggcgtt cagggtgctg 1020
ctgtcgtcag attccggcaa gaagtcgtca gaaatatggg agaagcaggt agtggaaccg 1080
agcgtgaagt ttgtgaggcg cttcttagag gagtaggttg ttcagctttt tctacccgtc 1140
ctgttttcct atgatccaaa attagttacc taaattactt tcatttcccc ctttttttgg 1200
atttactctt tccctctcta tttgaaaaaa aaa 1233
<210>165
<211>371
<212>PRT
<213>葡萄
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa可以是任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(68)..(68)
<223>Xaa可以是任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(73)..(73)
<223>Xaa可以是任何天然存在的氨基酸
<400>165
Met Pro Ser Leu Ser Xaa Cys Asp Val Ser Val Gln Asp Cys Thr Asn
1 5 10 15
His Pro Thr Lys Thr Thr Val Thr Ser Ile Pro Met Lys Leu Pro Val
20 25 30
Pro Thr Gly Tyr His Pro Tyr Cys Ser Lys Val Gln Thr Leu Pro Leu
35 40 45
Ile Pro Ala Ile Lys Pro Thr Phe Arg Arg Ser Gly Trp Ala Arg Met
50 55 60
Asp Ser Thr Xaa Arg Arg Asn Arg Xaa Lys His Lys Val Val Val Ile
65 70 75 80
Met Gly Ala Thr Gly Thr Gly Lys Ser Lys Leu Ser Ile Asp Leu Ala
85 90 95
Thr Arg Phe Pro Ala Glu Ile Ile Asn Ser Asp Lys Ile Gln Ile Tyr
100 105 110
Ser Gly Leu Asp Ile Thr Thr Asn Lys Ile Gln Met His Glu Arg Gln
115 120 125
Gly Val Pro His His Leu Leu Gly Asp Phe Asp Ser Ser His Ala Glu
130 135 140
Ile Thr Pro Ser Gln Phe Arg Ser Val Ala Ala Ala Ala Ile Ser Asp
145 150 155 160
Ile Ser Ser Arg Arg Lys Leu Pro Val Leu Ala Gly Gly Ser Asn Ser
165 170 175
Phe Ile His Ala Leu Leu Val Asp Arg Phe Asp Ser Glu Ser Asp Pro
180 185 190
Phe Asn Gly Ser Asp Ser Val Ser Thr Glu Leu Arg Tyr Arg Cys Cys
195 200 205
Phe Leu Trp Val Asp Val Ser Phe Ala Val Leu Ser Asp Tyr Leu Ser
210 215 220
Lys Arg Val Asp Glu Met Leu Gly Ser Gly Met Leu Glu Glu Leu Ala
225 230 235 240
Lys Phe Tyr Asp Pro Asp Glu Asp Glu Ser Arg Pro Lys Thr Gly Leu
245 250 255
Arg Lys Ala Ile Gly Val Pro Glu Phe Asp Arg His Phe Arg Lys Tyr
260 265 270
Pro Pro Val Asp Gln Gly Ile Ile Ala Gly Asn Pro Lys Lys Lys Lys
275 280 285
Asp Asp Pro Glu Met Glu Ser Phe Glu Glu Ala Val Lys Ala Ile Lys
290 295 300
Asp Asn Thr Cys His Leu Ala Lys Lys Gln Ile Glu Lys Ile Leu Arg
305 310 315 320
Met Arg Gly Ala Gly Trp Asp Leu Lys Arg Leu Asp Ala Thr Glu Ala
325 330 335
Phe Arg Val Leu Leu Ser Ser Asp Ser Gly Lys Lys Ser Ser Glu Ile
340 345 350
Trp Glu Lys Gln Val Val Glu Pro Ser Val Lys Phe Val Arg Arg Phe
355 360 365
Leu Glu Glu
370
<210>166
<211>1167
<212>DNA
<213>玉米
<400>166
atgaccaccc tcctcgccaa taggatcact acgctcgtgc gcgcccctcc tcctcccatg 60
gccgccgccg ccgtcgcggg agcgcggagg ccattgcacc ggaccttggc gcacccgcca 120
ccgcccgagg aggacgagca tcagcagcag cgcgcgtgcc gcagcagggg atcctcgtcc 180
tcctgctcgg cttcctcgtc atcgacgccc gcccggcccc ggggcacggg gatggtggtg 240
atcgtcggcg ccacgggcac cgggaagacc aagctgtcca tcgacgccgc ggaggcggtc 300
ggcggggagg tggtgaacgc ggataagatc cagctctacg ccgggctgga cgtgaccacg 360
aacaaggtgg cccccgcgga ccgccgcggc gtgccgcacc acctcctcgg cgccatccgc 420
cccgaggccg gcgagctccc gccctccacg ttccgctccc tcgccgccgc cacggccgcc 480
tcgatcgccg cgcgcggccg cctgccggtc gtcgcgggcg gctccaactc cctcatccac 540
gcgctcctcg ccgaccgcct cgacgccggc gccgccgacc ccttctccgc tccaccgcag 600
ccggcgccgc cgcggtgggg ccgccggccc gcgctccgat ccccgtgctg tctcctctgg 660
gtccacgtcg acgccgcgct cctcgcggag tacctggacc ggcgcgtgga cgacatggtg 720
cgcggcggca tggtggagga gctgcgggag tacttcgccg cgaccaccgc cgccgagcgc 780
gccgcgcacg ccgcggggct gggcagggcc atcggcgtgc ccgagctggg cgcctgcttc 840
gcggggcgcg ccagcttccg cgccgcgatc gacgacatca aggccaacac gcgggacctg 900
gcggccgcgc aggtgcgcaa gatccgacgc atggccgatg cctggggctg gcccatccag 960
cggctcgacg cgtcggccac agtccgcgcg cgcctccgcg gcgcggggcc cgacgcggag 1020
tcggcgtgct gggagcgcga cgtgcgcgcg cccgggctcg ccgccatccg gagcttcctt 1080
ctagagctgg acggcggcag cgtcgtcgac ggcgctgtgg tggaggaggt ggagccgcgg 1140
gtgcgatgct gcgacgtggt ggggtga 1167
<210>167
<211>388
<212>PRT
<213>玉米
<400>167
Met Thr Thr Leu Leu Ala Asn Arg Ile Thr Thr Leu Val Arg Ala Pro
1 5 10 15
Pro Pro Pro Met Ala Ala Ala Ala Val Ala Gly Ala Arg Arg Pro Leu
20 25 30
His Arg Thr Leu Ala His Pro Pro Pro Pro Glu Glu Asp Glu His Gln
35 40 45
Gln Gln Arg Ala Cys Arg Ser Arg Gly Ser Ser Ser Ser Cys Ser Ala
50 55 60
Ser Ser Ser Ser Thr Pro Ala Arg Pro Arg Gly Thr Gly Met Val Val
65 70 75 80
Ile Val Gly Ala Thr Gly Thr Gly Lys Thr Lys Leu Ser Ile Asp Ala
85 90 95
Ala Glu Ala Val Gly Gly Glu Val Val Asn Ala Asp Lys Ile Gln Leu
100 105 110
Tyr Ala Gly Leu Asp Val Thr Thr Asn Lys Val Ala Pro Ala Asp Arg
115 120 125
Arg Gly Val Pro His His Leu Leu Gly Ala Ile Arg Pro Glu Ala Gly
130 135 140
Glu Leu Pro Pro Ser Thr Phe Arg Ser Leu Ala Ala Ala Thr Ala Ala
145 150 155 160
Ser Ile Ala Ala Arg Gly Arg Leu Pro Val Val Ala Gly Gly Ser Asn
165 170 175
Ser Leu Ile His Ala Leu Leu Ala Asp Arg Leu Asp Ala Gly Ala Ala
180 185 190
Asp Pro Phe Ser Ala Pro Pro Gln Pro Ala Pro Pro Arg Trp Gly Arg
195 200 205
Arg Pro Ala Leu Arg Ser Pro Cys Cys Leu Leu Trp Val His Val Asp
210 215 220
Ala Ala Leu Leu Ala Glu Tyr Leu Asp Arg Arg Val Asp Asp Met Val
225 230 235 240
Arg Gly Gly Met Val Glu Glu Leu Arg Glu Tyr Phe Ala Ala Thr Thr
245 250 255
Ala Ala Glu Arg Ala Ala His Ala Ala Gly Leu Gly Arg Ala Ile Gly
260 265 270
Val Pro Glu Leu Gly Ala Cys Phe Ala Gly Arg Ala Ser Phe Arg Ala
275 280 285
Ala Ile Asp Asp Ile Lys Ala Asn Thr Arg Asp Leu Ala Ala Ala Gln
290 295 300
Val Arg Lys Ile Arg Arg Met Ala Asp Ala Trp Gly Trp Pro Ile Gln
305 310 315 320
Arg Leu Asp Ala Ser Ala Thr Val Arg Ala Arg Leu Arg Gly Ala Gly
325 330 335
Pro Asp Ala Glu Ser Ala Cys Trp Glu Arg Asp Val Arg Ala Pro Gly
340 345 350
Leu Ala Ala Ile Arg Ser Phe Leu Leu Glu Leu Asp Gly Gly Ser Val
355 360 365
Val Asp Gly Ala Val Val Glu Glu Val Glu Pro Arg Val Arg Cys Cys
370 375 380
Asp Val Val Gly
385
<210>168
<211>753
<212>DNA
<213>稻
<400>168
atgaaggtgc agtgcgacgt gtgcgcggcc gaggccgcct cggtcttctg ctgcgccgac 60
gaggccgcgc tgtgcgacgc gtgcgaccgc cgcgtccaca gcgcgaacaa gctcgccggg 120
aagcaccgcc gattctccct cctccaaccg ttggcgtcgt cgtcgtccgc ccagaagcca 180
ccgctctgcg acatctgtca ggagaagagg gggttcttgt tctgcaagga ggacagggcg 240
atcctgtgcc gggagtgcga cgtcacggtg cacaccacga gcgagctgac gaggcggcac 300
ggccggttcc tcctcaccgg cgtgcgcctc tcgtcggcgc cgatggactc ccccgcgccg 360
tcggaggaag aggaggagga agcaggggag gactacagct gcagccccag cagcgtcgcc 420
ggcaccgccg cggggagcgc gagcgacggg agcagcatct ccgagtacct caccaagacg 480
ctgcccggtt ggcacgtcga ggacttcctc gtcgacgagg ccaccgccgc ctcctcctcc 540
tcagacgggc tatttcaggg tgggctgctg gctcagatcg gtggggtgcc ggacggttac 600
gcggcgtggg ccggccggga gcagctgcac agtggcgtcg ctgtcgccgc cgacgagcgg 660
gccagccgcg agcggtgggt gccgcagatg aacgcggagt ggggcgccgg cagcaagcga 720
cccagggcgt cgcctccctg cttgtactgg tga 753
<210>169
<211>250
<212>PRT
<213>稻
<400>169
Met Lys Val Gln Cys Asp Val Cys Ala Ala Glu Ala Ala Ser Val Phe
1 5 10 15
Cys Cys Ala Asp Glu Ala Ala Leu Cys Asp Ala Cys Asp Arg Arg Val
20 25 30
His Ser Ala Asn Lys Leu Ala Gly Lys His Arg Arg Phe Ser Leu Leu
35 40 45
Gln Pro Leu Ala Ser Ser Ser Ser Ala Gln Lys Pro Pro Leu Cys Asp
50 55 60
Ile Cys Gln Glu Lys Arg Gly Phe Leu Phe Cys Lys Glu Asp Arg Ala
65 70 75 80
Ile Leu Cys Arg Glu Cys Asp Val Thr Val His Thr Thr Ser Glu Leu
85 90 95
Thr Arg Arg His Gly Arg Phe Leu Leu Thr Gly Val Arg Leu Ser Ser
100 105 110
Ala Pro Met Asp Ser Pro Ala Pro Ser Glu Glu Glu Glu Glu Glu Ala
115 120 125
Gly Glu Asp Tyr Ser Cys Ser Pro Ser Ser Val Ala Gly Thr Ala Ala
130 135 140
Gly Ser Ala Ser Asp Gly Ser Ser Ile Ser Glu Tyr Leu Thr Lys Thr
145 150 155 160
Leu Pro Gly Trp His Val Glu Asp Phe Leu Val Asp Glu Ala Thr Ala
165 170 175
Ala Ser Ser Ser Ser Asp Gly Leu Phe Gln Gly Gly Leu Leu Ala Gln
180 185 190
Ile Gly Gly Val Pro Asp Gly Tyr Ala Ala Trp Ala Gly Arg Glu Gln
195 200 205
Leu His Ser Gly Val Ala Val Ala Ala Asp Glu Arg Ala Ser Arg Glu
210 215 220
Arg Trp Val Pro Gln Met Asn Ala Glu Trp Gly Ala Gly Ser Lys Arg
225 230 235 240
Pro Arg Ala Ser Pro Pro Cys Leu Tyr Trp
245 250
<210>170
<211>1074
<212>DNA
<213>稻
<400>170
atgaaggtgc tgtgctccgc gtgcgaggcg gcggaggcgc gggtgctctg ctgcgccgac 60
gacgccgccc tctgcgcgcg ctgcgacctc cacgtccacg ccgccaaccg cctcgccggc 120
aagcaccacc gcctccccct cctctcctcc tcctcttctt cctcctctcc ctcccccccg 180
acctgcgaca tctgccagga cgcccacgcc tacttcttct gcgtcgagga ccgcgccctc 240
ctctgccgcg cctgcgacgt cgccgtccac accgccaacg ccctcgtctc cgcccaccgc 300
cgcttcctcc tcaccggcgt ccacgtcggc cttgacgccg ccgccgacga cgacgacaaa 360
caccccccac accccttgtc gtcgtcgctg ccgcgcaaca cggcaccgcc cccgcagccg 420
ccgccgaagc gcagcccctc gccgatctac agcgatgacg acgtcatcga ctgggccacc 480
ggtggccacg acatcggcat caccggcaac ctgcccgact ggtcgctcgt cgacgagcag 540
ttcaacaccc ctgcgctgcc gccggtggtg accaagaccc cgccgaagcg ggcctcccgt 600
ggccccgtca cggccggcac cgccgcggcg gtgttcggca acctcgccgg cggatcgccg 660
gactggccgc tcaacgagtt cttcggcttc gccgacttca gctccggctt cggcttcgcc 720
gagaacggca cgtccaaggc ggacagcggc aagatcggga gcatggacgg ctcgccgaac 780
ggcggcaggt cgtcgtcgtc gtcctcctcc tcctccgccg ccgccgccgg cggcggcggc 840
ggcggccagg acttcttcgg ccaggtgccg gaagttcact gggccgtgcc ggagctcccc 900
tcgccgccca cggcgtcagg gctccactgg caacgggacc cgcgctacgg tggcggcgcc 960
accgacgcca gcgcggtgtt cgtgccggac atctcctcgc cggagaaccc cttccgttgc 1020
ttcgccgccg ccgccgccgg tgaccatacc atgaaacgcc ggaggagatg ctaa 1074
<210>171
<211>357
<212>PRT
<213>稻
<400>171
Met Lys Val Leu Cys Ser Ala Cys Glu Ala Ala Glu Ala Arg Val Leu
1 5 10 15
Cys Cys Ala Asp Asp Ala Ala Leu Cys Ala Arg Cys Asp Leu His Val
20 25 30
His Ala Ala Asn Arg Leu Ala Gly Lys His His Arg Leu Pro Leu Leu
35 40 45
Ser Ser Ser Ser Ser Ser Ser Ser Pro Ser Pro Pro Thr Cys Asp Ile
50 55 60
Cys Gln Asp Ala His Ala Tyr Phe Phe Cys Val Glu Asp Arg Ala Leu
65 70 75 80
Leu Cys Arg Ala Cys Asp Val Ala Val His Thr Ala Asn Ala Leu Val
85 90 95
Ser Ala His Arg Arg Phe Leu Leu Thr Gly Val His Val Gly Leu Asp
l00 105 110
Ala Ala Ala Asp Asp Asp Asp Lys His Pro Pro His Pro Leu Ser Ser
115 120 125
Ser Leu Pro Arg Asn Thr Ala Pro Pro Pro Gln Pro Pro Pro Lys Arg
130 135 140
Ser Pro Ser Pro Ile Tyr Ser Asp Asp Asp Val Ile Asp Trp Ala Thr
145 150 155 160
Gly Gly His Asp Ile Gly Ile Thr Gly Asn Leu Pro Asp Trp Ser Leu
165 170 175
Val Asp Glu Gln Phe Asn Thr Pro Ala Leu Pro Pro Val Val Thr Lys
180 185 190
Thr Pro Pro Lys Arg Ala Ser Arg Gly Pro Val Thr Ala Gly Thr Ala
195 200 205
Ala Ala Val Phe Gly Asn Leu Ala Gly Gly Ser Pro Asp Trp Pro Leu
210 215 220
Asn Glu Phe Phe Gly Phe Ala Asp Phe Ser Ser Gly Phe Gly Phe Ala
225 230 235 240
Glu Asn Gly Thr Ser Lys Ala Asp Ser Gly Lys Ile Gly Ser Met Asp
245 250 255
Gly Ser Pro Asn Gly Gly Arg Ser Ser Ser Ser Ser Ser Ser Ser Ser
260 265 270
Ala Ala Ala Ala Gly Gly Gly Gly Gly Gly Gln Asp Phe Phe Gly Gln
275 280 285
Val Pro Glu Val His Trp Ala Val Pro Glu Leu Pro Ser Pro Pro Thr
290 295 300
Ala Ser Gly Leu His Trp Gln Arg Asp Pro Arg Tyr Gly Gly Gly Ala
305 310 315 320
Thr Asp Ala Ser Ala Val Phe Val Pro Asp Ile Ser Ser Pro Glu Asn
325 330 335
Pro Phe Arg Cys Phe Ala Ala Ala Ala Ala Gly Asp His Thr Met Lys
340 345 350
Arg Arg Arg Arg Cys
355
<210>172
<211>816
<212>DNA
<213>稻
<400>172
atgaagatcc agtgcgacgc gtgcgagagc gcggcggcgg cggtggtgtg ctgcgcggac 60
gaggcggcgc tgtgcgcggc gtgcgacgtg gaggtgcacg cggcgaacaa gctggccggg 120
aagcaccagc ggctgccgct ggaggcgctc tcggcgaggc tcccgcgctg cgacgtgtgc 180
caggagaagg cggcgttcat cttctgcgtg gaggaccgcg cgctcttctg ccgcgactgc 240
gacgagccca tccacgtccc cggcacgctc tccggcaacc accagcgcta cctcgccacc 300
ggcatccgcg tcggcttcgc ctccgcctcg ccctgcgacg gcggcagcga cgcccatgac 360
tccgaccacc acgccccgcc catgggctcc tccgagcatc atcaccatca tcagcagccg 420
gccccgaccg tcgccgtcga cacgccctcg ccgcagttcc tgccgcaggg ctgggccgtc 480
gacgagctcc tccagttctc cgactacgag accggcgaca agctgcagaa ggagtcgtcg 540
ccgccgctcg ggttccagga gctggagtgg ttcgccgaca tcgacctgtt ccacaaccag 600
gcgcccaagg gcggcgccgc cgccggccgg acgacggcgg aggtccccga gctcttcgct 660
tcgcaggcgg ccaacgacgt ggcgtactac aggccgccga ccaggaccgc cgccgccgcc 720
ttcaccgcgg ccaccggctt ccgccagagc aagaaggccc gcgtcgagct ccccgacgac 780
gaggaggatt acctcatcgt ccctgatctt ggttga 816
<210>173
<211>271
<212>PRT
<213>稻
<400>173
Met Lys Ile Gln Cys Asp Ala Cys Glu Ser Ala Ala Ala Ala Val Val
1 5 10 15
Cys Cys Ala Asp Glu Ala Ala Leu Cys Ala Ala Cys Asp Val Glu Val
20 25 30
His Ala Ala Asn Lys Leu Ala Gly Lys His Gln Arg Leu Pro Leu Glu
35 40 45
Ala Leu Ser Ala Arg Leu Pro Arg Cys Asp Val Cys Gln Glu Lys Ala
50 55 60
Ala Phe Ile Phe Cys Val Glu Asp Arg Ala Leu Phe Cys Arg Asp Cys
65 70 75 80
Asp Glu Pro Ile His Val Pro Gly Thr Leu Ser Gly Asn His Gln Arg
85 90 95
Tyr Leu Ala Thr Gly Ile Arg Val Gly Phe Ala Ser Ala Ser Pro Cys
100 105 110
Asp Gly Gly Ser Asp Ala His Asp Ser Asp His His Ala Pro Pro Met
115 120 125
Gly Ser Ser Glu His His His His His Gln Gln Pro Ala Pro Thr Val
130 135 140
Ala Val Asp Thr Pro Ser Pro Gln Phe Leu Pro Gln Gly Trp Ala Val
145 150 155 160
Asp Glu Leu Leu Gln Phe Ser Asp Tyr Glu Thr Gly Asp Lys Leu Gln
165 170 175
Lys Glu Ser Ser Pro Pro Leu Gly Phe Gln Glu Leu Glu Trp Phe Ala
180 185 190
Asp Ile Asp Leu Phe His Asn Gln Ala Pro Lys Gly Gly Ala Ala Ala
195 200 205
Gly Arg Thr Thr Ala Glu Val Pro Glu Leu Phe Ala Ser Gln Ala Ala
210 215 220
Asn Asp Val Ala Tyr Tyr Arg Pro Pro Thr Arg Thr Ala Ala Ala Ala
225 230 235 240
Phe Thr Ala Ala Thr Gly Phe Arg Gln Ser Lys Lys Ala Arg Val Glu
245 250 255
Leu Pro Asp Asp Glu Glu Asp Tyr Leu Ile Val Pro Asp Leu Gly
260 265 270
<210>174
<211>810
<212>DNA
<213>稻
<400>174
atgaaggtgc agtgcgacgt gtgcgcggcc gaggcggcgt cggtgttctg ctgcgccgac 60
gaggccgcgc tgtgcgacgc gtgcgaccac cgggtgcacc gggccaacaa gctcgccggg 120
aagcaccgcc ggttctcgct gctcaacccc tcggcgtccg gccgctcgcc gacatcgacg 180
acggcgccgc tctgcgacat ctgccaggag aagaggggtt tcctgttctg caaggaggac 240
cgggcgatcc tgtgccgcga gtgcgacgtg ccggtgcaca cggcgagcga gctcaccatg 300
cgccacagcc ggtacctcct caccggcgtg cggctctcct cggagcctgc cgcgtccccg 360
gcgccgccgt cggaggagga gaacagcagc agcttctgct gcagcgccga cgacgccgtg 420
ccggccccgg cggcgcccgc cacgagccac ggcgggagca gcggcagcag cagcatctcc 480
gagtacctca ccacgctgcc cgggtggcac gtcgaggact tcctcgtcga cgacgccact 540
gccgaggccg ccgccgccgc cgccgccacc tcttccggca tctccgcgaa cgggccgtgt 600
cagggggtaa cacggatcgg agggctgcaa gaatccgccg gctaccctgc gtggatggcg 660
cagcagcagc tgtgctgcga cggcctcgtc gccggcgacg cgtcgccggc tagccgggag 720
cggtgggtgc cgcagatgta cgcggatcag cttgccgccg gcagcaagag atccaggacg 780
tccactgctt cttcctactc ctactggtga 810
<210>175
<211>269
<212>PRT
<213>稻
<400>175
Met Lys Val Gln Cys Asp Val Cys Ala Ala Glu Ala Ala Ser Val Phe
1 5 10 15
Cys Cys Ala Asp Glu Ala Ala Leu Cys Asp Ala Cys Asp His Arg Val
20 25 30
His Arg Ala Asn Lys Leu Ala Gly Lys His Arg Arg Phe Ser Leu Leu
35 40 45
Asn Pro Ser Ala Ser Gly Arg Ser Pro Thr Ser Thr Thr Ala Pro Leu
50 55 60
Cys Asp Ile Cys Gln Glu Lys Arg Gly Phe Leu Phe Cys Lys Glu Asp
65 70 75 80
Arg Ala Ile Leu Cys Arg Glu Cys Asp Val Pro Val His Thr Ala Ser
85 90 95
Glu Leu Thr Met Arg His Ser Arg Tyr Leu Leu Thr Gly Val Arg Leu
100 105 110
Ser Ser Glu Pro Ala Ala Ser Pro Ala Pro Pro Ser Glu Glu Glu Asn
115 120 125
Ser Ser Ser Phe Cys Cys Ser Ala Asp Asp Ala Val Pro Ala Pro Ala
130 135 140
Ala Pro Ala Thr Ser His Gly Gly Ser Ser Gly Ser Ser Ser Ile Ser
145 150 155 160
Glu Tyr Leu Thr Thr Leu Pro Gly Trp His Val Glu Asp Phe Leu Val
165 170 175
Asp Asp Ala Thr Ala Glu Ala Ala Ala Ala Ala Ala Ala Thr Ser Ser
180 185 190
Gly Ile Ser Ala Asn Gly Pro Cys Gln Gly Val Thr Arg Ile Gly Gly
195 200 205
Leu Gln Glu Ser Ala Gly Tyr Pro Ala Trp Met Ala Gln Gln Gln Leu
210 215 220
Cys Cys Asp Gly Leu Val Ala Gly Asp Ala Ser Pro Ala Ser Arg Glu
225 230 235 240
Arg Trp Val Pro Gln Met Tyr Ala Asp Gln Leu Ala Ala Gly Ser Lys
245 250 255
Arg Ser Arg Thr Ser Thr Ala Ser Ser Tyr SerTyr Trp
260 265
<210>176
<211>774
<212>DNA
<213>稻
<400>176
atgaggatcc agtgcgacgc gtgcgaggcc gcggcggcca cggtggtgtg ctgcgcggac 60
gaggcggcgc tgtgcgcgcg ctgcgacgtc gagatccacg ccgccaacaa gctcgccagc 120
aagcaccagc gcctcccgct cgacgccgcg ctccccgccg ccctcccgcg ctgcgacgtc 180
tgccaggaga aggcggcgtt catcttctgc gtggaggaca gggcgctctt ctgccgggac 240
tgcgacgagc ccatccacgt cccggggacg ctctccggca accaccagcg ctacctcacc 300
accggcatcc gcgtcgggtt cagctccgtc tgtagcgcca acgccgacca cctcccgccg 360
ccagcgccca aggggaactc caagccgccg gcaagcggca tcgctgctgc tgctgctccc 420
aagccggccg tgtccgcggc ggcgcaggag gtgccgtcgt caccgttctt gccgccgtcg 480
ggctgggccg tcgaggatct cctgcagctc tccgactacg agtccagcga caagaagggc 540
tctcctattg ggttcaagga tctggagtgg ctcgatgaca tcgacctgtt ccatgtccag 600
tcgccggcca agggaggcag cacggcggcg gaggtgcctg agctcttcgc ctcgccgcag 660
ccagcgagca acatggggct ctacaaggcg agcggtgcac gccaaagcaa gaagccacgg 720
gtggagatac ccgatgacga cgaggacttc ttcatcgttc ctgatcttgg atga 774
<210>177
<211>257
<212>PRT
<213>稻
<400>177
Met Arg Ile Gln Cys Asp Ala Cys Glu Ala Ala Ala Ala Thr Val Val
1 5 10 15
Cys Cys Ala Asp Glu Ala Ala Leu Cys Ala Arg Cys Asp Val Glu Ile
20 25 30
His Ala Ala Asn Lys Leu Ala Ser Lys His Gln Arg Leu Pro Leu Asp
35 40 45
Ala Ala Leu Pro Ala Ala Leu Pro Arg Cys Asp Val Cys Gln Glu Lys
50 55 60
Ala Ala Phe Ile Phe Cys Val Glu Asp Arg Ala Leu Phe Cys Arg Asp
65 70 75 80
Cys Asp Glu Pro Ile His Val Pro Gly Thr Leu Ser Gly Asn His Gln
85 90 95
Arg Tyr Leu Thr Thr Gly Ile Arg Val Gly Phe Ser Ser Val Cys Ser
100 105 110
Ala Asn Ala Asp His Leu Pro Pro Pro Ala Pro Lys Gly Asn Ser Lys
115 120 125
Pro Pro Ala Ser Gly Ile Ala Ala Ala Ala Ala Pro Lys Pro Ala Val
130 135 140
Ser Ala Ala Ala Gln Glu Val Pro Ser Ser Pro Phe Leu Pro Pro Ser
145 150 155 160
Gly Trp Ala Val Glu Asp Leu Leu Gln Leu Ser Asp Tyr Glu Ser Ser
165 170 175
Asp Lys Lys Gly Ser Pro Ile Gly Phe Lys Asp Leu Glu Trp Leu Asp
180 185 190
Asp Ile Asp Leu Phe His Val Gln Ser Pro Ala Lys Gly Gly Ser Thr
195 200 205
Ala Ala Glu Val Pro Glu Leu Phe Ala Ser Pro Gln Pro Ala Ser Asn
210 215 220
Met Gly Leu Tyr Lys Ala Ser Gly Ala Arg Gln Ser Lys Lys Pro Arg
225 230 235 240
Val Glu Ile Pro Asp Asp Asp Glu Asp Phe Phe Ile Val Pro Asp Leu
245 250 255
Gly
<210>178
<211>1137
<212>DNA
<213>稻
<400>178
atgtcgcctc ctcctccacc atattaccac cacctcctcc tcctccgctc ctcgcccacc 60
accactggag gaggagctcg ggttcttgcc gcggcggagc tcgcacgcat gaagctactg 120
tgcagcgcgt gcgaggcggc ggaggccagc gtcctctgct gcgccgacga ggccgccctg 180
tgcgcgcgct gcgaccgcga catccacgcc gccaaccgcc tcgccgggaa gcacctccgc 240
ctccctctcc tctcccccgc ctcctcctcc tcctcctccg ccgccgccct cgcgccgccg 300
ccgccgtcgc cgcccaagtg cgacatatgc caggagagcc acgcgtactt cttctgcctc 360
gaggaccgcg cgctgctgtg ccggagctgc gacgtggcgg tgcacacggc caacgccttc 420
gtctccgcgc accgccgttt cctcctcacc ggcgtgcagg tcgggcagga gcaggacgag 480
cactcccctg acccgcctga gccgtctcct cctccgccgc cgccgccgcc tgcatccaag 540
agcgaccacc cggcgccgct ctacggcgag ggcggaggag ggttcagctg ggacgccgcc 600
gactcgccgg ccgcgggcgg cctccccgac tggtcggccg tcgtcgacca gttcggctcc 660
ccgccgccgc cgcgccacac ggacaccgcg accgtgacga ccccgccgcc gaccaagagg 720
agcccacgcg cgccggcgtt cggcggccag ggcggcatga tggattggcc cctcggcgag 780
ttcttcggcg gcttcaccga cttcaccggc ggctttggct tcggcttcgg cgacagtggc 840
acctccaagg ctgacagcgg gaagctggga gggagcacgg acggctcgcc gtactaccgg 900
tcgtcatcgg aagatgaccg gaacgccgac gagctcttcg ggcaggtacc agagatccag 960
tggtcggtgc cggagctccc ctcgccgccg acggcctccg gcctccactg gcaacgccat 1020
ccagccgcca ctcacggcgg cggcggcggc ggacccgaca ccaccgcctt cgtccccgac 1080
atctgctccc ccgacagctg cttcccggcc accacctcca aacgccggag gcaataa 1137
<210>179
<211>378
<212>PRT
<213>稻
<400>179
Met Ser Pro Pro Pro Pro Pro Tyr Tyr His His Leu Leu Leu Leu Arg
1 5 10 15
Ser Ser Pro Thr Thr Thr Gly Gly Gly Ala Arg Val Leu Ala Ala Ala
20 25 30
Glu Leu Ala Arg Met Lys Leu Leu Cys Ser Ala Cys Glu Ala Ala Glu
35 40 45
Ala Ser Val Leu Cys Cys Ala Asp Glu Ala Ala Leu Cys Ala Arg Cys
50 55 60
Asp Arg Asp Ile His Ala Ala Asn Arg Leu Ala Gly Lys His Leu Arg
65 70 75 80
Leu Pro Leu Leu Ser Pro Ala Ser Ser Ser Ser Ser Ser Ala Ala Ala
85 90 95
Leu Ala Pro Pro Pro Pro Ser Pro Pro Lys Cys Asp Ile Cys Gln Glu
100 105 110
Ser His Ala Tyr Phe Phe Cys Leu Glu Asp Arg Ala Leu Leu Cys Arg
115 120 125
Ser Cys Asp Val Ala Val His Thr Ala Asn Ala Phe Val Ser Ala His
130 135 140
Arg Arg Phe Leu Leu Thr Gly Val Gln Val Gly Gln Glu Gln Asp Glu
145 150 155 160
His Ser Pro Asp Pro Pro Glu Pro Ser Pro Pro Pro Pro Pro Pro Pro
165 170 175
Pro Ala Ser Lys Ser Asp His Pro Ala Pro Leu Tyr Gly Glu Gly Gly
180 185 190
Gly Gly Phe Ser Trp Asp Ala Ala Asp Ser Pro Ala Ala Gly Gly Leu
195 200 205
Pro Asp Trp Ser Ala Val Val Asp Gln Phe Gly Ser Pro Pro Pro Pro
210 215 220
Arg His Thr Asp Thr Ala Thr Val Thr Thr Pro Pro Pro Thr Lys Arg
225 230 235 240
Ser Pro Arg Ala Pro Ala Phe Gly Gly Gln Gly Gly Met Met Asp Trp
245 250 255
Pro Leu Gly Glu Phe Phe Gly Gly Phe Thr Asp Phe Thr Gly Gly Phe
260 265 270
Gly Phe Gly Phe Gly Asp Ser Gly Thr Ser Lys Ala Asp Ser Gly Lys
275 280 285
Leu Gly Gly Ser Thr Asp Gly Ser Pro Tyr Tyr Arg Ser Ser Ser Glu
290 295 300
Asp Asp Arg Asn Ala Asp Glu Leu Phe Gly Gln Val Pro Glu Ile Gln
305 310 315 320
Trp Ser Val Pro Glu Leu Pro Ser Pro Pro Thr Ala Ser Gly Leu His
325 330 335
Trp Gln Arg His Pro Ala Ala Thr His Gly Gly Gly Gly Gly Gly Pro
340 345 350
Asp Thr Thr Ala Phe Val Pro Asp Ile Cys Ser Pro Asp Ser Cys Phe
355 360 365
Pro Ala Thr Thr Ser Lys Arg Arg Arg Gln
370 375
<210>180
<211>1083
<212>DNA
<213>稻
<400>180
atgaagatcc agtgcaacgc gtgcggcgcg gcggaggcgc gggtgctgtg ctgcgccgac 60
gaggcagcgc tctgcacggc gtgcgacgag gaggtgcacg ccgccaacaa gctcgccggg 120
aagcaccagc gggtgccgct gctctccgac gacggcggcg ccgcgcccgc cgccgccgcc 180
ccggccgtgc ccaagtgcga catctgccag gaggcttctg gatacttctt ctgcctggag 240
gaccgtgcac ttctttgcag agattgtgat gtttctatac acacagtaaa ctcctttgtt 300
tcagtacacc aaagattcct actaacaggt gttcaagttg gccttgatcc tgctgatcca 360
gttccacctg ttgctgacaa gcatgttaag agtgctggtg gttcagtgga ttcagcaact 420
aaacatttgc aaaggaatcc tacagactta tctggtgaaa acagtgcatc tttgcccagc 480
caaaatgtaa tcaatggtaa ttattctagg cagagttctg ttacaatggc caagacagga 540
caggtcaatt ggactatgag caacaacaca attagatcaa tagaccctcc acccaagtat 600
tcatcagagg aaagtccagc acttctgcta gctagccaca ctagcaccat ggcagcgtac 660
tccagtcaaa tcagtaagga tagtgatcgg atctacaact taccattcac aggtggtaat 720
gggtcagata gtctacatga ttggcatgtt gatgagttct ttagtaactc agaatttggc 780
tttgctgagc atggttcttc taagggtgac aacgctaagc cagggagtgc tggtggatct 840
ccgcagtgcc gtctggctga aggcctgttt gtcgaaggac ttctaggtca agtgcctgac 900
aatccatgga cagtgcctga ggtcccctcg ccaccgacag cctctggtct ctattggcaa 960
aataatttgc tttgcccttc gtacgacagc accatgttcg tccctgagat ttcctccttg 1020
gagaactctc agaacaactt cactgtatct gctggtttga agcgccgaag gaggcagttt 1080
tga 1083
<210>181
<211>360
<212>PRT
<213>稻
<400>181
Met Lys Ile Gln Cys Asn Ala Cys Gly Ala Ala Glu Ala Arg Val Leu
1 5 10 15
Cys Cys Ala Asp Glu Ala Ala Leu Cys Thr Ala Cys Asp Glu Glu Val
20 25 30
His Ala Ala Asn Lys Leu Ala Gly Lys His Gln Arg Val Pro Leu Leu
35 40 45
Ser Asp Asp Gly Gly Ala Ala Pro Ala Ala Ala Ala Pro Ala Val Pro
50 55 60
Lys Cys Asp Ile Cys Gln Glu Ala Ser Gly Tyr Phe Phe Cys Leu Glu
65 70 75 80
Asp Arg Ala Leu Leu Cys Arg Asp Cys Asp Val Ser Ile His Thr Val
85 90 95
Asn Ser Phe Val Ser Val His Gln Arg Phe Leu Leu Thr Gly Val Gln
100 105 110
Val Gly Leu Asp Pro Ala Asp Pro Val Pro Pro Val Ala Asp Lys His
115 120 125
Val Lys Ser Ala Gly Gly Ser Val Asp Ser Ala Thr Lys His Leu Gln
130 135 140
Arg Asn Pro Thr Asp Leu Ser Gly Glu Asn Ser Ala Ser Leu Pro Ser
145 150 155 160
Gln Asn Val Ile Asn Gly Asn Tyr Ser Arg Gln Ser Ser Val Thr Met
165 170 175
Ala Lys Thr Gly Gln Val Asn Trp Thr Met Ser Asn Asn Thr Ile Arg
180 185 190
Ser Ile Asp Pro Pro Pro Lys Tyr Ser Ser Glu Glu Ser Pro Ala Leu
195 200 205
Leu Leu Ala Ser His Thr Ser Thr Met Ala Ala Tyr Ser Ser Gln Ile
210 215 220
Ser Lys Asp Ser Asp Arg Ile Tyr Asn Leu Pro Phe Thr Gly Gly Asn
225 230 235 240
Gly Ser Asp Ser Leu His Asp Trp His Val Asp Glu Phe Phe Ser Asn
245 250 255
Ser Glu Phe Gly Phe Ala Glu His Gly Ser Ser Lys Gly Asp Asn Ala
260 265 270
Lys Pro Gly Ser Ala Gly Gly Ser Pro Gln Cys Arg Leu Ala Glu Gly
275 280 285
Leu Phe Val Glu Gly Leu Leu Gly Gln Val Pro Asp Asn Pro Trp Thr
290 295 300
Val Pro Glu Val Pro Ser Pro Pro Thr Ala Ser Gly Leu Tyr Trp Gln
305 310 315 320
Asn Asn Leu Leu Cys Pro Ser Tyr Asp Ser Thr Met Phe Val Pro Glu
325 330 335
Ile Ser Ser Leu Glu Asn Ser GlnAsn Asn Phe Thr Val Ser Ala Gly
340 345 350
Leu Lys Arg Arg Arg Arg Gln Phe
355 360
<210>182
<211>927
<212>DNA
<213>稻
<400>182
atgcgggtgc agtgcgacgt ctgcgccgcc gagccggccg cggtgctctg ctgcgccgac 60
gaggccgcgc tctgctccgc ctgcgaccgc cgcgtccacc gcgccaaccg cctcgccagc 120
aagcaccgcc gcctcccgct cgtccacccg tcctcctcct cctccggcga cggtggcgcc 180
gccgccgcgc cgctgtgcga cgtgtgcagg gagaagaggg gcctcgtgtt ctgcgtcgag 240
gaccgcgcca tcctgtgcgc cgactgcgac gagcccatcc actccgccaa cgacctcacc 300
gccaagcaca cccgcttcct cctcgtcggc gccaagctct cccccgccgc gctcgccgaa 360
cagccgctcc cgtcctccga ctgcagctcc gacgacgacg ccgccgccgc cgccaccgag 420
gaggagtacc actcctccgc cgcatccacc ggcgccgcag tgagcgcgcc tcttgacgcc 480
tccagcaacg gcgccggtgg cggaggagga gtaggaggga gcagcatctc cgactacctc 540
accaccatct gccccggctg gcgcgtcgag gacctcctcc ccgacgacga cgccttcgcc 600
gccgccgccg cgcaggcggg gaaagagaag gacgagcgcg tgccgttcct cgacgccgac 660
ctgttcgacg tggtcgccgg ccggccggag aagaagggcg gcgcgtgggc gccgcacgtg 720
ccgcacctgc cggcgtggtg cctcgacgag gtgccggtcg tcgtcgccgc gtcggcggcg 780
ccagcggcga cacctgtaaa ggcgaagcag ggacacgtgc gggacagcca ctggagcgac 840
agcgacgcgt tcgccgtgcc ggagttctcg ccgccgccgc cgccggccaa gagggcgcgg 900
cccagctcgc agttctggtg cttctga 927
<210>183
<211>308
<212>PRT
<213>稻
<400>183
Met Arg Val Gln Cys Asp Val Cys Ala Ala Glu Pro Ala Ala Val Leu
1 5 10 15
Cys Cys Ala Asp Glu Ala Ala Leu Cys Ser Ala Cys Asp Arg Arg Val
20 25 30
His Arg Ala Asn Arg Leu Ala Ser Lys His Arg Arg Leu Pro Leu Val
35 40 45
His Pro Ser Ser Ser Ser Ser Gly Asp Gly Gly Ala Ala Ala Ala Pro
50 55 60
Leu Cys Asp Val Cys Arg Glu Lys Arg Gly Leu Val Phe Cys Val Glu
65 70 75 80
Asp Arg Ala Ile Leu Cys Ala Asp Cys Asp Glu Pro Ile His Ser Ala
85 90 95
Asn Asp Leu Thr Ala Lys His Thr Arg Phe Leu Leu Val Gly Ala Lys
100 105 110
Leu Ser Pro Ala Ala Leu Ala Glu Gln Pro Leu Pro Ser Ser Asp Cys
115 120 125
Ser Ser Asp Asp Asp Ala Ala Ala Ala Ala Thr Glu Glu Glu Tyr His
130 135 140
Ser Ser Ala Ala Ser Thr Gly Ala Ala Val Ser Ala Pro Leu Asp Ala
145 150 155 160
Ser Ser Asn Gly Ala Gly Gly Gly Gly Gly Val Gly Gly Ser Ser Ile
165 170 175
Ser Asp Tyr Leu Thr Thr Ile Cys Pro Gly Trp Arg Val Glu Asp Leu
180 185 190
Leu Pro Asp Asp Asp Ala Phe Ala Ala Ala Ala Ala Gln Ala Gly Lys
195 200 205
Glu Lys Asp Glu Arg Val Pro Phe Leu Asp Ala Asp Leu Phe Asp Val
210 215 220
Val Ala Gly Arg Pro Glu Lys Lys Gly Gly Ala Trp Ala Pro His Val
225 230 235 240
Pro His Leu Pro Ala Trp Cys Leu Asp Glu Val Pro Val Val Val Ala
245 250 255
Ala Ser Ala Ala Pro Ala Ala Thr Pro Val Lys Ala Lys Gln Gly His
260 265 270
Val Arg Asp Ser His Trp Ser Asp Ser Asp Ala Phe Ala Val Pro Glu
275 280 285
Phe Ser Pro Pro Pro Pro Pro Ala Lys Arg Ala Arg Pro Ser Ser Gln
290 295 300
Phe Trp Cys Phe
305
<210>184
<211>636
<212>DNA
<213>稻
<400>184
atgcggacga tctgcgacgt gtgcgagagc gcgccggcgg tgctcttctg cgtggccgac 60
gaggccgcgc tctgccggtc ctgcgacgag aaggtgcata tgtgtaacaa gcttgctagg 120
cggcacgtga gagttgggct tgcagaccct aataaagttc aacgctgtga tatatgtgaa 180
aatgcccccg ccttcttcta ttgcgagata gatggtacat cactttgcct tagttgtgat 240
atgactgttc atgttggtgg gaaacgaacc catggaagat acctgctcct aaggcaacgg 300
gttgaatttc caggagataa accaggtcat atggatgatg ttgctatgca acagaaagat 360
cctgaaaacc ggacggatca aaagaaggcc cctcactcag taacaaagga gcaaatggca 420
aaccatcata atgtgtctga tgatccagcc tcagatggca actgcgatga ccagggtaac 480
atcgattcca aaatgattga tcttaatatg agacccgtcc gtactcatgg acaaggttca 540
aactcacaga ctcagggcgt ggatgttagc gtcaacaatc atgattctcc aggagtggtg 600
ccaacatgta atttcgaacg agaagccaac aaataa 636
<210>185
<211>211
<212>PRT
<213>稻
<400>185
Met Arg Thr Ile Cys Asp Val Cys Glu Ser Ala Pro Ala Val Leu Phe
1 5 10 15
Cys Val Ala Asp Glu Ala Ala Leu Cys Arg Ser Cys Asp Glu Lys Val
20 25 30
His Met Cys Asn Lys Leu Ala Arg Arg His Val Arg Val Gly Leu Ala
35 40 45
Asp Pro Asn Lys Val Gln Arg Cys Asp Ile Cys Glu Asn Ala Pro Ala
50 55 60
Phe Phe Tyr Cys Glu Ile Asp Gly Thr Ser Leu Cys Leu Ser Cys Asp
65 70 75 80
Met Thr Val His Val Gly Gly Lys Arg Thr His Gly Arg Tyr Leu Leu
85 90 95
Leu Arg Gln Arg Val Glu Phe Pro Gly Asp Lys Pro Gly His Met Asp
100 105 110
Asp Val Ala Met Gln Gln Lys Asp Pro Glu Asn Arg Thr Asp Gln Lys
115 120 125
Lys Ala Pro His Ser Val Thr Lys Glu Gln Met Ala Asn His His Asn
130 135 140
Val Ser Asp Asp Pro Ala Ser Asp Gly Asn Cys Asp Asp Gln Gly Asn
145 150 155 160
Ile Asp Ser Lys Met Ile Asp Leu Asn Met Arg Pro Val Arg Thr His
165 170 175
Gly Gln Gly Ser Asn Ser Gln Thr Gln Gly Val Asp Val Ser Val Asn
180 185 190
Asn His Asp Ser Pro Gly Val Val Pro Thr Cys Asn Phe Glu Arg Glu
195 200 205
Ala Asn Lys
210
<210>186
<211>633
<212>DNA
<213>稻
<400>186
atgaagatcg ggtgcgacgc gtgcgagcag gcggaggcgg cggtgctgtg ctgcgccgac 60
gaggccgcgc tctgccgccg ctgcgacgcc gccgtccact ccgccaacag gctcgccggc 120
aagcacaccc gcgtcgcgct cctcctcccc tcctcctcct ccgccgccgc cggcgacgac 180
gaccaccacc ccacctgcga catctgccag gagaagacgg gctacttctt ctgcctcgag 240
gaccgcgccc tgctctgccg gagctgcgac gtcgccgtcc acaccgccac tgcgcacgcc 300
gccgcccacc gccgcttcct catcaccggc gtccgcatcg gcggcagcgt cgacgccgcc 360
gccgcggccg acgtcatcgt cagcccaaca agcagcagca tcgcgccggc cggctcggcc 420
agcagcaacc acgccggcgc cgccggcaac aacaatggcc ggtcgccggc gccggtgagg 480
ttctcagggg gagacggcgg cgttgagccg gagcagcagt ggccgtggag tgacgtcttc 540
gccgccgacg acgacgatga cgtcagcgcc gccatggagc agtgctacta tcatggcatc 600
tctgaacctc actcctccag cctcactgga tga 633
<210>187
<211>210
<212>PRT
<213>稻
<400>187
Met Lys Ile Gly Cys Asp Ala Cys Glu Gln Ala Glu Ala Ala Val Leu
1 5 10 15
Cys Cys Ala Asp Glu Ala Ala Leu Cys Arg Arg Cys Asp Ala Ala Val
20 25 30
His Ser Ala Asn Arg Leu Ala Gly Lys His Thr Arg Val Ala Leu Leu
35 40 45
Leu Pro Ser Ser Ser Ser Ala Ala Ala Gly Asp Asp Asp His His Pro
50 55 60
Thr Cys Asp Ile Cys Gln Glu Lys Thr Gly Tyr Phe Phe Cys Leu Glu
65 70 75 80
Asp Arg Ala Leu Leu Cys Arg Ser Cys Asp Val Ala Val His Thr Ala
85 90 95
Thr Ala His Ala Ala Ala His Arg Arg Phe Leu Ile Thr Gly Val Arg
100 105 110
Ile Gly Gly Ser Val Asp Ala Ala Ala Ala Ala Asp Val Ile Val Ser
115 120 125
Pro Thr Ser Ser Ser Ile Ala Pro Ala Gly Ser Ala Ser Ser Asn His
130 135 140
Ala Gly Ala Ala Gly Asn Asn Asn Gly Arg Ser Pro Ala Pro Val Arg
145 150 155 160
Phe Ser Gly Gly Asp Gly Gly Val Glu Pro Glu Gln Gln Trp Pro Trp
165 170 175
Ser Asp Val Phe Ala Ala Asp Asp Asp Asp Asp Val Ser Ala Ala Met
180 185 190
Glu Gln Cys Tyr Tyr His Gly Ile Ser Glu Pro His Ser Ser Ser Leu
195 200 205
Thr Gly
210
<210>188
<211>597
<212>DNA
<213>甘蔗
<400>188
atgaagatcc agtgcgacgc ttgcgagggc gcggctgcca cggtggtgtg ctgcgccgac 60
gaggccgcgc tgtgcgcgcg ctgcgacgtc gagatccacg ccgccaacaa gctcgccagc 120
aagcaccagc gcctcccgct cgaggcgctc tcggccaagc tcccgcgctg cgacgtctgc 180
caggagaaag cggcgttcat cttctgcgtg gaggaccggg cgctcttctg ccgggactgc 240
gacgagccca tccacgtccc gggcacgctc tccgggaacc accagcgcta cctcgccacc 300
ggcatccgcg tcggcttcgc ctccgcctcc gcctgcagcg acggcgcctg cgacgcccac 360
gactccgacc accacgcccc gcccaaggcc accatcgagc caccgcaggc caccgtctcc 420
gccgcggcgc agcaggtgcc ctcgccgccg cagttcctgc cgcagggctg ggccgtcgac 480
gagctcctgc agttctccga ctacgagtcc agcgacaagc tgcacaagga gtccccgctc 540
gggttcggag ctggagtggt tcgccgacat cgacctcttc cacgagcagg cgcctaa 597
<210>189
<211>198
<212>PRT
<213>甘蔗
<400>189
Met Lys Ile Gln Cys Asp Ala Cys Glu Gly Ala Ala Ala Thr Val Val
1 5 10 15
Cys Cys Ala Asp Glu Ala Ala Leu Cys Ala Arg Cys Asp Val Glu Ile
20 25 30
His Ala Ala Asn Lys Leu Ala Ser Lys His Gln Arg Leu Pro Leu Glu
35 40 45
Ala Leu Ser Ala Lys Leu Pro Arg Cys Asp Val Cys Gln Glu Lys Ala
50 55 60
Ala Phe Ile Phe Cys Val Glu Asp Arg Ala Leu Phe Cys Arg Asp Cys
65 70 75 80
Asp Glu Pro Ile His Val Pro Gly Thr Leu Ser Gly Asn Hi s Gln Arg
85 90 95
Tyr Leu Ala Thr Gly Ile Arg Val Gly Phe Ala Ser Ala Ser Ala Cys
100 105 110
Ser Asp Gly Ala Cys Asp Ala His Asp Ser Asp His His Ala Pro Pro
115 120 125
Lys Ala Thr Ile Glu Pro Pro Gln Ala Thr Val Ser Ala Ala Ala Gln
130 135 140
Gln Val Pro Ser Pro Pro Gln Phe Leu Pro Gln Gly Trp Ala Val Asp
145 150 155 160
Glu Leu Leu Gln Phe Ser Asp Tyr Glu Ser Ser Asp Lys Leu His Lys
165 170 175
Glu Ser Pro Leu Gly Phe Gly Ala Gly Val Val Arg Arg His Arg Pro
180 185 190
Leu Pro Arg Ala Gly Ala
195
<210>190
<211>534
<212>DNA
<213>拟南芥
<400>190
atgaagatac agtgtgatgt gtgtgagaaa gctccggcga cggtgatttg ttgcgccgac 60
gaagctgctc tctgtcctca atgcgacatc gagattcacg ccgctaacaa actcgctagc 120
aagcaccaac gtcttcatct taattccctc tccaccaaat tccctcgttg cgatatctgc 180
caagagaagg cagctttcat tttctgtgta gaggatagag ctctgctttg cagggactgc 240
gatgaatcca tccacgtggc taattctcga tctgctaatc accagaggtt cttagccact 300
gggatcaaag tagctctgac ctcaactata tgtagtaaag aaattgagaa gaatcaacct 360
gagccttcca acaaccaaca gaaggctaat cagattcctg ctaaatccac aagccagcag 420
caacaacaac cttcttctgc tactccactt ccctgggctg ttgacgattt ctttcacttc 480
tctgatattg aatccaccga caaggtagtg atgagaattg agattcaatg ttag 534
<210>191
<211>177
<212>PRT
<213>拟南芥
<400>191
Met Lys Ile Gln Cys Asp Val Cys Glu Lys Ala Pro Ala Thr Val Ile
1 5 10 15
Cys Cys Ala Asp Glu Ala Ala Leu Cys Pro Gln Cys Asp Ile Glu Ile
20 25 30
His Ala Ala Asn Lys Leu Ala Ser Lys His Gln Arg Leu His Leu Asn
35 40 45
Ser Leu Ser Thr Lys Phe Pro Arg Cys Asp Ile Cys Gln Glu Lys Ala
50 55 60
Ala Phe Ile Phe Cys Val Glu Asp Arg Ala Leu Leu Cys Arg Asp Cys
65 70 75 80
Asp Glu Ser Ile His Val Ala Asn Ser Arg Ser Ala Asn His Gln Arg
85 90 95
Phe Leu Ala Thr Gly Ile Lys Val Ala Leu Thr Ser Thr Ile Cys Ser
100 105 110
Lys Glu Ile Glu Lys Asn Gln Pro Glu Pro Ser Asn Asn Gln Gln Lys
115 120 125
Ala Asn Gln Ile Pro Ala Lys Ser Thr Ser Gln Gln Gln Gln Gln Pro
130 135 140
Ser Ser Ala Thr Pro Leu Pro Trp Ala Val Asp Asp Phe Phe His Phe
145 150 155 160
Ser Asp Ile Glu Ser Thr Asp Lys Val Val Met Arg Ile Glu Ile Gln
165 170 175
Cys
<210>192
<211>747
<212>DNA
<213>拟南芥
<400>192
atgaagatac agtgtgatgt gtgtgagaaa gctccggcga cggtgatttg ttgcgccgac 60
gaagctgctc tctgtcctca atgcgacatc gagattcacg ccgctaacaa actcgctagc 120
aagcaccaac gtcttcatct taattccctc tccaccaaat tccctcgttg cgatatctgc 180
caagagaagg cagctttcat tttctgtgta gaggatagag ctctgctttg cagggactgc 240
gatgaatcca tccacgtggc taattctcga tctgctaatc accagaggtt cttagccact 300
gggatcaaag tagctctgac ctcaactata tgtagtaaag aaattgagaa gaatcaacct 360
gagccttcca acaaccaaca gaaggctaat cagattcctg ctaaatccac aagccagcag 420
caacaacaac cttcttctgc tactccactt ccctgggctg ttgacgattt ctttcacttc 480
tctgatattg aatccaccga caagaaagga cagcttgatc ttggggcagg ggagttggat 540
tggttttcag acatgggatt cttcggtgat cagattaatg acaaggctct tcctgcagct 600
gaagttcctg agctttctgt ttcgcattta ggtcatgttc attcatacaa acctatgaag 660
tcaaatgttt cacacaagaa gccgaggttt gagaccagat atgatgatga tgatgaggaa 720
cacttcattg tccctgatct tggctaa 747
<210>193
<211>248
<212>PRT
<213>拟南芥
<400>193
Met Lys Ile Gln Cys Asp Val Cys Glu Lys Ala Pro Ala Thr Val Ile
1 5 10 15
Cys Cys Ala Asp Glu Ala Ala Leu Cys Pro Gln Cys Asp Ile Glu Ile
20 25 30
His Ala Ala Asn Lys Leu Ala Ser Lys His Gln Arg Leu His Leu Asn
35 40 45
Ser Leu Ser Thr Lys Phe Pro Arg Cys Asp Ile Cys Gln Glu Lys Ala
50 55 60
Ala Phe Ile Phe Cys Val Glu Asp Arg Ala Leu Leu Cys Arg Asp Cys
65 70 75 80
Asp Glu Ser Ile His Val Ala Asn Ser Arg Ser Ala Asn His Gln Arg
85 90 95
Phe Leu Ala Thr Gly Ile Lys Val Ala Leu Thr Ser Thr Ile Cys Ser
100 105 110
Lys Glu Ile Glu Lys Asn Gln Pro Glu Pro Ser Asn Asn Gln Gln Lys
115 120 125
Ala Asn Gln Ile Pro Ala Lys Ser Thr Ser Gln Gln Gln Gln Gln Pro
130 135 140
Ser Ser Ala Thr Pro Leu Pro Trp Ala Val Asp Asp Phe Phe His Phe
145 150 155 160
Ser Asp Ile Glu Ser Thr Asp Lys Lys Gly Gln Leu Asp Leu Gly Ala
165 170 175
Gly Glu Leu Asp Trp Phe Ser Asp Met Gly Phe Phe Gly Asp Gln Ile
180 185 190
Asn Asp Lys Ala Leu Pro Ala Ala Glu Val Pro Glu Leu Ser Val Ser
195 200 205
His Leu Gly His Val His Ser Tyr Lys Pro Met Lys Ser Asn Val Ser
210 215 220
His Lys Lys Pro Arg Phe Glu Thr Arg Tyr Asp Asp Asp Asp Glu Glu
225 230 235 240
His Phe Ile Val Pro Asp Leu Gly
245
<210>194
<211>996
<212>DNA
<213>拟南芥
<400>194
atgaagatca ggtgcgacgt ctgcgataaa gaagaagcgt cggtgttttg cacggccgac 60
gaagcatctc tctgcggcgg ctgcgaccac caagtccacc acgctaacaa actcgcctct 120
aaacatctcc gtttctctct cctttatcct tcttcttcca acacctcctc tcctctctgc 180
gacatctgtc aggataaaaa agctctgttg ttctgtcaac aagatagagc tattttatgc 240
aaagattgcg attcatcgat ccacgctgcg aacgaacaca caaagaaaca cgataggttt 300
cttcttacag gggttaagct ctctgcaaca tcgtctgttt acaaacctac ttcgaaatct 360
tcttcttctt cttcaagcaa ccaagatttc tctgtccctg gatcatcaat ctctaatcct 420
cctcctctca agaaacctct ctcagctcct cctcagagca acaagatcca acccttttcg 480
aagatcaacg gcggtgatgc gtcggtgaat cagtggggat ccacaagcac gatttctgag 540
tatttgatgg atacgttacc tggttggcac gttgaggatt tcctcgattc ctctcttcct 600
acttatggtt tctctaagag tggtgatgat gatggagtgt taccatatat ggaaccagaa 660
gatgacaaca acactaagag aaacaacaac aacaacaaca acaacaacaa caatacagtg 720
tcacttccat ctaagaattt agggatttgg gtccctcaga ttccacaaac tcttccttct 780
tcatacccaa atcaatactt ttctcaagac aacaacatac agtttgggat gtacaacaaa 840
gaaacatcac cagaagtagt gtcttttgct ccaatacaaa acatgaaaca acaaggacag 900
aacaacaaga gatggtatga tgatggtggc ttcactgtcc cacagatcac tcctcctcct 960
ctttcttcta ataaaaagtt tagatctttc tggtaa 996
<210>195
<211>331
<212>PRT
<213>拟南芥
<400>195
Met Lys Ile Arg Cys Asp Val Cys Asp Lys Glu Glu Ala Ser Val Phe
1 5 10 15
Cys Thr Ala Asp Glu Ala Ser Leu Cys Gly Gly Cys Asp His Gln Val
20 25 30
His His Ala Asn Lys Leu Ala Ser Lys His Leu Arg Phe Ser Leu Leu
35 40 45
Tyr Pro Ser Ser Ser Asn Thr Ser Ser Pro Leu Cys Asp Ile Cys Gln
50 55 60
Asp Lys Lys Ala Leu Leu Phe Cys Gln Gln Asp Arg Ala Ile Leu Cys
65 70 75 80
Lys Asp Cys Asp Ser Ser Ile His Ala Ala Asn Glu His Thr Lys Lys
85 90 95
His Asp Arg Phe Leu Leu Thr Gly Val Lys Leu Ser Ala Thr Ser Ser
100 105 110
Val Tyr Lys Pro Thr Ser Lys Ser Ser Ser Ser Ser Ser Ser Asn Gln
115 120 125
Asp Phe Ser Val Pro Gly Ser Ser Ile Ser Asn Pro Pro Pro Leu Lys
130 135 140
Lys Pro Leu Ser Ala Pro Pro Gln Ser Asn Lys Ile Gln Pro Phe Ser
145 150 155 160
Lys Ile Asn Gly Gly Asp Ala Ser Val Asn Gln Trp Gly Ser Thr Ser
165 170 175
Thr Ile Ser Glu Tyr Leu Met Asp Thr Leu Pro Gly Trp His Val Glu
180 185 190
Asp Phe Leu Asp Ser Ser Leu Pro Thr Tyr Gly Phe Ser Lys Ser Gly
195 200 205
Asp Asp Asp Gly Val Leu Pro Tyr Met Glu Pro Glu Asp Asp Asn Asn
210 215 220
Thr Lys Arg Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Thr Val
225 230 235 240
Ser Leu Pro Ser Lys Asn Leu Gly Ile Trp Val Pro Gln Ile Pro Gln
245 250 255
Thr Leu Pro Ser Ser Tyr Pro Asn Gln Tyr Phe Ser Gln Asp Asn Asn
260 265 270
Ile Gln Phe Gly Met Tyr Asn Lys Glu Thr Ser Pro Glu Val Val Ser
275 280 285
Phe Ala Pro Ile Gln Asn Met Lys Gln Gln Gly Gln Asn Asn Lys Arg
290 295 300
Trp Tyr Asp Asp Gly Gly Phe Thr Val Pro Gln Ile Thr Pro Pro Pro
305 310 315 320
Leu Ser Ser Asn Lys Lys Phe Arg Ser Phe Trp
325 330
<210>196
<211>900
<212>DNA
<213>拟南芥
<400>196
atgaagattc agtgtaacgt ttgtgaggcg gcggaagcga cggttctatg ttgcgccgac 60
gaggctgctc tttgttgggc ttgcgatgag aaaattcacg ccgctaataa actcgccgga 120
aaacatcaga gagtccctct ctctgcctct gcctcttcca tacccaaatg tgacatttgt 180
caggaagcat ctggattctt cttttgtctg caagatagag ctttgctatg taggaaatgt 240
gatgttgcaa tccacactgt gaatcctcat gtttcagctc accagagatt tcttctcact 300
ggaatcaaag ttggtcttga atctatagac actggtcctt ctactaaatc ctcacctacc 360
aatgatgata aaaccatgga gaccaaacct tttgttcaat ctatacctga gcctcaaaag 420
atggccttcg atcatcatca tcaccagcag cagcaggaac agcaggaagg agttataccg 480
ggaactaaag tcaatgatca gacatcgaca aagcttcctc tcgtaagtag cggatcaact 540
actggaagca ttcctcagtg gcaaatagag gagattttcg ggctaaccga ctttgatcag 600
agctatgaat acatggagaa taatggatca tctaaggcgg atactagtag acgaggagat 660
tcagacagtt cttcgatgat gagatctgca gaagaagatg gagaagataa caataactgc 720
ttgggaggtg agacatcatg ggcggttcca cagattcagt ctccacctac agcgtctggt 780
ctaaactggc ctaagcattt tcaccaccac tctgtgtttg ttccggacat aacttcttca 840
actccttata ccggttcatc cccgaatcaa agggttggga aacggcggcg acggttctag 900
<210>197
<211>299
<212>PRT
<213>拟南芥
<400>197
Met Lys Ile Gln Cys Asn Val Cys Glu Ala Ala Glu Ala Thr Val Leu
1 5 10 15
Cys Cys Ala Asp Glu Ala Ala Leu Cys Trp Ala Cys Asp Glu Lys Ile
20 25 30
His Ala Ala Asn Lys Leu Ala Gly Lys His Gln Arg Val Pro Leu Ser
35 40 45
Ala Ser Ala Ser Ser Ile Pro Lys Cys Asp Ile Cys Gln Glu Ala Ser
50 55 60
Gly Phe Phe Phe Cys Leu Gln Asp Arg Ala Leu Leu Cys Arg Lys Cys
65 70 75 80
Asp Val Ala Ile His Thr Val Asn Pro His Val Ser Ala His Gln Arg
85 90 95
Phe Leu Leu Thr Gly Ile Lys Val Gly Leu Glu Ser Ile Asp Thr Gly
100 105 110
Pro Ser Thr Lys Ser Ser Pro Thr Asn Asp Asp Lys Thr Met Glu Thr
115 120 125
Lys Pro Phe Val Gln Ser Ile Pro Glu Pro Gln Lys Met Ala Phe Asp
130 135 140
His His His His Gln Gln Gln Gln Glu Gln Gln Glu Gly Val Ile Pro
145 150 155 160
Gly Thr Lys Val Asn Asp Gln Thr Ser Thr Lys Leu Pro Leu Val Ser
165 170 175
Ser Gly Ser Thr Thr Gly Ser Ile Pro Gln Trp Gln Ile Glu Glu Ile
180 185 190
Phe Gly Leu Thr Asp Phe Asp Gln Ser Tyr Glu Tyr Met Glu Asn Asn
195 200 205
Gly Ser Ser Lys Ala Asp Thr Ser Arg Arg Gly Asp Ser Asp Ser Ser
210 215 220
Ser Met Met Arg Ser Ala Glu Glu Asp Gly Glu Asp Asn Asn Asn Cys
225 230 235 240
Leu Gly Gly Glu Thr Ser Trp Ala Val Pro Gln Ile Gln Ser Pro Pro
245 250 255
Thr Ala Ser Gly Leu Asn Trp Pro Lys His Phe His His His Ser Val
260 265 270
Phe Val Pro Asp Ile Thr Ser Ser Thr Pro Tyr Thr Gly Ser Ser Pro
275 280 285
Asn Gln Arg Val Gly Lys Arg Arg Arg Arg Phe
290 295
<210>198
<211>717
<212>DNA
<213>拟南芥
<400>198
atgaagatac aatgtgatgt gtgtgagaaa gctccggcca cgcttatatg ttgtgctgat 60
gaagctgctc tctgcgctaa atgtgacgtt gaggttcatg ctgctaataa actcgctagc 120
aaacaccaac gcctttttct tgactctctc tcaactaaat tccctccctg cgacatctgc 180
cttgagaagg cagctttcat attctgtgta gaggataggg ctctgctctg cagagattgc 240
gatgaggcga cccatgcgcc aaatactcgc tctgctaatc accagaggtt cttagccact 300
ggaatccgag ttgctcttag ttccactagt tgcaatcaag aagtggaaaa gaatcacttt 360
gacccatcta atcagcagag tctctctaaa ccgccaactc agcaacccgc tgctccatct 420
cctttgtggg ctaccgatga attcttcagc tactctgatc ttgactgcag taataaggag 480
aaagagcaac tcgatctcgg ggagctggat tggcttgcag agatgggtct gtttggtgac 540
cagcctgatc aagaggctct accggtagcc gaagttcccg agctttcctt ttcacatttg 600
gctcatgctc attcctacaa cagacctatg aagtccaatg tacccaacaa gaagcagagg 660
cttgagtacc ggtatgatga tgaagaagag cacttcctag tccccgacct aggctaa 717
<210>199
<211>238
<212>PRT
<213>拟南芥
<400>199
Met Lys Ile Gln Cys Asp Val Cys Glu Lys Ala Pro Ala Thr Leu Ile
1 5 10 15
Cys Cys Ala Asp Glu Ala Ala Leu Cys Ala Lys Cys Asp Val Glu Val
20 25 30
His Ala Ala Asn Lys Leu Ala Ser Lys His Gln Arg Leu Phe Leu Asp
35 40 45
Ser Leu Ser Thr Lys Phe Pro Pro Cys Asp Ile Cys Leu Glu Lys Ala
50 55 60
Ala Phe Ile Phe Cys Val Glu Asp Arg Ala Leu Leu Cys Arg Asp Cys
65 70 75 80
Asp Glu Ala Thr His Ala Pro Asn Thr Arg Ser Ala Asn His Gln Arg
85 90 95
Phe Leu Ala Thr Gly Ile Arg Val Ala Leu Ser Ser Thr Ser Cys Asn
100 105 110
Gln Glu Val Glu Lys Asn His Phe Asp Pro Ser Asn Gln Gln Ser Leu
115 120 125
Ser Lys Pro Pro Thr Gln Gln Pro Ala Ala Pro Ser Pro Leu Trp Ala
130 135 140
Thr Asp Glu Phe Phe Ser Tyr Ser Asp Leu Asp Cys Ser Asn Lys Glu
145 150 155 160
Lys Glu Gln Leu Asp Leu Gly Glu Leu Asp Trp Leu Ala Glu Met Gly
165 170 175
Leu Phe Gly Asp Gln Pro Asp Gln Glu Ala Leu Pro Val Ala Glu Val
180 185 190
Pro Glu Leu Ser Phe Ser His Leu Ala His Ala His Ser Tyr Asn Arg
195 200 205
Pro Met Lys Ser Asn Val Pro Asn Lys Lys Gln Arg Leu Glu Tyr Arg
210 215 220
Tyr Asp Asp Glu Glu Glu His Phe Leu Val Pro Asp Leu Gly
225 230 235
<210>200
<211>489
<212>DNA
<213>拟南芥
<400>200
atgaagatac aatgtgaagt gtgtgaaaag gctgaagcag aagtactttg ttgttcagat 60
gaagctgtac tatgcaagcc atgtgacatt aaggttcatg aagctaataa acttttccaa 120
agacatcacc gagtcgcctt acaaaaagat gcagcctcag ccaccacagc ttctggagct 180
cctctatgtg atatctgcca ggagagaaaa gggtacttct tctgcttaga ggatagagca 240
atgctgtgca atgattgtga tgaagccatt cacacttgca attctcacca aagattctta 300
ctttctggag tacaagtttc tgatcagtct ttgactgaaa actccgaatg cagcactagt 360
tttagctctg aaacttacca gattcagtca aaagtgtctc tgaatagtca gtactctagt 420
gaggaaactg aagctggaaa ctcaggtgag atagtacaca agaatccttc tgtaatctta 480
agtccttag 489
<210>201
<211>162
<212>PRT
<213>拟南芥
<400>201
Met Lys Ile Gln Cys Glu Val Cys Glu Lys Ala Glu Ala Glu Val Leu
1 5 10 15
Cys Cys Ser Asp Glu Ala Val Leu Cys Lys Pro Cys Asp Ile Lys Val
20 25 30
His Glu Ala Asn Lys Leu Phe Gln Arg His His Arg Val Ala Leu Gln
35 40 45
Lys Asp Ala Ala Ser Ala Thr Thr Ala Ser Gly Ala Pro Leu Cys Asp
50 55 60
Ile Cys Gln Glu Arg Lys Gly Tyr Phe Phe Cys Leu Glu Asp Arg Ala
65 70 75 80
Met Leu Cys Asn Asp Cys Asp Glu Ala Ile His Thr Cys Asn Ser His
85 90 95
Gln Arg Phe Leu Leu Ser Gly Val Gln Val Ser Asp Gln Ser Leu Thr
100 105 110
Glu Asn Ser Glu Cys Ser Thr Ser Phe Ser Ser Glu Thr Tyr Gln Ile
115 120 125
Gln Ser Lys Val Ser Leu Asn Ser Gln Tyr Ser Ser Glu Glu Thr Glu
130 135 140
Ala Gly Asn Ser Gly Glu Ile Val His Lys Asn Pro Ser Val Ile Leu
145 150 155 160
Ser Pro
<210>202
<211>729
<212>DNA
<213>拟南芥
<400>202
atgaagattt ggtgtgctgt ttgtgataaa gaagaagctt cggtgttttg ttgtgcggat 60
gaagcagctc tttgtaatgg ttgcgatcgc catgttcatt tcgccaataa actagccggg 120
aaacatctcc ggttctctct cacttctcct actttcaaag atgctcctct ttgtgatatt 180
tgcggggaga ggcgtgcatt attattttgc caagaagaca gagcaatact atgcagagaa 240
tgtgacattc caatacatca agctaatgag cacactaaga aacacaatag attcctcctt 300
accggcgtta agatctctgc ctccccgtca gcctacccaa gagcctccaa ttccaactct 360
gctgctgcat ttggtcgagc caaaacccga ccaaaatcag tatcgagcga ggtcccgagc 420
tcggcctcca atgaggtatt tacgagctct tcttcgacga ccacgagcaa ttgctattat 480
gggatagaag aaaactacca tcacgtgagc gattcggggt cgggatcggg ttgtacaggt 540
agtatatccg agtatttgat ggagacatta ccgggttgga gagtggagga tttgcttgaa 600
cacccttctt gtgtctccta tgaggataac attattacta ataacaataa cagtgagtct 660
tatagggttt atgatggttc ttcacaattc catcatcaag ggttttggga tcacaaaccc 720
ttctcttga 729
<210>203
<211>242
<212>PRT
<213>拟南芥
<400>203
Met Lys Ile Trp Cys Ala Val Cys Asp Lys Glu Glu Ala Ser Val Phe
1 5 10 15
Cys Cys Ala Asp Glu Ala Ala Leu Cys Asn Gly Cys Asp Arg His Val
20 25 30
His Phe Ala Asn Lys Leu Ala Gly Lys His Leu Arg Phe Ser Leu Thr
35 40 45
Ser Pro Thr Phe Lys Asp Ala Pro Leu Cys Asp Ile Cys Gly Glu Arg
50 55 60
Arg Ala Leu Leu Phe Cys Gln Glu Asp Arg Ala Ile Leu Cys Arg Glu
65 70 75 80
Cys Asp Ile Pro Ile His Gln Ala Asn Glu His Thr Lys Lys His Asn
85 90 95
Arg Phe Leu Leu Thr Gly Val Lys Ile Ser Ala Ser Pro Ser Ala Tyr
100 105 110
Pro Arg Ala Ser Asn Ser Asn Ser Ala Ala Ala Phe Gly Arg Ala Lys
115 120 125
Thr Arg Pro Lys Ser Val Ser Ser Glu Val Pro Ser Ser Ala Ser Asn
130 135 140
Glu Val Phe Thr Ser Ser Ser Ser Thr Thr Thr Ser Asn Cys Tyr Tyr
145 150 155 160
Gly Ile Glu Glu Asn Tyr His His Val Ser Asp Ser Gly Ser Gly Ser
165 170 175
Gly Cys Thr Gly Ser Ile Ser Glu Tyr Leu Met Glu Thr Leu Pro Gly
180 185 190
Trp Arg Val Glu Asp Leu Leu Glu His Pro Ser Cys Val Ser Tyr Glu
195 200 205
Asp Asn Ile Ile Thr Asn Asn Asn Asn Ser Glu Ser Tyr Arg Val Tyr
210 215 220
Asp Gly Ser Ser Gln Phe His His Gln Gly Phe Trp Asp His Lys Pro
225 230 235 240
Phe Ser
<210>204
<211>700
<212>DNA
<213>蒺藜苜蓿
<400>204
atgaagatcc agtgtgatgc atgtcacaaa caagaggcct ccttgttttg ccctgcagat 60
gaagcagctc tctgcaatca atgtgatcgc aatatccact atgccaacaa ggtctctgct 120
aaacacaaac gcttcactct tcaccacccc acttccaaag acacccctct ctgtgatatc 180
tgcaaggaga ggcgtgcata tctattttgc aaagaagaca gagcaatact ttgcagggaa 240
tgtgacattc ctatccatga aatcaacaaa cttaccaagc aacacaacag gtttcttctc 300
acaggcgtaa agatcggtgc ttcttcttct tgttcaaatc caacaatttc caatggctca 360
gaactaagaa cctcaagtcc aagaccaagt tcattttcaa gtgaaaataa tagttgttct 420
caaagttcat tcaaagagaa catggtttgt gacacagttt caaccagtag catttccgaa 480
tacttgattg aaacgattcc tggttactgc atggaggacc tttttgatgc ttcttttgca 540
cctaataacg ttttctgtaa taaggattat tatgaacaga accaagatct tcaagttata 600
aacatgtctg actgggtacc acaatctcaa gttagattcc ctcagcttag tgctaattcg 660
aatgttccca attgattctt tagatggggt tatgaaaatg 700
<210>205
<211>224
<212>PRT
<213>蒺藜苜蓿
<400>205
Met Lys Ile Gln Cys Asp Ala Cys His Lys Gln Glu Ala Ser Leu Phe
1 5 10 15
Cys Pro Ala Asp Glu Ala Ala Leu Cys Asn Gln Cys Asp Arg Asn Ile
20 25 30
His Tyr Ala Asn Lys Val Ser Ala Lys His Lys Arg Phe Thr Leu His
35 40 45
His Pro Thr Ser Lys Asp Thr Pro Leu Cys Asp Ile Cys Lys Glu Arg
50 55 60
Arg Ala Tyr Leu Phe Cys Lys Glu Asp Arg Ala Ile Leu Cys Arg Glu
65 70 75 80
Cys Asp Ile Pro Ile His Glu Ile Asn Lys Leu Thr Lys Gln His Asn
85 90 95
Arg Phe Leu Leu Thr Gly Val Lys Ile Gly Ala Ser Ser Ser Cys Ser
100 105 110
Asn Pro Thr Ile Ser Asn Gly Ser Glu Leu Arg Thr Ser Ser Pro Arg
115 120 125
Pro Ser Ser Phe Ser Ser Glu Asn Asn Ser Cys Ser Gln Ser Ser Phe
130 135 140
Lys Glu Asn Met Val Cys Asp Thr Val Ser Thr Ser Ser Ile Ser Glu
145 150 155 160
Tyr Leu Ile Glu Thr Ile Pro Gly Tyr Cys Met Glu Asp Leu Phe Asp
165 170 175
Ala Ser Phe Ala Pro Asn Asn Val Phe Cys Asn Lys Asp Tyr Tyr Glu
180 185 190
Gln Asn Gln Asp Leu Gln Val Ile Asn Met Ser Asp Trp Val Pro Gln
195 200 205
Ser Gln Val Arg Phe Pro Gln Leu Ser Ala Asn Ser Asn Val Pro Asn
210 215 220
<210>206
<211>702
<212>DNA
<213>番茄
<400>206
atgaagatac agtgtgatgt gtgtgagaaa gctcaagcta ctgtgatttg ctgtgctgat 60
gaggctgctc tgtgtgcaaa atgtgatatt gaagttcatg ctgctaataa attagcaagc 120
aagcaccaaa ggcttcatct tcagtgccta tctaacaagc ttcctccttg tgatatttgc 180
caagataaag cagccttcat cttctgtgtt gaggatagag ctctcttttg caaggactgt 240
gacgaagcaa ttcattcagc cagcagcctc gctaagaacc accaacgctt cttagccact 300
ggaatccgtg tagccttgag ctcaagctgt aataaggaat cagtaaaaaa ccaactgcag 360
ccacaaccac ctcagcagaa ttcccaacaa gttggcttga aaatgcctcc acagcagttg 420
tcctgtataa catcaccatc ttggcctgtc gatgatttac taggatttcc agattatgag 480
tcgagtgaca agaaggatct acttgagctt ggtgaatttg agtggttagg gggcattgat 540
ctctttggtg aacaaacagc agctgaagtg cccgagctat cagtacctca gtcgagcaat 600
acaaatattt acaggacaac caaatatcaa atgccttaca agaagtccag aattgaaatc 660
ccagatgatg atgagtattt tactgtcccc gatcttggtt ga 702
<210>207
<211>233
<212>PRT
<213>番茄
<400>207
Met Lys Ile Gln Cys Asp Val Cys Glu Lys Ala Gln Ala Thr Val Ile
1 5 10 15
Cys Cys Ala Asp Glu Ala Ala Leu Cys Ala Lys Cys Asp Ile Glu Val
20 25 30
His Ala Ala Asn Lys Leu Ala Ser Lys His Gln Arg Leu His Leu Gln
35 40 45
Cys Leu Ser Asn Lys Leu Pro Pro Cys Asp Ile Cys Gln Asp Lys Ala
50 55 60
Ala Phe Ile Phe Cys Val Glu Asp Arg Ala Leu Phe Cys Lys Asp Cys
65 70 75 80
Asp Glu Ala Ile His Ser Ala Ser Ser Leu Ala Lys Asn His Gln Arg
85 90 95
Phe Leu Ala Thr Gly Ile Arg Val Ala Leu Ser Ser Ser Cys Asn Lys
100 105 110
Glu Ser Val Lys Asn Gln Leu Gln Pro Gln Pro Pro Gln Gln Asn Ser
115 120 125
Gln Gln Val Gly Leu Lys Met Pro Pro Gln Gln Leu Ser Cys Ile Thr
130 135 140
Ser Pro Ser Trp Pro Val Asp Asp Leu Leu Gly Phe Pro Asp Tyr Glu
145 150 155 160
Ser Ser Asp Lys Lys Asp Leu Leu Glu Leu Gly Glu Phe Glu Trp Leu
165 170 175
Gly Gly Ile Asp Leu Phe Gly Glu Gln Thr Ala Ala Glu Val Pro Glu
180 185 190
Leu Ser Val Pro Gln Ser Ser Asn Thr Asn Ile Tyr Arg Thr Thr Lys
195 200 205
Tyr Gln Met Pro Tyr Lys Lys Ser Arg Ile Glu Ile Pro Asp Asp Asp
210 215 220
Glu Tyr Phe Thr Val Pro Asp Leu Gly
225 230
<210>208
<211>702
<212>DNA
<213>马铃薯
<400>208
atgaagatcc agtgtgatgt gtgtgagaaa gctcaagcta ctgtgatttg ctgtgctgat 60
gaggctgctt tgtgtgcaaa atgtgatatt gaagttcatg ctgctaataa attagcaagt 120
aagcatcaaa ggcttcatct tcagtgcctg tctaacaagc ttcctccttg tgatatttgc 180
caagataaag cagccttcat cttctgtgtt gaggatagag ctctcttttg caaggactgt 240
gacgaagcaa ttcattcagc cagcagcctc gctaagaacc accaacgctt cttagccact 300
ggaatccgtg tagccttgag ctcaagctgc aataaggaag cagtaaaaaa ccaactggag 360
ccacaaccac ctcagcagaa ttcccaacaa gttggcttga aaatgcctcc acagcaattg 420
tccggtatca catcaccatc ttggcctgtt gatgatttac taggatttcc agattatgaa 480
tcgagtgaca agaaggatct acttgagctt ggtgaatttg agtggttagg aggtattgat 540
ctctttggtg aacaaacagc agctgaagta cccgagctat cagtacctca gtcaagcaac 600
acaaatattt accggacaac caaatatcaa atgccttaca agaagcccag aattgaaatc 660
ccagatgatg atgagtattt taccgtccca gatcttggtt ga 702
<210>209
<211>233
<212>PRT
<213>马铃薯
<400>209
Met Lys Ile Gln Cys Asp Val Cys Glu Lys Ala Gln Ala Thr Val Ile
1 5 10 15
Cys Cys Ala Asp Glu Ala Ala Leu Cys Ala Lys Cys Asp Ile Glu Val
20 25 30
His Ala Ala Asn Lys Leu Ala Ser Lys His Gln Arg Leu His Leu Gln
35 40 45
Cys Leu Ser Asn Lys Leu Pro Pro Cys Asp Ile Cys Gln Asp Lys Ala
50 55 60
Ala Phe Ile Phe Cys Val Glu Asp Arg Ala Leu Phe Cys Lys Asp Cys
65 70 75 80
Asp Glu Ala Ile His Ser Ala Ser Ser Leu Ala Lys Asn His Gln Arg
85 90 95
Phe Leu Ala Thr Gly Ile Arg Val Ala Leu Ser Ser Ser Cys Asn Lys
100 105 110
Glu Ala Val Lys Asn Gln Leu Glu Pro Gln Pro Pro Gln Gln Asn Ser
115 120 125
Gln Gln Val Gly Leu Lys Met Pro Pro Gln Gln Leu Ser Gly Ile Thr
130 135 140
Ser Pro Ser Trp Pro Val Asp Asp Leu Leu Gly Phe Pro Asp Tyr Glu
145 150 155 160
Ser Ser Asp Lys Lys Asp Leu Leu Glu Leu Gly Glu Phe Glu Trp Leu
165 170 175
Gly Gly Ile Asp Leu Phe Gly Glu Gln Thr Ala Ala Glu Val Pro Glu
180 185 190
Leu Ser Val Pro Gln Ser Ser Asn Thr Asn Ile Tyr Arg Thr Thr Lys
195 200 205
Tyr Gln Met Pro Tyr Lys Lys Pro Arg Ile Glu Ile Pro Asp Asp Asp
210 215 220
Glu Tyr Phe Thr Val Pro Asp Leu Gly
225 230
<210>210
<211>933
<212>DNA
<213>Populus trichocarpa
<400>210
atgaagatcc agtgcgatgt gtgtaacaaa gaagaggcat cggtgttttg caccgctgac 60
gaggcagctc tttgcgacac ctgtgaccac cgtgttcacc atgccaacaa gcttgcttca 120
aagcaccaac gtttttccct tctccatcct tcctcaaaaa acttccccat ctgtgatatc 180
tgccaggaga aacgggcttt cttgttctgt caacaagaca gggcgatttt atgtagagag 240
tgtgatggtc caatacacac agcaaacgag catacccaga agcacaacag gtttcttctc 300
acaggagtca agctctctgc tacatctgct gtttatatat cttcttcctc tgtcaccaac 360
agtggtggtg atctcgttcc tgattcaaag tctcaacagc agcagcagca gcagcaatca 420
atcaagaaac ctgtgtttga tgctccagtg aattccaatc cacctacagt tcccagtacc 480
ttatctacaa acacagaagt aaacaagggt ggggataatt tggtaacaaa tgaagggttt 540
ggttcaacaa caagtagtac tatatcagag tacttgatgg agactcttcc tggctggcat 600
gttgaagact ttcttgattc ctctactact ccctttggtt tctgtaagat tgatgatggt 660
ctattgccgt ttatggatgc tcatgatctt gagagcaaca tgagttcttt ctcatcagaa 720
agtttggggc tttgggtccc tcaagcacca tctactccat acacatctca acagtattat 780
tatccacagt tggtagggca aagtgggttc aaggagataa aagagaccac aaacatgaaa 840
gctaacagaa ggttggcaga tgatgtcttc actgttccac agatcagcct cccggccaat 900
ataagctcta agagatctag gcccttatgg tag 933
<210>211
<211>310
<212>PRT
<213>Populus trichocarpa
<400>211
Met Lys Ile Gln Cys Asp Val Cys Asn Lys Glu Glu Ala Ser Val Phe
1 5 10 15
Cys Thr Ala Asp Glu Ala Ala Leu Cys Asp Thr Cys Asp His Arg Val
20 25 30
His His Ala Asn Lys Leu Ala Ser Lys His Gln Arg Phe Ser Leu Leu
35 40 45
His Pro Ser Ser Lys Asn Phe Pro Ile Cys Asp Ile Cys Gln Glu Lys
50 55 60
Arg Ala Phe Leu Phe Cys Gln Gln Asp Arg Ala Ile Leu Cys Arg Glu
65 70 75 80
Cys Asp Gly Pro Ile His Thr Ala Asn Glu His Thr Gln Lys His Asn
85 90 95
Arg Phe Leu Leu Thr Gly Val Lys Leu Ser Ala Thr Ser Ala Val Tyr
100 105 110
Ile Ser Ser Ser Ser Val Thr Asn Ser Gly Gly Asp Leu Val Pro Asp
115 120 125
Ser Lys Ser Gln Gln Gln Gln Gln Gln Gln Gln Ser Ile Lys Lys Pro
130 135 140
Val Phe Asp Ala Pro Val Asn Ser Asn Pro Pro Thr Val Pro Ser Thr
145 150 155 160
Leu Ser Thr Asn Thr Glu Val Asn Lys Gly Gly Asp Asn Leu Val Thr
165 170 175
Asn Glu Gly Phe Gly Ser Thr Thr Ser Ser Thr Ile Ser Glu Tyr Leu
180 185 190
Met Glu Thr Leu Pro Gly Trp His Val Glu Asp Phe Leu Asp Ser Ser
195 200 205
Thr Thr Pro Phe Gly Phe Cys Lys Ile Asp Asp Gly Leu Leu Pro Phe
210 215 220
Met Asp Ala His Asp Leu Glu Ser Asn Met Ser Ser Phe Ser Ser Glu
225 230 235 240
Ser Leu Gly Leu Trp Val Pro Gln Ala Pro Ser Thr Pro Tyr Thr Ser
245 250 255
Gln Gln Tyr Tyr Tyr Pro Gln Leu Val Gly Gln Ser Gly Phe Lys Glu
260 265 270
Ile Lys Glu Thr Thr Asn Met Lys Ala Asn Arg Arg Leu Ala Asp Asp
275 280 285
Val Phe Thr Val Pro Gln Ile Ser Leu Pro Ala Asn Ile Ser Ser Lys
290 295 300
Arg Ser Arg Pro Leu Trp
305 310
<210>212
<211>618
<212>DNA
<213>葡萄
<400>212
atgaagatac cgtgtgatat atgtgggaat gtggaggctg aggttctatg tagtgctgat 60
gaggcagtac tctgttgggg atgcgatgaa agggtgcaca cagctaacaa gctgtcccag 120
aagcatcaac gtgtccctct tctcaaacac ccaccctcca cttcmtcttc tcagctgcct 180
ccttgtgata tctgccagga gaaaagcggg tattttttct gcctggagga cagggcatta 240
ctctgcaaga actgtgatgt ttcaactcat tcaacaaact cttacgtgtc gtcacaccga 300
cgttttgtca tatcaggaat caaagttgct cttcaatccg taactaacaa ctacagaact 360
ggctgcaaca gcagaaccta ccctctcgat atgccaaact caaatagttc ttcagtcaac 420
ttcccaatgg atagggagaa gaagccagaa atgaccacag aagttgcatc cacatcctca 480
gacatggtag ccatgttctc aggtgaaatc catttggcaa ctggacctga atggacatta 540
gatgaaatcc ttgggagcaa tgattttgac tattatgagt tttcggacat ggggcaatcc 600
aggattagca gccaatga 618
<210>213
<211>205
<212>PRT
<213>葡萄
<400>213
Met Lys Ile Pro Cys Asp Ile Cys Gly Asn Val Glu Ala Glu Val Leu
1 5 10 15
Cys Ser Ala Asp Glu Ala Val Leu Cys Trp Gly Cys Asp Glu Arg Val
20 25 30
His Thr Ala Asn Lys Leu Ser Gln Lys His Gln Arg Val Pro Leu Leu
35 40 45
Lys His Pro Pro Ser Thr Ser Ser Ser Gln Leu Pro Pro Cys Asp Ile
50 55 60
Cys Gln Glu Lys Ser Gly Tyr Phe Phe Cys Leu Glu Asp Arg Ala Leu
65 70 75 80
Leu Cys Lys Asn Cys Asp Val Ser Thr His Ser Thr Asn Ser Tyr Val
85 90 95
Ser Ser His Arg Arg Phe Val Ile Ser Gly Ile Lys Val Ala Leu Gln
100 105 110
Ser Val Thr Asn Asn Tyr Arg Thr Gly Cys Asn Ser Arg Thr Tyr Pro
115 120 125
Leu Asp Met Pro Asn Ser Asn Ser Ser Ser Val Asn Phe Pro Met Asp
130 135 140
Arg Glu Lys Lys Pro Glu Met Thr Thr Glu Val Ala Ser Thr Ser Ser
145 150 155 160
Asp Met Val Ala Met Phe Ser Gly Glu Ile His Leu Ala Thr Gly Pro
165 170 175
Glu Trp Thr Leu Asp Glu Ile Leu Gly Ser Asn Asp Phe Asp Tyr Tyr
180 185 190
Glu Phe Ser Asp Met Gly Gln Ser Arg Ile Ser Ser Gln
195 200 205
<210>214
<211>717
<212>DNA
<213>大豆
<400>214
atgaaaattc agtgcgatgt gtgtgagaaa gccccggcaa ccgtgatttg ctgcgcagat 60
gaggcagctt tgtgtgccaa atgtgacgtt gaagttcatg ctgcaaacaa gcttgcaagc 120
aagcaccaga ggcttctcct tcaatctgta tctaacaagc ttcccagatg tgacatatgt 180
caagataagc cagctttcat attttgtgtt gaggacagag cactcttctg taaagactgt 240
gatgaaccta ttcatttagc cagtagcctt tctgcaaacc accagcgctt ccttgctact 300
ggtatccggg tggctttggg ttctaattgc accaaaggca atgaaaaagg tcacgtggaa 360
ccatctaaac caaaagcaca agaagttcct gcgaaaattc cttctcagca agtgcctagc 420
ttcacatcct cttgggcagt tgatgacttg ttggaattaa cagactttga atcaccagac 480
aaagttcaga agcaatccct tgagtttgga gaacttgaat ggctagcaga tgtaggcctt 540
tttggtgaac agtttcctca tgaagcttta gcggcggctg aagttcctca gcttccaatg 600
actagcagtg ttggctcaca caaagccccc aaatccttgt tgtcttacaa aaagcctagg 660
attgaagtcc tagatgaaga tgatgatgag cacttcaccg taccagatct cggataa 717
<210>215
<211>238
<212>PRT
<213>大豆
<400>215
Met Lys Ile Gln Cys Asp Val Cys Glu Lys Ala Pro Ala Thr Val Ile
1 5 10 15
Cys Cys Ala Asp Glu Ala Ala Leu Cys Ala Lys Cys Asp Val Glu Val
20 25 30
His Ala Ala Asn Lys Leu Ala Ser Lys His Gln Arg Leu Leu Leu Gln
35 40 45
Ser Val Ser Asn Lys Leu Pro Arg Cys Asp Ile Cys Gln Asp Lys Pro
50 55 60
Ala Phe Ile Phe Cys Val Glu Asp Arg Ala Leu Phe Cys Lys Asp Cys
65 70 75 80
Asp Glu Pro Ile His Leu Ala Ser Ser Leu Ser Ala Asn His Gln Arg
85 90 95
Phe Leu Ala Thr Gly Ile Arg Val Ala Leu Gly Ser Asn Cys Thr Lys
100 105 110
Gly Asn Glu Lys Gly His Val Glu Pro Ser Lys Pro Lys Ala Gln Glu
115 120 125
Val Pro Ala Lys Ile Pro Ser Gln Gln Val Pro Ser Phe Thr Ser Ser
130 135 140
Trp Ala Val Asp Asp Leu Leu Glu Leu Thr Asp Phe Glu Ser Pro Asp
145 150 155 160
Lys Val Gln Lys Gln Ser Leu Glu Phe Gly Glu Leu Glu Trp Leu Ala
165 170 175
Asp Val Gly Leu Phe Gly Glu Gln Phe Pro His Glu Ala Leu Ala Ala
180 185 190
Ala Glu Val Pro Gln Leu Pro Met Thr Ser Ser Val Gly Ser His Lys
195 200 205
Ala Pro Lys Ser Leu Leu Ser Tyr Lys Lys Pro Arg Ile Glu Val Leu
210 215 220
Asp Glu Asp Asp Asp Glu His Phe Thr Val Pro Asp Leu Gly
225 230 235
<210>216
<211>52
<212>DNA
<213>人工序列
<220>
<223>引物1
<400>216
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgaa ggtgcagtgc ga 52
<210>217
<211>49
<212>DNA
<213>人工序列
<220>
<223>引物2
<400>217
ggggaccact ttgtacaaga aagctgggtt caccagtaca agcagggag 49
<210>218
<211>2194
<212>DNA
<213>稻
<400>218
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160
ttggtgtagc ttgccacttt caccagcaaa gttc 2194
<210>219
<211>47
<212>PRT
<213>人工序列
<220>
<223>SEQ ID NO:2中的B框1
<400>219
Met Lys Val Gln Cys Asp Val Cys Ala Ala Glu Ala Ala Ser Val Phe
1 5 10 15
Cys Cys Ala Asp Glu Ala Ala Leu Cys Asp Ala Cys Asp Arg Arg Val
20 25 30
His Ser Ala Asn Lys Leu Ala Gly Lys His Arg Arg Phe Ser Leu
35 40 45
<210>220
<211>48
<212>PRT
<213>人工序列
<220>
<223>SEQ ID NO:2中的B框2
<400>220
Gln Lys Pro Pro Leu Cys Asp Ile Cys Gln Glu Lys Arg Gly Phe Leu
1 5 10 15
Phe Cys Lys Glu Asp Arg Ala Ile Leu Cys Arg Glu Cys Asp Val Thr
20 25 30
Val His Thr Thr Ser Glu Leu Thr Arg Arg His Gly Arg Phe Leu Leu
35 40 45
<210>221
<211>24
<212>PRT
<213>人工序列
<220>
<223>B框的共有序列
<220>
<221>UNSURE
<222>(2)..(3)
<223>Xaa可以是任何天然存在的氨基酸
<220>
<221>UNSURE
<222>(5)..(20)
<223>Xaa可以是任何天然存在的氨基酸
<220>
<221>UNSURE
<222>(22)..(23)
<223>Xaa可以是任何天然存在的氨基酸
<400>221
Cys Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Cys Xaa Xaa Cys
20
<210>222
<211>1245
<212>DNA
<213>玉米
<400>222
cccgtccggt ctagctagga ctagtaagta gcataccatt accatcctcc gcgcggctag 60
ctccgactcg ctttcatcca tacgattgcc cggagctcaa gccctgagct gagccgccag 120
agcgcgcgcg atcatcgctt gagggaaaag cagagtggag tggccgagat gaaggtgcag 180
tgcgacgtgt gcgcggccga ggcggccgag gtgttctgct gcgccgacga ggcggcgctg 240
tgcgacgcgt gcgaccgccg cgtgcaccgc gccaacaagc tcgccggcaa gcaccgccgc 300
ttctcgctgc tcagcccggc gccaccgccg ccgccgccgc tctgcgacat ctgccaggac 360
aagcgggggc tcctgttctg caaggaggac cgcgccatcc tgtgccgcga ctgcgacgtg 420
tcggtgcaca cggccagcga cctgaccatg cgccacgccc ggttcctgct cacgggcgtc 480
cgcctctccg ccgagcccgc cgccgcgtgc ccggcgccgg aggatgagga ggaggaggac 540
gacgagaaca gcagcggcag cttctgctgc agcgccggcg acgcagccgc acatcctcct 600
cctcttccgt cgtcggcgcc cgccaccagc cacgggagcg acagcagcag catctccgag 660
tacctcacca agacgctgcc cgggtggcac gtcgaggact tcctcattga cgacgcgtcc 720
gctggcgacg tcggcgcctg ctcggatggc ctctatcagg gacaaaatgg acagatcagt 780
ggggtgctgc aagaagctta cctgccgtgg acggagcggg agcaggtgca aactgacgtc 840
gcagacgagc gggccagctg ggagcggtgg gtgccacaga tgcatgcgga gttcggcggc 900
ggcggcaagc gacctagagc gtcgccttcg cctccctgtt cgtactggtg attggtgaaa 960
agttcgccgt cttcagcaag atgatttgta ttgggctaat tagtagagct actgtaggaa 1020
cgaccgaaaa atgagccaaa aaagtaacgg cctccatcga gctcgtttta aattattctc 1080
tgcctaaagc caaactttca gaaaggagaa cggtattttc ctgttcgatt aattaggtcg 1140
atttcgatcg aactcgttcc aaaatcccaa ttgtttgcta cctaaagaca gacttcctga 1200
atatagttga gtaacagggg aatttgccga aggaaaaaaa aaaaa 1245
<210>223
<211>260
<212>PRT
<213>玉米
<400>223
Met Lys Val Gln Cys Asp Val Cys Ala Ala Glu Ala Ala Glu Val Phe
1 5 10 15
Cys Cys Ala Asp Glu Ala Ala Leu Cys Asp Ala Cys Asp Arg Arg Val
20 25 30
His Arg Ala Asn Lys Leu Ala Gly Lys His Arg Arg Phe Ser Leu Leu
35 40 45
Ser Pro Ala Pro Pro Pro Pro Pro Pro Leu Cys Asp Ile Cys Gln Asp
50 55 60
Lys Arg Gly Leu Leu Phe Cys Lys Glu Asp Arg Ala Ile Leu Cys Arg
65 70 75 80
Asp Cys Asp Val Ser Val His Thr Ala Ser Asp Leu Thr Met Arg His
85 90 95
Ala Arg Phe Leu Leu Thr Gly Val Arg Leu Ser Ala Glu Pro Ala Ala
100 105 110
Ala Cys Pro Ala Pro Glu Asp Glu Glu Glu Glu Asp Asp Glu Asn Ser
115 120 125
Ser Gly Ser Phe Cys Cys Ser Ala Gly Asp Ala Ala Ala His Pro Pro
130 135 140
Pro Leu Pro Ser Ser Ala Pro Ala Thr Ser His Gly Ser Asp Ser Ser
145 150 155 160
Ser Ile Ser Glu Tyr Leu Thr Lys Thr Leu Pro Gly Trp His Val Glu
165 170 175
Asp Phe Leu Ile Asp Asp Ala Ser Ala Gly Asp Val Gly Ala Cys Ser
180 185 190
Asp Gly Leu Tyr Gln Gly Gln Asn Gly Gln Ile Ser Gly Val Leu Gln
195 200 205
Glu Ala Tyr Leu Pro Trp Thr Glu Arg Glu Gln Val Gln Thr Asp Val
210 215 220
Ala Asp Glu Arg Ala Ser Trp Glu Arg Trp Val Pro Gln Met His Ala
225 230 235 240
Glu Phe Gly Gly Gly Gly Lys Arg Pro Arg Ala Ser Pro Ser Pro Pro
245 250 255
Cys Ser Tyr Trp
260
<210>224
<211>1065
<212>DNA
<213>稻
<400>224
atggtttcgg ccttgtttcg gacgatcctg gtgacgggcg gcgccggcta catcggcagc 60
cacaccgtcc tccagcttct ccaactcggc ttccgcgttg tcgtcctcga caacctcgac 120
aacgcctccg agctcgccat cctccgcgtc agggaactcg ccggacacaa cgccaacaac 180
ctcgacttcc gcaaggttga cctccgcgac aagcaagcgt tggaccaaat cttctcctct 240
caaaggtttg aggctgtcat ccattttgcc gggctgaaag ctgttggcga gagcgtgcag 300
aagcccctgc tttactacga caacaacctc atcggcacca tcactctcct gcaggtcatg 360
gccgcacatg gctgcaccaa gctggtgttc tcatcatccg caactgtcta cgggtggccc 420
aaggaggtgc cctgcactga agaatcccca ctttgtgcaa tgaaccccta cggcagaaca 480
aagctggtaa tcgaagacat gtgccgggat ctgcatgcct cagacccaaa ctggaagatc 540
atactgctcc gatacttcaa ccctgttgga gctcacccaa gcgggtacat tggtgaggac 600
ccctgcggca tcccaaacaa cctcatgccc ttcgtccagc aggtcgctgt tggcaggagg 660
ccggccctta ccgtctatgg aaccgactac aacaccaagg atggaactgg ggttcgtgac 720
tatatccatg ttgttgatct agcggatggt catatcgccg cgttaaggaa gctctatgaa 780
gattctgata gaataggatg tgaggtgtac aatctgggca ctggaaaggg gacatctgtg 840
ctggaaatgg ttgcagcatt cgagaaagct tctggaaaga aaatcccgct tgtatttgct 900
ggacgaaggc ctggagatgc cgagatcgtt tacgctcaaa ctgccaaagc tgagaaggaa 960
ctgaaatgga aggcaaaata cggggtagag gagatgtgca gggacctgtg gaattgggcg 1020
agcaagaacc cctacgggta tggatcgccg gacagtagca actga 1065
<210>225
<211>354
<212>PRT
<213>稻
<400>225
Met Val Ser Ala Leu Phe Arg Thr Ile Leu Val Thr Gly Gly Ala Gly
1 5 10 15
Tyr Ile Gly Ser His Thr Val Leu Gln Leu Leu Gln Leu Gly Phe Arg
20 25 30
Val Val Val Leu Asp Asn Leu Asp Asn Ala Ser Glu Leu Ala Ile Leu
35 40 45
Arg Val Arg Glu Leu Ala Gly His Asn Ala Asn Asn Leu Asp Phe Arg
50 55 60
Lys Val Asp Leu Arg Asp Lys Gln Ala Leu Asp Gln Ile Phe Ser Ser
65 70 75 80
Gln Arg Phe Glu Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly
85 90 95
Glu Ser Val Gln Lys Pro Leu Leu Tyr Tyr Asp Asn Asn Leu Ile Gly
100 105 110
Thr Ile Thr Leu Leu Gln Val Met Ala Ala His Gly Cys Thr Lys Leu
115 120 125
Val Phe Ser Ser Ser Ala Thr Val Tyr Gly Trp Pro Lys Glu Val Pro
130 135 140
Cys Thr Glu Glu Ser Pro Leu Cys Ala Met Asn Pro Tyr Gly Arg Thr
145 150 155 160
Lys Leu Val Ile Glu Asp Met Cys Arg Asp Leu His Ala Ser Asp Pro
165 170 175
Asn Trp Lys Ile Ile Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala His
180 185 190
Pro Ser Gly Tyr Ile Gly Glu Asp Pro Cys Gly Ile Pro Asn Asn Leu
195 200 205
Met Pro Phe Val Gln Gln Val Ala Val Gly Arg Arg Pro Ala Leu Thr
210 215 220
Val Tyr Gly Thr Asp Tyr Asn Thr Lys Asp Gly Thr Gly Val Arg Asp
225 230 235 240
Tyr Ile His Val Val Asp Leu Ala Asp Gly His Ile Ala Ala Leu Arg
245 250 255
Lys Leu Tyr Glu Asp Ser Asp Arg Ile Gly Cys Glu Val Tyr Asn Leu
260 265 270
Gly Thr Gly Lys Gly Thr Ser Val Leu Glu Met Val Ala Ala Phe Glu
275 280 285
Lys Ala Ser Gly Lys Lys Ile Pro Leu Val Phe Ala Gly Arg Arg Pro
290 295 300
Gly Asp Ala Glu Ile Val Tyr Ala Gln Thr Ala Lys Ala Glu Lys Glu
305 310 315 320
Leu Lys Trp Lys Ala Lys Tyr Gly Val Glu Glu Met Cys Arg Asp Leu
325 330 335
Trp Asn Trp Ala Ser Lys Asn Pro Tyr Gly Tyr Gly Ser Pro Asp Ser
340 345 350
Ser Asn
<210>226
<211>1176
<212>DNA
<213>稻
<400>226
atggacttcg gtgattctag acgcaagcct aatgtcgtcg ggaagttcac cgtagctgtt 60
gcactcacgg tcatgtgcat cattgtgttg aaacagtcgc ctggttttac cagtacaagt 120
gtgttctctc gccatgaaat tggtgtgact catgtgttgg tgactggagg agctggatac 180
attgggtcac atgctactct tcgtctactt agggacaact accgagttac cattgtggat 240
aacctttcta gagggaacat gggagctgtc agagtccttc aacgtttgtt tccagagcct 300
gggaggcttc agtttattta tgctgattta ggcgatgcga aagctgttaa caaaatattt 360
tcagaaaatg cattcgatgc tgttatgcac tttgctgccg ttgcttacgt tggtgagagc 420
acgttggagc cactgaggta ctaccacaac ataacatcaa atacattgac agtgcttgag 480
gcaatggcag catataatgt aaaaactctg atatactcaa gtacttgtgc aacatatggt 540
gaacctgaca caatgcctat cacagaagca acccctcaga atcctatcaa tccatatggg 600
aaggcaaaaa agatggcaga ggacatcatt ttagatttct ctaagagatc agaaatggca 660
gtcatgatct taagatactt caacgtcatt ggatcagacc caggggggcg gttaggggaa 720
gctccacgac cagagctgcg tgagcatgga cggatttctg gtgcttgctt tgatgcagca 780
ctgggaatca ttccaggttt gaaggttcgg ggaactgatt accctacagc tgatggaact 840
tgcataaggg actatattga tgtcacggat ctcgttgatg ctcatgtgaa agctcttgat 900
aaagctcagc ctggcaaagt tggaatctac aatgttggca caggacatgg tagatcagtg 960
aaggagtttg tagaagcatg taagagcgca acaggagcta gcatcaaggt ttcattcctt 1020
acccggagac caggagacta tgctgaagtt tacagtgacc catccaaaat ccatgacgag 1080
ctgaactgga cagcccgtta cattgatctt cgcgaaagcc tttcaactgc atggaaatgg 1140
cagaaagcac acccgaatgg gtatggatcg gcctga 1176
<210>227
<211>391
<212>PRT
<213>稻
<400>227
Met Asp Phe Gly Asp Ser Arg Arg Lys Pro Asn Val Val Gly Lys Phe
1 5 10 15
Thr Val Ala Val Ala Leu Thr Val Met Cys Ile Ile Val Leu Lys Gln
20 25 30
Ser Pro Gly Phe Thr Ser Thr Ser Val Phe Ser Arg His Glu Ile Gly
35 40 45
Val Thr His Val Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His
50 55 60
Ala Thr Leu Arg Leu Leu Arg Asp Asn Tyr Arg Val Thr Ile Val Asp
65 70 75 80
Asn Leu Ser Arg Gly Asn Met Gly Ala Val Arg Val Leu Gln Arg Leu
85 90 95
Phe Pro Glu Pro Gly Arg Leu Gln Phe Ile Tyr Ala Asp Leu Gly Asp
100 105 110
Ala Lys Ala Val Asn Lys Ile Phe Ser Glu Asn Ala Phe Asp Ala Val
115 120 125
Met His Phe Ala Ala Val Ala Tyr Val Gly Glu Ser Thr Leu Glu Pro
130 135 140
Leu Arg Tyr Tyr His Asn Ile Thr Ser Asn Thr Leu Thr Val Leu Glu
145 150 155 160
Ala Met Ala Ala Tyr Asn Val Lys Thr Leu Ile Tyr Ser Ser Thr Cys
165 170 175
Ala Thr Tyr Gly Glu Pro Asp Thr Met Pro Ile Thr Glu Ala Thr Pro
180 185 190
Gln Asn Pro Ile Asn Pro Tyr Gly Lys Ala Lys Lys Met Ala Glu Asp
195 200 205
Ile Ile Leu Asp Phe Ser Lys Arg Ser Glu Met Ala Val Met Ile Leu
210 215 220
Arg Tyr Phe Asn Val Ile Gly Ser Asp Pro Gly Gly Arg Leu Gly Glu
225 230 235 240
Ala Pro Arg Pro Glu Leu Arg Glu His Gly Arg Ile Ser Gly Ala Cys
245 250 255
Phe Asp Ala Ala Leu Gly Ile Ile Pro Gly Leu Lys Val Arg Gly Thr
260 265 270
Asp Tyr Pro Thr Ala Asp Gly Thr Cys Ile Arg Asp Tyr Ile Asp Val
275 280 285
Thr Asp Leu Val Asp Ala His Val Lys Ala Leu Asp Lys Ala Gln Pro
290 295 300
Gly Lys Val Gly Ile Tyr Asn Val Gly Thr Gly His Gly Arg Ser Val
305 310 315 320
Lys Glu Phe Val Glu Ala Cys Lys Ser Ala Thr Gly Ala Ser Ile Lys
325 330 335
Val Ser Phe Leu Thr Arg Arg Pro Gly Asp Tyr Ala Glu Val Tyr Ser
340 345 350
Asp Pro Ser Lys Ile His Asp Glu Leu Asn Trp Thr Ala Arg Tyr Ile
355 360 365
Asp Leu Arg Glu Ser Leu Ser Thr Ala Trp Lys Trp Gln Lys Ala His
370 375 380
Pro Asn Gly Tyr Gly Ser Ala
385 390
<210>228
<211>1065
<212>DNA
<213>稻
<400>228
atggtttcgg ccttgttgcg gacgatcctg gtgacgggcg gcgccggcta catcggcagc 60
cacaccgtcc tccagcttct ccaactcggc ttccgcgttg tcgtcctcga caacctcgac 120
aacgcctccg agctcgccat cctccgcgtc agggaactcg ccggacacaa cgccaacaac 180
ctcgacttcc gcaaggttga cctccgcgac aagcaagcgt tggaccaaat cttctcctct 240
caaaggtttg aggctgtcat ccattttgcc gggctgaaag ctgttggcga gagcgtgcag 300
aagcccctgc tttactacga caacaacctc atcggcacca tcactctcct gcaggtcatg 360
gccgcacatg gctgcaccaa gctggtgttc tcatcatccg caactgtcta cgggtggccc 420
aaggaggtgc cctgcactga agaatcccca ctttgtgcaa tgaaccccta cggcagaaca 480
aagctggtaa tcgaagacat gtgccgggat ctgcatgcct cagacccaaa ctggaagatc 540
atactgctcc gatacttcaa ccctgttgga gctcacccaa gcgggtacat tggtgaggac 600
ccctgcggca tcccaaacaa cctcatgccc ttcgtccagc aggtcgctgt tggcaggagg 660
ccggccctta ccgtctatgg aaccgactac aacaccaagg atggaactgg ggttcgtgac 720
tatatccatg ttgttgatct agcggatggt catatcgccg cgttaaggaa gctctatgaa 780
gattctgata gaataggatg tgaggtgtac aatctgggca ctggaaaggg gacatctgtg 840
ctggaaatgg ttgcagcatt cgagaaagct tctggaaaga aaatcccgct tgtatttgct 900
ggacgaaggc ctggagatgc cgagatcgtt tacgctcaaa ctgccaaagc tgagaaggaa 960
ctgaaatgga aggcaaaata cggggtagag gagatgtgca gggacctgtg gaattgggcg 1020
agcaagaacc cctacgggta tggatcgccg gacagtagca actga 1065
<210>229
<211>354
<212>PRT
<213>稻
<400>229
Met Val Ser Ala Leu Leu Arg Thr Ile Leu Val Thr Gly Gly Ala Gly
1 5 10 15
Tyr Ile Gly Ser His Thr Val Leu Gln Leu Leu Gln Leu Gly Phe Arg
20 25 30
Val Val Val Leu Asp Asn Leu Asp Asn Ala Ser Glu Leu Ala Ile Leu
35 40 45
Arg Val Arg Glu Leu Ala Gly His Asn Ala Asn Asn Leu Asp Phe Arg
50 55 60
Lys Val Asp Leu Arg Asp Lys Gln Ala Leu Asp Gln Ile Phe Ser Ser
65 70 75 80
Gln Arg Phe Glu Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly
85 90 95
Glu Ser Val Gln Lys Pro Leu Leu Tyr Tyr Asp Asn Asn Leu Ile Gly
100 105 110
Thr Ile Thr Leu Leu Gln Val Met Ala Ala His Gly Cys Thr Lys Leu
115 120 125
Val Phe Ser Ser Ser Ala Thr Val Tyr Gly Trp Pro Lys Glu Val Pro
130 135 140
Cys Thr Glu Glu Ser Pro Leu Cys Ala Met Asn Pro Tyr Gly Arg Thr
145 150 155 160
Lys Leu Val Ile Glu Asp Met Cys Arg Asp Leu His Ala Ser Asp Pro
165 170 175
Asn Trp Lys Ile Ile Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala His
180 185 190
Pro Ser Gly Tyr Ile Gly Glu Asp Pro Cys Gly Ile Pro Asn Asn Leu
195 200 205
Met Pro Phe Val Gln Gln Val Ala Val Gly Arg Arg Pro Ala Leu Thr
210 215 220
Val Tyr Gly Thr Asp Tyr Asn Thr Lys Asp Gly Thr Gly Val Arg Asp
225 230 235 240
Tyr Ile His Val Val Asp Leu Ala Asp Gly His Ile Ala Ala Leu Arg
245 250 255
Lys Leu Tyr Glu Asp Ser Asp Arg Ile Gly Cys Glu Val Tyr Asn Leu
260 265 270
Gly Thr Gly Lys Gly Thr Ser Val Leu Glu Met Val Ala Ala Phe Glu
275 280 285
Lys Ala Ser Gly Lys Lys Ile Pro Leu Val Phe Ala Gly Arg Arg Pro
290 295 300
Gly Asp Ala Glu Ile Val Tyr Ala Gln Thr Ala Lys Ala Glu Lys Glu
305 310 315 320
Leu Lys Trp Lys Ala Lys Tyr Gly Val Glu Glu Met Cys Arg Asp Leu
325 330 335
Trp Asn Trp Ala Ser Lys Asn Pro Tyr Gly Tyr Gly Ser Pro Asp Ser
340 345 350
Ser Asn
<210>230
<211>1266
<212>DNA
<213>稻
<400>230
atgcttccca ccaacaggaa caggccccag cagaggcctg ccagatcttg gtatttcatc 60
tcagacatgg acttctccga tccgaagcgc aagccgcggt acctcagtaa gatcctcatg 120
gtggcgctcc tcaccgccat gtgcgtcgtc atgctcacac agccgccctg ccataggagg 180
actcccagtg tgttctccat ccatgaaccc ggagtcacgc atgttctagt gacgggcggc 240
gctggatata tcggttcgca cgctgcgctt cggctgctga aagattcctt cagagtcacc 300
atagtggata atctttcaag aggaaatatg ggggcaatca aggttcttca gaacttgttt 360
tcagagcctg ggcggttgca gttcatctat gctgatttag gcgatccaaa agctgttaat 420
agaatatttg cagaaaatgc ttttgatgct gtcatgcact ttgctgctgt cgcttatgtt 480
ggtgagagca cacttgagcc tttgaggtac tatcataaca tcacctcaaa cactttagtt 540
gtgctagagg ctatggcagc acacaatgtg agaaccctga tctactctag cacatgtgcc 600
acctatggag aacccgagaa gatgcctatc accgaaggaa ctccccagtt tccgatcaac 660
ccatatggta aagccaagaa gatggcagag gacatcatct tggatttttc caaatccaag 720
aaggcagaca tggctgtgat gattctaaga tacttcaacg tcattggttc tgaccctgaa 780
ggaaggcttg gcgaggctcc aaaacctgaa ttacgggagc atggccgtat atctggtgca 840
tgctttgatg ctgcactggg gataattcct ggtttgaagg ttaaaggtac tgactatgaa 900
acacctgacg gtacttgtgt aagagattac atcgatgtca ctgacctcgt tgacgcccat 960
gtgaaggcgc tcaacaaggc ggaaaggggc aaagttggca tatacaatgt tggcacaggc 1020
aaaggtaggt cagtgaaaga atttgtcgaa gcttgcaaga aggcaacagg agttgacatc 1080
aaggtcgact acttccctcg tcgacccggt gactatgccg aagtgtacag cgatcccgca 1140
aagatcaaca gcgagctgaa ctggactgct caacataccg atctcctgga gagcctcagg 1200
gttgcctgga catggcagaa gaagcaccgg agcggctacg gaccccctca ggccatggtt 1260
ttgtga 1266
<210>231
<211>421
<212>PRT
<213>稻
<400>231
Met Leu Pro Thr Asn Arg Asn Arg Pro Gln Gln Arg Pro Ala Arg Ser
1 5 10 15
Trp Tyr Phe Ile Ser Asp Met Asp Phe Ser Asp Pro Lys Arg Lys Pro
20 25 30
Arg Tyr Leu Ser Lys Ile Leu Met Val Ala Leu Leu Thr Ala Met Cys
35 40 45
Val Val Met Leu Thr Gln Pro Pro Cys His Arg Arg Thr Pro Ser Val
50 55 60
Phe Ser Ile His Glu Pro Gly Val Thr His Val Leu Val Thr Gly Gly
65 70 75 80
Ala Gly Tyr Ile Gly Ser His Ala Ala Leu Arg Leu Leu Lys Asp Ser
85 90 95
Phe Arg Val Thr Ile Val Asp Asn Leu Ser Arg Gly Asn Met Gly Ala
100 105 110
Ile Lys Val Leu Gln Asn Leu Phe Ser Glu Pro Gly Arg Leu Gln Phe
115 120 125
Ile Tyr Ala Asp Leu Gly Asp Pro Lys Ala Val Asn Arg Ile Phe Ala
130 135 140
Glu Asn Ala Phe Asp Ala Val Met His Phe Ala Ala Val Ala Tyr Val
145 150 155 160
Gly Glu Ser Thr Leu Glu Pro Leu Arg Tyr Tyr His Asn Ile Thr Ser
165 170 175
Asn Thr Leu Val Val Leu Glu Ala Met Ala Ala His Asn Val Arg Thr
180 185 190
Leu Ile Tyr Ser Ser Thr Cys Ala Thr Tyr Gly Glu Pro Glu Lys Met
195 200 205
Pro Ile Thr Glu Gly Thr Pro Gln Phe Pro Ile Asn Pro Tyr Gly Lys
210 215 220
Ala Lys Lys Met Ala Glu Asp Ile Ile Leu Asp Phe Ser Lys Ser Lys
225 230 235 240
Lys Ala Asp Met Ala Val Met Ile Leu Arg Tyr Phe Asn Val Ile Gly
245 250 255
Ser Asp Pro Glu Gly Arg Leu Gly Glu Ala Pro Lys Pro Glu Leu Arg
260 265 270
Glu His Gly Arg Ile Ser Gly Ala Cys Phe Asp Ala Ala Leu Gly Ile
275 280 285
Ile Pro Gly Leu Lys Val Lys Gly Thr Asp Tyr Glu Thr Pro Asp Gly
290 295 300
Thr Cys Val Arg Asp Tyr Ile Asp Val Thr Asp Leu Val Asp Ala His
305 310 315 320
Val Lys Ala Leu Asn Lys Ala Glu Arg Gly Lys Val Gly Ile Tyr Asn
325 330 335
Val Gly Thr Gly Lys Gly Arg Ser Val Lys Glu Phe Val Glu Ala Cys
340 345 350
Lys Lys Ala Thr Gly Val Asp Ile Lys Val Asp Tyr Phe Pro Arg Arg
355 360 365
Pro Gly Asp Tyr Ala Glu Val Tyr Ser Asp Pro Ala Lys Ile Asn Ser
370 375 380
Glu Leu Asn Trp Thr Ala Gln His Thr Asp Leu Leu Glu Ser Leu Arg
385 390 395 400
Val Ala Trp Thr Trp Gln Lys Lys His Arg Ser Gly Tyr Gly Pro Pro
405 410 415
Gln Ala Met Val Leu
420
<210>232
<211>1227
<212>DNA
<213>稻
<400>232
atggcggtgg agaagacggt gccgggcggg gtgaggacgg tgctggtgac gggcggggcg 60
gggtacatcg gcagccacgc cgtgctgcag ctcctcctcg ccggattccg cgccgtcgtc 120
gtcgacaacc tcaacaactc ctccgagctc gccgtccgcc gcgtcgccgc cctcgccggc 180
gaccactccc ggaacctcgc cttccacaag gttgacctcc gtgacaaggg agcactggaa 240
aaggtttttg cttcaacaag attcgatgct gtagttcact ttgctgggct aaaagctgtg 300
ggcgaaagtg tgcagaagcc attgctttat tacgacaaca atgttaatgg aacagtaaat 360
cttctggaag ttatgtctgc ccatggatgt aagaagttgg tgttctcatc atcagctgca 420
gtttatggat caccgaagaa ctcaccctgc acagaagagt ttcctctcac tccaaacaat 480
ccatatggca aaacaaagct tgttgttgaa gatatttgcc gtgatatcta ccgtacagat 540
cctgaatgga agattattct acttaggtac ttcaatccag ttggggctca tcctagcgga 600
taccttgggg aagatccatg tggcattccc aacaatctta tgccttatgt tcagcaagtt 660
gctgttggca ggaggccagc tctgacaata ctaggaaatg attatgcaac cagagatggt 720
accggggtcc gagattacat ccatgtggtt gaccttgctg atggacatat tgcggcattg 780
cagaaactct ttgagagctc cagcataggg tgtgaagcat acaaccttgg aactggtaaa 840
ggtacctctg tgctggagat agtcaaggca tttgagaagg cttctgggaa gaaaattcct 900
ctgattattg gcccaagacg ccctggtgat gcggagattc tattttcatt acctgctaaa 960
gcagagaagg aactcaactg gaaagcgaaa tttggcatcg atgaaatgtg tagggatcaa 1020
tggaactggg ctagcaagaa cccttatgga tacgggtcac ttgactccac caagcagaac 1080
ggacaccact cgtacggatc aattggctct cccaagcaga atggccactg cacaaatgga 1140
ttttctgaat ccactaggca taatggtcac aacggatatg gactggtcga ctctgccaag 1200
cataacggca acggccactt ccactga 1227
<210>233
<211>408
<212>PRT
<213>稻
<400>233
Met Ala Val Glu Lys Thr Val Pro Gly Gly Val Arg Thr Val Leu Val
1 5 10 15
Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Ala Val Leu Gln Leu Leu
20 25 30
Leu Ala Gly Phe Arg Ala Val Val Val Asp Asn Leu Asn Asn Ser Ser
35 40 45
Glu Leu Ala Val Arg Arg Val Ala Ala Leu Ala Gly Asp His Ser Arg
50 55 60
Asn Leu Ala Phe His Lys Val Asp Leu Arg Asp Lys Gly Ala Leu Glu
65 70 75 80
Lys Val Phe Ala Ser Thr Arg Phe Asp Ala Val Val His Phe Ala Gly
85 90 95
Leu Lys Ala Val Gly Glu Ser Val Gln Lys Pro Leu Leu Tyr Tyr Asp
100 105 110
Asn Asn Val Asn Gly Thr Val Asn Leu Leu Glu Val Met Ser Ala His
115 120 125
Gly Cys Lys Lys Leu Val Phe Ser Ser Ser Ala Ala Val Tyr Gly Ser
130 135 140
Pro Lys Asn Ser Pro Cys Thr Glu Glu Phe Pro Leu Thr Pro Asn Asn
145 150 155 160
Pro Tyr Gly Lys Thr Lys Leu Val Val Glu Asp Ile Cys Arg Asp Ile
165 170 175
Tyr Arg Thr Asp Pro Glu Trp Lys Ile Ile Leu Leu Arg Tyr Phe Asn
180 185 190
Pro Val Gly Ala His Pro Ser Gly Tyr Leu Gly Glu Asp Pro Cys Gly
195 200 205
Ile Pro Asn Asn Leu Met Pro Tyr Val Gln Gln Val Ala Val Gly Arg
210 215 220
Arg Pro Ala Leu Thr Ile Leu Gly Asn Asp Tyr Ala Thr Arg Asp Gly
225 230 235 240
Thr Gly Val Arg Asp Tyr Ile His Val Val Asp Leu Ala Asp Gly His
245 250 255
Ile Ala Ala Leu Gln Lys Leu Phe Glu Ser Ser Ser Ile Gly Cys Glu
260 265 270
Ala Tyr Asn Leu Gly Thr Gly Lys Gly Thr Ser Val Leu Glu Ile Val
275 280 285
Lys Ala Phe Glu Lys Ala Ser Gly Lys Lys Ile Pro Leu Ile Ile Gly
290 295 300
Pro Arg Arg Pro Gly Asp Ala Glu Ile Leu Phe Ser Leu Pro Ala Lys
305 310 315 320
Ala Glu Lys Glu Leu Asn Trp Lys Ala Lys Phe Gly Ile Asp Glu Met
325 330 335
Cys Arg Asp Gln Trp Asn Trp Ala Ser Lys Asn Pro Tyr Gly Tyr Gly
340 345 350
Ser Leu Asp Ser Thr Lys Gln Asn Gly His His Ser Tyr Gly Ser Ile
355 360 365
Gly Ser Pro Lys Gln Asn Gly His Cys Thr Asn Gly Phe Ser Glu Ser
370 375 380
Thr Arg His Asn Gly His Asn Gly Tyr Gly Leu Val Asp Ser Ala Lys
385 390 395 400
His Asn Gly Asn Gly His Phe His
405
<210>234
<211>1110
<212>DNA
<213>稻
<400>234
atggcggggg gcgaggtggt ggcggtggcg gcggcggcgg cggggacgag caggacggtg 60
ctggtgacgg gaggggccgg gtacatcggg agccacaccg tgctgcagct gctcgccgcg 120
gggttccgcg tcgtcgtcgc cgacagcctc gggaactcct ccgagctcgc cgtccgccgc 180
gtcgccgcgc tcgccgggga caaggcgcgg aacctctcct tacacaaggt tgatattcgt 240
gataagggtg gactggaaaa ggttttttct tcgacaagat ttgatgctgt cgttcatttt 300
gctggtctga aagctgtggg tgaaagtgtg cagaagccat tgctttatta tgaccataat 360
gttgctggga caataattct tctagaagtt atggcagccc atggatgtaa aaagttggtg 420
ttttcatcgt cagctgcagt ttatggatca cctaaaaact caccctgcac agaagagttt 480
cctctcactc cacacaatcc atatggcaga accaagctca tagcagagga gatttgccgt 540
gatatatacc attcagattc tgaatggagc ataattttac ttaggtactt caatcctgtt 600
ggagctcatc ccagtggata ccttggtgaa gacccatgtg gaattcctaa caacctcatg 660
cccttcgtcc agcaagttgc tgtcgggagg agaccgtcac ttacaatatt tggaaatgac 720
tatgcaacaa aagatgggac aggggtacgt gattatattc atgtagttga tcttgctgag 780
gggcatattg ctgcactacg gaagctgttt gaaagctcaa taggatgtca agcatacaac 840
cttggaacag gaaagggaac atcagtgttg gaaatagtta atgcatttga gaaagtttct 900
ggaaagaaaa tacctttggt tattggtcca cgacgccctg gtgatgctga gattctcttt 960
tcgtcagctg ctaaagcaga gagagaattc aagtggaagg caaaatatgg catcgaagaa 1020
atgtgcagag accaatggaa ctgggcgagc aagaatcctt tcgggtacgc ctcgcccgac 1080
tccaccaagc agaatggtca ttcacactga 1110
<210>235
<211>369
<212>PRT
<213>稻
<400>235
Met Ala Gly Gly Glu Val Val Ala Val Ala Ala Ala Ala Ala Gly Thr
1 5 10 15
Ser Arg Thr Val Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His
20 25 30
Thr Val Leu Gln Leu Leu Ala Ala Gly Phe Arg Val Val Val Ala Asp
35 40 45
Ser Leu Gly Asn Ser Ser Glu Leu Ala Val Arg Arg Val Ala Ala Leu
50 55 60
Ala Gly Asp Lys Ala Arg Asn Leu Ser Leu His Lys Val Asp Ile Arg
65 70 75 80
Asp Lys Gly Gly Leu Glu Lys Val Phe Ser Ser Thr Arg Phe Asp Ala
85 90 95
Val Val His Phe Ala Gly Leu Lys Ala Val Gly Glu Ser Val Gln Lys
100 105 110
Pro Leu Leu Tyr Tyr Asp His Asn Val Ala Gly Thr Ile Ile Leu Leu
115 120 125
Glu Val Met Ala Ala His Gly Cys Lys Lys Leu Val Phe Ser Ser Ser
130 135 140
Ala Ala Val Tyr Gly Ser Pro Lys Asn Ser Pro Cys Thr Glu Glu Phe
145 150 155 160
Pro Leu Thr Pro His Asn Pro Tyr Gly Arg Thr Lys Leu Ile Ala Glu
165 170 175
Glu Ile Cys Arg Asp Ile Tyr His Ser Asp Ser Glu Trp Ser Ile Ile
180 185 190
Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala His Pro Ser Gly Tyr Leu
195 200 205
Gly Glu Asp Pro Cys Gly Ile Pro Asn Asn Leu Met Pro Phe Val Gln
210 215 220
Gln Val Ala Val Gly Arg Arg Pro Ser Leu Thr Ile Phe Gly Asn Asp
225 230 235 240
Tyr Ala Thr Lys Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Val
245 250 255
Asp Leu Ala Glu Gly His Ile Ala Ala Leu Arg Lys Leu Phe Glu Ser
260 265 270
Ser Ile Gly Cys Gln Ala Tyr Asn Leu Gly Thr Gly Lys Gly Thr Ser
275 280 285
Val Leu Glu Ile Val Asn Ala Phe Glu Lys Val Ser Gly Lys Lys Ile
290 295 300
Pro Leu Val Ile Gly Pro Arg Arg Pro Gly Asp Ala Glu Ile Leu Phe
305 310 315 320
Ser Ser Ala Ala Lys Ala Glu Arg Glu Phe Lys Trp Lys Ala Lys Tyr
325 330 335
Gly Ile Glu Glu Met Cys Arg Asp Gln Trp Asn Trp Ala Ser Lys Asn
340 345 350
Pro Phe Gly Tyr Ala Ser Pro Asp Ser Thr Lys Gln Asn Gly His Ser
355 360 365
His
<210>236
<211>1497
<212>DNA
<213>稻
<400>236
atgccggcgg acgcggcggc gaaggggatg aagctggaga ggtacgcgag cggcgcgggc 60
gcgatgctgc tgctgcggcg ggcggcgagc gggaaggtcg tgtcggcgtc gtcgcacctg 120
ctgttccgcg ccaccgtgct cgccacgatg gcgctcgtgt tcctcttcac gttccactac 180
ccgtcgctgc tgtcgcgctc cttcacgctc tcctccggcg ccggcgccgg cgagggggga 240
gccgcggcgc acgcctcgca ccggagcttg ctcatgtcgt cgtcgtcggc gtcggcgtcg 300
gcggcgtcgg tgtacggggg cgcggcgtgg gagaaggagg tgaggcggag cgcgaagccg 360
aggaaggacg gggggatagc cgtgctggtg accggcgcgg cggggttcgt cggcacgcac 420
tgctcgctgg cgctgagggc gcgcggcgac ggcgtgctgg ggctcgacaa cttcaacgcc 480
tactacgacc cggagctgaa gcgcgcgcgg cagaggctcc tcgccggccg cggcgtgctc 540
gtgctcgacg ccgacatcaa cgacgcgctc ctgctcgaga agctgttcga cctggtgccg 600
ttcacccacg tgctgcacct cgccgcgcag gccggcgtgc gctacgccat ggaggcgccg 660
cagacgtacg tggcgtccaa cgtggccggg ctcgtgaccg tcctcgaggt cgccgccaag 720
cacgccgacc cgcagccggc gatcgtctgg gcgtcgtcgt cgtcggtgta cggcctcaac 780
accgacgcac ccttctccga ggagcaccgc accgaccggc cggcgtcgct gtacgcggcg 840
accaagaagg ccggcgaggc catcgcgcac acgtacaacc acatctacgg cctctccatc 900
accggcctcc gcttcttcac cgtgtacggg ccatggggcc gccccgacat ggcctacttc 960
ttcttcgcca agagcatcgt ctccggcgag cccatcacgc tgttccgcgc cgccgacggc 1020
gccgacgcgc gccgcgattt cacctacatc gacgacgtcg tcaagggctg cctcggcgcg 1080
ctcgacacct ccggcaagag caccggctcc tccaagtccg gcaagaagtc cggcccggcg 1140
ccgctccgcg tctacaacct cggcaacacc tcgccggtgc cggtcacccg catggtcgcc 1200
atcctcgaga agctcctcgg caagaaggcc aacaagcgca tcgtcgccat gcccagcaat 1260
ggcgacgtgc ccttcaccca cgccaacgtc acccacgccg cccacgactt cggctaccgc 1320
cccaccacct ccctcgacgc cggcctccgc cacttcgtcg actggttcgc cgactactac 1380
aagctcaagc tcgacgtccc caagatcgcc gccaaggtcg ccggcgccgg caagccctcc 1440
tcctcgtcgg cctccaagaa gaagaagaag gccgcggcga tgtcggcgtc atcatga 1497
<210>237
<211>498
<212>PRT
<213>稻
<400>237
Met Pro Ala Asp Ala Ala Ala Lys Gly Met Lys Leu Glu Arg Tyr Ala
1 5 10 15
Ser Gly Ala Gly Ala Met Leu Leu Leu Arg Arg Ala Ala Ser Gly Lys
20 25 30
Val Val Ser Ala Ser Ser His Leu Leu Phe Arg Ala Thr Val Leu Ala
35 40 45
Thr Met Ala Leu Val Phe Leu Phe Thr Phe His Tyr Pro Ser Leu Leu
50 55 60
Ser Arg Ser Phe Thr Leu Ser Ser Gly Ala Gly Ala Gly Glu Gly Gly
65 70 75 80
Ala Ala Ala His Ala Ser His Arg Ser Leu Leu Met Ser Ser Ser Ser
85 90 95
Ala Ser Ala Ser Ala Ala Ser Val Tyr Gly Gly Ala Ala Trp Glu Lys
100 105 110
Glu Val Arg Arg Ser Ala Lys Pro Arg Lys Asp Gly Gly Ile Ala Val
115 120 125
Leu Val Thr Gly Ala Ala Gly Phe Val Gly Thr His Cys Ser Leu Ala
130 135 140
Leu Arg Ala Arg Gly Asp Gly ValLeu Gly Leu Asp Asn Phe Asn Ala
145 150 155 160
Tyr Tyr Asp Pro Glu Leu Lys Arg Ala Arg Gln Arg Leu Leu Ala Gly
165 170 175
Arg Gly Val Leu Val Leu Asp Ala Asp Ile Asn Asp Ala Leu Leu Leu
180 185 190
Glu Lys Leu Phe Asp Leu Val Pro Phe Thr His Val Leu His Leu Ala
195 200 205
Ala Gln Ala Gly Val Arg Tyr Ala Met Glu Ala Pro Gln Thr Tyr Val
210 215 220
Ala Ser Asn Val Ala Gly Leu Val Thr Val Leu Glu Val Ala Ala Lys
225 230 235 240
His Ala Asp Pro Gln Pro Ala Ile Val Trp Ala Ser Ser Ser Ser Val
245 250 255
Tyr Gly Leu Asn Thr Asp Ala Pro Phe Ser Glu Glu His Arg Thr Asp
260 265 270
Arg Pro Ala Ser Leu Tyr Ala Ala Thr Lys Lys Ala Gly Glu Ala Ile
275 280 285
Ala His Thr Tyr Asn His Ile Tyr Gly Leu Ser Ile Thr Gly Leu Arg
290 295 300
Phe Phe Thr Val Tyr Gly Pro Trp Gly Arg Pro Asp Met Ala Tyr Phe
305 310 315 320
Phe Phe Ala Lys Ser Ile Val Ser Gly Glu Pro Ile Thr Leu Phe Arg
325 330 335
Ala Ala Asp Gly Ala Asp Ala Arg Arg Asp Phe Thr Tyr Ile Asp Asp
340 345 350
Val Val Lys Gly Cys Leu Gly Ala Leu Asp Thr Ser Gly Lys Ser Thr
355 360 365
Gly Ser Ser Lys Ser Gly Lys Lys Ser Gly Pro Ala Pro Leu Arg Val
370 375 380
Tyr Asn Leu Gly Asn Thr Ser Pro Val Pro Val Thr Arg Met Val Ala
385 390 395 400
Ile Leu Glu Lys Leu Leu Gly Lys Lys Ala Asn Lys Arg Ile Val Ala
405 410 4l5
Met Pro Ser Asn Gly Asp Val Pro Phe Thr His Ala Asn Val Thr His
420 425 430
Ala Ala His Asp Phe Gly Tyr Arg Pro Thr Thr Ser Leu Asp Ala Gly
435 440 445
Leu Arg His Phe Val Asp Trp Phe Ala Asp Tyr Tyr Lys Leu Lys Leu
450 455 460
Asp Val Pro Lys Ile Ala Ala Lys Val Ala Gly Ala Gly Lys Pro Ser
465 470 475 480
Ser Ser Ser Ala Ser Lys Lys Lys Lys Lys Ala Ala Ala Met Ser Ala
485 490 495
Ser Ser
<210>238
<211>1122
<212>DNA
<213>稻
<400>238
atggtgagcg gcggaggagt agcggcggag aacggcgaga tggtggggaa cggggagggg 60
aggaagggtg cgggggcgag cgtgctggtg acggggggag cggggtacat cgggacgcac 120
acggtgctgc ggctgctgga gaaggggttc gcggtcaccg tcgtcgacaa cttccacaac 180
tccgtcccgg aggcgctcga ccgcgtccgc ctcatcgccg gcgccgccct ctccgcccgc 240
ctcgacttca tcgccgggga tctcaagagc aaggacgaca tggagaaggt gttcgccgcc 300
aagaggtatg acgccgtgat ccacttcgcc gggctgaagg cggtggggga gagcgtcgcg 360
cacccgcaga tgtactacga gaacaacgtc gccggcacca tgaacctcta ctccgccatg 420
accaagtacg gctgcaagaa gatagtgttc tcgtcgtcgg cgacggtgta cggccagccg 480
gagaagaccc cctgcgtcga ggattccaag ctgagcgctc tcaacccata cggcaccacc 540
aagctcgtcc tggagaacta cttccggcag gtgcaggccg ccgacccgga gatgagggtg 600
atcctgctca ggtacttcaa ccccatcggc gctcaccgga gcggcgacat cggggaggac 660
cccaggggca tccccaacaa ccttcttccg tacatccagc aggtcgccgt cggccgccgc 720
cccgagctca acgtctacgg cgtcgactac ccaaccaggg acggcaccgc gatcagggat 780
tacatacatg tagtggacct tgccgatggc cacattgccg cactggagaa gctcttcgct 840
actcctgaca ttggttgtgt ggcttacaat ctaggaacag ggtgtggaac aacggtgctc 900
gaggtggtga aggcgttcga ggaggcgtcc ggaaagaaaa ttcctatcaa gatttgcccc 960
agaagacctg gagattgcac tgaggtttac gcttccactg acaaggccaa gaaggagctc 1020
ggatggagtg ctcggtttgg aatagaggac atgtgcaggg accagtggaa ttgggccaag 1080
aagaatccgt acggatacag cgccaatgct gagcagaatt ag 1122
<210>239
<211>373
<212>PRT
<213>稻
<400>239
Met Val Ser Gly Gly Gly Val Ala Ala Glu Asn Gly Glu Met Val Gly
1 5 10 15
Asn Gly Glu Gly Arg Lys Gly Ala Gly Ala Ser Val Leu Val Thr Gly
20 25 30
Gly Ala Gly Tyr Ile Gly Thr His Thr Val Leu Arg Leu Leu Glu Lys
35 40 45
Gly Phe Ala Val Thr Val Val Asp Asn Phe His Asn Ser Val Pro Glu
50 55 60
Ala Leu Asp Arg Val Arg Leu Ile Ala Gly Ala Ala Leu Ser Ala Arg
65 70 75 80
Leu Asp Phe Ile Ala Gly Asp Leu Lys Ser Lys Asp Asp Met Glu Lys
85 90 95
Val Phe Ala Ala Lys Arg Tyr Asp Ala Val Ile His Phe Ala Gly Leu
100 105 110
Lys Ala Val Gly Glu Ser Val Ala His Pro Gln Met Tyr Tyr Glu Asn
115 120 125
Asn Val Ala Gly Thr Met Asn Leu Tyr Ser Ala Met Thr Lys Tyr Gly
130 135 140
Cys Lys Lys Ile Val Phe Ser Ser Ser Ala Thr Val Tyr Gly Gln Pro
145 150 155 160
Glu Lys Thr Pro Cys Val Glu Asp Ser Lys Leu Ser Ala Leu Asn Pro
165 170 175
Tyr Gly Thr Thr Lys Leu Val Leu Glu Asn Tyr Phe Arg Gln Val Gln
180 185 190
Ala Ala Asp Pro Glu Met Arg Val Ile Leu Leu Arg Tyr Phe Asn Pro
195 200 205
Ile Gly Ala His Arg Ser Gly Asp Ile Gly Glu Asp Pro Arg Gly Ile
210 215 220
Pro Asn Asn Leu Leu Pro Tyr Ile Gln Gln Val Ala Val Gly Arg Arg
225 230 235 240
Pro Glu Leu Asn Val Tyr Gly Val Asp Tyr Pro Thr Arg Asp Gly Thr
245 250 255
Ala Ile Arg Asp Tyr Ile His Val Val Asp Leu Ala Asp Gly His Ile
260 265 270
Ala Ala Leu Glu Lys Leu Phe Ala Thr Pro Asp Ile Gly Cys Val Ala
275 280 285
Tyr Asn Leu Gly Thr Gly Cys Gly Thr Thr Val Leu Glu Val Val Lys
290 295 300
Ala Phe Glu Glu Ala Ser Gly Lys Lys Ile Pro Ile Lys Ile Cys Pro
305 310 315 320
Arg Arg Pro Gly Asp Cys Thr Glu Val Tyr Ala Ser Thr Asp Lys Ala
325 330 335
Lys Lys Glu Leu Gly Trp Ser Ala Arg Phe Gly Ile Glu Asp Met Cys
340 345 350
Arg Asp Gln Trp Asn Trp Ala Lys Lys Asn Pro Tyr Gly Tyr Ser Ala
355 360 365
Asn Ala Glu Gln Asn
370
<210>240
<211>1056
<212>DNA
<213>拟南芥
<400>240
atgggttctt ctgtggagca gaacattctt gttactggtg gtgctggctt tatcgggacg 60
catactgttg ttcaacttct caaagatggt tttaaggttt cgatcatcga taattttgat 120
aactctgtta tcgaagctgt tgatagagtt agggagcttg ttggtcctga tctctccaag 180
aagctcgact tcaatctggg tgatctaaga aacaaagggg acattgagaa actattctcc 240
aagcagagat ttgatgctgt gattcatttt gcgggtctta aagctgtggg tgagagtgtt 300
gaaaaccctc gccgctactt tgacaataac ttggttggaa caatcaatct atatgagacc 360
atggcaaagt acaactgcaa aatgatggtg ttttcatctt ctgccactgt ttatggacaa 420
cctgaaaaga ttccatgcat ggaagacttt gaattaaagg ctatgaatcc ttatggtcgt 480
actaagctct ttcttgaaga aatagctaga gatattcaaa aggcagaacc ggaatggaga 540
attattctgc tgaggtactt caatcctgta ggagcacatg agagtggcag tattggtgag 600
gatccaaaag gcatccccaa taacctcatg ccttacatcc aacaagtggc cgttggacgt 660
ttaccggaac tcaatgtcta tggacatgac tatcccaccg aggatggtag tgcggtaaga 720
gactacatcc atgtgatgga tttagcagat ggccatatcg ctgcgctcag gaagctattt 780
gctgatccaa agattggttg tactgcttac aatctaggga ctggtcaagg aacgtctgtg 840
ttagaaatgg ttgcagcttt tgaaaaagct tccggcaaga aaatcccgat taagctctgt 900
ccgagaaggt caggagatgc aacagcagtt tatgcttcaa cagagaaggc tgagaaagaa 960
cttggctgga aggcaaaata tggagtggat gagatgtgca gagatcagtg gaaatgggca 1020
aacaataatc catggggtta ccagaataag ctttga 1056
<210>241
<211>351
<212>PRT
<213>拟南芥
<400>241
Met Gly Ser Ser Val Glu Gln Asn Ile Leu Val Thr Gly Gly Ala Gly
1 5 10 15
Phe Ile Gly Thr His Thr Val Val Gln Leu Leu Lys Asp Gly Phe Lys
20 25 30
Val Ser Ile Ile Asp Asn Phe Asp Asn Ser Val Ile Glu Ala Val Asp
35 40 45
Arg Val Arg Glu Leu Val Gly Pro Asp Leu Ser Lys Lys Leu Asp Phe
50 55 60
Asn Leu Gly Asp Leu Arg Asn Lys Gly Asp Ile Glu Lys Leu Phe Ser
65 70 75 80
Lys Gln Arg Phe Asp Ala Val Ile His Phe Ala Gly Leu Lys Ala Val
85 90 95
Gly Glu Ser Val Glu Asn Pro Arg Arg Tyr Phe Asp Asn Asn Leu Val
100 105 110
Gly Thr Ile Asn Leu Tyr Glu Thr Met Ala Lys Tyr Asn Cys Lys Met
115 120 125
Met Val Phe Ser Ser Ser Ala Thr Val Tyr Gly Gln Pro Glu Lys Ile
130 135 140
Pro Cys Met Glu Asp Phe Glu Leu Lys Ala Met Asn Pro Tyr Gly Arg
145 150 155 160
Thr Lys Leu Phe Leu Glu Glu Ile Ala Arg Asp Ile Gln Lys Ala Glu
165 170 175
Pro Glu Trp Arg Ile Ile Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala
180 185 190
His Glu Ser Gly Ser Ile Gly Glu Asp Pro Lys Gly Ile Pro Asn Asn
195 200 205
Leu Met Pro Tyr Ile Gln Gln Val Ala Val Gly Arg Leu Pro Glu Leu
210 215 220
Asn Val Tyr Gly His Asp Tyr Pro Thr Glu Asp Gly Ser Ala Val Arg
225 230 235 240
Asp Tyr Ile His Val Met Asp Leu Ala Asp Gly His Ile Ala Ala Leu
245 250 255
Arg Lys Leu Phe Ala Asp Pro Lys Ile Gly Cys Thr Ala Tyr Asn Leu
260 265 270
Gly Thr Gly Gln Gly Thr Ser Val Leu Glu Met Val Ala Ala Phe Glu
275 280 285
Lys Ala Ser Gly Lys Lys Ile Pro Ile Lys Leu Cys Pro Arg Arg Ser
290 295 300
Gly Asp Ala Thr Ala Val Tyr Ala Ser Thr Glu Lys Ala Glu Lys Glu
305 310 315 320
Leu Gly Trp Lys Ala Lys Tyr Gly Val Asp Glu Met Cys Arg Asp Gln
325 330 335
Trp Lys Trp Ala Asn Asn Asn Pro Trp Gly Tyr Gln Asn Lys Leu
340 345 350
<210>242
<211>1056
<212>DNA
<213>拟南芥
<400>242
atgggttctt ctgtggaaca gaacattttg gtgactggtg gtgctggatt cattggaaca 60
catactgttg ttcagctttt gaatcagggt tttaaggtta cgatcattga taatcttgat 120
aactctgtcg ttgaagctgt tcatagggtt agggaacttg ttggtcctga tctctctacc 180
aagcttgaat tcaatctggg tgatctaaga aacaaaggag atattgagaa actcttttcc 240
aatcagagat ttgatgctgt gattcacttt gctggtctta aagctgtggg agaaagtgtt 300
ggaaaccctc gtcgttactt tgataataac ttagttggaa ctatcaatct atatgagacc 360
atggcaaaat acaactgcaa aatgatggtg ttttcgtcgt ctgcaacagt ttatggtcaa 420
cctgaaatag tcccatgtgt ggaagacttt gagttacagg ctatgaatcc ttatggtcgt 480
actaagctgt ttcttgaaga gatagctaga gacattcacg ctgcggaacc agaatggaag 540
ataattcttc tgaggtactt caatccggtt ggagctcacg agagtggaag aattggagaa 600
gatccaaagg gcataccgaa taatctcatg ccttatatcc aacaagtggc ggttggaaga 660
ttacctgaac tcaatgtatt tggacatgat tatcctacca tggatggtag cgcggttaga 720
gactacatcc atgtaatgga tttagcagat ggccatgtgg ctgcgttaaa caaattgttt 780
tcagactcaa agattggctg tactgcttat aatcttggca ctggtcaagg aacttctgtc 840
ttagaaatgg tttcttcttt tgaaaaagct tctggcaaga aaatacctat caagctatgt 900
ccaagaagag ctggagatgc aacagctgtt tatgcttcaa ctcagaaagc tgagaaggaa 960
cttggctgga aggcaaaata tggagttgat gagatgtgca gagatcaatg gaactgggca 1020
aataagaatc catggggttt ccagaagaag ccttga 1056
<210>243
<211>351
<212>PRT
<213>拟南芥
<400>243
Met Gly Ser Ser Val Glu Gln Asn Ile Leu Val Thr Gly Gly Ala Gly
1 5 10 15
Phe Ile Gly Thr His Thr Val Val Gln Leu Leu Asn Gln Gly Phe Lys
20 25 30
Val Thr Ile Ile Asp Asn Leu Asp Asn Ser Val Val Glu Ala Val His
35 40 45
Arg Val Arg Glu Leu Val Gly Pro Asp Leu Ser Thr Lys Leu Glu Phe
50 55 60
Asn Leu Gly Asp Leu Arg Asn Lys Gly Asp Ile Glu Lys Leu Phe Ser
65 70 75 80
Asn Gln Arg Phe Asp Ala Val Ile His Phe Ala Gly Leu Lys Ala Val
85 90 95
Gly Glu Ser Val Gly Asn Pro Arg Arg Tyr Phe Asp Asn Asn Leu Val
100 105 110
Gly Thr Ile Asn Leu Tyr Glu Thr Met Ala Lys Tyr Asn Cys Lys Met
115 120 125
Met Val Phe Ser Ser Ser Ala Thr Val Tyr Gly Gln Pro Glu Ile Val
130 135 140
Pro Cys Val Glu Asp Phe Glu Leu Gln Ala Met Asn Pro Tyr Gly Arg
145 150 155 160
Thr Lys Leu Phe Leu Glu Glu Ile Ala Arg Asp Ile His Ala Ala Glu
165 170 175
Pro Glu Trp Lys Ile Ile Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala
180 185 190
His Glu Ser Gly Arg Ile Gly Glu Asp Pro Lys Gly Ile Pro Asn Asn
195 200 205
Leu Met Pro Tyr Ile Gln Gln Val Ala Val Gly Arg Leu Pro Glu Leu
210 215 220
Asn Val Phe Gly His Asp Tyr Pro Thr Met Asp Gly Ser Ala Val Arg
225 230 235 240
Asp Tyr Ile His Val Met Asp Leu Ala Asp Gly His Val Ala Ala Leu
245 250 255
Asn Lys Leu Phe Ser Asp Ser Lys Ile Gly Cys Thr Ala Tyr Asn Leu
260 265 270
Gly Thr Gly Gln Gly Thr Ser Val Leu Glu Met Val Ser Ser Phe Glu
275 280 285
Lys Ala Ser Gly Lys Lys Ile Pro Ile Lys Leu Cys Pro Arg Arg Ala
290 295 300
Gly Asp Ala Thr Ala Val Tyr Ala Ser Thr Gln Lys Ala Glu Lys Glu
305 310 315 320
Leu Gly Trp Lys Ala Lys Tyr Gly Val Asp Glu Met Cys Arg Asp Gln
325 330 335
Trp Asn Trp Ala Asn Lys Asn Pro Trp Gly Phe Gln Lys Lys Pro
340 345 350
<210>244
<211>1047
<212>DNA
<213>拟南芥
<400>244
atggttggga atattctggt gaccggtggt gctggttaca tcggaagtca cacggttctt 60
cagcttcttc tcggaggcta taacaccgtc gttatagaca acctcgacaa ttcctctctc 120
gtttcgatcc aacgcgtcaa ggatctcgcc ggagatcatg gacaaaatct caccgtccac 180
caggtggacc ttcgcgataa acccgcactt gagaaggttt tctccgaaac aaagtttgat 240
gcagtaatgc attttgctgg attgaaagca gttggtgaga gcgtggcgaa accacttctg 300
tattataaca ataacttgat tgcgactatt acacttttgg aagtaatggc tgcacacgga 360
tgtaaaaagc ttgtattttc ttcgtccgct actgtgtatg gctggccaaa ggaggttcct 420
tgtacagaag agtctcccct gtctggaatg agtccttatg gacggacaaa gctgttcata 480
gaggacattt gccgtgatgt acaacgtggt gatcctgaat ggagaatcat aatgctgagg 540
tactttaacc ctgtgggagc tcaccctagc ggtcgcattg gtgaggatcc ttgtgggact 600
ccaaataatc tcatgcctta tgtccagcaa gtcgttgttg ggaggctacc taacctaaaa 660
atttatggaa ctgactatac cactaaagat ggcactggtg tacgagacta tattcatgtt 720
gttgatctag cagatggcca tatatgtgcg cttcaaaagc tagacgatac tgaaataggt 780
tgtgaggtat acaacctggg aaccggaaaa ggaacaacag tgttggagat ggttgatgca 840
tttgagaaag cttctggaat gaaaatccca ctggtgaagg ttggaaggag accaggtgat 900
gcagaaaccg tctatgcgtc aacagaaaaa gctgaacgcg aactaaactg gaaggcaaat 960
tttggaatcg aagaaatgtg tagggatcag tggaactggg caagcaacaa tcctttcggt 1020
tacggttctt caccaaactc aacataa 1047
<210>245
<211>348
<212>PRT
<213>拟南芥
<400>245
Met Val Gly Asn Ile Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser
1 5 10 15
His Thr Val Leu Gln Leu Leu Leu Gly Gly Tyr Asn Thr Val Val Ile
20 25 30
Asp Asn Leu Asp Asn Ser Ser Leu Val Ser Ile Gln Arg Val Lys Asp
35 40 45
Leu Ala Gly Asp His Gly Gln Asn Leu Thr Val His Gln Val Asp Leu
50 55 60
Arg Asp Lys Pro Ala Leu Glu Lys Val Phe Ser Glu Thr Lys Phe Asp
65 70 75 80
Ala Val Met His Phe Ala Gly Leu Lys Ala Val Gly Glu Ser Val Ala
85 90 95
Lys Pro Leu Leu Tyr Tyr Asn Asn Asn Leu Ile Ala Thr Ile Thr Leu
100 105 110
Leu Glu Val Met Ala Ala His Gly Cys Lys Lys Leu Val Phe Ser Ser
115 120 125
Ser Ala Thr Val Tyr Gly Trp Pro Lys Glu Val Pro Cys Thr Glu Glu
130 135 140
Ser Pro Leu Ser Gly Met Ser Pro Tyr Gly Arg Thr Lys Leu Phe Ile
145 150 155 160
Glu Asp Ile Cys Arg Asp Val Gln Arg Gly Asp Pro Glu Trp Arg Ile
165 170 175
Ile Met Leu Arg Tyr Phe Asn Pro Val Gly Ala His Pro Ser Gly Arg
180 185 190
Ile Gly Glu Asp Pro Cys Gly Thr Pro Asn Asn Leu Met Pro Tyr Val
195 200 205
Gln Gln Val Val Val Gly Arg Leu Pro Asn Leu Lys Ile Tyr Gly Thr
2l0 215 220
Asp Tyr Thr Thr Lys Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val
225 230 235 240
Val Asp Leu Ala Asp Gly His Ile Cys Ala Leu Gln Lys Leu Asp Asp
245 250 255
Thr Glu Ile Gly Cys Glu Val Tyr Asn Leu Gly Thr Gly Lys Gly Thr
260 265 270
Thr Val Leu Glu Met Val Asp Ala Phe Glu Lys Ala Ser Gly Met Lys
275 280 285
Ile Pro Leu Val Lys Val Gly Arg Arg Pro Gly Asp Ala Glu Thr Val
290 295 300
Tyr Ala Ser Thr Glu Lys Ala Glu Arg Glu Leu Asn Trp Lys Ala Asn
305 310 315 320
Phe Gly Ile Glu Glu Met Cys Arg Asp Gln Trp Asn Trp Ala Ser Asn
325 330 335
Asn Pro Phe Gly Tyr Gly Ser Ser Pro Asn Ser Thr
340 345
<210>246
<211>1056
<212>DNA
<213>拟南芥
<400>246
atgatggcta gaaacgttct agtaagcggt ggtgctggat acatcggtag tcacacggtg 60
cttcaacttc ttctcggtgg ttactccgtc gtagttgttg ataatctcga taattcctcc 120
gccgtctctc ttcaacgtgt gaagaaactc gcggctgaac acggagaacg cctctccttc 180
caccaggtgg atcttcgaga caggtctgct cttgagaaga tattctcaga aacaaagttt 240
gatgcagtga tacattttgc tggacttaaa gcagttggtg agagtgtaga gaagcctttg 300
ctttattata ataataatct tgttggtact attactcttt tggaagttat ggctcaacat 360
ggctgcaaaa atcttgtgtt ttcatcatca gcaactgtgt atggctctcc aaaagaagtt 420
ccttgtacag aggagtttcc aatttctgct ttgaacccat atggacgaac aaagctattc 480
attgaggaaa tctgccgcga tgtatacggt tctgacccgg aatggaagat tatattgctt 540
aggtatttca atcctgttgg tgcacatcct agtggtgaca ttggtgaaga ccctcgtggt 600
attccaaaca atctcatgcc ctttgtacaa caagtggctg ttggtaggag acctcatctc 660
actgtctttg gaaatgatta caatacaaaa gatggaacag gggttcgaga ttacattcat 720
gttattgatt tagctgatgg acacatagcg gctctacgta agctagaaga ttgcaagatc 780
ggttgtgaag tgtacaatct cggaacagga aatggaacat cagttcttga aatggttgat 840
gcttttgaaa aagcatccgg aaagaaaatc cctctggtga tcgcgggacg tcgaccggga 900
gatgctgaag ttgtatacgc ctcgacggaa agagcagaaa gtgaattgaa ttggaaggcc 960
aaatatggga ttgaggagat gtgtagagat ttgtggaact gggctagtaa taatccttat 1020
ggatatgatt cctcttctga agacaactct cattaa 1056
<210>247
<211>351
<212>PRT
<213>拟南芥
<400>247
Met Met Ala Arg Asn Val Leu Val Ser Gly Gly Ala Gly Tyr Ile Gly
1 5 10 15
Ser His Thr Val Leu Gln Leu Leu Leu Gly Gly Tyr Ser Val Val Val
20 25 30
Val Asp Asn Leu Asp Asn Ser Ser Ala Val Ser Leu Gln Arg Val Lys
35 40 45
Lys Leu Ala Ala Glu His Gly Glu Arg Leu Ser Phe His Gln Val Asp
50 55 60
Leu Arg Asp Arg Ser Ala Leu Glu Lys Ile Phe Ser Glu Thr Lys Phe
65 70 75 80
Asp Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly Glu Ser Val
85 90 95
Glu Lys Pro Leu Leu Tyr Tyr Asn Asn Asn Leu Val Gly Thr Ile Thr
100 105 110
Leu Leu Glu Val Met Ala Gln His Gly Cys Lys Asn Leu Val Phe Ser
115 120 125
Ser Ser Ala Thr Val Tyr Gly Ser Pro Lys Glu Val Pro Cys Thr Glu
130 135 140
Glu Phe Pro Ile Ser Ala Leu Asn Pro Tyr Gly Arg Thr Lys Leu Phe
145 150 155 160
Ile Glu Glu Ile Cys Arg Asp Val Tyr Gly Ser Asp Pro Glu Trp Lys
165 170 175
Ile Ile Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala His Pro Ser Gly
180 185 190
Asp Ile Gly Glu Asp Pro Arg Gly Ile Pro Asn Asn Leu Met Pro Phe
195 200 205
Val Gln Gln Val Ala Val Gly Arg Arg Pro His Leu Thr Val Phe Gly
210 215 220
Asn Asp Tyr Asn Thr Lys Asp Gly Thr Gly Val Arg Asp Tyr Ile His
225 230 235 240
Val Ile Asp Leu Ala Asp Gly His Ile Ala Ala Leu Arg Lys Leu Glu
245 250 255
Asp Cys Lys Ile Gly Cys Glu Val Tyr Asn Leu Gly Thr Gly Asn Gly
260 265 270
Thr Ser Val Leu Glu Met Val Asp Ala Phe Glu Lys Ala Ser Gly Lys
275 280 285
Lys Ile Pro Leu Val Ile Ala Gly Arg Arg Pro Gly Asp Ala Glu Val
290 295 300
Val Tyr Ala Ser Thr Glu Arg Ala Glu Ser Glu Leu Asn Trp Lys Ala
305 310 315 320
Lys Tyr Gly Ile Glu Glu Met Cys Arg Asp Leu Trp Asn Trp Ala Ser
325 330 335
Asn Asn Pro Tyr Gly Tyr Asp Ser Ser Ser Glu Asp Asn Ser His
340 345 350
<210>248
<211>1053
<212>DNA
<213>拟南芥
<400>248
atggcgaaga gtgttttggt taccggcggc gctggctata tcggaagtca tactgttctt 60
caactgcttg aaggtggtta ctccgccgtc gttgttgaca attacgacaa ttcctctgct 120
gcttcgcttc agcgcgtgaa gaaactcgcc ggcgaaaacg gaaaccgcct ctccttccac 180
caggtggatc tccgagacag gcctgcgctt gagaagatat tctcagaaac aaagtttgat 240
gcagtgatac actttgctgg acttaaagca gtaggtgaga gtgtggagaa gcctttgctc 300
tattataata ataacattgt tggcactgtt actcttttgg aggttatggc tcaatacggc 360
tgcaaaaatc ttgtattttc atcatcagct actgtctatg gctggcctaa ggaggttcct 420
tgcactgagg agtcaccaat ttctgccact aacccatatg gccgtacaaa gctttttatc 480
gaagagattt gccgggatgt acatcgttct gactcggaat ggaagatcat attgcttaga 540
tacttcaacc ctgttggtgc acatcctagt ggttacattg gtgaagatcc tcttggagtt 600
cccaacaatc tcatgcctta tgtccaacaa gttgcagttg gccggagacc tcaccttact 660
gtctttggaa ccgactacaa gacaaaggat ggtacagggg ttagagatta cattcatgtc 720
atggatttag cagatggaca catagctgct ctgcgtaagc tagatgatct caaaatcagt 780
tgtgaggtat acaatcttgg aacgggtaat ggaacatcgg tcctagaaat ggtcgctgcc 840
tttgaaaaag catccggaaa gaaaatccct ttggtgatgg ctggacgacg tcctggagac 900
gctgaagttg tttacgcctc aacggaaaaa gcagagcgcg aactaaattg gaaggctaag 960
aatgggatag aggagatgtg tagggatcta tggaattggg caagcaataa cccctacggc 1020
tacaattcct cctccaatgg ctcctcttca taa 1053
<210>249
<211>350
<212>PRT
<213>拟南芥
<400>249
Met Ala Lys Ser Val Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser
1 5 10 15
His Thr Val Leu Gln Leu Leu Glu Gly Gly Tyr Ser Ala Val Val Val
20 25 30
Asp Asn Tyr Asp Asn Ser Ser Ala Ala Ser Leu Gln Arg Val Lys Lys
35 40 45
Leu Ala Gly Glu Asn Gly Asn Arg Leu Ser Phe His Gln Val Asp Leu
50 55 60
Arg Asp Arg Pro Ala Leu Glu Lys Ile Phe Ser Glu Thr Lys Phe Asp
65 70 75 80
Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly Glu Ser Val Glu
85 90 95
Lys Pro Leu Leu Tyr Tyr Asn Asn Asn Ile Val Gly Thr Val Thr Leu
100 105 110
Leu Glu Val Met Ala Gln Tyr Gly Cys Lys Asn Leu Val Phe Ser Ser
115 120 125
Ser Ala Thr Val Tyr Gly Trp Pro Lys Glu Val Pro Cys Thr Glu Glu
130 135 140
Ser Pro Ile Ser Ala Thr Asn Pro Tyr Gly Arg Thr Lys Leu Phe Ile
145 150 155 160
Glu Glu Ile Cys Arg Asp Val His Arg Ser Asp Ser Glu Trp Lys Ile
165 170 175
Ile Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala His Pro Ser Gly Tyr
180 185 190
Ile Gly Glu Asp Pro Leu Gly Val Pro Asn Asn Leu Met Pro Tyr Val
195 200 205
Gln Gln Val Ala Val Gly Arg Arg Pro His Leu Thr Val Phe Gly Thr
210 215 220
Asp Tyr Lys Thr Lys Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val
225 230 235 240
Met Asp Leu Ala Asp Gly His Ile Ala Ala Leu Arg Lys Leu Asp Asp
245 250 255
Leu Lys Ile Ser Cys Glu Val Tyr Asn Leu Gly Thr Gly Asn Gly Thr
260 265 270
Ser Val Leu Glu Met Val Ala Ala Phe Glu Lys Ala Ser Gly Lys Lys
275 280 285
Ile Pro Leu Val Met Ala Gly Arg Arg Pro Gly Asp Ala Glu Val Val
290 295 300
Tyr Ala Ser Thr Glu Lys Ala Glu Arg Glu Leu Asn Trp Lys Ala Lys
305 310 315 320
Asn Gly Ile Glu Glu Met Cys Arg Asp Leu Trp Asn Trp Ala Ser Asn
325 330 335
Asn Pro Tyr Gly Tyr Asn Ser Ser Ser Asn Gly Ser Ser Ser
340 345 350
<210>250
<211>1137
<212>DNA
<213>Populus tremuloides
<400>250
atggattatc tggattcaag acgaaagagc agatgtgctg gaaaaattat tgcagctgcg 60
ctctgcatta cattctccca gcatgagctc ggcgtaacgc atgtcttagt gactggaggt 120
gctgggtata ttggctctca tgctgcactt cgactcttga aggattcata ccgtgtaact 180
aaagtggaca atctttctcg agggaatctg ggtgctgtta aagttctcca agatctattt 240
ccggagcctg ggcggttaca gttcatatac gcagacttgg gagatgcaaa agctgtaaac 300
aaaatctttg ctgaaaatgc atttgatgct gtgatgcatt tcgctgctgt tgcatatgtt 360
ggtgaaagta caatggaacc tctcagatat tatcacaaca tcacatcaaa taccttggta 420
gttttagaag caatggcagc acataaggtg aagacattga tttattctag cacttgtgca 480
acttacggcg agcctgttaa gatgccgatt acagaacaaa ctcctcagct tccaatcaac 540
ccctatggaa aagccaagaa aatggcagaa gatatcataa ttgacttctc aaaaaccact 600
gacatggctg tcatgatcct aagatacttc aatgttattg ggtctgatcc agaaggaaga 660
ttaggggaag ctccgcaacc tgaacttcgt gagcatggcc gaatctctgg cgcttgtttt 720
gatgcagctc gaggaataat accaggacta aaacagagaa tcacaattca gtggatagac 780
tataaaactg ctgatggcac gtgtgtacgg gactatatcg atgtcactga cctggtcgat 840
gcccatgtga aagctcttgc ccatgcaaag cctcgaaaag ttggcattta caatgttgga 900
actggaaaag gtagatcagt gaaggagttt gtcgaggcat gtaagaaggc aacaggtgtg 960
gacataaagg ttgaatacct caatcgtcgg ccaggagact atgctgaggt cttcagtgac 1020
ccttccaaaa taaaacaaga gctaaactgg aaagctcaat atactgacct taagaagagt 1080
ttgcagattg catggaaatg gcagaagtca catttgaatg gttacagtca cagttaa 1137
<210>251
<211>378
<212>PRT
<213>Populus tremuloides
<400>251
Met Asp Tyr Leu Asp Ser Arg Arg Lys Ser Arg Cys Ala Gly Lys Ile
1 5 10 15
Ile Ala Ala Ala Leu Cys Ile Thr Phe Ser Gln His Glu Leu Gly Val
20 25 30
Thr His Val Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Ala
35 40 45
Ala Leu Arg Leu Leu Lys Asp Ser Tyr Arg Val Thr Lys Val Asp Asn
50 55 60
Leu Ser Arg Gly Asn Leu Gly Ala Val Lys Val Leu Gln Asp Leu Phe
65 70 75 80
Pro Glu Pro Gly Arg Leu Gln Phe Ile Tyr Ala Asp Leu Gly Asp Ala
85 90 95
Lys Ala Val Asn Lys Ile Phe Ala Glu Asn Ala Phe Asp Ala Val Met
100 105 110
His Phe Ala Ala Val Ala Tyr Val Gly Glu Ser Thr Met Glu Pro Leu
115 120 125
Arg Tyr Tyr His Asn Ile Thr Ser Asn Thr Leu Val Val Leu Glu Ala
130 135 140
Met Ala Ala His Lys Val Lys Thr Leu Ile Tyr Ser Ser Thr Cys Ala
145 150 155 160
Thr Tyr Gly Glu Pro Val Lys Met Pro Ile Thr Glu Gln Thr Pro Gln
165 170 175
Leu Pro Ile Asn Pro Tyr Gly Lys Ala Lys Lys Met Ala Glu Asp Ile
180 185 190
Ile Ile Asp Phe Ser Lys Thr Thr Asp Met Ala Val Met Ile Leu Arg
195 200 205
Tyr Phe Asn Val Ile Gly Ser Asp Pro Glu Gly Arg Leu Gly Glu Ala
210 215 220
Pro Gln Pro Glu Leu Arg Glu His Gly Arg Ile Ser Gly Ala Cys Phe
225 230 235 240
Asp Ala Ala Arg Gly Ile Ile Pro Gly Leu Lys Gln Arg Ile Thr Ile
245 250 255
Gln Trp Ile Asp Tyr Lys Thr Ala Asp Gly Thr Cys Val Arg Asp Tyr
260 265 270
Ile Asp Val Thr Asp Leu Val Asp Ala His Val Lys Ala Leu Ala His
275 280 285
Ala Lys Pro Arg Lys Val Gly Ile Tyr Asn Val Gly Thr Gly Lys Gly
290 295 300
Arg Ser Val Lys Glu Phe Val Glu Ala Cys Lys Lys Ala Thr Gly Val
305 310 315 320
Asp Ile Lys Val Glu Tyr Leu Asn Arg Arg Pro Gly Asp Tyr Ala Glu
325 330 335
Val Phe Ser Asp Pro Ser Lys Ile Lys Gln Glu Leu Asn Trp Lys Ala
340 345 350
Gln Tyr Thr Asp Leu Lys Lys Ser Leu Gln Ile Ala Trp Lys Trp Gln
355 360 365
Lys Ser His Leu Asn Gly Tyr Ser His Ser
370 375
<210>252
<211>1254
<212>DNA
<213>Populus tremuloides
<400>252
atgctaaact ttggcaggac cagagctcag acaaggtcca atagatctat atctcttgga 60
ggcatggatt attcagatcc aaaaaggaaa aacaacgttg taggaaagat tcttttggct 120
gctaccctca cagctttatg tataattatg ctaaagcaat ctccgacctt ttattctcca 180
agcccgttct ctttgcatga agaaggggtg atccatgtcc tagtgacagg tggtgctggc 240
tacattggtt cccatgctgc attgcgactt ttgaaggatg gttaccgagt aaccatagtg 300
gacaaccttt ctcgaggaaa cataggtgca gtcaaggttt tacaagaatt atttccagag 360
cccgggaggc ttcagtttat atatgctgac ctgggagatc ctaaaactgt taacattatc 420
ttctcacaaa atgcatttga tgctgtgatg cattttgcgg cagttgcata tgttggggaa 480
agcaccatgg aacccctgaa gtactatcac aatatcacat caaatacctt ggtagttttg 540
gaggcaatgg ctgcaaatga tgtaaagact ttgatatatt caagtacatg tgcaacatat 600
ggggagcctg aaaagatgcc gattactgaa gtaactccac aggtacccat taatccatat 660
ggaaaagcta agaagatggc agaagatatc atccttgatt tttctaaaaa ctcagacatg 720
gcaattatga tattgagata cttcaatgtg attggatcag atccagatgg caggttaggt 780
gaggctccta gacctgaact gcgtgagcat ggacgaattt ccggtgcttg tttcgatgca 840
gctcgtggta ttattgctgg gctgaaggtt aaaggaacag actataagac gcatgatgga 900
acttgtataa gagattatat tgacgttact gatcttgttg atgctcatgt taaagcactt 960
gaaaaggcaa tgcctggtaa agtaggaatc tacaatgttg gcactggaaa gggtagatca 1020
gtcaaggagt ttgttaaggc atgtaaaaag gcaactggtg tagatatcaa agttgactat 1080
ttacctcgcc gtcctggtga ctacgctgaa gtattcagtg acccatcaaa aatttaccgc 1140
gagctgaact ggacagcgca atacacggat ctccagaaga gcttacagac tgcatggaga 1200
tggcaaaaat cacatcaaaa tgggtatgga tcccctttgg tgatggcttc ttga 1254
<210>253
<211>417
<212>PRT
<213>Populus tremuloides
<400>253
Met Leu Asn Phe Gly Arg Thr Arg Ala Gln Thr Arg Ser Asn Arg Ser
1 5 10 15
Ile Ser Leu Gly Gly Met Asp Tyr Ser Asp Pro Lys Arg Lys Asn Asn
20 25 30
Val Val Gly Lys Ile Leu Leu Ala Ala Thr Leu Thr Ala Leu Cys Ile
35 40 45
Ile Met Leu Lys Gln Ser Pro Thr Phe Tyr Ser Pro Ser Pro Phe Ser
50 55 60
Leu His Glu Glu Gly Val Ile His Val Leu Val Thr Gly Gly Ala Gly
65 70 75 80
Tyr Ile Gly Ser His Ala Ala Leu Arg Leu Leu Lys Asp Gly Tyr Arg
85 90 95
Val Thr Ile Val Asp Asn Leu Ser Arg Gly Asn Ile Gly Ala Val Lys
100 105 110
Val Leu Gln Glu Leu Phe Pro Glu Pro Gly Arg Leu Gln Phe Ile Tyr
115 120 125
Ala Asp Leu Gly Asp Pro Lys Thr Val Asn Ile Ile Phe Ser Gln Asn
130 135 140
Ala Phe Asp Ala Val Met His Phe Ala Ala Val Ala Tyr Val Gly Glu
145 150 155 160
Ser Thr Met Glu Pro Leu Lys Tyr Tyr His Asn Ile Thr Ser Asn Thr
165 170 175
Leu Val Val Leu Glu Ala Met Ala Ala Asn Asp Val Lys Thr Leu Ile
180 185 190
Tyr Ser Ser Thr Cys Ala Thr Tyr Gly Glu Pro Glu Lys Met Pro Ile
195 200 205
Thr Glu Val Thr Pro Gln Val Pro Ile Asn Pro Tyr Gly Lys Ala Lys
210 215 220
Lys Met Ala Glu Asp Ile Ile Leu Asp Phe Ser Lys Asn Ser Asp Met
225 230 235 240
Ala Ile Met Ile Leu Arg Tyr Phe Asn Val Ile Gly Ser Asp Pro Asp
245 250 255
Gly Arg Leu Gly Glu Ala Pro Arg Pro Glu Leu Arg Glu His Gly Arg
260 265 270
Ile Ser Gly Ala Cys Phe Asp Ala Ala Arg Gly Ile Ile Ala Gly Leu
275 280 285
Lys Val Lys Gly Thr Asp Tyr Lys Thr His Asp Gly Thr Cys Ile Arg
290 295 300
Asp Tyr Ile Asp Val Thr Asp Leu Val Asp Ala His Val Lys Ala Leu
305 310 315 320
Glu Lys Ala Met Pro Gly Lys Val Gly Ile Tyr Asn Val Gly Thr Gly
325 330 335
Lys Gly Arg Ser Val Lys Glu Phe Val Lys Ala Cys Lys Lys Ala Thr
340 345 350
Gly Val Asp Ile Lys Val Asp Tyr Leu Pro Arg Arg Pro Gly Asp Tyr
355 360 365
Ala Glu Val Phe Ser Asp Pro Ser Lys Ile Tyr Arg Glu Leu Asn Trp
370 375 380
Thr Ala Gln Tyr Thr Asp Leu Gln Lys Ser Leu Gln Thr Ala Trp Arg
385 390 395 400
Trp Gln Lys Ser His Gln Asn Gly Tyr Gly Ser Pro Leu Val Met Ala
405 410 415
Ser
<210>254
<211>1233
<212>DNA
<213>Populus tremuloides
<400>254
atggtgcaca agggctctgg tatggatttc ctggattcaa gaagaaagag caattctgct 60
ggaaaagtta ttgcagttgc attcttcatt gcagtatgca ttgtcatgct caagcaagtg 120
tactcaccta gttataccag ccccgacatg ttctcccaac atgagctagg cgtaacgcat 180
gtgttggtga ccggaggtgc tggttacata ggttctcacg ctgcacttcg actcttgaag 240
gattcatacc gagtaactat agtggacaat ctctctcgag ggaatctcgg tgcggttaaa 300
gttcttcaag agctatttcc agagcctggg agattgcagt tcatatatgc tgacctagga 360
gatgcaaaag ctgtaaacaa aatctttgcc gaaaatgcat ttgatgctgt gatgcatttt 420
gctgctgttg catatgttgg tgaaagtaca atagagcccc ttagatatta tcacaatatc 480
acatcaaata ccttggttgt cttggaagca atggctgcac ataatgtgaa gacattaatc 540
tattcgagca cttgtgcaac gtacggagaa cctattaaga tgccgattag agaagaaact 600
cctcagcttc caatcaaccc ctatggaaaa gccaagaaaa tggcagaaga tatcataatt 660
gacttctcca acaccactga catggctgtc atgatcctaa gcatccagca ttctgatcaa 720
aataatgcct atgtttacag atacttcaat gttattgggt ctgacccgga aggaagatta 780
ggggaagctc cacgacctga gcttcgtgag catggccgaa tctctggtgc ttgttttgat 840
gcagctcgag ggataacacc tggactcaag gttaaaggga cagactataa aacagctgat 900
ggcacatgtg tacgcgacta tatcgatgtc actgacctgg ttgatgccca tgtgaaagct 960
cttgcccacg caaaacctcg gaaagttggc atttacaatg ttggaactgg aaaaggcaga 1020
tcagtgaagg agtttgttga tgcgtgtaag aaggcaacag gcgtggacat aaaggttgaa 1080
taccttgatc gccggccagg agactatgct gaggtcttca gtgatccttc caaaataaaa 1140
caagagctaa gctggacagc tcaatatact gaccttcaga agagtttaca gattgcttgg 1200
aaatggcaga agtcacattt gaatggttat tga 1233
<210>255
<211>410
<212>PRT
<213>Populus tremuloides
<400>255
Met Val His Lys Gly Ser Gly Met Asp Phe Leu Asp Ser Arg Arg Lys
1 5 10 15
Ser Asn Ser Ala Gly Lys Val Ile Ala Val Ala Phe Phe Ile Ala Val
20 25 30
Cys Ile Val Met Leu Lys Gln Val Tyr Ser Pro Ser Tyr Thr Ser Pro
35 40 45
Asp Met Phe Ser Gln His Glu Leu Gly Val Thr His Val Leu Val Thr
50 55 60
Gly Gly Ala Gly Tyr Ile Gly Ser His Ala Ala Leu Arg Leu Leu Lys
65 70 75 80
Asp Ser Tyr Arg Val Thr Ile Val Asp Asn Leu Ser Arg Gly Asn Leu
85 90 95
Gly Ala Val Lys Val Leu Gln Glu Leu Phe Pro Glu Pro Gly Arg Leu
100 105 110
Gln Phe Ile Tyr Ala Asp Leu Gly Asp Ala Lys Ala Val Asn Lys Ile
115 120 125
Phe Ala Glu Asn Ala Phe Asp Ala Val Met His Phe Ala Ala Val Ala
130 135 140
Tyr Val Gly Glu Ser Thr Ile Glu Pro Leu Arg Tyr Tyr His Asn Ile
145 150 155 160
Thr Ser Asn Thr Leu Val Val Leu Glu Ala Met Ala Ala His Asn Val
165 170 175
Lys Thr Leu Ile Tyr Ser Ser Thr Cys Ala Thr Tyr Gly Glu Pro Ile
180 185 190
Lys Met Pro Ile Arg Glu Glu Thr Pro Gln Leu Pro Ile Asn Pro Tyr
195 200 205
Gly Lys Ala Lys Lys Met Ala Glu Asp Ile Ile Ile Asp Phe Ser Asn
210 215 220
Thr Thr Asp Met Ala Val Met Ile Leu Ser Ile Gln His Ser Asp Gln
225 230 235 240
Asn Asn Ala Tyr Val Tyr Arg Tyr Phe Asn Val Ile Gly Ser Asp Pro
245 250 255
Glu Gly Arg Leu Gly Glu Ala Pro Arg Pro Glu Leu Arg Glu His Gly
260 265 270
Arg Ile Ser Gly Ala Cys Phe Asp Ala Ala Arg Gly Ile Thr Pro Gly
275 280 285
Leu Lys Val Lys Gly Thr Asp Tyr Lys Thr Ala Asp Gly Thr Cys Val
290 295 300
Arg Asp Tyr Ile Asp Val Thr Asp Leu Val Asp Ala His Val Lys Ala
305 310 315 320
Leu Ala His Ala Lys Pro Arg Lys Val Gly Ile Tyr Asn Val Gly Thr
325 330 335
Gly Lys Gly Arg Ser Val Lys Glu Phe Val Asp Ala Cys Lys Lys Ala
340 345 350
Thr Gly Val Asp Ile Lys Val Glu Tyr Leu Asp Arg Arg Pro Gly Asp
355 360 365
Tyr Ala Glu Val Phe Ser Asp Pro Ser Lys Ile Lys Gln Glu Leu Ser
370 375 380
Trp Thr Ala Gln Tyr Thr Asp Leu Gln Lys Ser Leu Gln Ile Ala Trp
385 390 395 400
Lys Trp Gln Lys Ser His Leu Asn Gly Tyr
405 410
<210>256
<211>627
<212>DNA
<213>Populus tremuloides
<400>256
atggctggac aaacaattct tgtgactggt ggggctgggt ttattggcac tcacacagta 60
gtacagctcc taaaggaagg ttttaaggtt tcaatcattg acaatcttga taattctgtc 120
actgaagctg ttgatcgtgt taaggaagtg gtgggtcctc agctttctaa gaatcttgaa 180
ttcaatctgg gtgatcttag aaacaaggat gatttggaga agttgttttc aagaactaag 240
ttcgatgctg tgatccattt tgctggtctc aaggcagttg gggagagtgt tgctaatcca 300
cgtagatatt ttgacaataa tctggttggc accatcaatc tctatgaagt tatggcaaaa 360
tacaattgca agaagatggt tttctcatca tcagcaactg tttatggcca acctgaaaaa 420
attccttgtg ttgaggactt caacctaatg gcaatgaatc cttatggacg taccaagaaa 480
ttgctcgaga tattcaaaag gcagaaccag aatggagtat cattttactt aggtacttca 540
accccgtggg agctcatgag agtggtaaac ttggtgaaga tcccaagggt atcccaaaca 600
atctcatgcc ctacatacaa caagtag 627
<210>257
<211>208
<212>PRT
<213>Populus tremuloides
<400>257
Met Ala Gly Gln Thr Ile Leu Val Thr Gly Gly Ala Gly Phe Ile Gly
1 5 10 15
Thr His Thr Val Val Gln Leu Leu Lys Glu Gly Phe Lys Val Ser Ile
20 25 30
Ile Asp Asn Leu Asp Asn Ser Val Thr Glu Ala Val Asp Arg Val Lys
35 40 45
Glu Val Val Gly Pro Gln Leu Ser Lys Asn Leu Glu Phe Asn Leu Gly
50 55 60
Asp Leu Arg Asn Lys Asp Asp Leu Glu Lys Leu Phe Ser Arg Thr Lys
65 70 75 80
Phe Asp Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly Glu Ser
85 90 95
Val Ala Asn Pro Arg Arg Tyr Phe Asp Asn Asn Leu Val Gly Thr Ile
100 105 110
Asn Leu Tyr Glu Val Met Ala Lys Tyr Asn Cys Lys Lys Met Val Phe
115 120 125
Ser Ser Ser Ala Thr Val Tyr Gly Gln Pro Glu Lys Ile Pro Cys Val
130 135 140
Glu Asp Phe Asn Leu Met Ala Met Asn Pro Tyr Gly Arg Thr Lys Lys
145 150 155 160
Leu Leu Glu Ile Phe Lys Arg Gln Asn Gln Asn Gly Val Ser Phe Tyr
165 170 175
Leu Gly Thr Ser Thr Pro Trp Glu Leu Met Arg Val Val Asn Leu Val
180 185 190
Lys Ile Pro Arg Val Ser Gln Thr Ile Ser Cys Pro Thr Tyr Asn Lys
195 200 205
<210>258
<211>1047
<212>DNA
<213>Populus tremuloides
<400>258
atggcgaaga gtatcttggt taccggcggt gccggttaca tagggagcca tacggtgctg 60
cagcttttac ttggcggtta cagcatcgtg gttgttgata atctcgacaa ctcctctgat 120
attgctctta aaagagttaa agaactcgcc ggtgatttcg gtaaaaacct cgtctttcac 180
caggttgatc tccgggataa gccagcactg gaaaaaattt ttgccaggac aaaatttgat 240
gctgtcattc actttgctgg gctgaaagcg gttggtgaga gtgtgcagaa accattgctt 300
tactttaaca acaatctcat tggaacaatt accctgctag aagttatgac ttcccatgga 360
tgcaagcagt tggtgttttc atcttcggct actgtttatg gttgcccaaa ggaggttcca 420
tgtacagaag agtttccttt gtctgctgcc agcccatacg gaagaaccaa gctcttcatt 480
gaagggatct gctgtgatat ccaccgttca gactctgaat ggaagatcat tttgcttaga 540
tacttcaatc cagttggtgc acatccaagt ggtcatattg gtgaggatcc acttggaatt 600
ccaaacaatc tcatgcccta tgtgcagcaa gttgctgttg gcaggcggcc tcatctaacc 660
gtttatggaa ctgattattc aactaaagat ggcactgggg tacgtgatta cattcatgtt 720
gttgatttag cggatgggca cattgctgca ttgcgtaagc tctctgatgc taatataggt 780
tgtgaagtgt acaacttggg aacaggaaaa ggtacatccg ttctggagat ggttgcggca 840
tttgaaaagg catctagaaa gaaaattccc cttgtaatgg ccgctcggcg acctggtgat 900
gctgaaattg tgtatgcagc aacagagaag gcagaacgtg aattgaattg gaaggcaaaa 960
tatggcattg atgagatgtg tagggatcaa tggaactggg ccggcaagaa cccttatggc 1020
tatggatctt ctgacagcac taactaa 1047
<210>259
<211>348
<212>PRT
<213>Populus tremuloides
<400>259
Met Ala Lys Ser Ile Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser
1 5 10 15
His Thr Val Leu Gln Leu Leu Leu Gly Gly Tyr Ser Ile Val Val Val
20 25 30
Asp Asn Leu Asp Asn Ser Ser Asp Ile Ala Leu Lys Arg Val Lys Glu
35 40 45
Leu Ala Gly Asp Phe Gly Lys Asn Leu Val Phe His Gln Val Asp Leu
50 55 60
Arg Asp Lys Pro Ala Leu Glu Lys Ile Phe Ala Arg Thr Lys Phe Asp
65 70 75 80
Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly Glu Ser Val Gln
85 90 95
Lys Pro Leu Leu Tyr Phe Asn Asn Asn Leu Ile Gly Thr Ile Thr Leu
100 105 110
Leu Glu Val Met Thr Ser His Gly Cys Lys Gln Leu Val Phe Ser Ser
115 120 125
Ser Ala Thr Val Tyr Gly Cys Pro Lys Glu Val Pro Cys Thr Glu Glu
130 135 140
Phe Pro Leu Ser Ala Ala Ser Pro Tyr Gly Arg Thr Lys Leu Phe Ile
145 150 155 160
Glu Gly Ile Cys Cys Asp Ile His Arg Ser Asp Ser Glu Trp Lys Ile
165 170 175
Ile Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala His Pro Ser Gly His
180 185 190
Ile Gly Glu Asp Pro Leu Gly Ile Pro Asn Asn Leu Met Pro Tyr Val
195 200 205
Gln Gln Val Ala Val Gly Arg Arg Pro His Leu Thr Val Tyr Gly Thr
210 215 220
Asp Tyr Ser Thr Lys Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val
225 230 235 240
Val Asp Leu Ala Asp Gly His Ile Ala Ala Leu Arg Lys Leu Ser Asp
245 250 255
Ala Asn Ile Gly Cys Glu Val Tyr Asn Leu Gly Thr Gly Lys Gly Thr
260 265 270
Ser Val Leu Glu Met Val Ala Ala Phe Glu Lys Ala Ser Arg Lys Lys
275 280 285
Ile Pro Leu Val Met Ala Ala Arg Arg Pro Gly Asp Ala Glu Ile Val
290 295 300
Tyr Ala Ala Thr Glu Lys Ala Glu Arg Glu Leu Asn Trp Lys Ala Lys
305 310 315 320
Tyr Gly Ile Asp Glu Met Cys Arg Asp Gln Trp Asn Trp Ala Gly Lys
325 330 335
Asn Pro Tyr Gly Tyr Gly Ser Ser Asp Ser Thr Asn
340 345
<210>260
<211>990
<212>DNA
<213>Populus tremuloides
<400>260
atggcctata atattctggt tacaggcggt gctggttaca taggaagcca cacggtgctg 60
caacttttat taggcggcta caacactgtg gttgttgata acctcgacaa cgcctctgat 120
attgctctta aaagagttaa agaactcgcc ggtgatttcg gcaaaaacct cgtctttcac 180
caggttgatc tccgggacaa gccggctctg gaaaatgttt tcgccgagac aaagtttgat 240
gctgtcattc actttgctgg gctgaaagca gttggtgaga gtatgcagaa accattgctt 300
tatttcaaca ataatctcat tggaacaatt actctgctag aagttatggc tgctcatgga 360
tgcaagcagg taattttctc taggttgctt tgcattggtg ttttcatctt cagctactgt 420
ttatggttgg ccgaaggagg ttccatgtac agaagagttc cctttgtctg ctgcaaaccc 480
atatggaaga accaagagat ctgccgcgat atctacagtt cagattctga atggaagatc 540
atattactca gatactttaa tccagttggt gcacatccaa gtggctatat tggtgaggat 600
cctcgtggaa ttccaaacaa tctcatgccc tatgtgcagc aagttgctgt tggcaggagg 660
cctcatctaa cagtttttgg aactgattat ccaacaaaag acggtaccgg ggtacgtgat 720
tacattcatg ttgtcgattt agcagatggg cacattgctg cattgcgtaa gctctctgaa 780
gctaatatag gttgtgaagt gtacaacttg ggaacaggga aaggtacatc agttctggag 840
atggtcgcag catttgaaaa ggcatctgga aagagtccca tcttcgtgtg ccagaaaatt 900
cctcttgtaa tggctgatcg gcgacctggt gatgctgaaa ctgtgtatgc agcaacagag 960
aaggcagaac gtgaattgag ttggaagtaa 990
<210>261
<211>329
<212>PRT
<213>Populus tremuloides
<400>261
Met Ala Tyr Asn Ile Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser
1 5 10 15
His Thr Val Leu Gln Leu Leu Leu Gly Gly Tyr Asn Thr Val Val Val
20 25 30
Asp Asn Leu Asp Asn Ala Ser Asp Ile Ala Leu Lys Arg Val Lys Glu
35 40 45
Leu Ala Gly Asp Phe Gly Lys Asn Leu Val Phe His Gln Val Asp Leu
50 55 60
Arg Asp Lys Pro Ala Leu Glu Asn Val Phe Ala Glu Thr Lys Phe Asp
65 70 75 80
Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly Glu Ser Met Gln
85 90 95
Lys Pro Leu Leu Tyr Phe Asn Asn Asn Leu Ile Gly Thr Ile Thr Leu
100 105 110
Leu Glu Val Met Ala Ala His Gly Cys Lys Gln Val Ile Phe Ser Arg
115 120 125
Leu Leu Cys Ile Gly Val Phe Ile Phe Ser Tyr Cys Leu Trp Leu Ala
130 135 140
Glu Gly Gly Ser Met Tyr Arg Arg Val Pro Phe Val Cys Cys Lys Pro
145 150 155 160
Ile Trp Lys Asn Gln Glu Ile Cys Arg Asp Ile Tyr Ser Ser Asp Ser
165 170 175
Glu Trp Lys Ile Ile Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala His
180 185 190
Pro Ser Gly Tyr Ile Gly Glu Asp Pro Arg Gly Ile Pro Asn Asn Leu
195 200 205
Met Pro Tyr Val Gln Gln Val Ala Val Gly Arg Arg Pro His Leu Thr
210 215 220
Val Phe Gly Thr Asp Tyr Pro Thr Lys Asp Gly Thr Gly Val Arg Asp
225 230 235 240
Tyr Ile His Val Val Asp Leu Ala Asp Gly His Ile Ala Ala Leu Arg
245 250 255
Lys Leu Ser Glu Ala Asn Ile Gly Cys Glu Val Tyr Asn Leu Gly Thr
260 265 270
Gly Lys Gly Thr Ser Val Leu Glu Met Val Ala Ala Phe Glu Lys Ala
275 280 285
Ser Gly Lys Ser Pro Ile Phe Val Cys Gln Lys Ile Pro Leu Val Met
290 295 300
Ala Asp Arg Arg Pro Gly Asp Ala Glu Thr Val Tyr Ala Ala Thr Glu
305 310 315 320
Lys Ala Glu Arg Glu Leu Ser Trp Lys
325
<210>262
<211>1254
<212>DNA
<213>Populus tremuloides
<400>262
atgctaagtt ttggcaggac cagaactcag ccaaggtcca atagatctat gtcccttgga 60
ggcatggatt tttcagatcc aaaaagaaaa aataatgttg taggaaagat tcttttggcc 120
gcttccctaa cagctgtatg tataattatg ctgaaacaat ctccaacctt taattctcca 180
agcccgttct ctttgcgtga agatggggtg atccatgtcc ttgtgacagg tggtgctggc 240
tacattggtt cccatgcagc attgcgactt ttgaaggatg gttaccgagt aaccatagtg 300
gacaaccttt ctcgaggaaa cttaggtgca gtcaaggttt tacaagagtt atttcctgag 360
cctgggaggc ttcagtttat atatgctgac ttgggagagc ctaaaactgt taacagcatc 420
ttttcacaaa atgcatttga tgctgtgatg cattttgcag cagttgcata tgttggggaa 480
agcaccgtgt acccccttaa gtactatcac aacattacat caaatacctt ggtagtgttg 540
gagtcaatgg ctgcaaatga tgtaaagact ttgatatatt caagcacatg tgcaacatat 600
ggggagcctg aaaagatgcc tattactgaa gacactccac aggtacccat taatccatat 660
ggaaaagcta agaagatggc agaagatatc atccttgact tctctaaaaa ttcagacatg 720
gcaattatga tattgagata cttcaatgtg attggatcag atccagatgg aaggttaggt 780
gaggctccta gacctgaact gcgtgagcac ggacgaattt ctggtgcttg ttttgatgct 840
gctcgtggta ttgttgctgg actaaaggtt aaaggaacgg actataagac acacgatgga 900
acttgtataa gagattatat cgatgttact gatcttgttg atgctcatgt taaagcactt 960
gaaaaggcaa tgcctgggaa agttggaatc tacaatgttg gcactggaat gggtagatca 1020
gtcaacgagt ttgtacatgc atgtaaaaag gcaaccggtg tagatatcaa agtagactat 1080
ttacctcgcc ggcctggtga ctatgctgaa gtgtttagtg acccatcaaa aattaaccgt 1140
gagctgaact ggacagcaca atacactgat ctccaaaaga gtttacaggt tgcatggaga 1200
tggcaaaaat cacatcaaaa tgggtatgga tcccctttgg tgatggcttc ttga 1254
<210>263
<211>417
<212>PRT
<213>Populus tremuloides
<400>263
Met Leu Ser Phe Gly Arg Thr Arg Thr Gln Pro Arg Ser Asn Arg Ser
1 5 10 15
Met Ser Leu Gly Gly Met Asp Phe Ser Asp Pro Lys Arg Lys Asn Asn
20 25 30
Val Val Gly Lys Ile Leu Leu Ala Ala Ser Leu Thr Ala Val Cys Ile
35 40 45
Ile Met Leu Lys Gln Ser Pro Thr Phe Asn Ser Pro Ser Pro Phe Ser
50 55 60
Leu Arg Glu Asp Gly Val Ile His Val Leu Val Thr Gly Gly Ala Gly
65 70 75 80
Tyr Ile Gly Ser His Ala Ala Leu Arg Leu Leu Lys Asp Gly Tyr Arg
85 90 95
Val Thr Ile Val Asp Asn Leu Ser Arg Gly Asn Leu Gly Ala Val Lys
100 105 110
Val Leu Gln Glu Leu Phe Pro Glu Pro Gly Arg Leu Gln Phe Ile Tyr
115 120 125
Ala Asp Leu Gly Glu Pro Lys Thr Val Asn Ser Ile Phe Ser Gln Asn
130 135 140
Ala Phe Asp Ala Val Met His Phe Ala Ala Val Ala Tyr Val Gly Glu
145 150 155 160
Ser Thr Val Tyr Pro Leu Lys Tyr Tyr His Asn Ile Thr Ser Asn Thr
165 170 175
Leu Val Val Leu Glu Ser Met Ala Ala Asn Asp Val Lys Thr Leu Ile
180 185 190
Tyr Ser Ser Thr Cys Ala Thr Tyr Gly Glu Pro Glu Lys Met Pro Ile
195 200 205
Thr Glu Asp Thr Pro Gln Val Pro Ile Asn Pro Tyr Gly Lys Ala Lys
210 215 220
Lys Met Ala Glu Asp Ile Ile Leu Asp Phe Ser Lys Asn Ser Asp Met
225 230 235 240
Ala Ile Met Ile Leu Arg Tyr Phe Asn Val Ile Gly Ser Asp Pro Asp
245 250 255
Gly Arg Leu Gly Glu Ala Pro Arg Pro Glu Leu Arg Glu His Gly Arg
260 265 270
Ile Ser Gly Ala Cys Phe Asp Ala Ala Arg Gly Ile Val Ala Gly Leu
275 280 285
Lys Val Lys Gly Thr Asp Tyr Lys Thr His Asp Gly Thr Cys Ile Arg
290 295 300
Asp Tyr Ile Asp Val Thr Asp Leu Val Asp Ala His Val Lys Ala Leu
305 310 315 320
Glu Lys Ala Met Pro Gly Lys Val Gly Ile Tyr Asn Val Gly Thr Gly
325 330 335
Met Gly Arg Ser Val Asn Glu Phe Val His Ala Cys Lys Lys Ala Thr
340 345 350
Gly Val Asp Ile Lys Val Asp Tyr Leu Pro Arg Arg Pro Gly Asp Tyr
355 360 365
Ala Glu Val Phe Ser Asp Pro Ser Lys Ile Asn Arg Glu Leu Asn Trp
370 375 380
Thr Ala Gln Tyr Thr Asp Leu Gln Lys Ser Leu Gln Val Ala Trp Arg
385 390 395 400
Trp Gln Lys Ser His Gln Asn Gly Tyr Gly Ser Pro Leu Val Met Ala
405 410 415
Ser
<210>264
<211>1575
<212>DNA
<213>Populus tremuloides
<400>264
atgattctgg tcacaggcgg cgccggcttc atcggctcgc atagctgcgt ggaactcgcc 60
gctgcgggcg agccctacct gatctacgac aacttcagca acagcagccc cgatgtgctc 120
gaacgcatgg aacgcatcac gggccggcgc ccgctgtgcg tcgagggaga cgtgcgcgac 180
cgcgccgcgc tggaccggct gtttgccgag cactccatcc gcgaggtgat ccacttcgcc 240
gcgctcaagg ccgtgggcga gtccgtggcc cagccgctgc gctactacga acacaacgtg 300
ggcggcacgg tggccctgct gcaggccatg cggacggcgg gcgtgcgcag cctggtgttc 360
tcctcctcgg ccacggtcta cggcgatccg gccagcctgc cgatccgcga agactttccg 420
ctgtccgcca ccaaccccta cggccgcagc aagctgtgga tcgaggaaat gctggccgac 480
ctggaccggg ccgaggccgg ccagtggagc ctggcacggc tgcgctactt caaccccgtg 540
ggcgcccatg aaagcggcct gatcggcgag gacccgcgcg acatccccaa caacctcatg 600
ccctatgtgt cgcaggtcgc catcggccag cgccagcagc tcagtgtcta tggcgatgac 660
tatgcgacgc cggacggcac gggcgtgcgc gactacatcc acgtcaccga cctggcgcgc 720
ggccacctgg cggcgctgcg ctatctgcgc gagcagcagg gcctgctgac cgtgaacctg 780
ggcacggggc gcccggtctc ggtgctggag atggtcaagg ccttcgagcg cgccagcggc 840
cgccccgtgc cctaccagat cgtggcgcgc cgacccggcg acgtggccca gtgctgggcc 900
gaccccgccg aggccgagcg gctgctgggc tggaaggcca tgctggacct ggaccgcatc 960
gcctgcgggc gccgagggcg tggtatcttt tcgcccttgt ttcacgccct agccaagagt 1020
ctgcccatgc ttgccaaacg catcatcccc tgtcttgacg tcacgggagg gcgcgtcgtc 1080
aaaggcgtga acttcgtgga actgcgcgat gcgggcgacc cggtggagat cgccgcgcgc 1140
tacaacgccc agggcgcgga cgagctgacc ttcctggaca tcacggccac cagcgacggg 1200
cgcgacctga tcctgcccat catcgaatcg gtggccagcc aggtcttcat tccgctgacc 1260
gtgggtggtg gcgtgcgcac cgtcgaggac gtgcgccgcc tgctcaacgc gggcgccgac 1320
aagaccagct tcaactcggc cgccatcgcc aaccccgacg tgatcaatgc ggcctcggac 1380
aagtacggcg cgcaatgcat cgtcgtggcc atcgatgcca agcggcgcac ggccgaggac 1440
gagcagcgca tcggcgccga tggccgcgct gccggccccg gctgggacgt gtacagccac 1500
ggcggacgca aaaacaccgg cctggacgcc gtgcactcac gcgcgccgtc agcgacgccg 1560
tgcccgtgcc cgtga 1575
<210>265
<211>524
<212>PRT
<213>Populus tremuloides
<400>265
Met Ile Leu Val Thr Gly Gly Ala Gly Phe Ile Gly Ser His Ser Cys
1 5 10 15
Val Glu Leu Ala Ala Ala Gly Glu Pro Tyr Leu Ile Tyr Asp Asn Phe
20 25 30
Ser Asn Ser Ser Pro Asp Val Leu Glu Arg Met Glu Arg Ile Thr Gly
35 40 45
Arg Arg Pro Leu Cys Val Glu Gly Asp Val Arg Asp Arg Ala Ala Leu
50 55 60
Asp Arg Leu Phe Ala Glu His Ser Ile Arg Glu Val Ile His Phe Ala
65 70 75 80
Ala Leu Lys Ala Val Gly G1u Ser Val Ala Gln Pro Leu Arg Tyr Tyr
85 90 95
Glu His Asn Val Gly Gly Thr Val Ala Leu Leu Gln Ala Met Arg Thr
100 105 110
Ala Gly Val Arg Ser Leu Val Phe Ser Ser Ser Ala Thr Val Tyr Gly
115 120 125
Asp Pro Ala Ser Leu Pro Ile Arg Glu Asp Phe Pro Leu Ser Ala Thr
130 135 140
Asn Pro Tyr Gly Arg Ser Lys Leu Trp Ile Glu Glu Met Leu Ala Asp
145 150 155 160
Leu Asp Arg Ala Glu Ala Gly Gln Trp Ser Leu Ala Arg Leu Arg Tyr
165 170 175
Phe Asn Pro Val Gly Ala His Glu Ser Gly Leu Ile Gly Glu Asp Pro
180 185 190
Arg Asp Ile Pro Asn Asn Leu Met Pro Tyr Val Ser Gln Val Ala Ile
195 200 205
Gly Gln Arg Gln Gln Leu Ser Val Tyr Gly Asp Asp Tyr Ala Thr Pro
210 215 220
Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Thr Asp Leu Ala Arg
225 230 235 240
Gly His Leu Ala Ala Leu Arg Tyr Leu Arg Glu Gln Gln Gly Leu Leu
245 250 255
Thr Val Asn Leu Gly Thr Gly Arg Pro Val Ser Val Leu Glu Met Val
260 265 270
Lys Ala Phe Glu Arg Ala Ser Gly Arg Pro Val Pro Tyr Gln Ile Val
275 280 285
Ala Arg Arg Pro Gly Asp Val Ala Gln Cys Trp Ala Asp Pro Ala Glu
290 295 300
Ala Glu Arg Leu Leu Gly Trp Lys Ala Met Leu Asp Leu Asp Arg Ile
305 310 315 320
Ala Cys Gly Arg Arg Gly Arg Gly Ile Phe Ser Pro Leu Phe His Ala
325 330 335
Leu Ala Lys Ser Leu Pro Met Leu Ala Lys Arg Ile Ile Pro Cys Leu
340 345 350
Asp Val Thr Gly Gly Arg Val Val Lys Gly Val Asn Phe Val Glu Leu
355 360 365
Arg Asp Ala Gly Asp Pro Val Glu Ile Ala Ala Arg Tyr Asn Ala Gln
370 375 380
Gly Ala Asp Glu Leu Thr Phe Leu Asp Ile Thr Ala Thr Ser Asp Gly
385 390 395 400
Arg Asp Leu Ile Leu Pro Ile Ile Glu Ser Val Ala Ser Gln Val Phe
405 410 415
Ile Pro Leu Thr Val Gly Gly Gly Val Arg Thr Val Glu Asp Val Arg
420 425 430
Arg Leu Leu Asn Ala Gly Ala Asp Lys Thr Ser Phe Asn Ser Ala Ala
435 440 445
Ile Ala Asn Pro Asp Val Ile Asn Ala Ala Ser Asp Lys Tyr Gly Ala
450 455 460
Gln Cys Ile Val Val Ala Ile Asp Ala Lys Arg Arg Thr Ala Glu Asp
465 470 475 480
Glu Gln Arg Ile Gly Ala Asp Gly Arg Ala Ala Gly Pro Gly Trp Asp
485 490 495
Val Tyr Ser His Gly Gly Arg Lys Asn Thr Gly Leu Asp Ala Val His
500 505 510
Ser Arg Ala Pro Ser Ala Thr Pro Cys Pro Cys Pro
515 520
<210>266
<211>1059
<212>DNA
<213>Ostreococcus tauri
<400>266
atgacgtgga acgtcctcgt caccggtggc gccggataca tcggctcgca cacgtgcgtg 60
cggctcctgc aagcgggcgc gcgcgtcacc gtcgtggata actttgacaa ctcgtgcgcg 120
gaatctttaa agcgcgtgcg aaacatcgtg ggcgaggacg cgggggcgcg tttgacgcac 180
cacgaggttg attgctgcga taaagtcgcg ctcgatggcg tcttcgcgtc ggcgggggtg 240
acgttcgatg cggtgataca cttcgccggg ttgaaggcgg tgggcgagag cgtggccgag 300
ccgatgaagt attacgagaa taacatcgtg agcacgctgg tgctgtgcga gacgatggcg 360
aaacacgggt gtaagacgat tatttttagc tcgagcgcga ccgtgtacgg ggagccggcg 420
tcggtgccgt gcacggaaga tttcccgacg gcggcgttga acccgtacgg acggaccaag 480
ttgttcatcg aacacatttt gagcgatctc tacgtgagtg ataaggagtg gaaggtggcg 540
ctgttgcgat actttaaccc ggtcggtgcg cacgagagtg ggacgctggg ggaggatccc 600
aagggaatcc cgaataactt gatgccattc gtgcagcaag tcgccgtcgg tcgacgaccc 660
gagctcaacg tgtttgggaa cgactatcca accaaggatg gaaccggtcg acgtgattac 720
attcatgtcg tcgatttggc cgacggacac gtcgcggcgg taaagaaact cacgagtgat 780
cccgacgccg gtttgctcac cgtcaacctc gggacgggga agagcacgag cgtcttagag 840
ctcgtcgcgg cgttcgagaa ggcgtccggt aagaaaattc cgtgcaagat tgtcgatcgt 900
cgcgcaggtg acgccgcaga ggtgtacggg gcgacagata aggcgttcaa ggttctcggt 960
tggcgtgcac ttcgcaccat cgaagactgc tgcatcgatc agtggaagtg ggcgagctcg 1020
aacccgtacg ggtacgcagg taagcccgac gacgcgtaa 1059
<210>267
<211>352
<212>PRT
<213>Ostreococcus tauri
<400>267
Met Thr Trp Asn Val Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser
1 5 10 15
His Thr Cys Val Arg Leu Leu Gln Ala Gly Ala Arg Val Thr Val Val
20 25 30
Asp Asn Phe Asp Asn Ser Cys Ala Glu Ser Leu Lys Arg Val Arg Asn
35 40 45
Ile Val Gly Glu Asp Ala Gly Ala Arg Leu Thr His His Glu Val Asp
50 55 60
Cys Cys Asp Lys Val Ala Leu Asp Gly Val Phe Ala Ser Ala Gly Val
65 70 75 80
Thr Phe Asp Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly Glu
85 90 95
Ser Val Ala Glu Pro Met Lys Tyr Tyr Glu Asn Asn Ile Val Ser Thr
100 105 110
Leu Val Leu Cys Glu Thr Met Ala Lys His Gly Cys Lys Thr Ile Ile
115 120 125
Phe Ser Ser Ser Ala Thr Val Tyr Gly Glu Pro Ala Ser Val Pro Cys
130 135 140
Thr Glu Asp Phe Pro Thr Ala Ala Leu Asn Pro Tyr Gly Arg Thr Lys
145 150 155 160
Leu Phe Ile Glu His Ile Leu Ser Asp Leu Tyr Val Ser Asp Lys Glu
165 170 175
Trp Lys Val Ala Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala His Glu
180 185 190
Ser Gly Thr Leu Gly Glu Asp Pro Lys Gly Ile Pro Asn Asn Leu Met
195 200 205
Pro Phe Val Gln Gln Val Ala Val Gly Arg Arg Pro Glu Leu Asn Val
210 215 220
Phe Gly Asn Asp Tyr Pro Thr Lys Asp Gly Thr Gly Arg Arg Asp Tyr
225 230 235 240
Ile His Val Val Asp Leu Ala Asp Gly His Val Ala Ala Val Lys Lys
245 250 255
Leu Thr Ser Asp Pro Asp Ala Gly Leu Leu Thr Val Asn Leu Gly Thr
260 265 270
Gly Lys Ser Thr Ser Val Leu Glu Leu Val Ala Ala Phe Glu Lys Ala
275 280 285
Ser Gly Lys Lys Ile Pro Cys Lys Ile Val Asp Arg Arg Ala Gly Asp
290 295 300
Ala Ala Glu Val Tyr Gly Ala Thr Asp Lys Ala Phe Lys Val Leu Gly
305 310 315 320
Trp Arg Ala Leu Arg Thr Ile Glu Asp Cys Cys Ile Asp Gln Trp Lys
325 330 335
Trp Ala Ser Ser Asn Pro Tyr Gly Tyr Ala Gly Lys Pro Asp Asp Ala
340 345 350
<210>268
<211>2100
<212>DNA
<213>Ostreococcus tauri
<400>268
atgacagctc agttacaaag tgaaagtact tctaaaattg ttttggttac aggtggtgct 60
ggatacattg gttcacacac tgtggtagag ctaattgaga atggatatga ctgtgttgtt 120
gctgataacc tgtcgaattc aacttatgat tctgtagcca ggttagaggt cttgaccaag 180
catcacattc ccttctatga ggttgatttg tgtgaccgaa aaggtctgga aaaggttttc 240
aaagaatata aaattgattc ggtaattcac tttgctggtt taaaggctgt aggtgaatct 300
acacaaatcc cgctgagata ctatcacaat aacattttgg gaactgtcgt tttattagag 360
ttaatgcaac aatacaacgt ttccaaattt gttttttcat cttctgctac tgtctatggt 420
gatgctacga gattcccaaa tatgattcct atcccagaag aatgtccctt agggcctact 480
aatccgtatg gtcatacgaa atacgccatt gagaatatct tgaatgatct ttacaatagc 540
gacaaaaaaa gttggaagtt tgctatcttg cgttatttta acccaattgg cgcacatccc 600
tctggattaa tcggagaaga tccgctaggt ataccaaaca atttgttgcc atatatggct 660
caagtagctg ttggtaggcg cgagaagctt tacatcttcg gagacgatta tgattccaga 720
gatggtaccc cgatcaggga ttatatccac gtagttgatc tagcaaaagg tcatattgca 780
gccctgcaat acctagaggc ctacaatgaa aatgaaggtt tgtgtcgtga gtggaacttg 840
ggttccggta aaggttctac agtttttgaa gtttatcatg cattctgcaa agcttctggt 900
attgatcttc catacaaagt tacgggcaga agagcaggtg atgttttgaa cttgacggct 960
aaaccagata gggccaaacg cgaactgaaa tggcagaccg agttgcaggt tgaagactcc 1020
tgcaaggatt tatggaaatg gactactgag aatccttttg gttaccagtt aaggggtgtc 1080
gaggccagat tttccgctga agatatgcgt tatgacgcaa gatttgtgac tattggtgcc 1140
ggcaccagat ttcaagccac gtttgccaat ttgggcgcca gcattgttga cctgaaagtg 1200
aacggacaat cagttgttct tggctatgaa aatgaggaag ggtatttgaa tcctgatagt 1260
gcttatatag gcgccacgat cggcaggtat gctaatcgta tttcgaaggg taagtttagt 1320
ttatgcaaca aagactatca gttaaccgtt aataacggcg ttaatgcgaa tcatagtagt 1380
atcggttctt tccacagaaa aagatttttg ggacccatca ttcaaaatcc ttcaaaggat 1440
gtttttaccg ccgagtacat gctgatagat aatgagaagg acaccgaatt tccaggtgat 1500
ctattggtaa ccatacagta tactgtgaac gttgcccaaa aaagtttgga aatggtatat 1560
aaaggtaaat tgactgctgg tgaagcgacg ccaataaatt taacaaatca tagttatttc 1620
aatctgaaca agccatatgg agacactatt gagggtacgg agattatggt gcgttcaaaa 1680
aaatctgttg atgtcgacaa aaacatgatt cctacgggta atatcgtcga tagagaaatt 1740
gctaccttta actctacaaa gccaacggtc ttaggcccca aaaatcccca gtttgattgt 1800
tgttttgtgg tggatgaaaa tgctaagcca agtcaaatca atactctaaa caatgaattg 1860
acgcttattg tcaaggcttt tcatcccgat tccaatatta cattagaagt tttaagtaca 1920
gagccaactt atcaatttta taccggtgat ttcttgtctg ctggttacga agcaagacaa 1980
ggttttgcaa ttgagcctgg tagatacatt gatgctatca atcaagagaa ctggaaagat 2040
tgtgtaacct tgaaaaacgg tgaaacttac gggtccaaga ttgtctacag attttcctga 2100
<210>269
<211>699
<212>PRT
<213>Ostreococcus tauri
<400>269
Met Thr Ala Gln Leu Gln Ser Glu Ser Thr Ser Lys Ile Val Leu Val
1 5 10 15
Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Thr Val Val Glu Leu Ile
20 25 30
Glu Asn Gly Tyr Asp Cys Val Val Ala Asp Asn Leu Ser Asn Ser Thr
35 40 45
Tyr Asp Ser Val Ala Arg Leu Glu Val Leu Thr Lys His His Ile Pro
50 55 60
Phe Tyr Glu Val Asp Leu Cys Asp Arg Lys Gly Leu Glu Lys Val Phe
65 70 75 80
Lys Glu Tyr Lys Ile Asp Ser Val Ile His Phe Ala Gly Leu Lys Ala
85 90 95
Val Gly Glu Ser Thr Gln Ile Pro Leu Arg Tyr Tyr His Asn Asn Ile
100 105 110
Leu Gly Thr Val Val Leu Leu Glu Leu Met Gln Gln Tyr Asn Val Ser
115 120 125
Lys Phe Val Phe Ser Ser Ser Ala Thr Val Tyr Gly Asp Ala Thr Arg
130 135 140
Phe Pro Asn Met Ile Pro Ile Pro Glu Glu Cys Pro Leu Gly Pro Thr
145 150 155 160
Asn Pro Tyr Gly His Thr Lys Tyr Ala Ile Glu Asn Ile Leu Asn Asp
165 170 175
Leu Tyr Asn Ser Asp Lys Lys Ser Trp Lys Phe Ala Ile Leu Arg Tyr
180 185 190
Phe Asn Pro Ile Gly Ala His Pro Ser Gly Leu Ile Gly Glu Asp Pro
195 200 205
Leu Gly Ile Pro Asn Asn Leu Leu Pro Tyr Met Ala Gln Val Ala Val
210 215 220
Gly Arg Arg Glu Lys Leu Tyr Ile Phe Gly Asp Asp Tyr Asp Ser Arg
225 230 235 240
Asp Gly Thr Pro Ile Arg Asp Tyr Ile His Val Val Asp Leu Ala Lys
245 250 255
Gly His Ile Ala Ala Leu Gln Tyr Leu Glu Ala Tyr Asn Glu Asn Glu
260 265 270
Gly Leu Cys Arg Glu Trp Asn Leu Gly Ser Gly Lys Gly Ser Thr Val
275 280 285
Phe Glu Val Tyr His Ala Phe Cys Lys Ala Ser Gly Ile Asp Leu Pro
290 295 300
Tyr Lys Val Thr Gly Arg Arg Ala Gly Asp Val Leu Asn Leu Thr Ala
305 310 315 320
Lys Pro Asp Arg Ala Lys Arg Glu Leu Lys Trp Gln Thr Glu Leu Gln
325 330 335
Val Glu Asp Ser Cys Lys Asp Leu Trp Lys Trp Thr Thr Glu Asn Pro
340 345 350
Phe Gly Tyr Gln Leu Arg Gly Val Glu Ala Arg Phe Ser Ala Glu Asp
355 360 365
Met Arg Tyr Asp Ala Arg Phe Val Thr Ile Gly Ala Gly Thr Arg Phe
370 375 380
Gln Ala Thr Phe Ala Asn Leu Gly Ala Ser Ile Val Asp Leu Lys Val
385 390 395 400
Asn Gly Gln Ser Val Val Leu Gly Tyr Glu Asn Glu Glu Gly Tyr Leu
405 410 415
Asn Pro Asp Ser Ala Tyr Ile Gly Ala Thr Ile Gly Arg Tyr Ala Asn
420 425 430
Arg Ile Ser Lys Gly Lys Phe Ser Leu Cys Asn Lys Asp Tyr Gln Leu
435 440 445
Thr Val Asn Asn Gly Val Asn Ala Asn His Ser Ser Ile Gly Ser Phe
450 455 460
His Arg Lys Arg Phe Leu Gly Pro Ile Ile Gln Asn Pro Ser Lys Asp
465 470 475 480
Val Phe Thr Ala Glu Tyr Met Leu Ile Asp Asn Glu Lys Asp Thr Glu
485 490 495
Phe Pro Gly Asp Leu Leu Val Thr Ile Gln Tyr Thr Val Asn Val Ala
500 505 510
Gln Lys Ser Leu Glu Met Val Tyr Lys Gly Lys Leu Thr Ala Gly Glu
515 520 525
Ala Thr Pro Ile Asn Leu Thr Asn His Ser Tyr Phe Asn Leu Asn Lys
530 535 540
Pro Tyr Gly Asp Thr Ile Glu Gly Thr Glu Ile Met Val Arg Ser Lys
545 550 555 560
Lys Ser Val Asp Val Asp Lys Asn Met Ile Pro Thr Gly Asn Ile Val
565 570 575
Asp Arg Glu Ile Ala Thr Phe Asn Ser Thr Lys Pro Thr Val Leu Gly
580 585 590
Pro Lys Asn Pro Gln Phe Asp Cys Cys Phe Val Val Asp Glu Asn Ala
595 600 605
Lys Pro Ser Gln Ile Asn Thr Leu Asn Asn Glu Leu Thr Leu Ile Val
610 615 620
Lys Ala Phe His Pro Asp Ser Asn Ile Thr Leu Glu Val Leu Ser Thr
625 630 635 640
Glu Pro Thr Tyr Gln Phe Tyr Thr Gly Asp Phe Leu Ser Ala Gly Tyr
645 650 655
Glu Ala Arg Gln Gly Phe Ala Ile Glu Pro Gly Arg Tyr Ile Asp Ala
660 665 670
Ile Asn Gln Glu Asn Trp Lys Asp Cys Val Thr Leu Lys Asn Gly Glu
675 680 685
Thr Tyr Gly Ser Lys Ile Val Tyr Arg Phe Ser
690 695
<210>270
<211>1024
<212>DNA
<213>大肠杆菌(Escherichia coli)
<400>270
atggctattc tcgttacagg tggtgctggt tatattgcat cacatactat actgagtttg 60
atagagcagg gtaatgaagt aattattatt gataatttat caaattcata ttatgattcg 120
ttattgaaaa taaaagagat tactggatgt gattgtcttt tttataaagg agatatcctt 180
gacaaaaaac tcttgctaaa aatatttgat gaaaataata tcactgctgt gatgcatttt 240
gctggtgcaa agtctgtaag tgaatctgtt atcagacctt tgcaatacta tcgaaataat 300
gtctctggca ctttttcttt agttgaggca atggaggagt ctggtgtaga aaatttaata 360
tttagctctt cagcaactgt ctatggtgag ccaaagatta ttcctgtgaa tgaaagttgt 420
gctataggtg gtactacaaa tccgtatgga acgtccaagt tatttgtaga gaactttttg 480
cgggattatt ctaaggcatc ccctaatttt aaaactatag tattaagata ttttaaccct 540
atcggtgctc actcatctgg aaaaataggt gaagatccta acggaattcc gaataacttg 600
atgcccttta tatgccaggt tgctatcggt aaacaaaaaa cgctcaagat ctacggaaat 660
gattatccta ctaaagatgg tactgggatt cgcgattata ttcatgttat ggatcttgct 720
gaaggtcatg ttgctgcatt aaataatatt aatcaaggag ctaattatag agtttacaac 780
cttggaacag gaattggata ctctgtgttg gaattattag aagcatttca gaaagttaca 840
actcggagag ttccctatgt ttttactaaa aggcgttcag gtgatattgc tgaatgttgg 900
tctgatccta ccaaagcgta tgaagaatta ggatggaaag caaggcgagg gttagaagat 960
atgattcgtg atgcatggaa ttggcagcaa aaaaatccaa atggatttaa gaaagtttaa 1020
gtaa 1024
<210>271
<211>339
<212>PRT
<213>大肠杆菌
<400>271
Met Ala Ile Leu Val Thr Gly Gly Ala Gly Tyr Ile Ala Ser His Thr
1 5 10 15
Ile Leu Ser Leu Ile Glu Gln Gly Asn Glu Val Ile Ile Ile Asp Asn
20 25 30
Leu Ser Asn Ser Tyr Tyr Asp Ser Leu Leu Lys Ile Lys Glu Ile Thr
35 40 45
Gly Cys Asp Cys Leu Phe Tyr Lys Gly Asp Ile Leu Asp Lys Lys Leu
50 55 60
Leu Leu Lys Ile Phe Asp Glu Asn Asn Ile Thr Ala Val Met His Phe
65 70 75 80
Ala Gly Ala Lys Ser Val Ser Glu Ser Val Ile Arg Pro Leu Gln Tyr
85 90 95
Tyr Arg Asn Asn Val Ser Gly Thr Phe Ser Leu Val Glu Ala Met Glu
100 105 110
Glu Ser Gly Val Glu Asn Leu Ile Phe Ser Ser Ser Ala Thr Val Tyr
115 120 125
Gly Glu Pro Lys Ile Ile Pro Val Asn Glu Ser Cys Ala Ile Gly Gly
130 135 140
Thr Thr Asn Pro Tyr Gly Thr Ser Lys Leu Phe Val Glu Asn Phe Leu
145 150 155 160
Arg Asp Tyr Ser Lys Ala Ser Pro Asn Phe Lys Thr Ile Val Leu Arg
165 170 175
Tyr Phe Asn Pro Ile Gly Ala His Ser Ser Gly Lys Ile Gly Glu Asp
180 185 190
Pro Asn Gly Ile Pro Asn Asn Leu Met Pro Phe Ile Cys Gln Val Ala
195 200 205
Ile Gly Lys Gln Lys Thr Leu Lys Ile Tyr Gly Asn Asp Tyr Pro Thr
210 215 220
Lys Asp Gly Thr Gly Ile Arg Asp Tyr Ile His Val Met Asp Leu Ala
225 230 235 240
Glu Gly His Val Ala Ala Leu Asn Asn Ile Asn Gln Gly Ala Asn Tyr
245 250 255
Arg Val Tyr Asn Leu Gly Thr Gly Ile Gly Tyr Ser Val Leu Glu Leu
260 265 270
Leu Glu Ala Phe Gln Lys Val Thr Thr Arg Arg Val Pro Tyr Val Phe
275 280 285
Thr Lys Arg Arg Ser Gly Asp Ile Ala Glu Cys Trp Ser Asp Pro Thr
290 295 300
Lys Ala Tyr Glu Glu Leu Gly Trp Lys Ala Arg Arg Gly Leu Glu Asp
305 310 315 320
Met Ile Arg Asp Ala Trp Asn Trp Gln Gln Lys Asn Pro Asn Gly Phe
325 330 335
Lys Lys Val
<210>272
<211>53
<212>DNA
<213>人工序列
<220>
<223>引物1
<400>272
ggggacaagt ttgtacaaaa aagcaggctt aaacaatggt ttcggccttg ttg 53
<210>273
<211>49
<212>DNA
<213>人工序列
<220>
<223>引物2
<400>273
ggggaccact ttgtacaaga aagctgggtg ctgctgctac tggaggatt 49
<210>274
<211>2194
<212>DNA
<213>稻
<400>274
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160
ttggtgtagc ttgccacttt caccagcaaa gttc 2194
<210>275
<211>265
<212>PRT
<213>人工序列
<220>
<223>SEQ ID NO:2中的差向异构酶结构域
<400>275
Ile Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Thr Val Leu
1 5 10 15
Gln Leu Leu Gln Leu Gly Phe Arg Val Val Val Leu Asp Asn Leu Asp
20 25 30
Asn Ala Ser Glu Leu Ala Ile Leu Arg Val Arg Glu Leu Ala Gly His
35 40 45
Asn Ala Asn Asn Leu Asp Phe Arg Lys Val Asp Leu Arg Asp Lys Gln
50 55 60
Ala Leu Asp Gln Ile Phe Ser Ser Gln Arg Phe Glu Ala Val Ile His
65 70 75 80
Phe Ala Gly Leu Lys Ala Val Gly Glu Ser Val Gln Lys Pro Leu Leu
85 90 95
Tyr Tyr Asp Asn Asn Leu Ile Gly Thr Ile Thr Leu Leu Gln Val Met
100 105 110
Ala Ala His Gly Cys Thr Lys Leu Val Phe Ser Ser Ser Ala Thr Val
115 120 125
Tyr Gly Trp Pro Lys Glu Val Pro Cys Thr Glu Glu Ser Pro Leu Cys
130 135 140
Ala Met Asn Pro Tyr Gly Arg Thr Lys Leu Val Ile Glu Asp Met Cys
145 150 155 160
Arg Asp Leu His Ala Ser Asp Pro Asn Trp Lys Ile Ile Leu Leu Arg
165 170 175
Tyr Phe Asn Pro Val Gly Ala His Pro Ser Gly Tyr Ile Gly Glu Asp
180 185 190
Pro Cys Gly Ile Pro Asn Asn Leu Met Pro Phe Val Gln Gln Val Ala
195 200 205
Val Gly Arg Arg Pro Ala Leu Thr Val Tyr Gly Thr Asp Tyr Asn Thr
210 215 220
Lys Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Val Asp Leu Ala
225 230 235 240
Asp Gly His Ile Ala Ala Leu Arg Lys Leu Tyr Glu Asp Ser Asp Arg
245 250 255
Ile Gly Cys Glu Val Tyr Asn Leu Gly
260 265
<210>276
<211>7
<212>PRT
<213>人工序列
<220>
<223>基序1:NAD+结合
<220>
<221>UNSURE
<222>(2)..(3)
<223>Xaa可以是任何天然存在的氨基酸
<220>
<221>UNSURE
<222>(5)..(6)
<223>Xaa可以是任何天然存在的氨基酸
<400>276
Gly Xaa Xaa Gly Xaa Xaa Gly
1 5
<210>277
<211>4
<212>PRT
<213>人工序列
<220>
<223>基序2:活性位点
<220>
<221>UNSURE
<222>(4)..(4)
<223>/替换=″Ser″
<400>277
Tyr Gly Arg Thr
1
<210>278
<211>12
<212>PRT
<213>人工序列
<220>
<223>基序3:保守区域
<400>278
Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His
1 5 10
<210>279
<211>5
<212>PRT
<213>人工序列
<220>
<223>基序4:保守区域
<220>
<221>UNSURE
<222>(2)..(2)
<223>Xaa可以是任何天然存在的氨基酸
<220>
<221>VARIANT
<222>(4)..(4)
<223>/替换=″Leu″
<400>279
Val Xaa His Phe Ala
1 5
<210>280
<211>11
<212>PRT
<213>人工序列
<220>
<223>基序5:保守区域
<400>280
Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val
1 5 10
<210>281
<211>1047
<212>DNA
<213>欧洲油菜
<400>281
atggtgaaga acgttctcgt cacaggcggc gctggctaca tcggaagcca cacggtgctt 60
caactgctca acggtggata ctccgccgta gtcgtcgaca atcacgacaa ttcatccgct 120
gtttctctcc aacgcgtcaa aaaactcgcc ggcgataacg gaaaccgcct ctccttccac 180
caggtggatc tcagagacag gcctgcgctt gagaagattt tctctgaaac taagtttgat 240
gcagtgatac actttgctgg acttaaagca gtaggtgaga gtgtggagaa gcctttgctc 300
tattataata ataacctttt tggcactgtt atccttttgg aggttatgtc tcaattcggc 360
tgcaaaaatc ttgtgttttc gtcatcagct actgtctatg gctggccaaa agaggttcct 420
tgcaccgagg agtccccaat ttctgcaacc aacccttatg gccgtaccaa gctttttatc 480
gaggaaattt gccgggatgt acatcgctcc gaccctgaat ggaagatcat attgcttaga 540
tacttcaacc ctgttggtgc acatcctagt ggttacattg gtgaagatcc tcttggggtt 600
ccaaacaacc tcatgcctta tgtccaacaa gttgcagttg gccggagacc tcacctcacc 660
gtctttggaa ctgactataa cacaaaggat ggcacagggg tgagagatta cattcatgtg 720
attgacttag cagatggaca tatagccgct ctgcgcaagc tggatgatct caaaatcagt 780
tgtgaggtat acaatcttgg aacgggtaat ggaacatcag ttctagaaat ggttgctgcc 840
tttgagaagg catccggaaa gaaaatccct ttggtgttgg ctggacgacg tcctggagac 900
gctgagattg tttacgcctc aaccgagaaa gcagaacgcg agctaaactg gaaggctaag 960
tatgggattg aagacatgtg tagggatcta tggaactggg ccagcaataa tccttacggc 1020
tacgcctcc t ccaatggctc ctcttaa 1047
<210>282
<211>348
<212>PRT
<213>欧洲油菜
<400>282
Met Val Lys Asn Val Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser
1 5 10 15
His Thr Val Leu Gln Leu Leu Asn Gly Gly Tyr Ser Ala Val Val Val
20 25 30
Asp Asn His Asp Asn Ser Ser Ala Val Ser Leu Gln Arg Val Lys Lys
35 40 45
Leu Ala Gly Asp Asn Gly Asn Arg Leu Ser Phe His Gln Val Asp Leu
50 55 60
Arg Asp Arg Pro Ala Leu Glu Lys Ile Phe Ser Glu Thr Lys Phe Asp
65 70 75 80
Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly Glu Ser Val Glu
85 90 95
Lys Pro Leu Leu Tyr Tyr Asn Asn Asn Leu Phe Gly Thr Val Ile Leu
100 105 110
Leu Glu Val Met Ser Gln Phe Gly Cys Lys Asn Leu Val Phe Ser Ser
115 120 125
Ser Ala Thr Val Tyr Gly Trp Pro Lys Glu Val Pro Cys Thr Glu Glu
130 135 140
Ser Pro Ile Ser Ala Thr Asn Pro Tyr Gly Arg Thr Lys Leu Phe Ile
145 150 155 160
Glu Glu Ile Cys Arg Asp Val His Arg Ser Asp Pro Glu Trp Lys Ile
165 170 175
Ile Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala His Pro Ser Gly Tyr
180 185 190
Ile Gly Glu Asp Pro Leu Gly Val Pro Asn Asn Leu Met Pro Tyr Val
195 200 205
Gln Gln Val Ala Val Gly Arg Arg Pro His Leu Thr Val Phe Gly Thr
210 215 220
Asp Tyr Asn Thr Lys Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val
225 230 235 240
Ile Asp Leu Ala Asp Gly His Ile Ala Ala Leu Arg Lys Leu Asp Asp
245 250 255
Leu Lys Ile Ser Cys Glu Val Tyr Asn Leu Gly Thr Gly Asn Gly Thr
260 265 270
Ser Val Leu Glu Met Val Ala Ala Phe Glu Lys Ala Ser Gly Lys Lys
275 280 285
Ile Pro Leu Val Leu Ala Gly Arg Arg Pro Gly Asp Ala Glu Ile Val
290 295 300
Tyr Ala Ser Thr Glu Lys Ala Glu Arg Glu Leu Asn Trp Lys Ala Lys
305 310 315 320
Tyr Gly Ile Glu Asp Met Cys Arg Asp Leu Trp Asn Trp Ala Ser Asn
325 330 335
Asn Pro Tyr Gly Tyr Ala Ser Ser Asn Gly Ser Ser
340 345
<210>283
<211>1047
<212>DNA
<213>欧洲油菜
<400>283
atggtgaaga acgttctggt cacaggcggc gctggctaca tcggtagcca cacggtgctt 60
caacttctca acggaggcta ctccgtcgta gtcgtcgaca atcacgacaa ttcatccgct 120
gtttctctcc aacgcgtcaa aaaactcgcc ggcgataacg gaaaccgcct ctccttccac 180
caggtggatc tcagagacag gcctgcgctt gagaagattt tctcagaaac taagtttgat 240
gcagtgatac actttgctgg acttaaagca gtaggtgaga gtgtggagaa gcccctgctt 300
tattataata ataacttatt tggcactgtt atccttttgg aggttatgtc tcagttcggc 360
tgcaaaaatc ttgtgttttc gtcatcagct actgtctatg gctggccaaa agaggttcct 420
tgtaccgagg agtccccaat ttctgcaacc aacccttatg gccgtaccaa gctttttatc 480
gaggaaattt gccgggatgt acatcgctcc gaccctgaat ggaagatcat attgctcaga 540
tacttcaacc ctgttggtgc acatcctagt ggttacattg gtgaagatcc tcttggggtt 600
ccaaacaacc tcatgcctta tgtccaacaa gttgcagttg gccggagacc tcacctcacc 660
gtctttggaa ctgactataa cacaaaggat ggcacagggg tgagagatta cattcatgtg 720
attgacttag cagatggaca tatagccgct ctgcgcaagc tggatgatct caaaatcagt 780
tgtgaggtat acaatcttgg aacgggtaat ggaacatcag ttctagaaat ggttgctgcc 840
tttgagaagg catccggaaa gaaaatccct ttggtgttgg ctggacgacg tcctggagac 900
gctgagattg tttacgcctc aaccgagaaa gcagaacgcg agctaaactg gaaggctaag 960
tatgggattg aagacatgtg tagggatcta tggaactggg ccagcaataa tccttacggc 1020
tacgcctcct ccaatggctc ctcttaa 1047
<210>284
<211>348
<212>PRT
<213>欧洲油菜
<400>284
Met Val Lys Asn Val Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser
1 5 10 15
His Thr Val Leu Gln Leu Leu Asn Gly Gly Tyr Ser Val Val Val Val
20 25 30
Asp Asn His Asp Asn Ser Ser Ala Val Ser Leu Gln Arg Val Lys Lys
35 40 45
Leu Ala Gly Asp Asn Gly Asn Arg Leu Ser Phe His Gln Val Asp Leu
50 55 60
Arg Asp Arg Pro Ala Leu Glu Lys Ile Phe Ser Glu Thr Lys Phe Asp
65 70 75 80
Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly Glu Ser Val Glu
85 90 95
Lys Pro Leu Leu Tyr Tyr Asn Asn Asn Leu Phe Gly Thr Val Ile Leu
100 105 110
Leu Glu Val Met Ser Gln Phe Gly Cys Lys Asn Leu Val Phe Ser Ser
115 120 125
Ser Ala Thr Val Tyr Gly Trp Pro Lys Glu Val Pro Cys Thr Glu Glu
130 135 140
Ser Pro Ile Ser Ala Thr Asn Pro Tyr Gly Arg Thr Lys Leu Phe Ile
145 150 155 160
Glu Glu Ile Cys Arg Asp Val His Arg Ser Asp Pro Glu Trp Lys Ile
165 170 175
Ile Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala His Pro Ser Gly Tyr
180 185 190
Ile Gly Glu Asp Pro Leu Gly Val Pro Asn Asn Leu Met Pro Tyr Val
195 200 205
Gln Gln Val Ala Val Gly Arg Arg Pro His Leu Thr Val Phe Gly Thr
210 215 220
Asp Tyr Asn Thr Lys Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val
225 230 235 240
Ile Asp Leu Ala Asp Gly His Ile Ala Ala Leu Arg Lys Leu Asp Asp
245 250 255
Leu Lys Ile Ser Cys Glu Val Tyr Asn Leu Gly Thr Gly Asn Gly Thr
260 265 270
Ser Val Leu Glu Met Val Ala Ala Phe Glu Lys Ala Ser Gly Lys Lys
275 280 285
Ile Pro Leu Val Leu Ala Gly Arg Arg Pro Gly Asp Ala Glu Ile Val
290 295 300
Tyr Ala Ser Thr Glu Lys Ala Glu Arg Glu Leu Asn Trp Lys Ala Lys
305 310 315 320
Tyr Gly Ile Glu Asp Met Cys Arg Asp Leu Trp Asn Trp Ala Ser Asn
325 330 335
Asn Pro Tyr Gly Tyr Ala Ser Ser Asn Gly Ser Ser
340 345
<210>285
<211>1068
<212>DNA
<213>玉米
<400>285
atggtgtccg ccgtgctccg gaccatcctc gtgacgggcg gcgccgggta catcggcagc 60
cacacggtgc tgcagctgct gcagcagggc ttccgcgtcg tcgtcgtcga caacctcgac 120
aacgcctccg aggccgccct cgcccgcgtc gccgagctcg ccgggcacga cggcgccaac 180
ctcgtcttcc acaaggttga ccttcgcgac aggcacgcgt tggtggacat cttctcgtcg 240
cacaggttcg aggctgtcat tcactttgct gggctcaagg ctgttgggga gagcgtgcac 300
aagcccctac tttactacga caacaacctg gtcggcacca tcaccctcct ggaggtgatg 360
gctgcgaacg gctgcaagaa gctggtgttc tcgtcatctg caactgtcta tgggtggccc 420
aaggaagtac cctgcaccga agaattcccg ctctgcgcca ccaatcccta tgggcggaca 480
aagcttgtga ttgaagacat ctgccgcgac gtccaccgct ccgaccccga ctggaagatc 540
atactgctca ggtacttcaa ccccgttggc gctcatccaa gcgggtacat cggcgaagac 600
ccctgcggtg tcccgaacaa cctgatgccc tacgtgcagc aagtcgctgt tgggaggtta 660
cctcacctca cggtctacgg gacggactac agcaccaagg atgggactgg ggtgcgtgat 720
tacatccacg ttgtcgacct ggctgacggc cacatagcag ccctgaggaa gctctacgaa 780
gactccgaca aaataggctg tgaagtgtac aacttgggga ctggaaaggg gacgtccgtg 840
ttggaaatgg tggctgcatt cgagaaggct tctgggaaga aaatccctct ggtgttcgct 900
gggcgaagac ccggagacgc agagatcgtc tacgccgcaa ctgccaaggc agagaaggag 960
ctcaaatgga aggccaagta cgggatcgag gagatgtgca gagatctgtg gaactgggcg 1020
agcaagaacc cgtacgggta cgctgggtca cgcgacaaca gcaaatga 1068
<210>286
<211>355
<212>PRT
<213>玉米
<400>286
Met Val Ser Ala Val Leu Arg Thr I1e Leu Val Thr Gly Gly Ala Gly
1 5 10 15
Tyr Ile Gly Ser His Thr Val Leu Gln Leu Leu Gln Gln Gly Phe Arg
20 25 30
Val Val Val Val Asp Asn Leu Asp Asn Ala Ser Glu Ala Ala Leu Ala
35 40 45
Arg Val Ala Glu Leu Ala Gly His Asp Gly Ala Asn Leu Val Phe His
50 55 60
Lys Val Asp Leu Arg Asp Arg His Ala Leu Val Asp Ile Phe Ser Ser
65 70 75 80
His Arg Phe Glu Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly
85 90 95
Glu Ser Val His Lys Pro Leu Leu Tyr Tyr Asp Asn Asn Leu Val Gly
100 105 110
Thr Ile Thr Leu Leu Glu Val Met Ala Ala Asn Gly Cys Lys Lys Leu
115 120 125
Val Phe Ser Ser Ser Ala Thr Val Tyr Gly Trp Pro Lys Glu Val Pro
130 135 140
Cys Thr Glu Glu Phe Pro Leu Cys Ala Thr Asn Pro Tyr Gly Arg Thr
145 150 155 160
Lys Leu Val Ile Glu Asp Ile Cys Arg Asp Val His Arg Ser Asp Pro
165 170 175
Asp Trp Lys Ile Ile Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala His
180 185 190
Pro Ser Gly Tyr Ile Gly Glu Asp Pro Cys Gly Val Pro Asn Asn Leu
195 200 205
Met Pro Tyr Val Gln Gln Val Ala Val Gly Arg Leu Pro His Leu Thr
210 215 220
Val Tyr Gly Thr Asp Tyr Ser Thr Lys Asp Gly Thr Gly Val Arg Asp
225 230 235 240
Tyr Ile His Val Val Asp Leu Ala Asp Gly His Ile Ala Ala Leu Arg
245 250 255
Lys Leu Tyr Glu Asp Ser Asp Lys Ile Gly Cys Glu Val Tyr Asn Leu
260 265 270
Gly Thr Gly Lys Gly Thr Ser Val Leu Glu Met Val Ala Ala Phe Glu
275 280 285
Lys Ala Ser Gly Lys Lys Ile Pro Leu Val Phe Ala Gly Arg Arg Pro
290 295 300
Gly Asp Ala Glu Ile Val Tyr Ala Ala Thr Ala Lys Ala Glu Lys Glu
305 310 315 320
Leu Lys Trp Lys Ala Lys Tyr Gly Ile Glu Glu Met Cys Arg Asp Leu
325 330 335
Trp Asn Trp Ala Ser Lys Asn Pro Tyr Gly Tyr Ala Gly Ser Arg Asp
340 345 350
Asn Ser Lys
355
<210>287
<211>1068
<212>DNA
<213>玉米
<400>287
atggtgtccg ccgtgctccg gaccatcctc gtgacgggcg gcgccgggta catcggcagc 60
cacacggtgc tgcagctgct gcagcagggc ttccgcgtcg tcgtcgtcga caacctcgac 120
aacgcctccg aggccgccct cgcccgcgtc gccgagctcg ccgggcacga cggcgccaac 180
ctcgtcttcc acaaggttga ccttcgcgac aggcacgcgt tggtggacat cttctcgtcg 240
cacaggttcg aggctgtcat tcactttgct gggctcaagg ctgttgggga gagcgtgcac 300
aagcccctac tttactacga caacaacctg gtcggcacca tcaccctcct cgaggtgatg 360
gctgcgaacg gctgcaagaa gctggtgttc tcgtcatctg caactgtcta tgggtggccc 420
aaggaagtac catgcaccga agaattcccg ctctgcgcca ccaatcccta tgggcggaca 480
aagcttgtga ttgaagacat ctgccgcgac gtccaccgct ccgaccccga ctggaagatc 540
atactgctca ggtacttcaa ccccgttggc gctcatccaa gcgggtacat cggcgaagac 600
ccctgcggtg tcccgaacaa cctgatgccc tacgtgcagc aagtcgctgt tgggaagtta 660
cctcacctca cggtctacgg gacggactac agcaccaagg atgggactgg ggtgcgtgat 720
tacatccacg ttgtcgacct ggctgacggc cacatagcag ccctgaggaa gctctacgaa 780
gactccgaca aaataggctg tgaagtgtac aacttgggga ctggaaaggg gacgtccgtg 840
ttggaaatgg tggctgcatt cgagaaggct tctgggaaga aaatccctct ggtgttcgct 900
gggcgaagac ccggagacgc agagatcgtc tacgccgcaa ctgccaaggc agagaaggag 960
ctcaaatgga aggccaagta cgggatcgag gagatgtgca gagatctgtg gaactgggcg 1020
agcaagaacc cgtacgggta cgctgggtca cgcgacaaca gcaaatga 1068
<210>288
<211>355
<212>PRT
<213>玉米
<400>288
Met Val Ser Ala Val Leu Arg Thr Ile Leu Val Thr Gly Gly Ala Gly
1 5 10 15
Tyr Ile Gly Ser His Thr Val Leu Gln Leu Leu Gln Gln Gly Phe Arg
20 25 30
Val Val Val Val Asp Asn Leu Asp Asn Ala Ser Glu Ala Ala Leu Ala
35 40 45
Arg Val Ala Glu Leu Ala Gly His Asp Gly Ala Asn Leu Val Phe His
50 55 60
Lys Val Asp Leu Arg Asp Arg His Ala Leu Val Asp Ile Phe Ser Ser
65 70 75 80
His Arg Phe Glu Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly
85 90 95
Glu Ser Val His Lys Pro Leu Leu Tyr Tyr Asp Asn Asn Leu Val Gly
100 105 110
Thr Ile Thr Leu Leu Glu Val Met Ala Ala Asn Gly Cys Lys Lys Leu
115 120 125
Val Phe Ser Ser Ser Ala Thr Val Tyr Gly Trp Pro Lys Glu Val Pro
130 135 140
Cys Thr Glu Glu Phe Pro Leu Cys Ala Thr Asn Pro Tyr Gly Arg Thr
145 150 155 160
Lys Leu Val Ile Glu Asp Ile Cys Arg Asp Val His Arg Ser Asp Pro
165 170 175
Asp Trp Lys Ile Ile Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala His
180 185 190
Pro Ser Gly Tyr Ile Gly Glu Asp Pro Cys Gly Val Pro Asn Asn Leu
195 200 205
Met Pro Tyr Val Gln Gln Val Ala Val Gly Lys Leu Pro His Leu Thr
210 215 220
Val Tyr Gly Thr Asp Tyr Ser Thr Lys Asp Gly Thr Gly Val Arg Asp
225 230 235 240
Tyr Ile His Val Val Asp Leu Ala Asp Gly His Ile Ala Ala Leu Arg
245 250 255
Lys Leu Tyr Glu Asp Ser Asp Lys Ile Gly Cys Glu Val Tyr Asn Leu
260 265 270
Gly Thr Gly Lys Gly Thr Ser Val Leu Glu Met Val Ala Ala Phe Glu
275 280 285
Lys Ala Ser Gly Lys Lys Ile Pro Leu Val Phe Ala Gly Arg Arg Pro
290 295 300
Gly Asp Ala Glu Ile Val Tyr Ala Ala Thr Ala Lys Ala Glu Lys Glu
305 310 315 320
Leu Lys Trp Lys Ala Lys Tyr Gly Ile Glu Glu Met Cys Arg Asp Leu
325 330 335
Trp Asn Trp Ala Ser Lys Asn Pro Tyr Gly Tyr Ala Gly Ser Arg Asp
340 345 350
Asn Ser Lys
355
<210>289
<211>1068
<212>DNA
<213>玉米
<400>289
atggtgtccg ccgtgctccg gaccatcctc gtgacgggcg gcgccgggta catcggcagc 60
cacacggtgc tgcagctgct gcagcagggc ttccgcgtcg tcgtcgtcga caacctcgac 120
aacgcctccg aggccgccct cgcccgcgtc gccgagctcg ccgggcacga cggcgccaac 180
ctcgtcttcc acaaggttga ccttcgcgac aggcacgcgt tggtggacat cttctcgtcg 240
cacaggttcg aggctgtcat tcactttgct gggctcaagg ctgttgggga gagcgtgcac 300
aagcccctac tttactacga caacaacctg gtcggcacca tcaccctcct cgaggtgatg 360
gctgcgaacg gctgcaagaa gctggtgttc tcgtcatctg caactgtcta tgggtggccc 420
aaggaagtac catgcaccga agaattcccg ctctgcgcca ccaatcccta tgggcggaca 480
aagcttgtga ttgaagacat ctgccgcgac gtccaccgct ccgaccccga ctggaagatc 540
atactgctca ggtacttcaa ccccgttggc gctcatccaa gcgggtacat cggcgaagac 600
ccctgcggtg tcccgaacaa cctgatgccc tacgtgcagc aagtcgctgt tgggaggtta 660
cctcacctca cggtctacgg gacggactac agcaccaagg atgggactgg ggtgcgtgat 720
tacatccacg ttgtcgacct ggctgacggc cacatagcag ccctgaggaa gctctacgaa 780
gactccgaca aaataggctg tgaagtgtac aacttgggga ctggaaaggg gacgtcggtg 840
ttggaaatgg tggctgcatt cgagaaggct tctgggaaga aaatccctct ggtgttcgct 900
gggcgaagac ccggagacgc agagatcgtc tacgccgcaa ctgccaaggc agagaaggag 960
ctcaaatgga aggccaagta cgggatcgag gagatgtgca gagatctgtg gaactgggcg 1020
agcaagaacc cgtacgggta cgctgggtca cgcgacaaca gcaaatga 1068
<210>290
<211>355
<212>PRT
<213>玉米
<400>290
Met Val Ser Ala Val Leu Arg Thr Ile Leu Val Thr Gly Gly Ala Gly
1 5 10 15
Tyr Ile Gly Ser His Thr Val Leu Gln Leu Leu Gln Gln Gly Phe Arg
20 25 30
Val Val Val Val Asp Asn Leu Asp Asn Ala Ser Glu Ala Ala Leu Ala
35 40 45
Arg Val Ala Glu Leu Ala Gly His Asp Gly Ala Asn Leu Val Phe His
50 55 60
Lys Val Asp Leu Arg Asp Arg His Ala Leu Val Asp Ile Phe Ser Ser
65 70 75 80
His Arg Phe Glu Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly
85 90 95
Glu Ser Val His Lys Pro Leu Leu Tyr Tyr Asp Asn Asn Leu Val Gly
100 105 110
Thr Ile Thr Leu Leu Glu Val Met Ala Ala Asn Gly Cys Lys Lys Leu
115 120 125
Val Phe Ser Ser Ser Ala Thr Val Tyr Gly Trp Pro Lys Glu Val Pro
130 135 140
Cys Thr Glu Glu Phe Pro Leu Cys Ala Thr Asn Pro Tyr Gly Arg Thr
145 150 155 160
Lys Leu Val Ile Glu Asp Ile Cys Arg Asp Val His Arg Ser Asp Pro
165 170 175
Asp Trp Lys Ile Ile Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala His
180 185 190
Pro Ser Gly Tyr Ile Gly Glu Asp Pro Cys Gly Val Pro Asn Asn Leu
195 200 205
Met Pro Tyr Val Gln Gln Val Ala Val Gly Arg Leu Pro His Leu Thr
210 215 220
Val Tyr Gly Thr Asp Tyr Ser Thr Lys Asp Gly Thr Gly Val Arg Asp
225 230 235 240
Tyr Ile His Val Val Asp Leu Ala Asp Gly His Ile Ala Ala Leu Arg
245 250 255
Lys Leu Tyr Glu Asp Ser Asp Lys Ile Gly Cys Glu Val Tyr Asn Leu
260 265 270
Gly Thr Gly Lys Gly Thr Ser Val Leu Glu Met Val Ala Ala Phe Glu
275 280 285
Lys Ala Ser Gly Lys Lys Ile Pro Leu Val Phe Ala Gly Arg Arg Pro
290 295 300
Gly Asp Ala Glu Ile Val Tyr Ala Ala Thr Ala Lys Ala Glu Lys Glu
305 310 315 320
Leu Lys Trp Lys Ala Lys Tyr Gly Ile Glu Glu Met Cys Arg Asp Leu
325 330 335
Trp Asn Trp Ala Ser Lys Asn Pro Tyr Gly Tyr Ala Gly Ser Arg Asp
340 345 350
Asn Ser Lys
355
<210>291
<211>1272
<212>DNA
<213>玉米
<400>291
atggcggtgg agaagacgct gcccggcgcg agtgcgggga ggaccgtgct ggtcacgggc 60
ggggcgggct acatcggtag ccacgccgtg ctgcagctcc tcctcgcggg cttccgcgcc 120
gtcgtcatcg acaacctcaa caactcctcc gagctggccg tccgccgcgt cgccgcgctc 180
gcgggggacc actcccgcaa cctctctttc cacaagattg atctccgtga caagggagca 240
ctggaaatgg tttttgcttc tacaagattt gaagctgtca ttcacttcgc tggattgaaa 300
gctgtgggtg aaagcgtaca gaagccatta ctttattatg acaacaacgt cattggcacg 360
ataaatcttc tagaagttat gtctgttcac ggttgcaaga agttggtgtt ctcatcatca 420
gctgcagttt atggatcacc caaaaactca ccctgcacag aaaattttcc tcttactcca 480
aacaatccat atggcaaaac aaagctcgtt gttgaagata tttgccggga tatctaccgt 540
tcagatcctg aatggaagat cattttactt aggtacttca atccagttgg tgctcatcct 600
agtggatatc ttggcgagga cccacgagga attcccaaca atcttatgcc ctatgttcag 660
caagttgcgg ttggtaggag gccagctcta acagttttag gaaatgacta tgcaacaaga 720
gatgggactg gggtccgaga ttacatccat gtggttgacc ttgctgacgg acatattgct 780
gcattgcaga agctttttga gaactctagc atagggtgtg aagcgtacaa ccttggaacc 840
ggaagaggta catctgtgct ggagattgtt aaagcatttg agaaggcttc tgggaagaaa 900
atacctctga tttttggtga aagacgccca ggtgatgcag agattctgtt ttcagagact 960
actaaagcag agagggagct taactggaaa gcaaaatacg gtattgaaga gatgtgccgc 1020
gaccaatgga actgggccag caagaaccct tatggctatg gatcacctga ctctatcaag 1080
cagaatggtc accaaacaaa cggatccgct gactcctcca agcagaatgg ccaccgcaca 1140
aacggttcaa ctgactcacc caagcggaac ggccaccatg cgtatgggtc tgctgactca 1200
cccaagcgca acgggcactg cgtttttgga tcatcagacc tcaagccgaa tggtaatggc 1260
cacctgcgct ga 1272
<210>292
<211>423
<212>PRT
<213>玉米
<400>292
Met Ala Val Glu Lys Thr Leu Pro Gly Ala Ser Ala Gly Arg Thr Val
1 5 10 15
Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Ala Val Leu Gln
20 25 30
Leu Leu Leu Ala Gly Phe Arg Ala Val Val Ile Asp Asn Leu Asn Asn
35 40 45
Ser Ser Glu Leu Ala Val Arg Arg Val Ala Ala Leu Ala Gly Asp His
50 55 60
Ser Arg Asn Leu Ser Phe His Lys Ile Asp Leu Arg Asp Lys Gly Ala
65 70 75 80
Leu Glu Met Val Phe Ala Ser Thr Arg Phe Glu Ala Val Ile His Phe
85 90 95
Ala Gly Leu Lys Ala Val Gly Glu Ser Val Gln Lys Pro Leu Leu Tyr
100 105 110
Tyr Asp Asn Asn Val Ile Gly Thr Ile Asn Leu Leu Glu Val Met Ser
115 120 125
Val His Gly Cys Lys Lys Leu Val Phe Ser Ser Ser Ala Ala Val Tyr
130 135 140
Gly Ser Pro Lys Asn Ser Pro Cys Thr Glu Asn Phe Pro Leu Thr Pro
145 150 155 160
Asn Asn Pro Tyr Gly Lys Thr Lys Leu Val Val Glu Asp Ile Cys Arg
165 170 175
Asp Ile Tyr Arg Ser Asp Pro Glu Trp Lys Ile Ile Leu Leu Arg Tyr
180 185 190
Phe Asn Pro Val Gly Ala His Pro Ser Gly Tyr Leu Gly Glu Asp Pro
195 200 205
Arg Gly Ile Pro Asn Asn Leu Met Pro Tyr Val Gln Gln Val Ala Val
210 215 220
Gly Arg Arg Pro Ala Leu Thr Val Leu Gly Asn Asp Tyr Ala Thr Arg
225 230 235 240
Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Val Asp Leu Ala Asp
245 250 255
Gly His Ile Ala Ala Leu Gln Lys Leu Phe Glu Asn Ser Ser Ile Gly
260 265 270
Cys Glu Ala Tyr Asn Leu Gly Thr Gly Arg Gly Thr Ser Val Leu Glu
275 280 285
Ile Val Lys Ala Phe Glu Lys Ala Ser Gly Lys Lys Ile Pro Leu Ile
290 295 300
Phe Gly Glu Arg Arg Pro Gly Asp Ala Glu Ile Leu Phe Ser Glu Thr
305 310 315 320
Thr Lys Ala Glu Arg Glu Leu Asn Trp Lys Ala Lys Tyr Gly Ile Glu
325 330 335
Glu Met Cys Arg Asp Gln Trp Asn Trp Ala Ser Lys Asn Pro Tyr Gly
340 345 350
Tyr Gly Ser Pro Asp Ser Ile Lys Gln Asn Gly His Gln Thr Asn Gly
355 360 365
Ser Ala Asp Ser Ser Lys Gln Asn Gly His Arg Thr Asn Gly Ser Thr
370 375 380
Asp Ser Pro Lys Arg Asn Gly His His Ala Tyr Gly Ser Ala Asp Ser
385 390 395 400
Pro Lys Arg Asn Gly His Cys Val Phe Gly Ser Ser Asp Leu Lys Pro
405 410 415
Asn Gly Asn Gly His Leu Arg
420
<210>293
<211>1272
<212>DNA
<213>玉米
<400>293
atggcggtgg agaagacgct gcccggcgcg agtgcgggga ggaccgtgct ggtcacgggc 60
ggggcgggct acatcggtag ccacgccgtg ctgcagctcc tcctcgcggg cttccgcgcc 120
gtcgtcatcg acaacctcaa caactcctcc gagctggccg tccgccgcgt cgccgcgctc 180
gcgggggacc actcccgcaa cctctctttc cacaagattg atctccgtga caagggagca 240
ctggaaatgg tttttgcttc tacaagattt gaagctgtca ttcacttcgc tggattgaaa 300
gctgtgggtg aaagcgtaca gaagccatta ctttattatg acaacaacgt cattggcacg 360
ataaatcttc tagaagttat gtctgttcac ggttgcaaga agttggtgtt ctcatcatca 420
gctgcagttt atggatcacc caaaaactca ccctgcacag aaaattttcc tcttactcca 480
aacaatccat atggcaaaac aaagctcgtt gttgaagata tttgccggga tatctaccgt 540
tcagatcctg aatggaagat cattttactt aggtacttca atccagttgg tgctcatcct 600
agtggatatc ttggcgagga cccacgagga attcccaaca atcttatgcc ctatgttcag 660
caagttgcgg ttggtaggag gccagctcta acagttttag gaaatgacta tgcaacaaga 720
gatgggactg gggtccgaga ttacatccat gtggttgacc ttgctgacgg acatattgct 780
gcattgcaga agctttttga gaactctagc atagggtgtg aagcgtacaa ccttggaacc 840
ggaagaggta catctgtgct ggagattgtt aaagcatttg agaaggcttc tgggaagaaa 900
atacctctga tttttggtga aagacgccca ggtgatgcag agattctgtt ttcagagact 960
actaaagcag agagggagct taactggaaa gcaaaatacg gtattgaaga gatgtgccgc 1020
gaccaatgga actgggccag caagaaccct tatggctatg gatcacctga ctctatcaag 1080
cagaatggtc accaaacaaa cggatccgct gactcctcca agcagaatgg ccaccgcaca 1140
aacggttcaa ctgactcacc caagcggaac ggccaccatg cgtatgggtc tgctgactca 1200
cccaagcgca acgggcactg cgtttttgga tcatcagacc tcaagccgaa tggtaatggc 1260
cacctgcgct ga 1272
<210>294
<211>423
<212>PRT
<213>玉米
<400>294
Met Ala Val Glu Lys Thr Leu Pro Gly Ala Ser Ala Gly Arg Thr Val
1 5 10 15
Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Ala Val Leu Gln
20 25 30
Leu Leu Leu Ala Gly Phe Arg Ala Val Val Ile Asp Asn Leu Asn Asn
35 40 45
Ser Ser Glu Leu Ala Val Arg Arg Val Ala Ala Leu Ala Gly Asp His
50 55 60
Ser Arg Asn Leu Ser Phe His Lys Ile Asp Leu Arg Asp Lys Gly Ala
65 70 75 80
Leu Glu Met Val Phe Ala Ser Thr Arg Phe Glu Ala Val Ile His Phe
85 90 95
Ala Gly Leu Lys Ala Val Gly Glu Ser Val Gln Lys Pro Leu Leu Tyr
100 105 110
Tyr Asp Asn Asn Val Ile Gly Thr Ile Asn Leu Leu Glu Val Met Ser
115 120 125
Val His Gly Cys Lys Lys Leu Val Phe Ser Ser Ser Ala Ala Val Tyr
130 135 140
Gly Ser Pro Lys Asn Ser Pro Cys Thr Glu Asn Phe Pro Leu Thr Pro
145 150 155 160
Asn Asn Pro Tyr Gly Lys Thr Lys Leu Val Val Glu Asp Ile Cys Arg
165 170 175
Asp Ile Tyr Arg Ser Asp Pro Glu Trp Lys Ile Ile Leu Leu Arg Tyr
180 185 190
Phe Asn Pro Val Gly Ala His Pro Ser Gly Tyr Leu Gly Glu Asp Pro
195 200 205
Arg Gly Ile Pro Asn Asn Leu Met Pro Tyr Val Gln Gln Val Ala Val
210 215 220
Gly Arg Arg Pro Ala Leu Thr Val Leu Gly Asn Asp Tyr Ala Thr Arg
225 230 235 240
Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Val Asp Leu Ala Asp
245 250 255
Gly His Ile Ala Ala Leu Gln Lys Leu Phe Glu Asn Ser Ser Ile Gly
260 265 270
Cys Glu Ala Tyr Asn Leu Gly Thr Gly Arg Gly Thr Ser Val Leu Glu
275 280 285
Ile Val Lys Ala Phe Glu Lys Ala Ser Gly Lys Lys Ile Pro Leu Ile
290 295 300
Phe Gly Glu Arg Arg Pro Gly Asp Ala Glu Ile Leu Phe Ser Glu Thr
305 310 315 320
Thr Lys Ala Glu Arg Glu Leu Asn Trp Lys Ala Lys Tyr Gly Ile Glu
325 330 335
Glu Met Cys Arg Asp Gln Trp Asn Trp Ala Ser Lys Asn Pro Tyr Gly
340 345 350
Tyr Gly Ser Pro Asp Ser Ile Lys Gln Asn Gly His Gln Thr Asn Gly
355 360 365
Ser Ala Asp Ser Ser Lys Gln Asn Gly His Arg Thr Asn Gly Ser Thr
370 375 380
Asp Ser Pro Lys Arg Asn Gly His His Ala Tyr Gly Ser Ala Asp Ser
385 390 395 400
Pro Lys Arg Asn Gly His Cys Val Phe Gly Ser Ser Asp Leu Lys Pro
405 410 415
Asn Gly Asn Gly His Leu Arg
420
<210>295
<21l>1272
<212>DNA
<213>玉米
<400>295
atggcggtgg agaagacgct gcccggcgcg agtgcgggga ggaccgtgct ggtcacgggc 60
ggggcgggct acatcggtag ccacgccgtg ctgcagctcc tcctcgcggg cttccgcgcc 120
gtcgtcatcg acaacctcaa caactcctcc gagctggccg tccgccgcgt cgccgcgctc 180
gcgggggacc actcccgcaa cctctctttc cacaagattg atctccgtga caagggagca 240
ctggaaatgg tttttgcttc tacaagattt gaagctgtca ttcacttcgc tggattgaaa 300
gctgtgggtg aaagcgtaca gaagccatta ctttattatg acaacaacgt cattggcacg 360
ataaatcttc tagaagttat gtctgttcac ggttgcaaga agttggtgtt ctcatcatca 420
gctgcagttt atggatcacc caaaaactca ccctgcacag aaaattttcc tcttactcca 480
aacaatccat atggcaaaac aaagctcgtt gttgaagata tttgccggga tatctaccgt 540
tcagatcctg aatggaagat cattttactt aggtacttca atccagttgg tgctcatcct 600
agtggatatc ttggcgagga cccacgagga attcccaaca atcttatgcc ctatgttcag 660
caagttgcgg ttggtaggag gccagctcta acagttttag gaaatgacta tgcaacaaga 720
gatgggactg gggtccgaga ttacatccat gtggttgacc ttgctgacgg acatattgct 780
gcattgcaga agctttttga gaactctagc atagggtgtg aagcgtacaa ccttggaacc 840
ggaagaggta catctgtgct ggagattgtt aaagcatttg agaaggcttc tgggaagaaa 900
atacctctga tttttggtga aagacgccca ggtgatgcag agattctgtt ttcagagact 960
actaaagcag agagggagct taactggaaa gcaaaatacg gtattgaaga gatgtgccgc 1020
gaccaatgga actgggccag caagaaccct tatggctatg gatcacctga ctctatcaag 1080
cagaatggtc accaaacaaa cggatccgct gactcctcca agcagaatgg ccaccgcaca 1140
aacggttcaa ctgactcacc caagcggaac ggccaccatg cgtatgggtc tgctgactca 1200
cccaagcgca acgggcactg cgtttttgga tcatcagacc tcaagccgaa tggtaatggc 1260
cacctgcgct ga 1272
<210>296
<211>423
<212>PRT
<213>玉米
<400>296
Met Ala Val Glu Lys Thr Leu Pro Gly Ala Ser Ala Gly Arg Thr Val
1 5 10 15
Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Ala Val Leu Gln
20 25 30
Leu Leu Leu Ala Gly Phe Arg Ala Val Val Ile Asp Asn Leu Asn Asn
35 40 45
Ser Ser Glu Leu Ala Val Arg Arg Val Ala Ala Leu Ala Gly Asp His
50 55 60
Ser Arg Asn Leu Ser Phe His Lys Ile Asp Leu Arg Asp Lys Gly Ala
65 70 75 80
Leu Glu Met Val Phe Ala Ser Thr Arg Phe Glu Ala Val Ile His Phe
85 90 95
Ala Gly Leu Lys Ala Val Gly Glu Ser Val Gln Lys Pro Leu Leu Tyr
100 105 110
Tyr Asp Asn Asn Val Ile Gly Thr Ile Asn Leu Leu Glu Val Met Ser
115 120 125
Val His Gly Cys Lys Lys Leu Val Phe Ser Ser Ser Ala Ala Val Tyr
130 135 140
Gly Ser Pro Lys Asn Ser Pro Cys Thr Glu Asn Phe Pro Leu Thr Pro
145 150 155 160
Asn Asn Pro Tyr Gly Lys Thr Lys Leu Val Val Glu Asp Ile Cys Arg
165 170 175
Asp Ile Tyr Arg Ser Asp Pro Glu Trp Lys Ile Ile Leu Leu Arg Tyr
180 185 190
Phe Asn Pro Val Gly Ala His Pro Ser Gly Tyr Leu Gly Glu Asp Pro
195 200 205
Arg Gly Ile Pro Asn Asn Leu Met Pro Tyr Val Gln Gln Val Ala Val
210 215 220
Gly Arg Arg Pro Ala Leu Thr Val Leu Gly Asn Asp Tyr Ala Thr Arg
225 230 235 240
Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Val Asp Leu Ala Asp
245 250 255
Gly His Ile Ala Ala Leu Gln Lys Leu Phe Glu Asn Ser Ser Ile Gly
260 265 270
Cys Glu Ala Tyr Asn Leu Gly Thr Gly Arg Gly Thr Ser Val Leu Glu
275 280 285
Ile Val Lys Ala Phe Glu Lys Ala Ser Gly Lys Lys Ile Pro Leu Ile
290 295 300
Phe Gly Glu Arg Arg Pro Gly Asp Ala Glu Ile Leu Phe Ser Glu Thr
305 310 315 320
Thr Lys Ala Glu Arg Glu Leu Asn Trp Lys Ala Lys Tyr Gly Ile Glu
325 330 335
Glu Met Cys Arg Asp Gln Trp Asn Trp Ala Ser Lys Asn Pro Tyr Gly
340 345 350
Tyr Gly Ser Pro Asp Ser Ile Lys Gln Asn Gly His Gln Thr Asn Gly
355 360 365
Ser Ala Asp Ser Ser Lys Gln Asn Gly His Arg Thr Asn Gly Ser Thr
370 375 380
Asp Ser Pro Lys Arg Asn Gly His His Ala Tyr Gly Ser Ala Asp Ser
385 390 395 400
Pro Lys Arg Asn Gly His Cys Val Phe Gly Ser Ser Asp Leu Lys Pro
405 410 415
Asn Gly Asn Gly His Leu Arg
420
<210>297
<211>1272
<212>DNA
<213>玉米
<400>297
atggcggtgg agaagacgct gcccggcgcg agtgctggga ggaccgtgct ggtcacgggc 60
ggggcgggct acatcggtag ccacgccgtg ctgcagctcc tcctcgcggg cttccgcgcc 120
gtcgtcgtcg acaacctcaa caactcctcc gagctggccg tccgccgcgt cgccgcgctc 180
gcgggggacc actcccgcaa cctctctttc cacaagattg atctccgtga caagggagca 240
ctggaaatgg tttttgcttc tacaagattt gaagctgtca ttcacttcgc tggattgaaa 300
gctgtgggtg aaagcgtaca gaagccatta ctttattatg acaacaacgt cattggcacg 360
ataaatcttc tagaagttat gtctgttcac ggttgcaaga agttggtgtt ctcatcatca 420
gctgcagttt atggatcacc caaaaactca ccctgcacag aaaattttcc tcttactcca 480
aacaatccat atggcaaaac aaagctcgtt gttgaagata tttgccggga tatctaccgt 540
tcagatcctg aatggaagat cattttactt aggtacttca atccagttgg tgctcatcct 600
agtggatatc ttggcgagga cccacgagga attcccaaca atcttatgcc ctatgttcag 660
caagttgcgg ttggtaggag gccagctcta acagttttag gaaatgacta tgcaacaaga 720
gatgggactg gggtccgaga ttacatccat gtggttgacc ttgctgacgg acatattgct 780
gcattgcaga agctttttga gaactctagc atagggtgtg aagcgtacaa ccttggaacc 840
ggaagaggta catctgtgct ggagattgtt aaagcatttg agaaggcttc tgggaagaaa 900
atacctctga tttttggtga aagacgccca ggtgatgcag agattctgtt ttcagagact 960
actaaagcag agagggagct taactggaaa gcaaaatacg gtattgaaga gatgtgccgc 1020
gaccaatgga actgggccag caagaaccct tatggctatg gatcacctga ctctatcaag 1080
cagaatggtc accaaacaaa cggatccgct gactcctcca agcagaatgg ccaccgcaca 1140
aacggttcaa ctgactcacc caagcggaac ggccaccatg cgtatgggtc tgctgactca 1200
cccaagcgca acgggcactg cgtttttgga tcatcagacc tcaagccgaa tggtaatggc 1260
cacctgcgct ga 1272
<210>298
<211>423
<212>PRT
<213>玉米
<400>298
Met Ala Val Glu Lys Thr Leu Pro Gly Ala Ser Ala Gly Arg Thr Val
1 5 10 15
Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Ala Val Leu Gln
20 25 30
Leu Leu Leu Ala Gly Phe Arg Ala Val Val Val Asp Asn Leu Asn Asn
35 40 45
Ser Ser Glu Leu Ala Val Arg Arg Val Ala Ala Leu Ala Gly Asp His
50 55 60
Ser Arg Asn Leu Ser Phe His Lys Ile Asp Leu Arg Asp Lys Gly Ala
65 70 75 80
Leu Glu Met Val Phe Ala Ser Thr Arg Phe Glu Ala Val Ile His Phe
85 90 95
Ala Gly Leu Lys Ala Val Gly Glu Ser Val Gln Lys Pro Leu Leu Tyr
100 105 110
Tyr Asp Asn Asn Val Ile Gly Thr Ile Asn Leu Leu Glu Val Met Ser
115 120 125
Val His Gly Cys Lys Lys Leu Val Phe Ser Ser Ser Ala Ala Val Tyr
130 135 140
Gly Ser Pro Lys Asn Ser Pro Cys Thr Glu Asn Phe Pro Leu Thr Pro
145 150 155 160
Asn Asn Pro Tyr Gly Lys Thr Lys Leu Val Val Glu Asp Ile Cys Arg
165 170 175
Asp Ile Tyr Arg Ser Asp Pro Glu Trp Lys Ile Ile Leu Leu Arg Tyr
180 185 190
Phe Asn Pro Val Gly Ala His Pro Ser Gly Tyr Leu Gly Glu Asp Pro
195 200 205
Arg Gly Ile Pro Asn Asn Leu Met Pro Tyr Val Gln Gln Val Ala Val
210 215 220
Gly Arg Arg Pro Ala Leu Thr Val Leu Gly Asn Asp Tyr Ala Thr Arg
225 230 235 240
Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Val Asp Leu Ala Asp
245 250 255
Gly His Ile Ala Ala Leu Gln Lys Leu Phe Glu Asn Ser Ser Ile Gly
260 265 270
Cys Glu Ala Tyr Asn Leu Gly Thr Gly Arg Gly Thr Ser Val Leu Glu
275 280 285
Ile Val Lys Ala Phe Glu Lys Ala Ser Gly Lys Lys Ile Pro Leu Ile
290 295 300
Phe Gly Glu Arg Arg Pro Gly Asp Ala Glu Ile Leu Phe Ser Glu Thr
305 310 315 320
Thr Lys Ala Glu Arg Glu Leu Asn Trp Lys Ala Lys Tyr Gly Ile Glu
325 330 335
Glu Met Cys Arg Asp Gln Trp Asn Trp Ala Ser Lys Asn Pro Tyr Gly
340 345 350
Tyr Gly Ser Pro Asp Ser Ile Lys Gln Asn Gly His Gln Thr Asn Gly
355 360 365
Ser Ala Asp Ser Ser Lys Gln Asn Gly His Arg Thr Asn Gly Ser Thr
370 375 380
Asp Ser Pro Lys Arg Asn Gly His His Ala Tyr Gly Ser Ala Asp Ser
385 390 395 400
Pro Lys Arg Asn Gly His Cys Val Phe Gly Ser Ser Asp Leu Lys Pro
405 410 415
Asn Gly Asn Gly His Leu Arg
420
<210>299
<211>1068
<212>DNA
<213>玉米
<400>299
atggtgtccg ccgtgctccg gaccatcctc gtgacgggcg gcgccgggta catcggcagc 60
cacacggtgc tgcagctgct gcagcagggc ttccgcgtcg tcgtcgtcga caacctcgac 120
aacgcctccg aggccgccct cgcccgcgtc gccgagctcg ccgggcacga cggcgccaac 180
ctcgtcttcc acaaggttga ccttcgcgac aggcacgcgt tggtggacat cttctcgtcg 240
cacaggttcg aggctgtcat tcactttgct gggctcaagg ctgttgggga gagcgtgcac 300
aagcccctac tttactacga caacaacctg gtcggcacca tcaccctcct ggaggtgatg 360
gctgcgaacg gctgcaagaa gctggtgttc tcgtcatctg caactgtcta tgggtggccc 420
aaggaagtac cctgcaccga agaattcccg ctctgcgcca ccaatcccta tgggcggaca 480
aagcttgtga ttgaagacat ctgccgcgac gtccaccgct ccgaccccga ctggaagatc 540
atactgctca ggtacttcaa ccccgttggc gctcatccaa gcgggtacat cggcgaagac 600
ccctgcggtg tcccgaacaa cctgatgccc tacgtgcagc aagtcgctgt tgggaagtta 660
cctcacctca cggtctacgg gacggactac agcaccaagg atgggactgg ggtgcgtgat 720
tacatccacg ttgtcgacct ggctgacggc cacatagcag ccctgaggaa gctctacgaa 780
gactccgaca aaataggctg tgaagtgtac aacttgggga ctggaaaggg gacgtccgtg 840
ttggaaatgg tggctgcatt cgagaaggct tctgggaaga aaatccctct ggtgttcgct 900
gggcgaagac ccggagacgc agagatcgtc tacgccgcaa ctgccaaggc agagaaggag 960
ctcaaatgga aggccaagta cgggatcgag gagatgtgca gagatctgtg gaactgggcg 1020
agcaagaacc cgtacgggta cgctgggtca cgcgacaaca gcaaatga 1068
<210>300
<211>355
<212>PRT
<213>玉米
<400>300
Met Val Ser Ala Val Leu Arg Thr Ile Leu Val Thr Gly Gly Ala Gly
1 5 10 15
Tyr Ile Gly Ser His Thr Val Leu Gln Leu Leu Gln Gln Gly Phe Arg
20 25 30
Val Val Val Val Asp Asn Leu Asp Asn Ala Ser Glu Ala Ala Leu Ala
35 40 45
Arg Val Ala Glu Leu Ala Gly His Asp Gly Ala Asn Leu Val Phe His
50 55 60
Lys Val Asp Leu Arg Asp Arg His Ala Leu Val Asp Ile Phe Ser Ser
65 70 75 80
His Arg Phe Glu Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly
85 90 95
Glu Ser Val His Lys Pro Leu Leu Tyr Tyr Asp Asn Asn Leu Val Gly
100 105 110
Thr Ile Thr Leu Leu Glu Val Met Ala Ala Asn Gly Cys Lys Lys Leu
115 120 125
Val Phe Ser Ser Ser Ala Thr Val Tyr Gly Trp Pro Lys Glu Val Pro
130 135 140
Cys Thr Glu Glu Phe Pro Leu Cys Ala Thr Asn Pro Tyr Gly Arg Thr
145 150 155 160
Lys Leu Val Ile Glu Asp Ile Cys Arg Asp Val His Arg Ser Asp Pro
165 170 175
Asp Trp Lys Ile Ile Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala His
180 185 190
Pro Ser Gly Tyr Ile Gly Glu Asp Pro Cys Gly Val Pro Asn Asn Leu
195 200 205
Met Pro Tyr Val Gln Gln Val Ala Val Gly Lys Leu Pro His Leu Thr
210 215 220
Val Tyr Gly Thr Asp Tyr Ser Thr Lys Asp Gly Thr Gly Val Arg Asp
225 230 235 240
Tyr Ile His Val Val Asp Leu Ala Asp Gly His Ile Ala Ala Leu Arg
245 250 255
Lys Leu Tyr Glu Asp Ser Asp Lys Ile Gly Cys Glu Val Tyr Asn Leu
260 265 270
Gly Thr Gly Lys Gly Thr Ser Val Leu Glu Met Val Ala Ala Phe Glu
275 280 285
Lys Ala Ser Gly Lys Lys Ile Pro Leu Val Phe Ala Gly Arg Arg Pro
290 295 300
Gly Asp Ala Glu Ile Val Tyr Ala Ala Thr Ala Lys Ala Glu Lys Glu
305 310 315 320
Leu Lys Trp Lys Ala Lys Tyr Gly Ile Glu Glu Met Cys Arg Asp Leu
325 330 335
Trp Asn Trp Ala Ser Lys Asn Pro Tyr Gly Tyr Ala Gly Ser Arg Asp
340 345 350
Asn Ser Lys
355
<210>301
<211>1065
<212>DNA
<213>稻
<400>301
atggtttcgg ccttgttgcg gacgatcctg gtgacgggcg gcgccggcta catcggcagc 60
cacaccgtcc tccagcttct ccaactcggc ttccgcgttg tcgtcctcga caacctcgac 120
aacgcctccg agctcgccat cctccgcgtc agggaactcg ccggacacaa cgccaacaac 180
ctcgacttcc gcaaggttga cctccgcgac aagcaagcgt tggaccaaat cttctcctct 240
caaaggtttg aggctgtcat ccattttgcc gggctgaaag ctgttggcga gagcgtgcag 300
aagcccctgc tttactacga caacaacctc atcggcacca tcactctcct gcaggtcatg 360
gccgcacatg gctgcaccaa gctggtgttc tcatcatccg caactgtcta cgggtggccc 420
aaggaggtgc cctgcactga agaatcccca ctttgtgcaa tgaaccccta cggcagaaca 480
aagctggtaa tcgaagacat gtgccgggat ctgcatgcct cagacccaaa ctggaagatc 540
atactgctcc gatacttcaa ccctgttgga gctcacccaa gcgggtacat tggtgaggac 600
ccctgcggca tcccaaacaa cctcatgccc ttcgtccagc aggtcgctgt tggcaggagg 660
ccggccctta ccgtctatgg aaccgactac aacaccaagg atggaactgg ggttcgtgac 720
tatatccatg ttgttgatct agcggatggt catatcgccg cgttaaggaa gctctatgaa 780
gattctgata gaataggatg tgaggtgtac aatctgggca ctggaaaggg gacatctgtg 840
ctggaaatgg ttgcagcatt cgagaaagct tctggaaaga aaatcccgct tgtatttgct 900
ggacgaaggc ctggagatgc cgagatcgtt tacgctcaaa ctgccaaagc tgagaaggaa 960
ctgaaatgga aggcaaaata cggggtagag gagatgtgca gggacctgtg gaattgggcg 1020
agcaagaacc cctacgggta tggatcgccg gacagtagca actga 1065
<210>302
<211>354
<212>PRT
<213>稻
<400>302
Met Val Ser Ala Leu Leu Arg Thr Ile Leu Val Thr Gly Gly Ala Gly
1 5 10 15
Tyr Ile Gly Ser His Thr Val Leu Gln Leu Leu Gln Leu Gly Phe Arg
20 25 30
Val Val Val Leu Asp Asn Leu Asp Asn Ala Ser Glu Leu Ala Ile Leu
35 40 45
Arg Val Arg Glu Leu Ala Gly His Asn Ala Asn Asn Leu Asp Phe Arg
50 55 60
Lys Val Asp Leu Arg Asp Lys Gln Ala Leu Asp Gln Ile Phe Ser Ser
65 70 75 80
Gln Arg Phe Glu Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly
85 90 95
Glu Ser Val Gln Lys Pro Leu Leu Tyr Tyr Asp Asn Asn Leu Ile Gly
100 105 110
Thr Ile Thr Leu Leu Gln Val Met Ala Ala His Gly Cys Thr Lys Leu
115 120 125
Val Phe Ser Ser Ser Ala Thr Val Tyr Gly Trp Pro Lys Glu Val Pro
130 135 140
Cys Thr Glu Glu Ser Pro Leu Cys Ala Met Asn Pro Tyr Gly Arg Thr
145 150 155 160
Lys Leu Val Ile Glu Asp Met Cys Arg Asp Leu His Ala Ser Asp Pro
165 170 175
Asn Trp Lys Ile Ile Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala His
180 185 190
Pro Ser Gly Tyr Ile Gly Glu Asp Pro Cys Gly Ile Pro Asn Asn Leu
195 200 205
Met Pro Phe Val Gln Gln Val Ala Val Gly Arg Arg Pro Ala Leu Thr
210 215 220
Val Tyr Gly Thr Asp Tyr Asn Thr Lys Asp Gly Thr Gly Val Arg Asp
225 230 235 240
Tyr Ile His Val Val Asp Leu Ala Asp Gly His Ile Ala Ala Leu Arg
245 250 255
Lys Leu Tyr Glu Asp Ser Asp Arg Ile Gly Cys Glu Val Tyr Asn Leu
260 265 270
Gly Thr Gly Lys Gly Thr Ser Val Leu Glu Met Val Ala Ala Phe Glu
275 280 285
Lys Ala Ser Gly Lys Lys Ile Pro Leu Val Phe Ala Gly Arg Arg Pro
290 295 300
Gly Asp Ala Glu Ile Val Tyr Ala Gln Thr Ala Lys Ala Glu Lys Glu
305 310 315 320
Leu Lys Trp Lys Ala Lys Tyr Gly Val Glu Glu Met Cys Arg Asp Leu
325 330 335
Trp Asn Trp Ala Ser Lys Asn Pro Tyr Gly Tyr Gly Ser Pro Asp Ser
340 345 350
Ser Asn
<210>303
<211>1176
<212>DNA
<213>大豆
<400>303
atggcatcgc gcgtcagcat tggcaacctt acctcctccg cgccgtatat taattcccct 60
cactttcgct caccacttaa gatttccaac aacccctctc tgcaaaacgc ttcgcataag 120
gtacttatgc gcgataagac tgtactggta accggcggag ccggttacat cggcagccac 180
accgttcttc agctcttgct cggaggtttc agagccgtcg tcctcgacaa cctcgaaaat 240
tcctccgagg ttgccatcca cagagtcagg gagctcgccg gcgaatttgg gaacaacctc 300
tcctttcaca aggtggacct acgggacaga gctgctctag accaaatatt ttcttccaca 360
caattcgatg ctgtcataca ttttgctgga ctgaaagcag taggagaaag tgtgcaaaaa 420
cctttactat actataacaa caacttgact gggacaatca ctctattgga agtcatggct 480
gcccatggat gcaagaagct cgtgttttca tcttcagcaa ctgtatatgg ttggccaaag 540
gaggttccat gcacagaaga gttccctctg tcagcaatga acccatatgg acgaactaag 600
cttatcattg aagaaatttg ccgtgatgtc cactgtgcag agccagattg taaaataatt 660
ttgttaagat acttcaaccc agttggtgca caccccagtg gttatattgg ggaggatcct 720
cgtggaattc caaacaatct catgccattt gttcagcaag tagcagttgg ccgacggcct 780
gcactgacag tttttggaaa tgattataat acaagtgatg gcactggggt tcgggattac 840
attcatgttg ttgatttagc agatgggcac attgctgcat tgcttaaact agatgaacct 900
aatataggtt gtgaggttta taacctggga acaggaaagg gaacatcagt tttggagatg 960
gttagagctt ttgaaatggc atctggaaag aaaattccac ttgtgatggc tggccgtaga 1020
cctggtgatg ctgaaattgt ttatgcatca acaaagaaag cggaaagaga gcttaaatgg 1080
aaggcaaaat atggcattga tgagatgtgc cgtgatcaat ggaattgggc tagcaaaaac 1140
ccttatggct atggagatca gggctccacc gattaa 1176
<210>304
<211>391
<212>PRT
<213>大豆
<400>304
Met Ala Ser Arg Val Ser Ile Gly Asn Leu Thr Ser Ser Ala Pro Tyr
1 5 10 15
Ile Asn Ser Pro His Phe Arg Ser Pro Leu Lys Ile Ser Asn Asn Pro
20 25 30
Ser Leu Gln Asn Ala Ser His Lys Val Leu Met Arg Asp Lys Thr Val
35 40 45
Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Thr Val Leu Gln
50 55 60
Leu Leu Leu Gly Gly Phe Arg Ala Val Val Leu Asp Asn Leu Glu Asn
65 70 75 80
Ser Ser Glu Val Ala Ile His Arg Val Arg Glu Leu Ala Gly Glu Phe
85 90 95
Gly Asn Asn Leu Ser Phe His Lys Val Asp Leu Arg Asp Arg Ala Ala
100 105 110
Leu Asp Gln Ile Phe Ser Ser Thr Gln Phe Asp Ala Val Ile His Phe
115 120 125
Ala Gly Leu Lys Ala Val Gly Glu Ser Val Gln Lys Pro Leu Leu Tyr
130 135 140
Tyr Asn Asn Asn Leu Thr Gly Thr Ile Thr Leu Leu Glu Val Met Ala
145 150 155 160
Ala His Gly Cys Lys Lys Leu Val Phe Ser Ser Ser Ala Thr Val Tyr
165 170 175
Gly Trp Pro Lys Glu Val Pro Cys Thr Glu Glu Phe Pro Leu Ser Ala
180 185 190
Met Asn Pro Tyr Gly Arg Thr Lys Leu Ile Ile Glu Glu Ile Cys Arg
195 200 205
Asp Val His Cys Ala Glu Pro Asp Cys Lys Ile Ile Leu Leu Arg Tyr
210 215 220
Phe Asn Pro Val Gly Ala His Pro Ser Gly Tyr Ile Gly Glu Asp Pro
225 230 235 240
Arg Gly Ile Pro Asn Asn Leu Met Pro Phe Val Gln Gln Val Ala Val
245 250 255
Gly Arg Arg Pro Ala Leu Thr Val Phe Gly Asn Asp Tyr Asn Thr Ser
260 265 270
Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Val Asp Leu Ala Asp
275 280 285
Gly His Ile Ala Ala Leu Leu Lys Leu Asp Glu Pro Asn Ile Gly Cys
290 295 300
Glu Val Tyr Asn Leu Gly Thr Gly Lys Gly Thr Ser Val Leu Glu Met
305 310 315 320
Val Arg Ala Phe Glu Met Ala Ser Gly Lys Lys Ile Pro Leu Val Met
325 330 335
Ala Gly Arg Arg Pro Gly Asp Ala Glu Ile Val Tyr Ala Ser Thr Lys
340 345 350
Lys Ala Glu Arg Glu Leu Lys Trp Lys Ala Lys Tyr Gly Ile Asp Glu
355 360 365
Met Cys Arg Asp Gln Trp Asn Trp Ala Ser Lys Asn Pro Tyr Gly Tyr
370 375 380
Gly Asp Gln Gly Ser Thr Asp
385 390
<210>305
<211>1053
<212>DNA
<213>大豆
<400>305
atgcctgccc aatcgattct ggttaccgga ggagccggtt acatcggtag ccacaccatc 60
cttcagcttc tcctcagcgg ttaccatgtc ttcgccgtcg acaacttcga caattcttcc 120
gaaaccgcca tcaacagagt caaggaactc gccggagaat tagcaaataa cctttccttt 180
tgcaagcttg acttgcggga cagagctgcc ctcgagaaaa tattttcaac cgtaaagttt 240
gatgccgtca tacattttgc tgggcttaaa gcagtgggtg aaagcgtgaa gaaaccactg 300
ctctactttg acaacaattt gatagggaca atcgttctat ttgaagtcat ggctgcccac 360
ggatgcaaga agcttgtgtt ctcatcttca gcaactgtat atgggtggcc aaaggaggtc 420
ccatgtaccg aagagttccc tttgtcagca acaaacccat atggacgaac caagcttatc 480
atcgaagaaa tttgtcgcga tatccaccgt gcagattcag attggacagt tatactattg 540
agatacttca acccagttgg tgcacatccc agtggttata ttggtgagga tcctcttgga 600
attccaaaca atctcatgcc ctttgttcaa caagtggcag ttggcagacg ccctgcattg 660
acagtttttg gaagcgatta taaaacaact gacggcactg gagttcgtga ttacattcat 720
gttcttgatt tagcagatgg gcatattgct gcgttgcgta aactggatga tcctaaaata 780
ggttgtgagg tttataactt gggaacagga aagggaacat cagttttgga gatggtaaac 840
gcttttgaac aggcctctgg aaagaaaatt ccacttgcaa tggcgggtcg gagacctgga 900
gatgctgaaa ttgtttatgc atcaacagaa aaagcggaaa gagaacttaa ttggaagact 960
aaatatagca tcgatgatat gtgccgcgat caatggaatt gggctagcaa aaacccttat 1020
ggctatggtg catctgcaga ttcctccaat tga 1053
<210>306
<211>350
<212>PRT
<213>大豆
<400>306
Met Pro Ala Gln Ser Ile Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly
1 5 10 15
Ser His Thr Ile Leu Gln Leu Leu Leu Ser Gly Tyr His Val Phe Ala
20 25 30
Val Asp Asn Phe Asp Asn Ser Ser Glu Thr Ala Ile Asn Arg Val Lys
35 40 45
Glu Leu Ala Gly Glu Leu Ala Asn Asn Leu Ser Phe Cys Lys Leu Asp
50 55 60
Leu Arg Asp Arg Ala Ala Leu Glu Lys Ile Phe Ser Thr Val Lys Phe
65 70 75 80
Asp Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly Glu Ser Val
85 90 95
Lys Lys Pro Leu Leu Tyr Phe Asp Asn Asn Leu Ile Gly Thr Ile Val
100 105 110
Leu Phe Glu Val Met Ala Ala His Gly Cys Lys Lys Leu Val Phe Ser
115 120 125
Ser Ser Ala Thr Val Tyr Gly Trp Pro Lys Glu Val Pro Cys Thr Glu
130 135 140
Glu Phe Pro Leu Ser Ala Thr Asn Pro Tyr Gly Arg Thr Lys Leu Ile
145 150 155 160
Ile Glu Glu Ile Cys Arg Asp Ile His Arg Ala Asp Ser Asp Trp Thr
165 170 175
Val Ile Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala His Pro Ser Gly
180 185 190
Tyr Ile Gly Glu Asp Pro Leu Gly Ile Pro Asn Asn Leu Met Pro Phe
195 200 205
Val Gln Gln Val Ala Val Gly Arg Arg Pro Ala Leu Thr Val Phe Gly
210 215 220
Ser Asp Tyr Lys Thr Thr Asp Gly Thr Gly Val Arg Asp Tyr Ile His
225 230 235 240
Val Leu Asp Leu Ala Asp Gly His Ile Ala Ala Leu Arg Lys Leu Asp
245 250 255
Asp Pro Lys Ile Gly Cys Glu Val Tyr Asn Leu Gly Thr Gly Lys Gly
260 265 270
Thr Ser Val Leu Glu Met Val Asn Ala Phe Glu Gln Ala Ser Gly Lys
275 280 285
Lys Ile Pro Leu Ala Met Ala Gly Arg Arg Pro Gly Asp Ala Glu Ile
290 295 300
Val Tyr Ala Ser Thr Glu Lys Ala Glu Arg Glu Leu Asn Trp Lys Thr
305 310 315 320
Lys Tyr Ser Ile Asp Asp Met Cys Arg Asp Gln Trp Asn Trp Ala Ser
325 330 335
Lys Asn Pro Tyr Gly Tyr Gly Ala Ser Ala Asp Ser Ser Asn
340 345 350
<210>307
<211>1050
<212>DNA
<213>大豆
<400>307
atgcgcgaca agactgtgct ggtaaccggc ggagccggtt acatcggcac ccacaccgtt 60
cttcagctct tgctcggagg ttgcagaacc gtcgtcgtcg acaatctcga caattcctcc 120
gaggtttcta tccaccgagt cagggagctt gccggcgaat ttgggaacaa cctctccttt 180
cacaaggtgg acctacggga cagggatgca ctagagcaaa tttttgtttc cacacaattt 240
gatgctgtca tacactttgc tggactgaaa gcagtaggag aaagtgtgca aaaaccttta 300
ctatactata acaacaactt gactgggaca atcactctat tggaagtcat ggctgcccat 360
ggatgcaaga agctcgtgtt ctcttcttca gcaactgtat atggttggcc aaaggaagtt 420
ccatgcacag aagagttccc tctgtcagca atgaacccat atggacgaac taagcttatc 480
attgaagaaa tttgccgtga tgtccactgt gcagagccag attgtaaaat aattttgtta 540
agatacttca acccagttgg tgcacacccc agcggttata ttggggagga tcctcgcgga 600
attccaaaca atctcatgcc atttgttcag caagtagcag ttggccgacg gcctgcactg 660
acagtttttg gaaatgatta taatacaagt gatggcactg gggttcggga ttacattcat 720
gttgttgatt tagcagatgg gcacattgct gcattgctta aactagatga acctaatata 780
ggttgtgagg tttataacct gggaacagga aagggaacat cagttttgga gatggttaga 840
gcttttgaaa tggcatctgg aaagaaaatt ccacttgtga tggctggccg tagacctggt 900
gatgctgaaa ttgtttatgc atcaacaaag aaagcggaaa gagagcttaa atggaaggca 960
aaatatggca ttgatgagat gtgccgtgat caatggaatt gggctagcaa aaacccttat 1020
ggctatggag atcagggctc caccgattaa 1050
<210>308
<211>349
<212>PRT
<213>大豆
<400>308
Met Arg Asp Lys Thr Val Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly
1 5 10 15
Thr His Thr Val Leu Gln Leu Leu Leu Gly Gly Cys Arg Thr Val Val
20 25 30
Val Asp Asn Leu Asp Asn Ser Ser Glu Val Ser Ile His Arg Val Arg
35 40 45
Glu Leu Ala Gly Glu Phe Gly Asn Asn Leu Ser Phe His Lys Val Asp
50 55 60
Leu Arg Asp Arg Asp Ala Leu Glu Gln Ile Phe Val Ser Thr Gln Phe
65 70 75 80
Asp Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly Glu Ser Val
85 90 95
Gln Lys Pro Leu Leu Tyr Tyr Asn Asn Asn Leu Thr Gly Thr Ile Thr
100 105 110
Leu Leu Glu Val Met Ala Ala His Gly Cys Lys Lys Leu Val Phe Ser
115 120 125
Ser Ser Ala Thr Val Tyr Gly Trp Pro Lys Glu Val Pro Cys Thr Glu
130 135 140
Glu Phe Pro Leu Ser Ala Met Asn Pro Tyr Gly Arg Thr Lys Leu Ile
145 150 155 160
Ile Glu Glu Ile Cys Arg Asp Val His Cys Ala Glu Pro Asp Cys Lys
165 170 175
Ile Ile Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala His Pro Ser Gly
180 185 190
Tyr Ile Gly Glu Asp Pro Arg Gly Ile Pro Asn Asn Leu Met Pro Phe
195 200 205
Val Gln Gln Val Ala Val Gly Arg Arg Pro Ala Leu Thr Val Phe Gly
210 215 220
Asn Asp Tyr Asn Thr Ser Asp Gly Thr Gly Val Arg Asp Tyr Ile His
225 230 235 240
Val Val Asp Leu Ala Asp Gly His Ile Ala Ala Leu Leu Lys Leu Asp
245 250 255
Glu Pro Asn Ile Gly Cys Glu Val Tyr Asn Leu Gly Thr Gly Lys Gly
260 265 270
Thr Ser Val Leu Glu Met Val Arg Ala Phe Glu Met Ala Ser Gly Lys
275 280 285
Lys Ile Pro Leu Val Met Ala Gly Arg Arg Pro Gly Asp Ala Glu Ile
290 295 300
Val Tyr Ala Ser Thr Lys Lys Ala Glu Arg Glu Leu Lys Trp Lys Ala
305 310 315 320
Lys Tyr Gly Ile Asp Glu Met Cys Arg Asp Gln Trp Asn Trp Ala Ser
325 330 335
Lys Asn Pro Tyr Gly Tyr Gly Asp Gln Gly Ser Thr Asp
340 345
<210>309
<211>1050
<212>DNA
<213>大豆
<400>309
atgcgcgaca agactgtgct ggtaaccggc ggagccggtt acatcggcac ccacaccgtt 60
cttcagctct tgctcggagg ttgcagaacc gtcgtcgtcg acaatctcga caattcctcc 120
gaggtttcta tccaccgagt cagggagctt gccggcgaat ttgggaacaa cctctccttt 180
cacaaggtgg acctacggga cagggatgca ctagagcaaa tttttgtttc cacacaattt 240
gatgctgtca tacactttgc tggactgaaa gcagtaggag aaagtgtgca aaaaccttta 300
ctatactata acaacaactt gactgggaca atcactctat tggaagtcat ggctgcccat 360
ggatgcaaga agctcgtgtt ctcttcttca gcaactgtat atggttggcc aaaggaagtt 420
ccatgcacag aagagttccc tctgtcagca atgaacccat atggacgaac taagcttatc 480
attgaagaaa tttgtcgtga tgtccaccgt gcagagccag attggaaaat aatattgtta 540
agatacttca acccagtcgg tgcacaccct agcggttgta ttggggagga tccccgcgga 600
attccaaaca atctcatgcc atttgttcag caagtagcag ttggccgacg gcctgcactg 660
acagtttttg gaaatgatta taatacaact gatggcactg gggttcggga ttacattcat 720
gttgttgatt tagcagatgg gcacattgct gcattgctta aactagatga acctaatata 780
ggttgtgagg tttataacct gggaacagga aagggaacat cagttttgga gatggttaga 840
gcttttgaaa tggcatctgg aaagaaaatt ccacttgtga tggctggccg tagacctggt 900
gatgctgaaa ttgtttatgc atcaacaaag aaagcggaaa gagagcttaa atggaaggca 960
aaatatggca ttgatgagat gtgccgaaat caatggaatt gggctagcaa aaacccttat 1020
ggctatggag atcagggctc caccgattaa 1050
<210>310
<211>349
<212>PRT
<213>大豆
<400>310
Met Arg Asp Lys Thr Val Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly
1 5 10 15
Thr His Thr Val Leu Gln Leu Leu Leu Gly Gly Cys Arg Thr Val Val
20 25 30
Val Asp Asn Leu Asp Asn Ser Ser Glu Val Ser Ile His Arg Val Arg
35 40 45
Glu Leu Ala Gly Glu Phe Gly Asn Asn Leu Ser Phe His Lys Val Asp
50 55 60
Leu Arg Asp Arg Asp Ala Leu Glu Gln Ile Phe Val Ser Thr Gln Phe
65 70 75 80
Asp Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly Glu Ser Val
85 90 95
Gln Lys Pro Leu Leu Tyr Tyr Asn Asn Asn Leu Thr Gly Thr Ile Thr
100 105 110
Leu Leu Glu Val Met Ala Ala His Gly Cys Lys Lys Leu Val Phe Ser
115 120 125
Ser Ser Ala Thr Val Tyr Gly Trp Pro Lys Glu Val Pro Cys Thr Glu
130 135 140
Glu Phe Pro Leu Ser Ala Met Asn Pro Tyr Gly Arg Thr Lys Leu Ile
145 150 155 160
Ile Glu Glu Ile Cys Arg Asp Val His Arg Ala Glu Pro Asp Trp Lys
165 170 175
Ile Ile Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala His Pro Ser Gly
180 185 190
Cys Ile Gly Glu Asp Pro Arg Gly Ile Pro Asn Asn Leu Met Pro Phe
195 200 205
Val Gln Gln Val Ala Val Gly Arg Arg Pro Ala Leu Thr Val Phe Gly
210 215 220
Asn Asp Tyr Asn Thr Thr Asp Gly Thr Gly Val Arg Asp Tyr Ile His
225 230 235 240
Val Val Asp Leu Ala Asp Gly His Ile Ala Ala Leu Leu Lys Leu Asp
245 250 255
Glu Pro Asn Ile Gly Cys Glu Val Tyr Asn Leu Gly Thr Gly Lys Gly
260 265 270
Thr Ser Val Leu Glu Met Val Arg Ala Phe Glu Met Ala Ser Gly Lys
275 280 285
Lys Ile Pro Leu Val Met Ala Gly Arg Arg Pro Gly Asp Ala Glu Ile
290 295 300
Val Tyr Ala Ser Thr Lys Lys Ala Glu Arg Glu Leu Lys Trp Lys Ala
305 310 315 320
Lys Tyr Gly Ile Asp Glu Met Cys Arg Asn Gln Trp Asn Trp Ala Ser
325 330 335
Lys Asn Pro Tyr Gly Tyr Gly Asp Gln Gly Ser Thr Asp
340 345
<210>311
<211>1176
<212>DNA
<213>大豆
<400>311
atggcatcgc gcgtcagcat tggcaacctt acctcctccg cgccgtatat taattcccct 60
cactttcgct caccacttaa gatttccaac aacccctctc tgcaaaacgc ttcgcataag 120
gtacttatgc gcgataagac tgtactggta accggcggag ccggttacat cggcagccac 180
accgttcttc agctcttgct cggaggtttc agagccgtcg tcctcgacaa cctcgaaaat 240
tcctccgagg ttgccatcca cagagtcagg gagctcgccg gcgaatttgg gaacaacctc 300
tcctttcaca aggtggacct acgggacaga gctgctctag accaaatatt ttcttccaca 360
caattcgatg ctgtcataca ttttgctgga ctgaaagcag taggagaaag tgtgcaaaaa 420
cctttactat actataacaa caacttgact gggacaatca ctctattgga agtcatggct 480
gcccatggat gcaagaagct cgtgttttca tcttcagcaa ctgtatatgg ttggccaaag 540
gaggttccat gcacagaaga gttccctctg tcagcaatga acccatatgg acgaactaag 600
cttatcattg aagaaatttg ccgtgatgtc cactgtgcag agccagattg taaaataatt 660
ttgttaagat acttcaaccc agttggtgca caccccagtg gttatattgg ggaggatcct 720
cgtggaattc caaacaatct catgccattt gttcagcaag tagcagttgg ccgacggcct 780
gcactgacag tttttggaaa tgattataat acaagtgatg gcactggggt tcgggattac 840
attcatgttg ttgatttagc agatgggcac attgctgcat tgcttaaact agatgaacct 900
aatataggtt gtgaggttta taacctggga acaggaaagg gaacatcagt tttggagatg 960
gttagagctt ttgaaatggc atctggaaag aaaattccac ttgtgatggc tggccgtaga 1020
cctggtgatg ctgaaattgt ttatgcatca acaaagaaag cggaaagaga gcttaaatgg 1080
aaggcaaaat atggcattga tgagatgtgc cgtgatcaat ggaattgggc tagcaaaaac 1140
ccttatggct atggagatca gggctccacc gattaa 1176
<210>312
<211>391
<212>PRT
<213>大豆
<400>312
Met Ala Ser Arg Val Ser Ile Gly Asn Leu Thr Ser Ser Ala Pro Tyr
1 5 10 15
Ile Asn Ser Pro His Phe Arg Ser Pro Leu Lys Ile Ser Asn Asn Pro
20 25 30
Ser Leu Gln Asn Ala Ser His Lys Val Leu Met Arg Asp Lys Thr Val
35 40 45
Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Thr Val Leu Gln
50 55 60
Leu Leu Leu Gly Gly Phe Arg Ala Val Val Leu Asp Asn Leu Glu Asn
65 70 75 80
Ser Ser Glu Val Ala Ile His Arg Val Arg Glu Leu Ala Gly Glu Phe
85 90 95
Gly Asn Asn Leu Ser Phe His Lys Val Asp Leu Arg Asp Arg Ala Ala
100 105 110
Leu Asp Gln Ile Phe Ser Ser Thr Gln Phe Asp Ala Val Ile His Phe
115 120 125
Ala Gly Leu Lys Ala Val Gly Glu Ser Val Gln Lys Pro Leu Leu Tyr
130 135 140
Tyr Asn Asn Asn Leu Thr Gly Thr Ile Thr Leu Leu Glu Val Met Ala
145 150 155 160
Ala His Gly Cys Lys Lys Leu Val Phe Ser Ser Ser Ala Thr Val Tyr
165 170 175
Gly Trp Pro Lys Glu Val Pro Cys Thr Glu Glu Phe Pro Leu Ser Ala
180 185 190
Met Asn Pro Tyr Gly Arg Thr Lys Leu Ile Ile Glu Glu Ile Cys Arg
195 200 205
Asp Val His Cys Ala Glu Pro Asp Cys Lys Ile Ile Leu Leu Arg Tyr
210 215 220
Phe Asn Pro Val Gly Ala His Pro Ser Gly Tyr Ile Gly Glu Asp Pro
225 230 235 240
Arg Gly Ile Pro Asn Asn Leu Met Pro Phe Val Gln Gln Val Ala Val
245 250 255
Gly Arg Arg Pro Ala Leu Thr Val Phe Gly Asn Asp Tyr Asn Thr Ser
260 265 270
Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Val Asp Leu Ala Asp
275 280 285
Gly His Ile Ala Ala Leu Leu Lys Leu Asp Glu Pro Asn Ile Gly Cys
290 295 300
Glu Val Tyr Asn Leu Gly Thr Gly Lys Gly Thr Ser Val Leu Glu Met
305 310 315 320
Val Arg Ala Phe Glu Met Ala Ser Gly Lys Lys Ile Pro Leu Val Met
325 330 335
Ala Gly Arg Arg Pro Gly Asp Ala Glu Ile Val Tyr Ala Ser Thr Lys
340 345 350
Lys Ala Glu Arg Glu Leu Lys Trp Lys Ala Lys Tyr Gly Ile Asp Glu
355 360 365
Met Cys Arg Asp Gln Trp Asn Trp Ala Ser Lys Asn Pro Tyr Gly Tyr
370 375 380
Gly Asp Gln Gly Ser Thr Asp
385 390
<210>313
<211>1059
<212>DNA
<213>向日葵(Helianthus annuus)
<400>313
atgacgcggc cgatgtgcat actggtgacc ggtggtgccg gttatatagg aagtcatact 60
gttttgcagt tgttgttaaa tggttacagt acggtggtgg ttgataattt ggataattcg 120
tcggaagttg ctatcagtcg ggttcgagaa ctcgctggtg atcgtggtcg taatctgtct 180
tttcacaaga tggatatccg ggataagcct gcactagagc agctttttgc ttctacaaag 240
tttgacgcgg ttatacattt tgctggatta aaggcagttg gtgaaagcgt gcagaagccg 300
ttgatgtatt acaacaataa tatcgttggt actataactt tattggaagt tatggctgcc 360
tatggctgca agaagcttgt gttttcatca tcggctactg tttatggctg gccaaaggag 420
ttgccgtgca cagaagagtt tcccttgtct gcagccaacc cgtatggacg aacaaagcta 480
atgatcgagg agatgtgccg agatgtatat gcttcagacc ctgagtggaa atttgtattg 540
ttgcggtatt ttaaccctgt tggtgcacat cccagtggcc gaattggcga agatcctcat 600
ggaattccaa acaatcttat gccttttatt cagcatgttg ctgttggtag acaacctgcg 660
cttaaagtgt tcggaactga ttactccaca aaagatggaa ctggggtacg tgattacatc 720
catgtcgtag atttagcaga cggacatact gcggcgttgg cgaaactttc tgatcccaaa 780
ataggttgtg aagtttataa cttggggact ggtaaaggga catctgtttt ggagatggta 840
tcagcctttg aaaaggcatc aggaaagaaa atcccattaa taaagactgc acgacgacct 900
ggtgatgctg agattgtata tgcgtcaaca acaaaggcag aacgcgagtt aaactggaag 960
gcaaagtatg gaatagagga gatgtgcaga gatcagtgga actgggctag caggaatcct 1020
tacggctatc agactgaagc aaagaaactt ggtgcatga 1059
<210>314
<211>352
<212>PRT
<213>向日葵
<400>314
Met Thr Arg Pro Met Cys Ile Leu Val Thr Gly Gly Ala Gly Tyr Ile
1 5 10 15
Gly Ser His Thr Val Leu Gln Leu Leu Leu Asn Gly Tyr Ser Thr Val
20 25 30
Val Val Asp Asn Leu Asp Asn Ser Ser Glu Val Ala Ile Ser Arg Val
35 40 45
Arg Glu Leu Ala Gly Asp Arg Gly Arg Asn Leu Ser Phe His Lys Met
50 55 60
Asp Ile Arg Asp Lys Pro Ala Leu Glu Gln Leu Phe Ala Ser Thr Lys
65 70 75 80
Phe Asp Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly Glu Ser
85 90 95
Val Gln Lys Pro Leu Met Tyr Tyr Asn Asn Asn Ile Val Gly Thr Ile
100 105 110
Thr Leu Leu Glu Val Met Ala Ala Tyr Gly Cys Lys Lys Leu Val Phe
115 120 125
Ser Ser Ser Ala Thr Val Tyr Gly Trp Pro Lys Glu Leu Pro Cys Thr
130 135 140
Glu Glu Phe Pro Leu Ser Ala Ala Asn Pro Tyr Gly Arg Thr Lys Leu
145 150 155 160
Met Ile Glu Glu Met Cys Arg Asp Val Tyr Ala Ser Asp Pro Glu Trp
165 170 175
Lys Phe Val Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala His Pro Ser
180 185 190
Gly Arg Ile Gly Glu Asp Pro His Gly Ile Pro Asn Asn Leu Met Pro
195 200 205
Phe Ile Gln His Val Ala Val Gly Arg Gln Pro Ala Leu Lys Val Phe
210 215 220
Gly Thr Asp Tyr Ser Thr Lys Asp Gly Thr Gly Val Arg Asp Tyr Ile
225 230 235 240
His Val Val Asp Leu Ala Asp Gly His Thr Ala Ala Leu Ala Lys Leu
245 250 255
Ser Asp Pro Lys Ile Gly Cys Glu Val Tyr Asn Leu Gly Thr Gly Lys
260 265 270
Gly Thr Ser Val Leu Glu Met Val Ser Ala Phe Glu Lys Ala Ser Gly
275 280 285
Lys Lys Ile Pro Leu Ile Lys Thr Ala Arg Arg Pro Gly Asp Ala Glu
290 295 300
Ile Val Tyr Ala Ser Thr Thr Lys Ala Glu Arg Glu Leu Asn Trp Lys
305 310 315 320
Ala Lys Tyr Gly Ile Glu Glu Met Cys Arg Asp Gln Trp Asn Trp Ala
325 330 335
Ser Arg Asn Pro Tyr Gly Tyr Gln Thr Glu Ala Lys Lys Leu Gly Ala
340 345 350
<210>315
<211>1497
<212>DNA
<213>玉米
<400>315
gaagcacggc aatctcgatc tcgttcgttc ccctgagcgg cagtcagtgc gagcgagcgc 60
gcacacagac aactcatcct ctcccctctc tctctcacac acacacatcc atcatcccat 120
ccctgtgacg ggcgatccga gggcctaccg acgatggtgt ccgccgtgct ccggaccatc 180
ctcgtgacgg gcggcgccgg gtacatcggc agccacacgg tgctgcagct gctgcagcag 240
ggcttccgcg tcgtcgtcgt cgacaacctc gacaacgcct ccgaggccgc cctcgcccgc 300
gtcgccgagc tcgccgggca cgacggcgcc aacctcgtct tccacaaggt tgaccttcgc 360
gacaggcacg cgttggtgga catcttctcg tcgcacaggt tcgaggctgt cattcacttt 420
gctgggctca aggctgttgg ggagagcgtg cacaagcccc tactttacta cgacaacaac 480
ctggtcggca ccatcaccct cctggaggtg atggctgcga acggctgcaa gaagctggtg 540
ttctcgtcat ctgcaactgt ctatgggtgg cccaaggaag taccctgcac cgaagaattc 600
ccgctctgcg ccaccaatcc ctatgggcgg acaaagcttg tgattgaaga catctgccgc 660
gacgtccacc gctccgaccc cgactggaag atcatactgc tcaggtactt caaccccgtt 720
ggcgctcatc caagcgggta catcggcgaa gacccctgcg gtgtcccgaa caacctgatg 780
ccctacgtgc agcaagtcgc tgttgggagg ttacctcacc tcacggtcta cgggacggac 840
tacagcacca aggatgggac tggggtgcgt gattacatcc acgttgtcga cctggctgac 900
ggccacatag cagccctgag gaagctctac gaagactccg acaaaatagg ctgtgaagtg 960
tacaacttgg ggactggaaa ggggacgtcc gtgttggaaa tggtggctgc attcgagaag 1020
gcttctggga agaaaatccc tctggtgttc gctgggcgaa gacccggaga cgcagagatc 1080
gtctacgccg caactgccaa ggcagagaag gagctcaaat ggaaggccaa gtacgggatc 1140
gaggagatgt gcagagatct gtggaactgg gcgagcaaga acccgtacgg gtacgctggg 1200
tcacgcgaca acagcaaatg aaccacccat ccatgcatcc catcctgcag taggagcaag 1260
cagcagcctt atagcctatg ctaccataat tagtaactca tcaatcatgc atacacataa 1320
ttagtaactc atcaatcatg catacataat cagccagtca tctgattagg ggtactgcga 1380
tgggcctcgc ttcttcagtg tatagaggga ggaggagggg gggtcatctt gatattcttt 1440
tttttttatc attcccgaat gattattatt agtagccagt tcgatgaaaa aaaaaaa 1497
<210>316
<211>355
<212>PRT
<213>玉米
<400>316
Met Val Ser Ala Val Leu Arg Thr Ile Leu Val Thr Gly Gly Ala Gly
1 5 10 15
Tyr Ile Gly Ser His Thr Val Leu Gln Leu Leu Gln Gln Gly Phe Arg
20 25 30
Val Val Val Val Asp Asn Leu Asp Asn Ala Ser Glu Ala Ala Leu Ala
35 40 45
Arg Val Ala Glu Leu Ala Gly His Asp Gly Ala Asn Leu Val Phe His
50 55 60
Lys Val Asp Leu Arg Asp Arg His Ala Leu Val Asp Ile Phe Ser Ser
65 70 75 80
His Arg Phe Glu Ala Val Ile His Phe Ala Gly Leu Lys Ala Val Gly
85 90 95
Glu Ser Val His Lys Pro Leu Leu Tyr Tyr Asp Asn Asn Leu Val Gly
100 105 110
Thr Ile Thr Leu Leu Glu Val Met Ala Ala Asn Gly Cys Lys Lys Leu
115 120 125
Val Phe Ser Ser Ser Ala Thr Val Tyr Gly Trp Pro Lys Glu Val Pro
130 135 140
Cys Thr Glu Glu Phe Pro Leu Cys Ala Thr Asn Pro Tyr Gly Arg Thr
145 150 155 160
Lys Leu Val Ile Glu Asp Ile Cys Arg Asp Val His Arg Ser Asp Pro
165 170 175
Asp Trp Lys Ile Ile Leu Leu Arg Tyr Phe Asn Pro Val Gly Ala His
180 185 190
Pro Ser Gly Tyr Ile Gly Glu Asp Pro Cys Gly Val Pro Asn Asn Leu
195 200 205
Met Pro Tyr Val Gln Gln Val Ala Val Gly Arg Leu Pro His Leu Thr
210 215 220
Val Tyr Gly Thr Asp Tyr Ser Thr Lys Asp Gly Thr Gly Val Arg Asp
225 230 235 240
Tyr Ile His Val Val Asp Leu Ala Asp Gly His Ile Ala Ala Leu Arg
245 250 255
Lys Leu Tyr Glu Asp Ser Asp Lys Ile Gly Cys Glu Val Tyr Asn Leu
260 265 270
Gly Thr Gly Lys Gly Thr Ser Val Leu Glu Met Val Ala Ala Phe Glu
275 280 285
Lys Ala Ser Gly Lys Lys Ile Pro Leu Val Phe Ala Gly Arg Arg Pro
290 295 300
Gly Asp Ala Glu Ile Val Tyr Ala Ala Thr Ala Lys Ala Glu Lys Glu
305 310 315 320
Leu Lys Trp Lys Ala Lys Tyr Gly Ile Glu Glu Met Cys Arg Asp Leu
325 330 335
Trp Asn Trp Ala Ser Lys Asn Pro Tyr Gly Tyr Ala Gly Ser Arg Asp
340 345 350
Asn Ser Lys
355
<210>317
<211>1980
<212>DNA
<213>玉米
<400>317
cattccatcg tcttcgcttc cactccccac gttccccgcc tgcttcctcc aggccccggc 60
cagatccgcg cgcccgcggg gaagagggcc tcctctcctc cctcctccct tggctcgcgc 120
tctggtcgag gaggcggagg ccggtgccgg cgggcgggcg gggaggtagg tagcagcttg 180
cggttgcggg agggaagctg cgcgcgctag gctgccatgg cggtggagaa gacgctgccc 240
ggcgcgagtg cggggaggac cgtgctggtc acgggcgggg cgggctacat cggtagccac 300
gccgtgctgc agctcctcct cgcgggcttc cgcgccgtcg tcatcgacaa cctcaacaac 360
tcctccgagc tggccgtccg ccgcgtcgcc gcgctcgcgg gggaccactc ccgcaacctc 420
tctttccaca agattgatct ccgtgacaag ggagcactgg aaatggtttt tgcttctaca 480
agatttgaag ctgtcattca cttcgctgga ttgaaagctg tgggtgaaag cgtacagaag 540
ccattacttt attatgacaa caacgtcatt ggcacgataa atcttctaga agttatgtct 600
gttcacggtt gcaagaagtt ggtgttctca tcatcagctg cagtttatgg atcacccaaa 660
aactcaccct gcacagaaaa ttttcctctt actccaaaca atccatatgg caaaacaaag 720
ctcgttgttg aagatatttg ccgggatatc taccgttcag atcctgaatg gaagatcatt 780
ttacttaggt acttcaatcc agttggtgct catcctagtg gatatcttgg cgaggaccca 840
cgaggaattc ccaacaatct tatgccctat gttcagcaag ttgcggttgg taggaggcca 900
gctctaacag ttttaggaaa tgactatgca acaagagatg ggactggggt ccgagattac 960
atccatgtgg ttgaccttgc tgacggacat attgctgcat tgcagaagct ttttgagaac 1020
tctagcatag ggtgtgaagc gtacaacctt ggaaccggaa gaggtacatc tgtgctggag 1080
attgttaaag catttgagaa ggcttctggg aagaaaatac ctctgatttt tggtgaaaga 1140
cgcccaggtg atgcagagat tctgttttca gagactacta aagcagagag ggagcttaac 1200
tggaaagcaa aatacggtat tgaagagatg tgccgcgacc aatggaactg ggccagcaag 1260
aacccttatg gctatggatc acctgactct atcaagcaga atggtcacca aacaaacgga 1320
tccgctgact cctccaagca gaatggccac cgcacaaacg gttcaactga ctcacccaag 1380
cggaacggcc accatgcgta tgggtctgct gactcaccca agcgcaacgg gcactgcgtt 1440
tttggatcat cagacctcaa gccgaatggt aatggccacc tgcgctgagc agaactgttt 1500
ggcctgtgag ctccctgtac attcggttgc gatgtgagct ccctgcacgt tcggtcgagg 1560
tctatcgtga acccactatc cgagattgat gtggatcatt gggttgacag gtcatacagt 1620
atagagccgg tggcagagga attcctgttt gctgtgggta aagcttatct tctgctttcg 1680
tgttttttct tgcttctttc gattatggtg taggaatgtg gtcataatgt attagctgat 1740
tatcctttcc ctgctaattg gactttatta cgcttcatta agtttggctg attactgttt 1800
aacggggaaa agttgcacct gtgtacgatt atttatttgt acctgtaata tttatggaga 1860
actagcctcg ccgcaaatag ccctgatgaa ttcagctgca gtttattccc aaaaaaaaaa 1920
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaggggcccc 1980
<210>318
<211>423
<212>PRT
<213>玉米
<400>318
Met Ala Val Glu Lys Thr Leu Pro Gly Ala Ser Ala Gly Arg Thr Val
1 5 10 15
Leu Val Thr Gly Gly Ala Gly Tyr Ile Gly Ser His Ala Val Leu Gln
20 25 30
Leu Leu Leu Ala Gly Phe Arg Ala Val Val Ile Asp Asn Leu Asn Asn
35 40 45
Ser Ser Glu Leu Ala Val Arg Arg Val Ala Ala Leu Ala Gly Asp His
50 55 60
Ser Arg Asn Leu Ser Phe His Lys Ile Asp Leu Arg Asp Lys Gly Ala
65 70 75 80
Leu Glu Met Val Phe Ala Ser Thr Arg Phe Glu Ala Val Ile His Phe
85 90 95
Ala Gly Leu Lys Ala Val Gly Glu Ser Val Gln Lys Pro Leu Leu Tyr
100 105 110
Tyr Asp Asn Asn Val Ile Gly Thr Ile Asn Leu Leu Glu Val Met Ser
115 120 125
Val His Gly Cys Lys Lys Leu Val Phe Ser Ser Ser Ala Ala Val Tyr
130 135 140
Gly Ser Pro Lys Asn Ser Pro Cys Thr Glu Asn Phe Pro Leu Thr Pro
145 150 155 160
Asn Asn Pro Tyr Gly Lys Thr Lys Leu Val Val Glu Asp Ile Cys Arg
165 170 175
Asp Ile Tyr Arg Ser Asp Pro Glu Trp Lys Ile Ile Leu Leu Arg Tyr
180 185 190
Phe Asn Pro Val Gly Ala His Pro Ser Gly Tyr Leu Gly Glu Asp Pro
195 200 205
Arg Gly Ile Pro Asn Asn Leu Met Pro Tyr Val Gln Gln Val Ala Val
210 215 220
Gly Arg Arg Pro Ala Leu Thr Val Leu Gly Asn Asp Tyr Ala Thr Arg
225 230 235 240
Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Val Asp Leu Ala Asp
245 250 255
Gly His Ile Ala Ala Leu Gln Lys Leu Phe Glu Asn Ser Ser Ile Gly
260 265 270
Cys Glu Ala Tyr Asn Leu Gly Thr Gly Arg Gly Thr Ser Val Leu Glu
275 280 285
Ile Val Lys Ala Phe Glu Lys Ala Ser Gly Lys Lys Ile Pro Leu Ile
290 295 300
Phe Gly Glu Arg Arg Pro Gly Asp Ala Glu Ile Leu Phe Ser Glu Thr
305 310 315 320
Thr Lys Ala Glu Arg Glu Leu Asn Trp Lys Ala Lys Tyr Gly Ile Glu
325 330 335
Glu Met Cys Arg Asp Gln Trp Asn Trp Ala Ser Lys Asn Pro Tyr Gly
340 345 350
Tyr Gly Ser Pro Asp Ser Ile Lys Gln Asn Gly His Gln Thr Asn Gly
355 360 365
Ser Ala Asp Ser Ser Lys Gln Asn Gly His Arg Thr Asn Gly Ser Thr
370 375 380
Asp Ser Pro Lys Arg Asn Gly His His Ala Tyr Gly Ser Ala Asp Ser
385 390 395 400
Pro Lys Arg Asn Gly His Cys Val Phe Gly Ser Ser Asp Leu Lys Pro
405 410 415
Asn Gly Asn Gly His Leu Arg
420
<210>319
<211>1444
<212>DNA
<213>大豆
<400>319
acgtgtcaca gaattctcgc cttttccgaa tatggcatcg cgcgtcagca ttggcaatct 60
cacttcctcc gcgccgtata ttaattcccc tcattttcgc tcacaactta agctttccag 120
caactcctct ttgcacaagc cactcatgcg cgacaagact gtgctggtaa ccggcggagc 180
cggttacatc ggcacccaca ccgttcttca gctcttgctc ggaggttgca gaaccgtcgt 240
cgtcgacaat ctcgacaatt cctccgaggt ttctatccac cgagtcaggg agcttgccgg 300
cgaatttggg aacaacctct cctttcacaa ggtggaccta cgggacaggg atgcactaga 360
gcaaattttt gtttccacac aatttgatgc tgtcatacac tttgctggac tgaaagcagt 420
aggagaaagt gtgcaaaaac ctttactata ctataacaac aacttgactg ggacaatcac 480
tctattggaa gtcatggctg cccatggatg caagaagctc gtgttctctt cttcagcaac 540
tgtatatggt tggccaaagg aagttccatg cacagaagag ttccctctgt cagcaatgaa 600
cccatatgga cgaactaagc ttatcattga agaaatttgc cgtgatgtcc actgtgcaga 660
gccagattgt aaaataattt tgttaagata cttcaaccca gttggtgcac accccagcgg 720
ttatattggg gaggatcctc gcggaattcc aaacaatctc atgccatttg ttcagcaagt 780
agcagttggc cgacggcctg cactgacagt ttttggaaat gattataata caagtgatgg 840
cactggggtt cgggattaca ttcatgttgt tgatttagca gatgggcaca ttgctgcatt 900
gcttaaacta gatgaaccta atataggttg tgaggtttat aacctgggaa caggaaaggg 960
aacatcagtt ttggagatgg ttagagcttt tgaaatggca tctggaaaga aaattccact 1020
tgtgatggct ggccgtagac ctggtgatgc tgaaattgtt tatgcatcaa caaagaaagc 1080
ggaaagagag cttaaatgga aggcaaaata tggcattgat gagatgtgcc gtgatcaatg 1140
gaattgggct agcaaaaacc cttatggcta tggagatcag ggctccaccg attaaccact 1200
tagttttctc tttgggttct tttctgaact cacccacacc gtagtccgta ggtcttgtga 1260
atttagtttt cccaaaagct tttctttctt tagtgatctt aaggtgacaa agtacttgta 1320
ttattactat tcatagttac atagtaagta agtagtggtt tactatactg taatttaaag 1380
gttctctagg ttccttctta caggttattg attattagat tcggattctc tcatgttcca 1440
catg 1444
<210>320
<211>387
<212>PRT
<213>大豆
<400>320
Met Ala Ser Arg Val Ser Ile Gly Asn Leu Thr Ser Ser Ala Pro Tyr
1 5 10 15
Ile Asn Ser Pro His Phe Arg Ser Gln Leu Lys Leu Ser Ser Asn Ser
20 25 30
Ser Leu His Lys Pro Leu Met Arg Asp Lys Thr Val Leu Val Thr Gly
35 40 45
Gly Ala Gly Tyr Ile Gly Thr His Thr Val Leu Gln Leu Leu Leu Gly
50 55 60
Gly Cys Arg Thr Val Val Val Asp Asn Leu Asp Asn Ser Ser Glu Val
65 70 75 80
Ser Ile His Arg Val Arg Glu Leu Ala Gly Glu Phe Gly Asn Asn Leu
85 90 95
Ser Phe His Lys Val Asp Leu Arg Asp Arg Asp Ala Leu Glu Gln Ile
100 105 110
Phe Val Ser Thr Gln Phe Asp Ala Val Ile His Phe Ala Gly Leu Lys
115 120 125
Ala Val Gly Glu Ser Val Gln Lys Pro Leu Leu Tyr Tyr Asn Asn Asn
130 135 140
Leu Thr Gly Thr Ile Thr Leu Leu Glu Val Met Ala Ala His Gly Cys
145 150 155 160
Lys Lys Leu Val Phe Ser Ser Ser Ala Thr Val Tyr Gly Trp Pro Lys
165 170 175
Glu Val Pro Cys Thr Glu Glu Phe Pro Leu Ser Ala Met Asn Pro Tyr
180 185 190
Gly Arg Thr Lys Leu Ile Ile Glu Glu Ile Cys Arg Asp Val His Cys
195 200 205
Ala Glu Pro Asp Cys Lys Ile Ile Leu Leu Arg Tyr Phe Asn Pro Val
210 215 220
Gly Ala His Pro Ser Gly Tyr Ile Gly Glu Asp Pro Arg Gly Ile Pro
225 230 235 240
Asn Asn Leu Met Pro Phe Val Gln Gln Val Ala Val Gly Arg Arg Pro
245 250 255
Ala Leu Thr Val Phe Gly Asn Asp Tyr Asn Thr Ser Asp Gly Thr Gly
260 265 270
Val Arg Asp Tyr Ile His Val Val Asp Leu Ala Asp Gly His Ile Ala
275 280 285
Ala Leu Leu Lys Leu Asp Glu Pro Asn Ile Gly Cys Glu Val Tyr Asn
290 295 300
Leu Gly Thr Gly Lys Gly Thr Ser Val Leu Glu Met Val Arg Ala Phe
305 310 315 320
Glu Met Ala Ser Gly Lys Lys Ile Pro Leu Val Met Ala Gly Arg Arg
325 330 335
Pro Gly Asp Ala Glu Ile Val Tyr Ala Ser Thr Lys Lys Ala Glu Arg
340 345 350
Glu Leu Lys Trp Lys Ala Lys Tyr Gly Ile Asp Glu Met Cys Arg Asp
355 360 365
Gln Trp Asn Trp Ala Ser Lys Asn Pro Tyr Gly Tyr Gly Asp Gln Gly
370 375 380
Ser Thr Asp
385
Claims (22)
1.在植物中相对于对照植物增强产量相关性状的方法,所述方法包括调节植物中核酸的表达,所述核酸编码产量增加多肽,所述多肽选自:
-bHLH6样(碱性螺旋-环-螺旋6样)蛋白质;
-GRP(生长调节蛋白质),其中所述GRP选自:
-RrmJ/FtsJ核糖体RNA甲基转移酶多肽(RrmJ/FtsJ多肽)
-碱性-螺旋-环-螺旋4(bHLH4)多肽
-异戊烯基转移酶(IPT)多肽
-STO(盐耐受性,Salt Tolerance)蛋白质
-UGE(UDP-葡萄糖4-差向异构酶(UDP-Glucose4-Epimerase)或UDP-Gal4-差向异构酶(UDP-Gal4-Epimerase))多肽。
2.根据权利要求1的方法,其中所述产量增加多肽选自:
-具有如表A1、A2、A3、A4、A5和/或A6所述的任意多肽的活性的多肽;
-具有根据表A1、A2、A3、A4、A5和/或A6所述的任意多肽的序列的多肽;
-由表A1、A2、A3、A4、A5和/或A6的任意核酸或能够与此类核酸杂交的核酸所编码的多肽;
-包含如基序1至12所述的或如图中所示的至少一个基序的多肽。
3.在植物中相对于对照植物增强产量相关性状的方法,其包括在植物中调节编码bHLH6样多肽的核酸的表达,其中所述bHLH6样多肽包含HLH结构域。
4.根据权利要求1的方法,其中所述bHLH6-样多肽包含一个或多个下述基序:
(i)基序1(SEQ ID NO:3),
(ii)基序2(SEQ ID NO:4),
(iii)基序3:(SEQ ID NO:5)
(iv)基序7(SEQ ID NO:9)或与SEQ ID NO:9具有至少80%序列同一性的序列。
5.根据权利要求3的方法,其中所述调节的表达通过在植物中导入和表达编码bHLH6样多肽的核酸来实现。
6.根据任何前述权利要求的方法,其中所述编码bHLH6样多肽的核酸编码表A1中所列的任一蛋白质或者是此类核酸的一部分或者是能够与此类核酸杂交的核酸。
7.根据任何前述权利要求的方法,其中所述核酸序列编码表A1中所给出的任何蛋白质的直向同源物或旁系同源物。
8.根据任何前述权利要求的方法,其中所述增强的产量相关性状包括相对于对照植物提高的产量、优选提高的出苗萌发势和/或提高的种子产量。
9.根据权利要求1至8任一项的方法,其中所述增强的产量相关性状在非胁迫条件下获得。
10.根据权利要求5至9中任一项的方法,其中所述核酸与组成型启动子,优选与GOS2启动子,最优选与来自稻的GOS2启动子有效连接。
11.根据任何前述权利要求的方法,其中所述编码bHLH6样多肽的核酸是植物来源的,优选来自双子叶植物,进一步优选来自十字花科(Brassicaceae),更优选来自拟南芥属(Arabidopsis),最优选来自拟南芥(Arabidopsis thaliana)。
12.植物或其部分,其包括种子,通过根据任何前述权利要求的方法可获得,其中所述植物或其部分包含编码bHLH6样多肽的重组核酸。
13.构建体,其包含
(i)编码在权利要求1至4中定义的bHLH6样多肽的核酸;
(ii)一个或多个调控序列,其能够驱动(a)的核酸序列的表达,以及任选地
(iii)转录终止序列。
14.根据权利要求13的构建体,其中所述调控序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
15.根据权利要求13或14的构建体在方法中的用途,所述方法用于制备相对于对照植物具有提高的产量,特别是提高的出苗萌发势和/或提高的种子产量的植物。
16.用根据权利要求13或14的构建体转化的植物、植物部分或植物细胞。
17.用于产生转基因植物的方法,所述植物相对于对照植物具有提高的产量,特别是提高的生物量和/或提高的种子产量,所述方法包括:
(i)在植物中导入和表达编码如权利要求1至4中所定义的bHLH6样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
18.相对于对照植物具有提高的产量、特别是提高的生物量和/或提高的种子产量的转基因植物或来自所述转基因植物的转基因植物细胞,所述转基因植物获得自编码如权利要求1至4所定义的bHLH6样多肽的核酸的调节的表达。
19.根据权利要求12、16或18的转基因植物或来自其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷物,例如稻、玉米、小麦、大麦、谷子、裸麦、黑小麦、高粱、二粒小麦、斯佩尔特小麦、黑麦属、单粒小麦、埃塞俄比亚画眉草、蜀黍和燕麦。
20.根据权利要求19的植物的可收获部分,其中所述可收获部分优选是枝条生物量和/或种子。
21.来自根据权利要求19的植物和/或来自根据权利要求20的植物可收获部分的产品。
22.编码bHLH6样多肽的核酸在相对于对照植物在植物中提高产量,特别是提高种子产量和/或枝条生物量中的用途。
Applications Claiming Priority (15)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP07111425 | 2007-06-29 | ||
EP07111425.0 | 2007-06-29 | ||
EP07112616 | 2007-07-17 | ||
EP07112614 | 2007-07-17 | ||
EP07112616.3 | 2007-07-17 | ||
EP07112614.8 | 2007-07-17 | ||
EP07112725.2 | 2007-07-18 | ||
EP07112724.5 | 2007-07-18 | ||
EP07112725 | 2007-07-18 | ||
EP07112724 | 2007-07-18 | ||
US5792108P | 2008-06-02 | 2008-06-02 | |
EP08157433.7 | 2008-06-02 | ||
EP08157433 | 2008-06-02 | ||
US61/057,921 | 2008-06-02 | ||
PCT/EP2008/058370 WO2009003977A2 (en) | 2007-06-29 | 2008-06-30 | Plants having enhanced yield-related traits and a method for making the same |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102027120A true CN102027120A (zh) | 2011-04-20 |
Family
ID=39736964
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008801047845A Pending CN102027120A (zh) | 2007-06-29 | 2008-06-30 | 具有增强的产量相关性状的植物和用于制备该植物的方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20100199380A1 (zh) |
EP (2) | EP2078090A2 (zh) |
CN (1) | CN102027120A (zh) |
AU (1) | AU2008270370A1 (zh) |
BR (1) | BRPI0813114A2 (zh) |
CA (1) | CA2690563A1 (zh) |
DE (1) | DE112008001730T5 (zh) |
WO (1) | WO2009003977A2 (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103890182A (zh) * | 2011-10-20 | 2014-06-25 | 巴斯夫植物科学有限公司 | 具有增强的产量相关性状的植物和其生产方法 |
CN106282393A (zh) * | 2016-10-27 | 2017-01-04 | 中国农业科学院作物科学研究所 | 特异引物对及其在检测水稻耐盐性中的应用 |
CN106497946A (zh) * | 2016-10-21 | 2017-03-15 | 云南省烟草农业科学研究院 | 一种烟草腋芽生长调控基因NtIPT1及其克隆方法与应用 |
CN110862442A (zh) * | 2019-12-16 | 2020-03-06 | 中国科学院遗传与发育生物学研究所 | 拟南芥myc3和myc4基因在调控种子大小中的应用 |
CN110964682A (zh) * | 2018-09-30 | 2020-04-07 | 上海凯赛生物技术股份有限公司 | L-赖氨酸耐受菌、生产菌及其用途 |
CN111690661A (zh) * | 2020-06-01 | 2020-09-22 | 云南省烟草农业科学研究院 | 一种烟草NtbHLH13基因突变体及分子鉴定方法和应用 |
CN112195186A (zh) * | 2020-10-06 | 2021-01-08 | 华中农业大学 | SlBBX20基因在调控番茄灰霉病抗性方面的应用 |
CN112301039A (zh) * | 2020-11-05 | 2021-02-02 | 四川农业大学 | 一种玉米叶斑马条纹叶色基因zb9以及与其连锁的InDel分子标记和应用 |
CN114480428A (zh) * | 2022-02-28 | 2022-05-13 | 扬州大学 | 水稻抗虫关键基因OsMYC2及其应用 |
CN114517201A (zh) * | 2021-06-03 | 2022-05-20 | 浙江农林大学 | BrMYC4-1基因过表达在提高植物对真菌病原体抗性中的应用 |
CN114656547A (zh) * | 2022-04-01 | 2022-06-24 | 四川农业大学 | 草莓FaBBX21转录因子及其编码蛋白与应用 |
CN115851765A (zh) * | 2022-11-25 | 2023-03-28 | 中国热带农业科学院热带生物技术研究所 | 粉蕉成熟相关基因MaMYC2-10及其应用 |
CN116426496A (zh) * | 2023-02-23 | 2023-07-14 | 宁夏大学 | 一种紫花苜蓿ipt基因在调控植物耐旱性中的应用 |
CN116515893A (zh) * | 2023-06-28 | 2023-08-01 | 海南大学三亚南繁研究院 | OsbHLH6基因及其蛋白质在提高作物耐冷性的应用 |
CN116769797A (zh) * | 2023-08-14 | 2023-09-19 | 浙江大学海南研究院 | 一种茉莉酸甲酯及PpyMYC2基因在萌芽中的应用 |
CN117683789A (zh) * | 2024-01-26 | 2024-03-12 | 华南农业大学 | Myc2基因在调控水稻日间开花时间中的应用 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2008339968A1 (en) * | 2007-12-20 | 2009-07-02 | Basf Plant Science Gmbh | Plants having enhanced yield-related traits and a method for making the same |
EP2391719A1 (en) * | 2009-01-28 | 2011-12-07 | BASF Plant Science Company GmbH | Plants having enhanced yield-related traits and a method for making the same |
BRPI1014386A2 (pt) * | 2009-04-29 | 2015-08-25 | Basf Plant Science Co Gmbh | Métodos para intensificar traços relacionados com o rendimento em plantas com relação às plantas de controle, construção, uso de uma construção, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica, partes colhíveis de uma planta, produtos, uso de um ácido nucleico, molécula de ácido nucleico isolada, e, polipeptídeo. |
WO2011006717A2 (en) | 2009-06-19 | 2011-01-20 | Basf Plant Science Company Gmbh | Plants having enhanced yield-related traits and a method for making the same |
EP2525658B1 (de) | 2010-01-22 | 2017-03-01 | Bayer Intellectual Property GmbH | Akarizide und/oder insektizide wirkstoffkombinationen |
CN102250226B (zh) * | 2010-05-17 | 2013-06-12 | 中国科学院遗传与发育生物学研究所 | 一种与水稻产量相关蛋白及其编码基因与应用 |
AU2012293636B2 (en) | 2011-08-10 | 2015-12-03 | Bayer Intellectual Property Gmbh | Active compound combinations comprising specific tetramic acid derivatives |
US9738901B2 (en) | 2012-05-10 | 2017-08-22 | The Regents Of The University Of California | Regulation of galactan synthase expression to modify galactan content in plants |
CN110904111B (zh) * | 2019-12-19 | 2021-06-11 | 西南大学 | 一种靶向敲除FcMYC2基因的sgRNA序列、CRISPR/Cas9载体及其应用 |
CN110938126B (zh) * | 2019-12-19 | 2021-06-11 | 西南大学 | 柑橘FcMYC2基因及其编码蛋白在调控柑橘精油合成中的应用 |
CN111996197B (zh) * | 2020-08-06 | 2022-04-12 | 南京农业大学 | 一种杜梨耐盐基因、蛋白及重组载体和应用 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006076423A2 (en) * | 2005-01-12 | 2006-07-20 | Monsanto Technology, Llc | Genes and uses for plant improvement |
US20070022495A1 (en) * | 1999-11-17 | 2007-01-25 | Mendel Biotechnology, Inc. | Transcription factors for increasing yield |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4962028A (en) | 1986-07-09 | 1990-10-09 | Dna Plant Technology Corporation | Plant promotors |
US5116742A (en) | 1986-12-03 | 1992-05-26 | University Patents, Inc. | RNA ribozyme restriction endoribonucleases and methods |
US4987071A (en) | 1986-12-03 | 1991-01-22 | University Patents, Inc. | RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods |
US5004863B2 (en) | 1986-12-03 | 2000-10-17 | Agracetus | Genetic engineering of cotton plants and lines |
AU3756889A (en) | 1988-06-01 | 1990-01-05 | The Texas A & M University System | Method for transforming plants via the shoot apex |
AU4115693A (en) | 1992-04-24 | 1993-11-29 | Sri International | In vivo homologous sequence targeting in eukaryotic cells |
RU94046396A (ru) | 1992-06-29 | 1996-11-10 | Джин Ширс Пти.Лтд. (AU) | Нуклеиновая кислота, днк, вектор, способ получения растения или животного, способ получения клеток, способ создания животного, животное, трансгенное животное, трансгенное растение, плоды, черенки и семена, растительные клетки, способ вмешательства в репликацию вируса |
WO1994012015A1 (en) | 1992-11-30 | 1994-06-09 | Chua Nam Hai | Expression motifs that confer tissue- and developmental-specific expression in plants |
AU694093B2 (en) | 1993-07-22 | 1998-07-16 | Gene Shears Pty. Limited | DNA virus ribozymes |
AU687961B2 (en) | 1993-11-19 | 1998-03-05 | Biotechnology Research And Development Corporation | Chimeric regulatory regions and gene cassettes for expression of genes in plants |
KR100386337B1 (ko) | 1993-12-09 | 2004-03-24 | 토마스 제퍼슨 대학교 | 진핵세포에서부위-특이적돌연변이를위한화합물과그방법 |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
US6395547B1 (en) | 1994-02-17 | 2002-05-28 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US5859337A (en) | 1995-06-06 | 1999-01-12 | The Regents Of The University Of California | Genes conferring salt tolerance and their uses |
AU718082B2 (en) | 1995-10-06 | 2000-04-06 | Plant Genetic Systems N.V. | Seed shattering |
GB9607517D0 (en) | 1996-04-11 | 1996-06-12 | Gene Shears Pty Ltd | The use of DNA Sequences |
GB9703146D0 (en) | 1997-02-14 | 1997-04-02 | Innes John Centre Innov Ltd | Methods and means for gene silencing in transgenic plants |
GB9710475D0 (en) | 1997-05-21 | 1997-07-16 | Zeneca Ltd | Gene silencing |
GB9720148D0 (en) | 1997-09-22 | 1997-11-26 | Innes John Centre Innov Ltd | Gene silencing materials and methods |
SI1068311T1 (sl) | 1998-04-08 | 2011-07-29 | Commw Scient Ind Res Org | Postopki in sredstva za pridobivanje modificiranih fenotipov |
US6764851B2 (en) | 1998-06-26 | 2004-07-20 | Iowa State University Research Foundation, Inc. | Materials and methods for the alteration of enzyme and acetyl CoA levels in plants |
US6555732B1 (en) | 1998-09-14 | 2003-04-29 | Pioneer Hi-Bred International, Inc. | Rac-like genes and methods of use |
US6992236B1 (en) | 1999-02-10 | 2006-01-31 | E. I. Du Pont De Nemours And Company | Plant UDP-glucose epimerases |
EP1198985B1 (en) | 1999-07-22 | 2010-09-08 | National Institute Of Agrobiological Sciences | Method for superrapid transformation of monocotyledon |
IL147950A0 (en) | 1999-08-26 | 2002-08-14 | Basf Plant Science Gmbh | PLANT GENE EXPRESSION, CONTROLLED BY CONSTITUTIVE PLANT V-ATPase PROMOTERS |
EP1384776B1 (en) * | 2001-03-12 | 2009-09-02 | Suntory Holdings Limited | Genes encoding proteins participating in cytokinin synthesis |
US20030233681A1 (en) * | 2002-05-01 | 2003-12-18 | Arizona Bd Of Regents/Behalf Of Univ. Of Arizona | ICE1, a regulator of cold induced transcriptome and freezing tolerance in plants |
ATE350481T1 (de) * | 2003-01-21 | 2007-01-15 | Cropdesign Nv | Verwendung der regulatorischen sequenz des gos2- gens aus reis für die genexpression in dikotyledonen pflanzen oder pflanzenzellen |
DE602004006477T2 (de) | 2003-02-04 | 2008-02-14 | Cropdesign N.V. | Promotor aus reis |
WO2004074442A2 (en) * | 2003-02-14 | 2004-09-02 | Monsanto Technology Llc | Plant regulatory sequences for selective control of gene expression |
WO2005049646A2 (en) * | 2003-11-19 | 2005-06-02 | Cropdesign N.V. | “seedy1” nuceic acids for making plants having changed growth characteristics |
US7705201B2 (en) * | 2004-06-23 | 2010-04-27 | Monsanto Technology Llc | Transgenic plants expressing cytokinin biosynthetic genes and methods of use therefor |
US20060064786A1 (en) * | 2004-09-17 | 2006-03-23 | Pioneer Hi-Bred International, Inc. | Isopentenyl transferase sequences and methods of use |
US8487160B2 (en) * | 2005-12-01 | 2013-07-16 | Cropdesign N.V. | Plants having improved growth characteristics and methods for making the same |
EP1820391A1 (en) | 2006-02-17 | 2007-08-22 | CropDesign N.V. | Method and apparatus to determine the start of flowering in plants |
-
2008
- 2008-06-30 AU AU2008270370A patent/AU2008270370A1/en not_active Abandoned
- 2008-06-30 CN CN2008801047845A patent/CN102027120A/zh active Pending
- 2008-06-30 CA CA2690563A patent/CA2690563A1/en not_active Abandoned
- 2008-06-30 DE DE112008001730T patent/DE112008001730T5/de not_active Withdrawn
- 2008-06-30 EP EP08774524A patent/EP2078090A2/en not_active Withdrawn
- 2008-06-30 WO PCT/EP2008/058370 patent/WO2009003977A2/en active Application Filing
- 2008-06-30 BR BRPI0813114-7A2A patent/BRPI0813114A2/pt not_active IP Right Cessation
- 2008-06-30 EP EP12168728A patent/EP2508610A1/en not_active Withdrawn
- 2008-06-30 US US12/666,317 patent/US20100199380A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070022495A1 (en) * | 1999-11-17 | 2007-01-25 | Mendel Biotechnology, Inc. | Transcription factors for increasing yield |
WO2006076423A2 (en) * | 2005-01-12 | 2006-07-20 | Monsanto Technology, Llc | Genes and uses for plant improvement |
Non-Patent Citations (2)
Title |
---|
HIROSHI ABE ET AL.: "Arabidopsis AtMYC2 (bHLH) and AtMYB2 (MYB) Function as Transcriptional Activators in Abscisic Acid Signaling", 《THE PLANT CELL》 * |
WIM VAN CAMP: "Yield enhancement genes: seeds for growth", 《CURRENT OPINION IN BIOTECHNOLOGY》 * |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103890182A (zh) * | 2011-10-20 | 2014-06-25 | 巴斯夫植物科学有限公司 | 具有增强的产量相关性状的植物和其生产方法 |
CN106497946A (zh) * | 2016-10-21 | 2017-03-15 | 云南省烟草农业科学研究院 | 一种烟草腋芽生长调控基因NtIPT1及其克隆方法与应用 |
CN106282393A (zh) * | 2016-10-27 | 2017-01-04 | 中国农业科学院作物科学研究所 | 特异引物对及其在检测水稻耐盐性中的应用 |
CN110964682B (zh) * | 2018-09-30 | 2021-09-03 | 上海凯赛生物技术股份有限公司 | L-赖氨酸耐受菌、生产菌及其用途 |
CN110964682A (zh) * | 2018-09-30 | 2020-04-07 | 上海凯赛生物技术股份有限公司 | L-赖氨酸耐受菌、生产菌及其用途 |
CN110862442A (zh) * | 2019-12-16 | 2020-03-06 | 中国科学院遗传与发育生物学研究所 | 拟南芥myc3和myc4基因在调控种子大小中的应用 |
CN110862442B (zh) * | 2019-12-16 | 2022-02-18 | 中国科学院遗传与发育生物学研究所 | 拟南芥myc3和myc4基因在调控种子大小中的应用 |
CN111690661A (zh) * | 2020-06-01 | 2020-09-22 | 云南省烟草农业科学研究院 | 一种烟草NtbHLH13基因突变体及分子鉴定方法和应用 |
CN112195186B (zh) * | 2020-10-06 | 2022-05-27 | 华中农业大学 | SlBBX20基因在调控番茄灰霉病抗性方面的应用 |
CN112195186A (zh) * | 2020-10-06 | 2021-01-08 | 华中农业大学 | SlBBX20基因在调控番茄灰霉病抗性方面的应用 |
CN112301039A (zh) * | 2020-11-05 | 2021-02-02 | 四川农业大学 | 一种玉米叶斑马条纹叶色基因zb9以及与其连锁的InDel分子标记和应用 |
CN114517201B (zh) * | 2021-06-03 | 2023-06-23 | 浙江农林大学 | BrMYC4-1基因过表达在提高植物对真菌病原体抗性中的应用 |
CN114517201A (zh) * | 2021-06-03 | 2022-05-20 | 浙江农林大学 | BrMYC4-1基因过表达在提高植物对真菌病原体抗性中的应用 |
CN114480428A (zh) * | 2022-02-28 | 2022-05-13 | 扬州大学 | 水稻抗虫关键基因OsMYC2及其应用 |
CN114656547A (zh) * | 2022-04-01 | 2022-06-24 | 四川农业大学 | 草莓FaBBX21转录因子及其编码蛋白与应用 |
CN115851765A (zh) * | 2022-11-25 | 2023-03-28 | 中国热带农业科学院热带生物技术研究所 | 粉蕉成熟相关基因MaMYC2-10及其应用 |
CN115851765B (zh) * | 2022-11-25 | 2024-01-12 | 中国热带农业科学院热带生物技术研究所 | 粉蕉成熟相关基因MaMYC2-10及其应用 |
CN116426496A (zh) * | 2023-02-23 | 2023-07-14 | 宁夏大学 | 一种紫花苜蓿ipt基因在调控植物耐旱性中的应用 |
CN116426496B (zh) * | 2023-02-23 | 2023-12-26 | 宁夏大学 | 一种紫花苜蓿ipt基因在调控植物耐旱性中的应用 |
CN116515893A (zh) * | 2023-06-28 | 2023-08-01 | 海南大学三亚南繁研究院 | OsbHLH6基因及其蛋白质在提高作物耐冷性的应用 |
CN116515893B (zh) * | 2023-06-28 | 2023-09-08 | 海南大学三亚南繁研究院 | OsbHLH6基因及其蛋白质在提高作物耐冷性的应用 |
CN116769797A (zh) * | 2023-08-14 | 2023-09-19 | 浙江大学海南研究院 | 一种茉莉酸甲酯及PpyMYC2基因在萌芽中的应用 |
CN116769797B (zh) * | 2023-08-14 | 2023-10-24 | 浙江大学海南研究院 | 一种茉莉酸甲酯及PpyMYC2基因在萌芽中的应用 |
CN117683789A (zh) * | 2024-01-26 | 2024-03-12 | 华南农业大学 | Myc2基因在调控水稻日间开花时间中的应用 |
Also Published As
Publication number | Publication date |
---|---|
WO2009003977A3 (en) | 2009-05-22 |
EP2078090A2 (en) | 2009-07-15 |
WO2009003977A2 (en) | 2009-01-08 |
AU2008270370A1 (en) | 2009-01-08 |
CA2690563A1 (en) | 2009-01-08 |
EP2508610A1 (en) | 2012-10-10 |
US20100199380A1 (en) | 2010-08-05 |
WO2009003977A9 (en) | 2010-03-04 |
WO2009003977A8 (en) | 2010-01-07 |
DE112008001730T5 (de) | 2010-06-02 |
BRPI0813114A2 (pt) | 2014-11-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101495640B (zh) | 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法 | |
CN102027120A (zh) | 具有增强的产量相关性状的植物和用于制备该植物的方法 | |
KR101662483B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
CN101842489B (zh) | 具有增强的产量相关性状的植物和用于制备该植物的方法 | |
CN101365786B (zh) | 具有改良的生长特征的植物及其生产方法 | |
KR101647732B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
CN101415829B (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN101952441B (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN101583720A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
KR101754083B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
KR20120126061A (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
CN101883783A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN101868544A (zh) | 具有提高的产量相关性状的植物和用于制备该植物的方法 | |
BRPI0718977A2 (pt) | Método para aumentar rendimento de sementes em plantas em relação às plantas de controle, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica tendo redimento aumentado de sementes em relação às plantas de controle, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico | |
CN101688214A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN101605902A (zh) | 具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法 | |
CN101627125A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
KR101429476B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
CN101351556B (zh) | 具有改良生长特性的植物及其制备方法 | |
CN101563461A (zh) | 具有改良特征的植物及其制备方法 | |
CN103154254A (zh) | 具有增强的产量相关性状的植物和产生该植物的方法 | |
CN101969759A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN101778942A (zh) | 产率相关性状增强的植物及制备其的方法 | |
CN101595222B (zh) | 具有改良的种子产量相关性状的植物及其制备方法 | |
CN101668859A (zh) | 具有增强的产量相关性状的植物及其制备方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20110420 |