CN111989403A - Mads盒蛋白以及在植物中改善农艺特征 - Google Patents
Mads盒蛋白以及在植物中改善农艺特征 Download PDFInfo
- Publication number
- CN111989403A CN111989403A CN201980026424.6A CN201980026424A CN111989403A CN 111989403 A CN111989403 A CN 111989403A CN 201980026424 A CN201980026424 A CN 201980026424A CN 111989403 A CN111989403 A CN 111989403A
- Authority
- CN
- China
- Prior art keywords
- plant
- polypeptide
- sequence
- polynucleotide
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title description 66
- 102000004169 proteins and genes Human genes 0.000 title description 43
- 230000009418 agronomic effect Effects 0.000 title description 2
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 134
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 134
- 239000002157 polynucleotide Substances 0.000 claims abstract description 134
- 238000000034 method Methods 0.000 claims abstract description 98
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 87
- 229920001184 polypeptide Polymers 0.000 claims abstract description 86
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 86
- 230000001965 increasing effect Effects 0.000 claims abstract description 53
- 230000014509 gene expression Effects 0.000 claims abstract description 52
- 238000012239 gene modification Methods 0.000 claims abstract description 43
- 230000005017 genetic modification Effects 0.000 claims abstract description 43
- 235000013617 genetically modified food Nutrition 0.000 claims abstract description 43
- 108020004511 Recombinant DNA Proteins 0.000 claims abstract description 26
- 241000196324 Embryophyta Species 0.000 claims description 209
- 125000003729 nucleotide group Chemical group 0.000 claims description 63
- 239000002773 nucleotide Substances 0.000 claims description 62
- 240000008042 Zea mays Species 0.000 claims description 57
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 53
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 claims description 50
- 235000009973 maize Nutrition 0.000 claims description 50
- 230000001105 regulatory effect Effects 0.000 claims description 49
- 235000013339 cereals Nutrition 0.000 claims description 41
- 241000209510 Liliopsida Species 0.000 claims description 40
- 230000004048 modification Effects 0.000 claims description 39
- 238000012986 modification Methods 0.000 claims description 39
- 108010042407 Endonucleases Proteins 0.000 claims description 38
- 102000004533 Endonucleases Human genes 0.000 claims description 38
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 28
- 230000000694 effects Effects 0.000 claims description 22
- 108091026890 Coding region Proteins 0.000 claims description 18
- 238000003780 insertion Methods 0.000 claims description 16
- 230000037431 insertion Effects 0.000 claims description 16
- 238000012217 deletion Methods 0.000 claims description 13
- 230000037430 deletion Effects 0.000 claims description 13
- 238000010459 TALEN Methods 0.000 claims description 12
- 108010017070 Zinc Finger Nucleases Proteins 0.000 claims description 11
- 238000010362 genome editing Methods 0.000 claims description 11
- 108091023045 Untranslated Region Proteins 0.000 claims description 10
- 108091092724 Noncoding DNA Proteins 0.000 claims description 9
- 240000007594 Oryza sativa Species 0.000 claims description 9
- 235000007164 Oryza sativa Nutrition 0.000 claims description 9
- 235000009566 rice Nutrition 0.000 claims description 9
- 102000008682 Argonaute Proteins Human genes 0.000 claims description 6
- 108010088141 Argonaute Proteins Proteins 0.000 claims description 6
- 239000004009 herbicide Substances 0.000 claims description 6
- 102000054765 polymorphisms of proteins Human genes 0.000 claims description 5
- 230000002363 herbicidal effect Effects 0.000 claims description 3
- 241000238631 Hexapoda Species 0.000 claims description 2
- 240000006394 Sorghum bicolor Species 0.000 claims 4
- 230000029553 photosynthesis Effects 0.000 claims 2
- 238000010672 photosynthesis Methods 0.000 claims 2
- 239000002028 Biomass Substances 0.000 claims 1
- 239000000203 mixture Substances 0.000 abstract description 7
- 210000004027 cell Anatomy 0.000 description 72
- 108020004414 DNA Proteins 0.000 description 45
- 230000005782 double-strand break Effects 0.000 description 27
- 150000007523 nucleic acids Chemical class 0.000 description 27
- 102000039446 nucleic acids Human genes 0.000 description 25
- 108020004707 nucleic acids Proteins 0.000 description 25
- 230000008836 DNA modification Effects 0.000 description 17
- 108091028043 Nucleic acid sequence Proteins 0.000 description 15
- 238000006467 substitution reaction Methods 0.000 description 13
- 238000013518 transcription Methods 0.000 description 13
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 12
- 238000012360 testing method Methods 0.000 description 12
- 230000035897 transcription Effects 0.000 description 12
- 150000001413 amino acids Chemical class 0.000 description 11
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 10
- 230000001939 inductive effect Effects 0.000 description 10
- 230000009466 transformation Effects 0.000 description 10
- 230000009261 transgenic effect Effects 0.000 description 10
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 9
- 229910052725 zinc Inorganic materials 0.000 description 9
- 239000011701 zinc Substances 0.000 description 9
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 230000008685 targeting Effects 0.000 description 8
- 238000003776 cleavage reaction Methods 0.000 description 7
- 230000012010 growth Effects 0.000 description 7
- 230000007017 scission Effects 0.000 description 7
- 102000053602 DNA Human genes 0.000 description 6
- 101710141470 MADS-box transcription factor 18 Proteins 0.000 description 6
- 101710163270 Nuclease Proteins 0.000 description 6
- 238000007792 addition Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 229910052757 nitrogen Inorganic materials 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 244000062793 Sorghum vulgare Species 0.000 description 5
- 241000700605 Viruses Species 0.000 description 5
- 230000004075 alteration Effects 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 210000000349 chromosome Anatomy 0.000 description 5
- 241001233957 eudicotyledons Species 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 230000001052 transient effect Effects 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 5
- 230000007018 DNA scission Effects 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 244000068988 Glycine max Species 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 239000003112 inhibitor Substances 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 229940035893 uracil Drugs 0.000 description 4
- 241000219194 Arabidopsis Species 0.000 description 3
- 108091033409 CRISPR Proteins 0.000 description 3
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 3
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 3
- 108700010070 Codon Usage Proteins 0.000 description 3
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 3
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 3
- 101150104463 GOS2 gene Proteins 0.000 description 3
- 235000010469 Glycine max Nutrition 0.000 description 3
- 239000005562 Glyphosate Substances 0.000 description 3
- 240000005979 Hordeum vulgare Species 0.000 description 3
- 235000007340 Hordeum vulgare Nutrition 0.000 description 3
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 3
- 244000046052 Phaseolus vulgaris Species 0.000 description 3
- 102000018120 Recombinases Human genes 0.000 description 3
- 108010091086 Recombinases Proteins 0.000 description 3
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 3
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 235000005822 corn Nutrition 0.000 description 3
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- -1 etc. Substances 0.000 description 3
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 3
- 229940097068 glyphosate Drugs 0.000 description 3
- 238000003306 harvesting Methods 0.000 description 3
- 239000000411 inducer Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 238000000520 microinjection Methods 0.000 description 3
- 230000000243 photosynthetic effect Effects 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 230000005783 single-strand break Effects 0.000 description 3
- 125000006850 spacer group Chemical group 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 230000003612 virological effect Effects 0.000 description 3
- 108020003589 5' Untranslated Regions Proteins 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 235000003826 Artemisia Nutrition 0.000 description 2
- 235000003261 Artemisia vulgaris Nutrition 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 241000743774 Brachypodium Species 0.000 description 2
- 235000011331 Brassica Nutrition 0.000 description 2
- 241000219198 Brassica Species 0.000 description 2
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 2
- 244000020518 Carthamus tinctorius Species 0.000 description 2
- 241001478750 Chlorophytum comosum Species 0.000 description 2
- 101100329224 Coprinopsis cinerea (strain Okayama-7 / 130 / ATCC MYA-4618 / FGSC 9003) cpf1 gene Proteins 0.000 description 2
- 229920000742 Cotton Polymers 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 241000219146 Gossypium Species 0.000 description 2
- 244000020551 Helianthus annuus Species 0.000 description 2
- 235000003222 Helianthus annuus Nutrition 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- 102100034343 Integrase Human genes 0.000 description 2
- 108010061833 Integrases Proteins 0.000 description 2
- 108091027974 Mature messenger RNA Proteins 0.000 description 2
- 240000004658 Medicago sativa Species 0.000 description 2
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 2
- 108020001991 Protoporphyrinogen Oxidase Proteins 0.000 description 2
- 102000005135 Protoporphyrinogen oxidase Human genes 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 244000098338 Triticum aestivum Species 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 244000030166 artemisia Species 0.000 description 2
- 235000009052 artemisia Nutrition 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000027455 binding Effects 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 101150059443 cas12a gene Proteins 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000004883 computer application Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000006471 dimerization reaction Methods 0.000 description 2
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 230000005714 functional activity Effects 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 229920001519 homopolymer Polymers 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- 235000021374 legumes Nutrition 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 229910044991 metal oxide Inorganic materials 0.000 description 2
- 150000004706 metal oxides Chemical class 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000013081 phylogenetic analysis Methods 0.000 description 2
- 238000003976 plant breeding Methods 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid Chemical compound CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- 241001133760 Acoelorraphe Species 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 108010052875 Adenine deaminase Proteins 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- 235000005336 Allium ursinum Nutrition 0.000 description 1
- 244000003363 Allium ursinum Species 0.000 description 1
- 235000017060 Arachis glabrata Nutrition 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- 235000010777 Arachis hypogaea Nutrition 0.000 description 1
- 235000018262 Arachis monticola Nutrition 0.000 description 1
- 229930192334 Auxin Natural products 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 241001538513 Caerulea Species 0.000 description 1
- 244000045232 Canavalia ensiformis Species 0.000 description 1
- 235000002566 Capsicum Nutrition 0.000 description 1
- 235000013912 Ceratonia siliqua Nutrition 0.000 description 1
- 240000008886 Ceratonia siliqua Species 0.000 description 1
- 108020004998 Chloroplast DNA Proteins 0.000 description 1
- 235000010523 Cicer arietinum Nutrition 0.000 description 1
- 244000045195 Cicer arietinum Species 0.000 description 1
- 241000223782 Ciliophora Species 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 235000013162 Cocos nucifera Nutrition 0.000 description 1
- 244000060011 Cocos nucifera Species 0.000 description 1
- 244000007835 Cyamopsis tetragonoloba Species 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 108010031325 Cytidine deaminase Proteins 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 241000476204 Delosperma nubigenum Species 0.000 description 1
- 239000005504 Dicamba Substances 0.000 description 1
- 208000035240 Disease Resistance Diseases 0.000 description 1
- 241001057636 Dracaena deremensis Species 0.000 description 1
- 235000005075 Dryopteris fragrans Nutrition 0.000 description 1
- 244000115361 Dryopteris fragrans Species 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 235000009709 Geum japonicum Nutrition 0.000 description 1
- 241001618015 Geum japonicum Species 0.000 description 1
- 239000005561 Glufosinate Substances 0.000 description 1
- 108020005004 Guide RNA Proteins 0.000 description 1
- 235000009198 Lamium amplexicaule Nutrition 0.000 description 1
- 244000303225 Lamium amplexicaule Species 0.000 description 1
- 235000014647 Lens culinaris subsp culinaris Nutrition 0.000 description 1
- 244000043158 Lens esculenta Species 0.000 description 1
- 102100025169 Max-binding protein MNT Human genes 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 240000002769 Morchella esculenta Species 0.000 description 1
- 235000002779 Morchella esculenta Nutrition 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 241000204031 Mycoplasma Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 239000006002 Pepper Substances 0.000 description 1
- 235000010617 Phaseolus lunatus Nutrition 0.000 description 1
- 235000016761 Piper aduncum Nutrition 0.000 description 1
- 235000017804 Piper guineense Nutrition 0.000 description 1
- 240000003889 Piper guineense Species 0.000 description 1
- 235000008184 Piper nigrum Nutrition 0.000 description 1
- 240000004713 Pisum sativum Species 0.000 description 1
- 235000010582 Pisum sativum Nutrition 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108700005075 Regulator Genes Proteins 0.000 description 1
- 241000589180 Rhizobium Species 0.000 description 1
- 241000209056 Secale Species 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- 108010052160 Site-specific recombinase Proteins 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 1
- 241000543664 Triglochin maritima Species 0.000 description 1
- 235000001484 Trigonella foenum graecum Nutrition 0.000 description 1
- 244000250129 Trigonella foenum graecum Species 0.000 description 1
- 101150013568 US16 gene Proteins 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 235000010749 Vicia faba Nutrition 0.000 description 1
- 240000006677 Vicia faba Species 0.000 description 1
- 235000002098 Vicia faba var. major Nutrition 0.000 description 1
- 241000219977 Vigna Species 0.000 description 1
- 240000004922 Vigna radiata Species 0.000 description 1
- 235000010721 Vigna radiata var radiata Nutrition 0.000 description 1
- 235000011469 Vigna radiata var sublobata Nutrition 0.000 description 1
- 235000010726 Vigna sinensis Nutrition 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 108700010756 Viral Polyproteins Proteins 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 108700002693 Viral Replicase Complex Proteins Proteins 0.000 description 1
- 101100339555 Zymoseptoria tritici HPPD gene Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 239000002363 auxin Substances 0.000 description 1
- 230000008238 biochemical pathway Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 230000008045 co-localization Effects 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 244000038559 crop plants Species 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- IWEDIXLBFLAXBO-UHFFFAOYSA-N dicamba Chemical compound COC1=C(Cl)C=CC(Cl)=C1C(O)=O IWEDIXLBFLAXBO-UHFFFAOYSA-N 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000000749 insecticidal effect Effects 0.000 description 1
- 230000017730 intein-mediated protein splicing Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 210000003593 megakaryocyte Anatomy 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 230000000361 pesticidal effect Effects 0.000 description 1
- 230000008119 pollen development Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000009712 regulation of translation Effects 0.000 description 1
- 230000009711 regulatory function Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000003584 silencer Effects 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 230000003007 single stranded DNA break Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000012250 transgenic expression Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 235000001019 trigonella foenum-graecum Nutrition 0.000 description 1
- 210000005167 vascular cell Anatomy 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8262—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield involving plant development
- C12N15/8269—Photosynthesis
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Physiology (AREA)
- Botany (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
提供了包含编码多肽的多核苷酸的组合物。还提供了包含所述多核苷酸的重组DNA构建体、植物、植物细胞、种子、谷物,以及在编码多肽的基因组基因座处包含遗传修饰的植物、植物细胞、种子、谷物。另外,本文还提供了在植物中使用所述多核苷酸和遗传修饰的各种方法,诸如用于在植物中调控表达水平的方法以及用于增加植物产量的方法。
Description
以电子方式递交的序列表的引用
所述序列表的官方副本经由EFS-Web以ASCII格式的序列表以电子方式提交,文件名为7845WOPCT_ST25.txt,创建于2019年4月11日,且具有118千字节的大小,并与本说明书同时提交。包含在该ASCII格式的文件中的序列表是本说明书的一部分并且以其全文通过引用并入本文。
技术领域
本公开涉及用于提高植物产量的组合物和方法。
背景技术
全球对农作物的需求和消费正在迅速增长。因此,需要开发新的组合物和方法以增加植物产量。本发明提供此类组合物和方法。本文提供了多种植物MADS盒多肽。
发明内容
本文提供了编码多肽的多核苷酸,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸或全长序列具有至少95%至99%同一性的氨基酸序列。
还提供了重组DNA构建体,其包含可操作地连接到编码多肽的多核苷酸的调节元件,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列或全长序列具有至少80%同一性的氨基酸序列。在某些实施例中,所述调节元件是异源启动子,诸如例如,GOS2中等组成型启动子。
提供了植物细胞、植物、和种子,其包含编码多肽的多核苷酸或重组DNA构建体,所述重组DNA构建体包含可操作地连接到编码多肽的多核苷酸的调节元件。在某些实施例中,所述调节元件是异源启动子。在某些实施例中,所述植物和/或种子来自单子叶植物。在某些实施例中,所述植物是单子叶植物。在某些实施例中,所述单子叶植物是玉蜀黍。
进一步提供了在基因组基因座处包含靶向遗传修饰的植物细胞、植物、和种子,所述基因组基因座编码多肽,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少80%同一性的氨基酸序列,其中所述遗传修饰增加所编码的多肽的水平和/或活性。在某些实施例中,所述遗传修饰选自由以下组成的组:插入、缺失、单核苷酸多态性(SNP)、和多核苷酸修饰。在某些实施例中,所述靶向遗传修饰存在于编码多肽的基因组基因座的(a)编码区;(b)非编码区;(c)调节序列;(d)非翻译区;或(e)(a)-(d)的任何组合。在某些实施例中,所述植物和/或种子来自单子叶植物。在某些实施例中,所述植物是单子叶植物。在某些实施例中,所述单子叶植物是玉蜀黍。
提供了用于通过在可再生植物细胞中表达重组DNA构建体并产生所述植物来增加植物产量的方法,所述重组DNA构建体包含可操作地连接到编码多肽的多核苷酸的调节元件,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少80%同一性的氨基酸序列;其中所述植物在其基因组中包含所述重组DNA构建体。在某些实施例中,所述调节元件是异源启动子。在某些实施例中,所述植物是单子叶植物。在某些实施例中,所述单子叶植物是玉蜀黍。在某些实施例中,所述产量是籽粒产量。
进一步提供了用于通过在可再生植物细胞中在基因组基因座处引入靶向遗传修饰并产生所述植物来增加植物产量的方法,所述基因组基因座编码多肽,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列或全长序列具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一性的氨基酸序列;其中所编码的多肽的水平和/或活性在所述植物中增加。在某些实施例中,所述遗传修饰使用基因组修饰技术引入,所述基因组修饰技术选自由以下组成的组:多核苷酸指导的内切核酸酶、CRISPR-Cas内切核酸酶、碱基编辑脱氨酶、锌指核酸酶、转录激活子样效应子核酸酶(TALEN)、工程化位点特异性大范围核酸酶、或Argonaute。在某些实施例中,所述靶向遗传修饰存在于编码多肽的基因组基因座的(a)编码区;(b)非编码区;(c)调节序列;(d)非翻译区;或(e)(a)-(d)的任何组合。在某些实施例中,所述植物细胞来自单子叶植物。在某些实施例中,所述单子叶植物是玉蜀黍。在某些实施例中,所述产量是籽粒产量。
提供了用于通过在可再生植物细胞中表达重组DNA构建体并产生所述植物来增加植物中光合作用活性的方法,所述重组DNA构建体包含可操作地连接到编码多肽的多核苷酸的调节元件,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少80%至98%同一性的氨基酸序列;其中所述植物在其基因组中包含所述重组DNA构建体。在某些实施例中,所述调节元件是异源启动子。在某些实施例中,所述植物是单子叶植物。在某些实施例中,所述单子叶植物是玉蜀黍。
还提供了用于通过在可再生植物细胞中在基因组基因座处引入靶向遗传修饰并产生所述植物来增加植物中光合作用活性的方法,所述基因组基因座编码多肽,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少80%至约98%同一性的氨基酸序列;其中所编码的多肽的水平和/或活性在所述植物中增加。在某些实施例中,所述遗传修饰使用基因组修饰技术引入,所述基因组修饰技术选自由以下组成的组:多核苷酸指导的内切核酸酶、CRISPR-Cas内切核酸酶、碱基编辑脱氨酶、锌指核酸酶、转录激活子样效应子核酸酶(TALEN)、工程化位点特异性大范围核酸酶、或Argonaute。在某些实施例中,所述靶向遗传修饰存在于编码多肽的基因组基因座的(a)编码区;(b)非编码区;(c)调节序列;(d)非翻译区;或(e)(a)-(d)的任何组合。在某些实施例中,所述植物细胞来自单子叶植物。在某些实施例中,所述单子叶植物是玉蜀黍。
附图和序列表的说明
图1表明在多地点产量测试中,来自具有增加的Os-MADS18表达的九个玉蜀黍品系的产量。绘制的值是转基因事件相对于对照的蒲式耳/英亩产量增加。*表示P<0.1。基础产量(对照产量)是184蒲式耳/英亩。数据用跨越8个地点的BLUP分析显示。
图2表明在多地点产量测试中,来自具有增加的SB-MADS28表达的四个玉蜀黍品系的产量。绘制的值是转基因事件相对于对照的蒲式耳/英亩产量增加。*表示P<0.1。基础产量(对照产量)是在低N条件下的142蒲式耳/英亩和在正常氮条件下的172蒲式耳/英亩。数据用BLUP分析显示。
图3显示相关的MADS盒蛋白的系统发育树。具有来自拟南芥和代表性单子叶植物的AP1-FUL进化枝成员的ZMM28(Zm00001d022088)的系统发育分析。突出显示了含有ZMM28的进化枝。
根据下列的详细描述和附图以及序列表,可以更全面地理解本公开,所述详细描述和附图以及序列表形成本申请的一部分。
这些序列描述以及所附序列表遵守如37 C.F.R.§§1.821和1.825所列出的管理专利申请中核苷酸和氨基酸序列公开内容的规则。这些序列描述包含如在37 C.F.R.§§1.821和1.825中所定义的用于氨基酸的三字母代码,将其通过引用结合在此。
表1:序列表
I.组合物
A.多核苷酸和多肽
本公开提供编码多肽的多核苷酸。因此,如本文使用的“多肽”、“蛋白质”等是指由SEQ ID NO表示的蛋白质。
本公开的一个方面提供编码多肽的多核苷酸,所述多肽包含与SEQ ID NO:1-10、12-51中的任一个的氨基酸序列具有至少80%-99%%同一性的氨基酸序列)。
图1b显示来自拟南芥属(Arabidopsis)、稻、高粱、大麦、短柄草属(Brachypodium)、和玉蜀黍的具有AP1-FUL进化枝MADS盒基因的ZMM28(Zm00001d022088)的系统发育分析。ZMM28分别与高粱Sb02g038780.1、大麦AK361063和AK361227、和稻LOC_Os07g41370.1(OsMADS18)蛋白质成簇,并且分别于它们共享94%、75%、69%、和76%氨基酸序列同一性。
如本文使用的,关于指定核酸的“编码”(“encoding”、“encoded”等)是指包含用于翻译成指定蛋白质的信息。编码蛋白质的核酸在所述核酸的翻译区之内可以包含非翻译序列(例如,内含子)或可能缺乏此类插入的非翻译序列(例如,在cDNA中)。通过密码子使用来详细说明用来编码蛋白质的信息。典型地,通过核酸使用“通用”遗传密码来编码氨基酸序列。然而,当核酸使用以下这些生物体表达时,可以使用通用密码的变体,诸如存在于一些植物、动物、和真菌线粒体、细菌山羊支原体(Mycoplasma capricolum)(Yamao,等人,(1985)Proc.Natl.Acad.Sci.USA[美国科学院院报]82:2306-9)或纤毛虫大核中的通用密码变体。
当合成地制备或改变核酸时,可以利用要表达核酸的预期宿主的已知密码子偏好性。例如,虽然在单子叶和双子叶植物物种中均可以表达本发明的核酸序列,但是可以修饰序列,以解释单子叶植物或双子叶植物的特定密码子偏好和GC含量偏好,因为这些偏好已经表现出了差异(Murray等人(1989)Nucleic Acids Res.[核酸研究]17:477-98)。
如本文使用的,“多核苷酸”包括提及具有天然核糖核苷酸的基本性质的脱氧核糖多核苷酸、核糖多核苷酸、或其类似物,因为在严格的杂交条件下,它们与和天然存在的核苷酸基本上相同的核苷酸序列杂交和/或允许翻译成与一种或多种天然存在的核苷酸相同的一种或多种氨基酸。多核苷酸可以是结构基因或调控基因的全长或子序列。除非另外指明,所述术语包括提及指定序列以及其互补序列。因此,出于稳定性或其他原因而具有经修饰的主链的DNA或RNA是“多核苷酸”,如该术语在本文中所意指的。此外,仅举两个例子,包含稀有碱基(诸如肌苷)或修饰的碱基(诸如三苯甲基化的碱基)的DNA或RNA是多核苷酸,如该术语在本文中所使用的。应当理解,已经对DNA和RNA进行了多种修饰,所述修饰具有本领域技术人员已知的许多有用目的。如本文采用的术语多核苷酸涵盖诸如多核苷酸的化学修饰形式、酶修饰形式或代谢修饰形式,以及病毒和细胞(尤其包括简单和复杂细胞)所特有的DNA和RNA的化学形式。
术语“多肽”、“肽”和“蛋白”在本文中可互换使用,是指氨基酸残基的聚合物。这些术语适用于其中一个或多个氨基酸残基是相应的天然存在的氨基酸的人工化学类似物的氨基酸聚合物,以及适用于天然存在的氨基酸聚合物。
如本文使用的,在两个核酸或多肽序列的上下文中的“序列同一性”或“同一性”包括,当在指定比较窗口上对齐最大对应性时,提及两个序列中的相同残基。当使用关于蛋白质的序列同一性百分比时,认识到不相同的残基位置通常相差保守氨基酸取代,其中氨基酸残基被具有相似化学性质(例如电荷或疏水性)的其他氨基酸残基取代,并且因此不改变分子的功能性质。当序列在保守取代方面不同时,可以向上调节序列同一性百分比,以校正所述取代的保守性质。相差这些保守取代的序列被称为具有“序列相似性”或“相似性”。用于进行此调节的方法是本领域技术人员所熟知的。典型地,这涉及作为部分而不是完全错配对保守取代打分,从而提高百分比序列同一性。因此,例如,当相同的氨基酸得分为1,并且非保守取代的得分为零时,保守取代的得分在零和1之间。例如,根据Meyers和Miller,(1988)Computer Applic.Biol.Sci.[计算机应用生物科学]4:11-17的算法来计算保守取代的得分,例如如在程序PC/GENE(易达利遗传学公司(Intelligenetics),山景城,加利福尼亚州,美国)中实现的。
如本文使用的,“序列同一性百分比”意指通过在比较窗口上比较两个最佳比对序列所确定的值,其中与参比序列(其不包含添加或缺失)相比,该比较窗中的多核苷酸序列部分可以包含添加或缺失(即空位),以进行这两个序列的最佳比对。通过以下方式计算所述百分比:确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗口中的位置的总数目,然后将所述结果乘以100以产生序列同一性的百分比。
如本文使用的,“参比序列”是用作序列比较的基础的确定序列。参比序列可以是指定序列的子集或整体;例如,作为全长cDNA或基因序列的区段、或完整的cDNA或基因序列。
如本文使用的,“比较窗口”意指包括提及多核苷酸序列的连续且指定的区段,其中所述多核苷酸序列可以与参比序列进行比较,并且其中与用于两个序列的最佳比对的参比序列(其不包含添加或缺失)相比,比较窗口中的多核苷酸序列部分可能包含添加或缺失(即空位)。通常,比较窗口的长度为至少20个连续核苷酸,并且任选地可以是30个、40个、50个、100个或更长。本领域技术人员应当理解,由于多核苷酸序列中含有空位,为了避免与参比序列的高相似性,典型地引入空位罚分,并且将其从匹配数中减去。
用于比较的核苷酸序列和氨基酸序列的比对方法是本领域熟知的。Smith和Waterman(1981)Adv.Appl.Math.[应用数学进展]2:482的局部同源性算法(BESTFIT)可进行比较的序列的最佳比对;通过Needleman和Wunsch,(1970)J.Mol.Biol.[分子生物学杂志]48:443-53的同源性比对算法(GAP);通过Pearson和Lipman,(1988)Proc.Natl.Acad.Sci.USA[美国科学院院报]85:2444的相似性搜索法(Tfasta和Fasta);通过这些算法的计算机化实现,包括但不限于:加利福尼亚州山景城的易达利遗传学公司(Intelligenetics)的PC/基因程序中的CLUSTAL,Wisconsin Genetics Software(版本8)中的GAP、BESTFIT、BLAST、FASTA、和TFASTA(可获得自遗传学计算机集团(Genetics Computer Group)(程序(Accelrys公司,圣地亚哥,加利福尼亚州))。以下充分描述了CLUSTAL程序:Higgins和Sharp,(1988)Gene[基因]73:23744;Higgins和Sharp,(1989)CABIOS[计算机应用生物科学]5:1513;Corpet等人,(1988)Nucleic AcidsRes.[核酸研究]16:10881-90;Huang等人(1992)Computer Applications in theBiosciences[计算机应用生物科学]8:155-65;以及Pearson等人(1994)Meth.Mol.Biol.[分子生物学方法]24:307-31。用于多个序列的最佳全局比对的优选程序是PileUp(Feng和Doolittle,(1987)J.Mol.Evol.[分子进化杂志],25:351-60,其类似于Higgins和Sharp,(1989)CABIOS[计算机应用生物科学]5:151-53描述的方法并且通过引用并入本文)。可用于数据库相似性搜索的BLAST程序家族包括:BLASTN,用于比较核苷酸查询序列与核苷酸数据库序列;BLASTX,用于比较核苷酸查询序列与蛋白质数据库序列;BLASTP,用于比较蛋白质查询序列与蛋白质数据库序列;TBLASTN,用于比较蛋白质查询序列与核苷酸数据库序列;以及TBLASTX,用于比较核苷酸查询序列与核苷酸数据库序列。参见,CURRENTPROTOCOLS IN MOLECULAR BIOLOGY[分子生物学实验指南],第19章,Ausubel等人编辑,Greene Publishing and Wiley-Interscience[格林出版与威利交叉科学出版社],纽约(1995)。
GAP使用上文的Needleman和Wunsch的算法来找到使匹配数目最大化并且使空位数目最小化的两个完整序列的对齐。GAP考虑所有可能的对齐和空位位置,并且产生具有最大匹配碱基数量和最少空位的对齐。它允许以匹配碱基单位提供空位产生罚分和空位延伸罚分。GAP必须为它插入的每个空位获取空位产生罚分匹配数目的收益。如果选择大于零的空位延伸罚分,GAP必须另外地为每个所插入空位获取空位长度乘以空位延伸罚分的收益。在Wisconsin Genetics Software的版本10中,默认空位产生罚分值和空位延伸罚分值分别为8和2。空位产生罚分和空位延伸罚分可以表示为选自下组的整数,该组由0至100组成。因此,例如,空位产生罚分和空位延伸罚分可以为0、1、2、3、4、5、6、7、8、9、10、15、20、30、40、50或更大。
GAP代表最佳对齐家族的一个成员。可以存在这个家族的许多成员,但是其他成员没有更好的品质。GAP展示出用于对齐的四个性能因数:质量、比率、同一性和相似性。为了对齐序列,质量是最大化的度量。比率是质量除以更短区段中的碱基数。同一性百分比是实际匹配的符号的百分比。相似性百分比是相似符号的百分比。空位对面的符号被忽略。当一对符号的评分矩阵值大于或等于相似性阈值0.50时,相似性得分。Wisconsin GeneticsSoftware 的版本10中使用的评分矩阵为BLOSUM62(参见Henikoff和Henikoff,(1989)Proc.Natl.Acad.Sci.USA[美国科学院院报]89:10915)。
除非另外说明,否则在此提供的序列同一性/相似性值是指使用BLAST2.0程序包、使用默认参数获得的值(Altschul等人,(1997)Nucleic Acids Res.[核酸研究]25:3389-402)。
如本领域技术人员将理解,BLAST搜索假设蛋白质可被建模为随机序列。然而,许多真实蛋白质包含非随机序列的区域,其可是同聚序列段(homopolymeric tracts)、短周期重复序列、或富含一种或多种氨基酸的区域。即使蛋白质的其他区域完全不同,这种低复杂性的区域也可在不相关蛋白质之间对齐。许多低复杂性滤波器程序可用来减少这些低复杂性比对。例如,可单独使用或组合使用SEG(Wooten和Federhen,(1993)Comput.Chem.[计算机化学]17:149-63)和XNU(Claverie和States,(1993)Comput.Chem.[计算机化学]17:191-201)低复杂性滤波器。
因此,在本文所述的任何实施例中,所述多核苷酸可编码与SEQ ID NO:1-10、12-51中的任一个具有至少80%同一性的多肽。例如,所述多核苷酸可编码与SEQ ID NO:1-10、12-51中的任一个的氨基酸序列具有至少81%同一性、至少82%同一性、至少83%同一性、至少84%同一性、至少85%同一性、至少86%同一性、至少87%同一性、至少88%同一性、至少89%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、或至少99%同一性的多肽。
B.重组DNA构建体
还提供了包含本文所述的任何多核苷酸的重组DNA构建体。在某些实施例中,所述重组DNA构建体进一步包含至少一种调节元件。在某些实施例中,所述重组DNA构建体的至少一种调节元件包含启动子。在某些实施例中,所述启动子是异源启动子。
如本文使用的,“重组DNA构建体”包含两个或更多个可操作地连接的DNA区段,优选在自然界中不可操作地连接(即,异源)的DNA区段。重组DNA构建体的非限制性实例包括与异源序列(也称为调节元件)可操作地连接的目的多核苷酸,这些异源序列有助于目的序列的表达、自主复制和/或基因组插入。此类调节元件包括例如启动子、终止序列、增强子等,或表达盒的任何组分;质粒、粘粒、病毒、自主复制序列、噬菌体、或线性或环状单链或双链DNA或RNA核苷酸序列;和/或编码异源多肽的序列。
本文所述的多核苷酸能以用于在目的植物或任何目的生物体中表达的表达盒提供。所述盒可以包括可操作地连接到多核苷酸的5′和3′调节序列。“可操作地连接”旨在表示两个或更多个元件之间的功能性连接。例如,目的多核苷酸和调节序列(例如,启动子)之间的可操作连接是允许目的多核苷酸表达的功能性连接。可操作地连接的元件可以是连续的或非连续的。当用于指两个蛋白质编码区的连接时,可操作地连接意指这些编码区处于相同的阅读框中。所述盒可以另外含有至少一个待共转化到生物体中的额外的基因。可替代地,所述一个或多个额外的基因可以在多个表达盒上提供。此类表达盒装备有多个限制性位点和/或重组位点,用于将多核苷酸插入到调节区的转录调节之下。表达盒可另外含有选择性标记基因。
所述表达盒以5′-3′转录的方向包括转录和翻译起始区(例如,启动子)、多核苷酸、和在植物中起作用的转录和翻译终止区(例如,终止区)。所述调节区(例如,启动子、转录调节区、和翻译终止区)和/或多核苷酸对于宿主细胞而言或彼此之间可以是天然的/同功的。可替代地,所述调节区和/或多核苷酸对于宿主细胞或彼此之间可以是异源的。
如本文使用的,关于序列的“异源性”是指该序列源于外来物种,或者,如果源于相同物种的话,则是通过蓄意人为干预从其在组合物和/或基因组基因座中的天然形式进行实质性修饰得到的序列。例如,可操作地连接到异源多核苷酸的启动子来自与从其衍生所述多核苷酸的物种不同的物种,或者,如果来自相同/类似的物种,那么一方或双方基本上由它们的原来形式和/或基因组基因座修饰得到,或者所述启动子不是可操作地连接到多核苷酸的天然启动子。
所述终止区对于转录起始区、对于植物宿主而言可是天然的,或可衍生自对于所述启动子、多核苷酸、植物宿主、或其任何组合而言的另一种来源(即外源的或异源的)。
所述表达盒可以另外含有5′前导序列。此类前导序列可以起到增强翻译的作用。翻译前导子在本领域是已知的并且包括病毒翻译前导序列。
在制备表达盒时,可以操作各种DNA片段,以提供处于适当取向以及合适时,处于适当阅读框中的DNA序列。为此,可采用衔接子(adapter)或接头以连接DNA片段,或可以涉及其他操作以提供方便的限制位点、移除多余的DNA、移除限制位点等。出于这个目的,可以涉及体外诱变、引物修复、限制性酶切(restriction)、退火、再取代(例如转换和颠换)。
如本文使用的“启动子”指DNA的在转录开始的上游并参与RNA聚合酶以及其他蛋白质的识别和结合以启动转录的区域。植物启动子是能够在植物细胞中起始转录的启动子。示例性植物启动子包括但不局限于从植物、植物病毒以及包含在植物细胞中表达的基因的细菌(如农杆菌属(Agrobacterium)或根瘤菌属(Rhizobium))获得的那些启动子。某些启动子类型优先在某些组织(如叶、根、种子、纤维、木质部导管、管胞或厚壁组织)中启动转录。这样的启动子被称为“组织偏好的”。“细胞类型”特异性启动子主要驱动在一个或多个器官中的某些细胞类型(例如,根或叶中的维管细胞)中的表达。“诱导型”或“调节型”启动子是指在环境控制下的启动子。可通过诱导型启动子影响转录的环境条件的实例包括厌氧条件或光照的存在。另一类型的启动子是发育调节启动子,例如在花粉发育期间驱动表达的启动子。组织偏好性启动子、细胞类型特异性启动子、发育调节启动子、和诱导型启动子构成“非组成型”启动子类别。“组成型”启动子是在大多数环境条件下有活性的启动子。组成型启动子包括,例如Rsyn7启动子的核心启动子和其他在WO 99/43838和美国专利号6,072,050中公开的组成型启动子;核心CaMV 35S启动子(Odell等人,(1985)Nature[自然]313:810-812);稻肌动蛋白(McElroy等人,(1990)Plant Cell[植物细胞]2:163-171);泛素(Christensen等人,(1989)Plant Mol.Biol.[植物分子生物学]12:619-632和Christensen等人,(1992)Plant Mol.Biol.[植物分子生物学]18:675-689);pEMU(Last等人(1991)Theor.Appl.Genet.[理论与应用遗传学]81:581-588);MAS(Velten等人,(1984)EMBO J.[欧洲分子生物学学会杂志]3:2723-2730);ALS启动子(美国专利号5,659,026);ZmGOS2(美国专利号6,504,083)等。其他组成型启动子包括例如美国专利号5,608,149;5,608,144;5,604,121;5,569,597;5,466,785;5,399,680;5,268,463;5,608,142;和6,177,611。
还考虑了包括一种或多种异源调节元件的组合的合成启动子。
C.植物和植物细胞
提供了包含本文所述的多核苷酸序列或本文所述的重组DNA构建体的植物、植物细胞、植物部分、种子、和谷物,于是植物、植物细胞、植物部分、种子、和/或谷物具有增加的多肽表达。在某些实施例中,植物、植物细胞、植物部分、种子、和/或谷物将本文所述的外源多核苷酸稳定地掺入其基因组中。在某些实施例中,植物、植物细胞、植物部分、种子、和/或谷物可以包含多个多核苷酸(即,至少1个、2个、3个、4个、5个、6个或更多个)。
在具体实施例中,植物、植物细胞、植物部分、种子、和/或谷物中的一种或多种多核苷酸可操作地连接到异源调节元件,例如,但不限于组成型启动子、组织偏好性启动子、或用于在植物中表达的合成启动子、或组成型增强子。例如,在某些实施例中,所述异源调节元件是玉蜀黍GOS2启动子。
本文还提供了在基因组基因座处包含引入的遗传修饰的植物、植物细胞、植物部分、种子、和谷物,所述基因组基因座编码多肽,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少80%同一性的氨基酸序列。
在某些实施例中,所述遗传修饰增加了蛋白质的活性。在某些实施例中,所述遗传修饰增加了蛋白质的水平。在某些实施例中,所述遗传修饰增加了蛋白质的水平和活性两者。
如本文使用的,“基因组基因座”通常指在植物的染色体上的位置,在该位置上发现了基因,诸如编码多肽的多核苷酸。如本文使用的,“基因”包括表达功能性分子的核酸片段,诸如但不限于特定蛋白质编码序列和调节元件,诸如在编码序列之前(5’非编码序列)和之后(3’非编码序列)的那些调节元件。
“调节元件”通常是指参与调节核酸分子(例如基因或靶基因)的转录的转录调节元件。调节元件是核酸,并且可以包括启动子、增强子、内含子、5’-非翻译区(5’UTR,还被称为前导序列)、或3’-UTR或其组合。调节元件能以“顺式”或“反式”起作用,并且通常以“顺式”起作用,即其激活位于调节元件所在的相同核酸分子(例如染色体)上的基因的表达。
“增强子”元件是当功能性连接至启动子时(无论其相对位置如何)都可增加核酸分子的转录的任何核酸分子。
将“阻遏物”(本文中有时也被称为沉默子)定义为当在功能上与启动子连接时(无论相对位置如何)都抑制转录的任何核酸分子。
术语“顺式元件”通常是指影响或调控可操作地连接的可转录的多核苷酸表达的转录调节元件,其中所述可转录的多核苷酸存在于相同DNA序列中。顺式元件可以起到结合转录因子的作用,所述转录因子是调节转录的反式作用多肽。
“内含子”是转录成RNA、但是然后在产生成熟mRNA的过程中被切除的基因中的间插序列。所述术语也用于切除的RNA序列。“外显子”是经转录的基因的序列的一部分,并且在源自所述基因的成熟信使RNA中被发现,但不一定是编码最终基因产物的序列的一部分。
5′非翻译区(5’UTR)(也称为翻译前导序列或前导RNA)是直接位于起始密码子上游的mRNA的区域。该区域涉及通过病毒、原核生物和真核生物中的不同机制对转录物的翻译的调节。
“3′非编码序列”是指位于编码序列下游的DNA序列,并且包括聚腺苷酸化识别序列和编码能够影响mRNA加工或基因表达的调节信号的其他序列。聚腺苷酸化信号通常表征为影响聚腺苷酸片添加到mRNA前体的3′末端。
“遗传修饰”、“DNA修饰”等是指在植物的特定基因组基因座上改变或变更核苷酸序列的位点特异性修饰。本文所述的组合物和方法的遗传修饰可以是本领域已知的任何修饰,诸如,例如,插入、缺失、单核苷酸多态性(SNP)、和或多核苷酸修饰。另外,基因组基因座上的靶向DNA修饰可位于基因组基因座上的任何位置,诸如,例如,所编码的多肽的编码区(例如,外显子)、非编码区(例如,内含子)、调节元件、或非翻译区。
如本文使用的,“靶向”遗传修饰或“靶向”DNA修饰是指对生物体基因的直接操作。所述靶向修饰可以使用本领域已知的任何技术引入,诸如,例如,植物育种、基因组编辑、或单基因座转化。
多核苷酸的DNA修饰的类型和位置不受特别限制,只要DNA修饰导致由相应多核苷酸编码的蛋白质的表达和/或活性增加即可。
在某些实施例中,植物、植物细胞、植物部分、种子、和/或谷物包含存在于编码多肽的内源性多核苷酸的(a)编码区;(b)非编码区;(c)调节序列;(d)非翻译区,或(e)(a)-(d)的任何组合中的一种或多种核苷酸修饰。
在某些实施例中,所述DNA修饰是在基因组基因座中插入一个或多个核苷酸(优选是连续的)。例如,插入表达调控元件(EME),诸如PCT/US 2018/025446中描述的EME,其与本文所述的目的基因可操作地连接。在某些实施例中,所述靶向DNA修饰可以是用本领域已知的具有较高表达的另一种启动子(诸如,例如,玉蜀黍GOS2启动子)替代内源性启动子。在某些实施例中,所述靶向DNA修饰可以是将本领域已知的具有较高表达的启动子(诸如,例如,玉蜀黍GOS2启动子)插入5’UTR,从而通过插入的启动子控制内源性多肽的表达。在某些实施例中,所述DNA修饰是优化Kozak背景以增加表达的修饰。在某些实施例中,所述DNA修饰是多核苷酸修饰或在调节所表达的蛋白的稳定性的位点上的SNP。
如本文使用的“增加的”、“增加”等是指与对照组(例如,不包含DNA修饰的野生型植物)相比,实验组(例如,具有本文所述的DNA修饰的植物)中的任何可检测的增加。因此,增加的蛋白质表达包含样品中蛋白质总水平的任何可检测的增加,并且可使用本领域的常规方法来确定,例如,蛋白质印迹法和ELISA。
在某些实施例中,所述基因组基因座具有超过一个(例如,2个、3个、4个、5个、6个、7个、8个、9个、或10个)DNA修饰。例如,基因组基因座的翻译区和调节元件可各自包含靶向DNA修饰。在某些实施例中,植物的超过一个基因组基因座可包含DNA修饰。
可以使用本领域已知的或本文所述的任何基因组修饰技术来完成基因组基因座的DNA修饰。在某些实施例中,通过基因组修饰技术进行靶向DNA修饰,所述基因组修饰技术选自由以下组成的组:多核苷酸指导的内切核酸酶、CRISPR-Cas内切核酸酶、碱基编辑脱氨酶、锌指核酸酶、转录激活子样效应子核酸酶(TALEN)、工程化位点特异性大范围核酸酶、或Argonaute。
在某些实施例中,可以通过在所需改变附近的基因组中的确定位置诱导双链断裂(DSB)或单链断裂来促进基因组修饰。可以使用任何可用的DSB诱导剂诱导DSB,所述诱导剂包括但不限于,TALEN、大范围核酸酶、锌指核酸酶、Cas9-gRNA系统(基于细菌性CRISPR-Cas系统)、指导的cpf1内切核酸酶系统等。在一些实施例中,可以将DSB的引入与多核苷酸修饰模板的引入组合。
本文公开的多核苷酸或重组DNA构建体可用于任何植物物种(包括但不限于单子叶植物和双子叶植物)的转化。另外,本文所述的遗传修饰可用于修饰任何植物物种(包括但不限于单子叶植物和双子叶植物)。
在特定实施例中,本公开的植物是作物植物(例如,玉米、苜蓿、向日葵、芸苔属植物、大豆、棉花、红花、花生、高粱、小麦、粟、烟草等)。在其他实施例中,玉米和大豆植物是最佳的,并且在又其他的实施例中,玉米植物是最佳的。
其他目的植物包括例如提供目的种子的谷物类植物、油料种子植物和豆科植物。目的种子包括例如谷物种子,诸如玉米、小麦、大麦、稻、高粱、黑麦等。油料种子植物包括例如棉花、大豆、红花、向日葵、芸苔属植物、玉蜀黍、苜蓿、棕榈、椰子等。豆科植物包括豆类和豌豆。豆类包括瓜耳豆、槐豆、胡芦巴、大豆、四季豆、豇豆、绿豆、利马豆、蚕豆、小扁豆、鹰嘴豆。
例如,在某些实施例中,提供了玉蜀黍植物,其在其基因组中包含重组DNA构建体,所述重组DNA构建体包含编码多肽的多核苷酸,所述多肽包含与SEQ ID NO:1-10、12-51中的任一个具有至少80%同一性的氨基酸序列。在某些实施例中,所述多肽包含与SEQ IDNO:1-10、12-51中任一个氨基酸序列具有至少80%同一性的氨基酸序列。在某些实施例中,所述多肽包含与SEQ ID NO:1-10、12-51中任一个氨基酸序列具有至少80%同一性的氨基酸序列。
在其他实施例中,提供了玉蜀黍植物,其在基因组基因座处包含遗传修饰,所述基因组基因座编码多肽,所述多肽包含与SEQ ID NO:1-10、12-51中的任一个的氨基酸序列具有至少80%同一性的氨基酸序列。在某些实施例中,所述多肽包含与SEQ ID NO:1-10、12-51中任一个氨基酸序列具有至少80%同一性的氨基酸序列。在某些实施例中,所述多肽包含与SEQ ID NO:1-10、12-51中任一个氨基酸序列具有至少80%同一性的氨基酸序列。
D.堆叠其他目的性状
在一些实施例中,本文公开的多核苷酸被工程化为分子堆叠物。因此,本文公开的各种宿主细胞、植物、植物细胞、植物部分、种子、和/或谷物可进一步包含一种或多种目的性状。在某些实施例中,宿主细胞、植物、植物部分、植物细胞、种子、和/或谷物与目的多核苷酸序列的任何组合堆叠,以产生具有所需性状的组合的植物。如本文所使用,术语“堆叠”是指具有存在于同一目的植物或生物体中的多种性状。例如,“堆叠性状”可包含其中序列在物理上彼此相邻的分子堆叠物。如本文所使用的性状是指源自特定序列或序列组群的表型。在一个实施例中,所述分子堆叠物包含赋予对草甘膦的耐受性的至少一种多核苷酸。赋予对草甘膦的耐受性的多核苷酸是本领域已知的。
在某些实施例中,所述分子堆叠物包含赋予对草甘膦的耐受性的至少一种多核苷酸和赋予对第二除草剂的耐受性的至少一种额外的多核苷酸。
在某些实施例中,具有本发明的多核苷酸序列的植物、植物细胞、种子、和/或谷物可与赋予对以下的耐受性的一个或多个序列堆叠:ALS抑制剂;HPPD抑制剂;2,4-D;其他苯氧基生长素除草剂;芳氧基苯氧基丙酸除草剂;麦草畏;草铵膦除草剂;靶向原卟啉原氧化酶(也称为“原卟啉原氧化酶抑制剂”)的除草剂。
具有本发明的多核苷酸序列的植物、植物细胞、植物部分、种子、和/或谷物也可与至少一个其他性状组合,以产生进一步包含多种所需性状组合的植物。例如,具有本发明的多核苷酸序列的植物、植物细胞、植物部分、种子、和/或谷物可以与编码具有杀有害生物活性和/或杀昆虫活性的多肽的多核苷酸堆叠,或具有本发明的多核苷酸序列的植物、植物细胞、植物部分、种子、和/或谷物可以与植物抗病性基因组合。
这些堆叠的组合可以通过如下任何方法产生,该方法包括但不限于,通过任何常规的方法学进行植物育种、或遗传转化。如果通过遗传转化植物来堆叠序列,则目的多核苷酸序列可以在任意时间并以任意顺序组合。可以用共转化方案将所述性状与转化盒的任何组合所提供的目的多核苷酸一起引入。例如,若引入两个序列,则这两个序列可包含在分开的转化盒(反式)或包含在同一个转化盒(顺式)中。所述序列的表达可以通过相同的启动子或通过不同的启动子驱动。在某些情况下,可能需要引入将抑制目的多核苷酸的表达的转化盒。这可以与其他抑制盒或过度表达盒的任何组合进行组合以在所述植物中产生所需性状组合。进一步应当认识到,可以使用位点特异性重组系统在所需的基因组位置堆叠多核苷酸序列。参见例如,WO99/25821、WO 99/25854、WO 99/25840、WO 99/25855、以及WO99/25853,将其全部通过引用并入本文。
可以使用具有本文公开的本发明的多核苷酸序列的任何植物来制造食品或饲料产品。此类方法包括获得包含多核苷酸序列的植物、外植体、种子、植物细胞、或细胞,并且加工所述植物、外植体、种子、植物细胞、或细胞以生产食品或饲料产品。
II.使用方法
A.在植物中增加产量和/或增加多核苷酸活性的方法
提供了用于增加植物产量、改变植物开花时间、和/或增加植物中的本文公开的一种或多种多核苷酸活性的方法,所述方法包括将重组DNA构建体引入植物、植物细胞、植物部分、种子和/或谷物中,借此使多肽在植物中表达,所述重组DNA构建体包含本文所述的任何本发明的多核苷酸。还提供了用于增加植物产量、改变植物开花时间、和/或增加植物中活性的方法,所述方法包括在植物的基因组基因座处引入遗传修饰,所述基因组基因座编码多肽,所述多肽包含与SEQ ID NO:1-10、12-51中的任一个所列出的氨基酸序列具有至少80%-99%或100%同一性的氨基酸序列。
用于在本发明的方法中使用的植物可以是本文所述的任何植物物种。在某些实施例中,所述植物是谷物类植物、油料种子植物和豆科植物。在某些实施例中,所述植物是谷物类植物,诸如玉蜀黍。
如本文使用的,“产量”是指收获的农业产量/单位土地,并且可包括提及收获时农作物的蒲式耳/英亩,如针对籽粒水分进行了调整(例如,玉蜀黍典型地为15%)。在籽粒收获时测量籽粒水分。确定调整后的籽粒测试重量为重量(磅)/蒲式耳,在收获时针对籽粒水分水平进行了调整。
在某些实施例中,在最佳生长条件下生长的植物中测量产量。如本文使用的,“最佳条件”是指在水分充足或无干旱的条件下生长的植物。在某些实施例中,基于实验中野生型对照植物的产量确定最佳生长条件。如本文使用的,当野生型植物提供至少75%的预测籽粒产量时,植物被认为是在最佳条件下生长。
如本文使用的,“改变开花时间”是指植物开花所需的天数或生长热单位的改变。在某些实施例中,在多肽表达增加后,植物的开花时间延迟。还考虑了在多肽表达降低后,开花时间减少的实施例(即,植物开花所需的更少的天数或生长热单位)。
如本文使用的,与合适的对照相比,光合作用活性的增加是指蛋白质功能活性的任何可检测的增加。功能活性可以是本文公开的一种或多种多肽的任何已知的生物特性,并且包括例如蛋白质复合物的形成增加、生化途径的调节、和/或增加的籽粒产量。
可以使用各种方法来将目的序列引入植物、植物部分、植物细胞、种子、和/或谷物。“引入”旨在意指以这样一种方式将本发明的多核苷酸或所得多肽提供给植物、植物细胞、种子、和/或谷物,使得所述序列得以进入所述植物的细胞内部。本公开的方法不取决于将序列引入植物、植物细胞、种子、和/或谷物的具体方法,只要所述多核苷酸或多肽进入植物的至少一个细胞的内部即可。
“稳定转化”旨在表示被引入植物中的多核苷酸整合到目的植物的基因组中,并且能够被其子代遗传。“瞬时转化”旨在表示将多核苷酸引入目的植物中并且不整合到所述植物或生物体的基因组中,或者将多肽引入植物或生物体中。
转化方案连同用于将多肽或多核苷酸序列引入植物中的方案可以取决于被靶向转化的植物或植物细胞的类型(即,单子叶植物或双子叶植物)而变化。
在具体实施例中,可以使用各种瞬时转化方法将本文公开的多核苷酸序列提供给植物。这类瞬时转化法包括但不限于将编码的多肽直接引入植物中。此类方法包括例如显微注射或粒子轰击。参见,例如,Crossway等人,(1986)Mol Gen.Genet.[分子遗传学和普通遗传学]202:179-185;Nomura等人,(1986)Plant Sci.[植物科学]44:53-58;Hepler等人,(1994)Proc.Natl.Acad.Sci.[美国科学院院报]91:2176-2180和Hush等人,(1994)TheJournal of Cell Science[细胞科学杂志]107:775-784,以上所有文献都通过引用并入本文。
在其他实施例中,可以通过使植物与病毒或病毒核酸接触将本文公开的本发明的目的多核苷酸引入植物中。通常,这类方法涉及将本公开的核苷酸构建体并入DNA或RNA分子内。应当认识到,本发明的多核苷酸序列最初可以被合成为病毒多蛋白的一部分,然后可以通过体内或体外蛋白水解而被加工,以产生所需的重组蛋白。此外,应当认识到,本文公开的启动子也涵盖用于通过病毒RNA聚合酶进行转录的启动子。涉及病毒DNA或RNA分子、用于将多核苷酸引入植物中并表达其中所编码的蛋白质的方法是本领域已知的。参见,例如,美国专利号5,889,191、5,889,190、5,866,785、5,589,367、5,316,931,以及Porta等人(1996)Molecular Biotechnology[分子生物技术]5:209-221;通过引用并入本文。
可以使用各种方法来将编码和多肽的基因组基因座上的遗传修饰引入植物、植物部分、植物细胞、种子、和/或谷物。在某些实施例中,通过基因组修饰技术进行靶向DNA修饰,所述基因组修饰技术选自由以下组成的组:多核苷酸指导的内切核酸酶、CRISPR-Cas内切核酸酶、碱基编辑脱氨酶、锌指核酸酶、转录激活子样效应子核酸酶(TALEN)、工程化位点特异性大范围核酸酶、或Argonaute。
在一些实施例中,可以通过在所需改变附近的基因组中的确定位置诱导双链断裂(DSB)或单链断裂来促进基因组修饰。可以使用任何可用的DSB诱导剂诱导DSB,所述诱导剂包括但不限于,TALEN、大范围核酸酶、锌指核酸酶、Cas9-gRNA系统(基于细菌性CRISPR-Cas系统)、指导的cpf1内切核酸酶系统等。在一些实施例中,可以将DSB的引入与多核苷酸修饰模板的引入组合。
可以通过本领域已知的任何方法将多核苷酸修饰模板引入细胞中,所述方法例如但不限于瞬时引入方法、转染、电穿孔、显微注射、粒子介导的递送、局部施用、晶须介导的递送、经由细胞穿透肽的递送或介孔二氧化硅纳米粒子(MSN)介导的直接递送。
可以将多核苷酸修饰模板作为单链多核苷酸分子、双链多核苷酸分子或作为环状DNA(载体DNA)的一部分引入细胞中。所述多核苷酸修饰模板还可以与指导RNA和/或Cas内切核酸酶进行系链。系链的DNA可以允许共定位靶标和模板DNA,可用于基因组编辑和靶向的基因组调控,并且还可以用于靶向有丝分裂后期细胞,在这些细胞中内源性HR机制的功能预计会大大降低(Mali等人2013Nature Methods[自然方法]第10卷:957-963)。所述多核苷酸修饰模板可以瞬时地存在于细胞中,或可以经由病毒复制子引入。
“经修饰的核苷酸”或“经编辑的核苷酸”是指当与其非修饰的核苷酸序列相比时,包含至少一个改变的目的核苷酸序列。此类“改变”包括,例如:(i)至少一个核苷酸的替代、(ii)至少一个核苷酸的缺失、(iii)至少一个核苷酸的插入、或(iv)(i)-(iii)的任何组合。
术语“多核苷酸修饰模板”包括,当与待编辑的核苷酸序列相比时,包含至少一个核苷酸修饰的多核苷酸。核苷酸修饰可以是至少一个核苷酸取代、添加或缺失。任选地,多核苷酸修饰模板可以进一步包含位于至少一个核苷酸修饰侧翼的同源核苷酸序列,其中侧翼同源核苷酸序列为待编辑的希望的核苷酸序列提供了充足同源性。
编辑组合有DSB和修饰模板的基因组序列的过程通常包括:向宿主细胞提供DSB诱导剂或编码DSB诱导剂的核酸(识别染色体序列中的靶序列并且能够诱导基因组序列中的DSB),和与待编辑的核苷酸序列相比时包含至少一个核苷酸变化的至少一个多核苷酸修饰模板。多核苷酸修饰模板还可以包含侧翼于所述至少一个核苷酸变化的核苷酸序列,其中侧翼序列与侧翼于DSB的染色体区域基本同源。
内切核酸酶可以通过本领域已知的任何方法提供给细胞,所述方法例如但不限于瞬时引入方法、转染、显微注射、和/或局部施用、或间接经由重组构建体。内切核酸酶可以作为蛋白质或作为指导多核苷酸复合物直接提供给细胞或经由重组构建体间接提供。使用本领域已知的任何方法,可以瞬时地将内切核酸酶引入细胞中,或可以将内切核酸酶并入宿主细胞的基因组中。在CRISPR-Cas系统的情况下,如2016年5月12日公开的WO2016073433中所述的,可以用细胞穿透肽(CPP)促进内切核酸酶和/或指导多核苷酸摄入进细胞。
除通过双链断裂技术进行修饰之外,无此类双链断裂的一种或多种碱基的修饰使用碱基编辑技术实现,参见例如,Gaudelli等人,(2017)Programmable base editing ofA*T to G*C in genomic DNA without DNA cleavage.[在无DNA切割时基因组DNA中A*T至G*C的可编程碱基编辑]Nature[自然]551(7681):464-471;Komor等人,(2016)Programmable editing of a target base in genomic DNA without double-strandedDNA cleavage[在无双链DNA切割时基因组DNA中靶碱基的可编程编辑],Nature[自然]533(7603):420-4。
这些融合物含有dCas9或Cas9切口酶和合适的脱氨酶,并且它们例如可以将胞嘧啶转化为尿嘧啶而不引起靶DNA的双链断裂。然后尿嘧啶通过DNA复制或修复被转化为胸腺嘧啶。具有目的灵活性和特异性的改善的碱基编辑器被用于编辑内源基因座以产生靶标变异并且提高籽粒产量。类似地,腺嘌呤碱基编辑器能使腺嘌呤向肌苷变化,然后通过修复或复制将其转化为鸟嘌呤。因此,使用适当的位点特异性碱基编辑器在一个多个位置上进行靶向性基因改变,即,C·G至T·A转化和A·T至G·C转化。
在一个实施例中,碱基编辑是基因组编辑方法,其可在靶基因组基因座上将一个碱基对直接转化为另一个碱基对,而无需双链DNA断裂(DSB)、同源定向修复(HDR)过程、或外部供体DNA模板。在一个实施例中,碱基编辑器包括(i)催化受损的CRISPR-Cas9突变体,其是突变的,这样使得其核酸酶结构域中的一个无法产生DSB;(ii)单链特异性胞苷/腺嘌呤脱氨酶,其可在通过Cas9产生的单链DNA气泡中的适当核苷酸窗口内将C转化成U或将A转化成G;(iii)尿嘧啶糖基化酶抑制剂(UGI),其阻止尿嘧啶切除以及降低碱基编辑效率和产物纯度的下游过程;以及(iv)切口酶活性以切割未编辑的DNA链,然后细胞DNA修复过程以替代含G的DNA链。
如本文使用的,“基因组区域”是存在于靶位点任一例上的细胞的基因组中的染色体的区段,或者可替代地,还包含靶位点的一部分。基因组区域可以包含至少5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60、5-65、5-70、5-75、5-80、5-85、5-90、5-95、5-100、5-200、5-300、5-400、5-500、5-600、5-700、5-800、5-900、5-1000、5-1100、5-1200、5-1300、5-1400、5-1500、5-1600、5-1700、5-1800、5-1900、5-2000、5-2100、5-2200、5-2300、5-2400、5-2500、5-2600、5-2700、5-2800。5-2900、5-3000、5-3100或更多个碱基,这样使得基因组区域具有足够的同源性以与相应的同源区域进行同源重组。
TAL效应子核酸酶(TALEN)是一类序列特异性核酸酶,其可以被用于在植物或其他生物体的基因组中特异性靶序列处造成双链断裂。(Miller等人(2011)NatureBiotechnology[自然生物技术]29:143-148)。
内切核酸酶是在多核苷酸链内切割磷酸二酯键的酶。内切核酸酶包括限制性内切核酸酶,其在特异性位点处切割DNA而不损坏碱基;并且包括大范围核酸酶,也称为归巢内切核酸酶(HE酶),其相似于限制性内切核酸酶,在特异性识别位点处结合并且切割,然而对于大范围核酸酶,识别位点典型地更长,约18bp或更长(于2012年3月22日提交的专利申请PCT/US 12/30061)。基于保守序列基序,大范围核酸酶已被分为四个家族。这些基序参与金属离子的配位和磷酸二酯键的水解。HE酶的显著之处在于它们的长识别位点,并且还在于耐受其DNA底物中的一些序列多态性。对于大范围核酸酶的命名约定相似于对其他限制性内切核酸酶的约定。大范围核酸酶还分别表征为针对由独立的ORF、内含子、和内含肽编码的酶的前缀F-、I-、或PI-。在重组过程中的一个步骤涉及在识别位点处或在所述识别位点附近的多核苷酸切割。可以将切割活性用于产生双链断裂。对于位点特异性重组酶和它们的识别位点的综述,参见,Sauer(1994)Curr Op Biotechnol[生物技术新见]5:521-7;以及Sadowski(1993)FASEB[美国实验生物学学会联合会杂志]7:760-7。在一些实例中,重组酶来自整合酶(Integrase)或解离酶(Resolvase)家族。
锌指核酸酶(ZFN)是由锌指DNA结合结构域和双链-断裂-诱导剂结构域组成的工程化双链断裂诱导剂。识别位点特异性由锌指结构域赋予,所述锌指结构域典型地包含两个、三个、或四个锌指,例如具有C2H2结构,然而其他锌指结构是已知的并且已经被工程化。锌指结构域适于设计特异性结合所选择的多核苷酸识别序列的多肽。ZFN包括连接至非特异性内切核酸酶结构域(例如来自IIs型内切核酸酶例如FokI的核酸酶结构域)的工程化DNA结合锌指结构域。额外的功能性可以融合到锌指结合结构域中,所述额外的功能性包括转录激活子结构域、转录阻遏物结构域、和甲基化酶。在一些实例中,核酸酶结构域的二聚化是切割活性所需的。每个锌指在靶DNA中识别三个连续的碱基对。例如,3指结构域识别9个连续核苷酸的序列,由于所述核酸酶的二聚化需要,因此两组锌指三联体用于结合18个核苷酸的识别序列。
例如在2015年3月19日公开的美国专利申请US 2015-0082478A1、2015年2月26日公开的WO 2015/026886 A1、2016年1月14日公开的WO 2016007347、以及2016年2月18日公开的WO201625131(将其全部通过引用并入本文)中已经描述了使用DSB诱导剂(例如Cas9-gRNA复合物)进行的基因组编辑。
指导多核苷酸/Cas内切核酸酶复合物可以切割DNA靶序列的一条或两条链。可以切割DNA靶序列的两条链的指导多核苷酸/Cas内切核酸酶复合物典型地包含具有处于功能状态的所有其内切核酸酶结构域的Cas蛋白(例如野生型内切核酸酶结构域或其变体在每个内切核酸酶结构域中保留一些或全部活性)。适用于本文使用的Cas9切口酶的非限制性实例公开于美国专利申请公开号2014/0189896中,将其通过引用并入本文。
其他Cas内切核酸酶系统已经在2016年5月12日提交的PCT专利申请PCT/US 16/32073和2016年5月12日提交的PCT/US16/32028中描述,将这两个申请通过引用并入本文中。
术语“靶位点”、“靶序列”、“靶位点序列”、“靶DNA”、“靶基因座”、“基因组靶位点”、“基因组靶序列”、“基因组靶基因座”和“前间区”在本文中可互换地使用,并且意指多核苷酸序列,例如,但不限于,在细胞的染色体、附加体,或基因组中的任何其他DNA分子(包括染色体DNA、叶绿体DNA、线粒体DNA、质粒DNA)上的核苷酸序列,在所述序列处指导多核苷酸/Cas内切核酸酶复合物可以进行识别、结合并任选地产生切口或进行切割。靶位点可以是细胞的基因组中的内源位点,或者可替代地,靶位点对于该细胞可以是异源的并且从而不是天然存在于细胞的基因组中,或者与在自然界发生的位置相比,可以在异质基因组位置中找到靶位点。如本文使用的,术语“内源性靶序列”和“天然靶序列”在本文中可互换使用,是指对细胞基因组来说是内源的或天然的、并且位于细胞的基因组中该靶序列的内源或天然位置处的靶序列。细胞包括但不限于人、非人、动物、细菌、真菌、昆虫、酵母、非常规酵母和植物细胞,以及通过本文所述的方法产生的植物和种子。“人工靶位点”或“人工靶序列”在本文中可互换使用,并且是指已经引入细胞的基因组中的靶序列。这种人工靶序列可以在序列上与细胞的基因组中的内源或天然靶序列相同,但是位于细胞的基因组中的不同位置(即,非内源的或非天然的位置)处。
“改变的靶位点”、“改变的靶序列”、“修饰的靶位点”、“修饰的靶序列”在本文中可互换使用,并且是指如本文公开的靶序列,当与非改变的靶序列相比时,所述靶序列包含至少一个改变。此类“改变”包括,例如:(i)至少一个核苷酸的替代、(ii)至少一个核苷酸的缺失、(iii)至少一个核苷酸的插入、或(iv)(i)-(iii)的任何组合。
用于“修饰靶位点”和“改变靶位点”的方法在本文中可互换使用,并且是指用于产生改变的靶位点的方法。
靶DNA序列(靶位点)的长度可以变化,并且包括例如为至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个核苷酸长度的靶位点。还有可能靶位点可以是回文的,即,一条链上的序列与在互补链上以相反方向的读取相同。切口/切割位点可以在靶序列内,或者切口/切割位点可以在靶序列之外。在另一种变异中,切割可以发生在彼此正好相对的核苷酸位置处,以产生平端切割,或者在其他情况下,切口可以交错以产生单链突出端,也称为“粘性端”,其可以是5′突出端抑或3′突出端。还可以使用基因组靶位点的活性变体。此类活性变体可以包含与给定靶位点至少65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性,其中所述活性变体保留生物活性,因此能够被Cas内切核酸酶识别和切割。测量由内切核酸酶引起的靶位点的单链或双链断裂的测定是本领域已知的,并且通常测量试剂在含有识别位点的DNA底物上的总体活性和特异性。
本文中的“前间隔子邻近基序”(PAM)指与由本文所述的指导多核苷酸/Cas内切核酸酶系统识别的(靶向的)靶序列(前间隔子序列)邻近的短核苷酸序列。如果靶DNA序列不在PAM序列后面,则Cas内切核酸酶可能无法成功识别所述靶DNA序列。本文中的PAM的序列和长度可以取决于所使用的Cas蛋白或Cas蛋白复合物而不同。所述PAM序列可以是任何长度,但典型地是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸长度。
术语“靶向”、“基因靶向”和“DNA靶向”在本文中可互换地使用。本文中的DNA靶向可能是在特异性的DNA序列(例如细胞的染色体或质粒)中特异性引入敲除、编辑、或敲入。通常,本文中可以通过在具有与合适的多核苷酸组分缔合的内切核酸酶的细胞中的特异性DNA序列处切割一条或两条链来进行DNA靶向。这种DNA切割,如果是双链断裂(DSB),可以促进NHEJ或HDR过程,这可能导致靶位点处的修饰。
本文的靶向方法能以例如在该方法中靶向两个或更多个DNA靶位点的这样的方式进行。这种方法可以任选地被表征为多重方法。在某些实施例中,可以同时靶向两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个靶位点。多路复用方法典型地通过本文的靶向方法进行,其中提供了多个不同的RNA组分,每一个被设计成将多核苷酸/Cas内切核酸酶复合物引导到唯一的DNA靶位点。
术语“敲除”、“基因敲除”和“遗传敲除”在本文中可互换使用。敲除表示已经通过用Cas蛋白进行靶向使得细胞的DNA序列部分或完全无效;例如,这种DNA序列在敲除之前可能已编码氨基酸序列,或可能已具有调节功能(例如启动子)。可以通过插入缺失(通过NHEJ在靶DNA序列中插入或缺失核苷酸碱基),或通过特异性去除在靶向位点处或其附近处降低或完全破坏序列功能的序列来产生敲除。
指导多核苷酸/Cas内切核酸酶系统可以与共同递送的多核苷酸修饰模板组合使用以允许编辑(修饰)目的基因组核苷酸序列。(还参见于2015年3月19日公开的美国专利申请US 2015-0082478 A1和2015年2月26日公开的WO 2015/026886 A1,两者均通过引用以其全文特此并入)。
术语“敲入”、“基因敲入”、“基因插入”和“遗传敲入”在本文中可互换使用。敲入代表通过用Cas蛋白靶向在细胞中的特异性DNA序列处进行的DNA序列的替代或插入(通过HR,其中还使用合适的供体DNA多核苷酸)。敲入的实例是异源氨基酸编码序列在基因的编码区中的特异性插入,或转录调节元件在遗传基因座中的特异性插入。
以下是本发明一些方面的具体实施例的实例。提供这些实例仅出于说明目的,而无意以任何方式限制本发明所要求的范围。
实例1
OsMADS18的表达增加和扩展提高了玉蜀黍籽粒产量
本实例表明,在玉蜀黍中,在ZmGOS2启动子下稻MADS转录因子OsMADS18(SEQ IDNO:1)的表达增加和扩展增加了在田间条件下的籽粒产量。在玉蜀黍中,OsMADS18 DNA与Zm-Gos2启动子的重组表达提高了正常生长条件下田间产量效力试验中的籽粒产量。如图1所示,当与不具有重组OsMADS18的对照相比时,九个独立转基因事件在跨越8个地点的大田产量测试中具有增加的产量(p<0.1)。所述事件的产量高于非转基因对照约5.7蒲式耳/英亩至约10.4蒲式耳/英亩。
如表明的,Os-MADS18的九个转基因玉蜀黍事件表明在多地点产量测试中增加的产量(图1)。绘制的值是转基因事件相对于对照的蒲式耳/英亩产量增加。*表示P<0.1。基础产量(对照产量)是184蒲式耳/英亩。数据用跨越8个地点的BLUP分析显示。
因此,本实例表明,当与缺乏OsMADS18的此类增加和扩展的表达的对照玉蜀黍植物相比,OsMADS18的表达水平在中等组成型启动子下增加时,OsMADS18(玉蜀黍MADS盒蛋白ZMM28的直向同源物并且表现出与玉蜀黍MADS盒直向同源物的全长具有约76%的氨基酸同一性)在玉蜀黍的田间生长条件下令人惊讶地表现出增加的籽粒产量。
实例2
SbMADS28的表达增加和扩展提高了玉蜀黍籽粒产量
在玉蜀黍中,Sb-MADS28基因组DNA与Zm-Gos2启动子的转基因表达提高了田间产量效力试验中的籽粒产量。如图2所述,四个转基因事件表明阳性产量效力。其中,在跨越两个地点的低氮产量测试下,一个事件显示显著的产量增加(4蒲式耳/英亩,p<0.1),并且在正常氮产量测试条件下,三个事件显示显著的产量增加。在正常氮条件下,所述3个事件分别比非转基因对照多产生6蒲式耳/英亩、7蒲式耳/英亩、和8蒲式耳/英亩(p<0.1)。
SB-MADS28的四个转基因玉蜀黍事件表明在多地点产量测试中增加的产量。绘制的值是转基因事件相对于对照的蒲式耳/英亩产量增加。*表示P<0.1。基础产量(对照产量)是在低N条件下的142蒲式耳/英亩和在正常氮条件下的172蒲式耳/英亩。数据用BLUP分析显示。
因此,本实例表明,当与不具有SbMADS28蛋白的此类增加的表达的对照玉蜀黍植物相比,SbMADS28的表达水平在中等组成型启动子下增加时,SbMADS28(玉蜀黍MADS盒蛋白ZMM28的直系同源物并且表现出与全长玉蜀黍蛋白具有约94%的氨基酸同一性)在玉蜀黍的田间生长条件下令人惊讶地表现出增加的籽粒产量。
实例3
分析多种MADS盒蛋白的表达增加对玉蜀黍产量的影响
该实例证实了这一分析:多种单子叶植物MADS盒蛋白的表达增加对玉蜀黍产量的影响。与实例1和实例2中所述的分析相似,使用其他单子叶植物直向同源物评估不同启动子对玉蜀黍产量的影响。产量结果列于表2中。所述田间测试结果基于一年的测试。
表2:单子叶作物MADS盒多肽的分析
如表2所示,评估了作为ZmM28的直向同源物的几种单子叶作物MADS盒蛋白,并且示出了基于一年的田间测试的、显示阳性/中性/阴性产量信号的那些线索。不同的启动子或调节元件如表达强度(量级)或特异性(例如,组织偏好性)可被进一步评估和产量增加的目的,并且在各种应激环境(诸如干旱和/或低氮生长条件)下测试。评估了来自草香碗蕨(Dennstaedtia punctilobula)、三齿蒿(Artemisia tridentate)、金边吊兰(Chlorophytum comosum“Variegatum”)、加利福尼亚花菱草(Eschscholzia california)、宝盖草(Lamium amplexicaule)、莫愁菊(Delosperma nubigenum)、皱叶椒草(Peperomiacaperata)、海韭菜(Triglochin maritima)的与ZmM28具有某些结构相似性的遥远直系同源物或蛋白,并且当在中等组成型启动子下与有限的产量测试中的野生型对照相比时,所有玉蜀黍产量信号是阴性或中性的。
除非另有指定,否则权利要求书和说明书中使用的术语如下文阐述定义。必须注意,除非上下文另外清楚地指明,否则如本说明书及所附权利要求书中所用,单数形式“一个/一种(a/an)”和“所述(the)”包括复数指示物。
本说明书中的所有出版物和专利申请都指示了本发明所属领域的普通技术人员的水平。将所有出版物和专利申请通过引用并入本文,其程度就像明确且单独指出通过引用每个单独出版物或专利申请一样。
除非另外定义,本文所使用的全部技术术语和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同意义。除非另外提及,否则本文采用或考虑的技术是本领域普通技术人员熟知的标准方法。材料、方法和实例仅为说明性的并且不是限制性的。
借助前面的描述和随附的附图中给出的教导,这些发明所属领域的技术人员将会想到本发明的许多修改及其他实施例。因此,应当理解,本发明不限于所公开的特定实施例,并且修改和其他实施例旨在包括在所附权利要求的范围内。尽管本文中采用了具体的术语,但这些术语仅在一般性和描述性意义上使用而并非用于限制目的。
单位、前缀和符号可以按它们SI接受的形式来表示。除非另外指明,否则核酸从左向右以5’至3’方向书写;氨基酸序列都从左向右以氨基到羧基方向书写。数值范围包括限定所述范围的数值在内。本文氨基酸可以通过它们普遍已知的三字母符号或通过IUPAC-IUB生物化学术语委员会推荐的单字母符号来表示。同样,核酸可以通过它们普遍接受的单个字母代码来表示。
Claims (58)
1.一种编码多肽的多核苷酸,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少95%同一性的氨基酸序列。
2.如权利要求1或2所述的多核苷酸,其中所述多核苷酸编码多肽,所述多肽包含与选自由SEQ ID NO:1-10和12组成的组的氨基酸序列具有至少99%同一性的氨基酸序列。
3.一种重组DNA构建体,其包含可操作地连接到调节元件的如权利要求1-2中任一项所述的多核苷酸。
4.如权利要求4所述的重组DNA构建体,其中所述调节元件是异源启动子。
5.一种植物细胞,所述植物细胞包含如权利要求1-2中任一项所述的多核苷酸或如权利要求4所述的重组DNA构建体。
6.如权利要求5所述的植物细胞,其中所述植物细胞来自单子叶植物。
7.如权利要求6所述的植物细胞,其中所述单子叶植物是玉蜀黍。
8.一种植物细胞,所述植物细胞在基因组基因座处包含靶向遗传修饰,所述基因组基因座编码多肽,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少95%同一性的氨基酸序列,其中所述靶向遗传修饰调控所编码的多肽的表达水平和/或活性。
9.如权利要求9所述的植物细胞,其中所述靶向修饰导致所述多核苷酸的表达水平增加。
10.如权利要求8或9所述的植物细胞,其中所述靶向遗传修饰选自由以下组成的组:插入、缺失、单核苷酸多态性(SNP)、和多核苷酸修饰。
11.如权利要求8或9所述的植物细胞,其中所述靶向遗传修饰存在于编码所述多肽的基因组基因座的(a)编码区;(b)非编码区;(c)调节序列;(d)非翻译区;或(e)(a)-(d)的任何组合。
12.如权利要求9-11中任一项所述的植物细胞,其中所述植物细胞来自单子叶植物。
13.如权利要求12所述的植物细胞,其中所述单子叶植物是玉蜀黍。
14.一种植物,所述植物在其基因组中包含如权利要求1-2中任一项所述的多核苷酸或如权利要求3所述的重组DNA构建体。
15.如权利要求14所述的植物,其中所述植物是单子叶植物。
16.如权利要求15所述的植物,其中所述单子叶植物是玉蜀黍。
17.一种玉蜀黍、水稻、或高粱植物,所述植物在基因组基因座处包含靶向遗传修饰,所述基因组基因座编码多肽,所述多肽包含与选自由SEQ ID NO:1-10和12组成的组的氨基酸序列具有至少95%同一性的氨基酸序列,其中与不包含遗传修饰的对照植物相比,所述靶向遗传修饰调控所编码的多肽的表达水平和/或活性。
18.如权利要求17所述的玉蜀黍、水稻、或高粱植物,其中所述靶向修饰导致编码所述多肽的多核苷酸的表达水平增加。
19.如权利要求17所述的玉蜀黍、水稻、或高粱植物,其中所述靶向遗传修饰选自由以下组成的组:插入、缺失、单核苷酸多态性(SNP)、和多核苷酸修饰。
20.如权利要求18或19所述的玉蜀黍、水稻、或高粱植物,其中所述靶向遗传修饰存在于编码所述多肽的基因组基因座的(a)编码区;(b)非编码区;(c)调节序列;(d)非翻译区;或(e)(a)-(d)的任何组合。
21.如权利要求18-20中任一项所述的植物,其中当与对照植物相比时,所述植物表现出增加的多核苷酸表达,所述多核苷酸编码与选自由SEQ ID NO:1或2组成的组的氨基酸序列具有至少95%同一性的多肽。
22.如权利要求21所述的植物,其中所述植物表现出增加的籽粒产量。
23.一种种子,所述种子在其基因组中包含如权利要求1-2中任一项所述的多核苷酸或如权利要求4所述的重组DNA构建体。
24.如权利要求23所述的种子,其中所述种子来自单子叶植物。
25.如权利要求24所述的种子,其中所述单子叶植物是玉蜀黍。
26.一种玉蜀黍种子,所述玉蜀黍种子在基因组基因座处包含靶向遗传修饰,所述基因组基因座编码多肽,所述多肽包含与选自由SEQ ID NO:3-5、10和12组成的组的氨基酸序列具有至少95%同一性的氨基酸序列,其中所述靶向遗传修饰调控所编码的多肽的表达水平和/或活性。
27.如权利要求27所述的玉蜀黍种子,其中所述靶向修饰导致多核苷酸的表达水平增加,所述多核苷酸编码包含与SEQ ID NO:10具有至少95%同一性的氨基酸序列的多肽。
28.如权利要求26或27所述的玉蜀黍种子,其中所述靶向遗传修饰选自由以下组成的组:插入、缺失、单核苷酸多态性(SNP)、和多核苷酸修饰。
29.如权利要求26或27所述的玉蜀黍种子,其中所述靶向遗传修饰存在于编码所述多肽的基因组基因座的(a)编码区;(b)非编码区;(c)调节序列;(d)非翻译区;或(e)(a)-(d)的任何组合。
30.如权利要求27-30中任一项所述的玉蜀黍种子,其中所述种子进一步包含编码除草剂耐受性和/或抗昆虫性的多肽。
31.如权利要求30所述的玉蜀黍种子,其中当与对照植物相比时,所述植物表现出编码SEQ ID NO:10的多肽的多核苷酸的表达增加。
32.一种用于增加植物中籽粒或种子或生物量产量的方法,所述方法包括:
a.在可再生植物细胞中表达重组DNA构建体,所述重组DNA构建体包含可操作地连接到编码多肽的多核苷酸的调节元件,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少95%同一性的氨基酸序列;以及
b.产生所述植物,其中所述植物在其基因组中包含所述重组DNA构建体。
33.如权利要求32所述的方法,其中所述调节元件是异源启动子。
34.如权利要求32所述的方法,其中所述多肽与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少98%同一性。
35.如权利要求32所述的方法,其中所述多核苷酸编码多肽,所述多肽包含与选自由SEQ ID NO:1-10和12组成的组的氨基酸序列具有至少98%同一性的氨基酸序列。
36.如权利要求32-35中任一项所述的方法,其中所述植物细胞来自单子叶植物。
37.如权利要求36所述的方法,其中所述单子叶植物是玉蜀黍。
38.一种用于增加植物产量的方法,所述方法包括:
a.在可再生植物细胞中引入在基因组基因座处的靶向遗传修饰,所述基因组基因座编码多肽,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少95%同一性的氨基酸序列;以及
b.产生所述植物,其中当与不包含所述遗传修饰的对照植物相比时,所编码的多肽的水平和/或活性在所述植物中被调控。
39.如权利要求38所述的方法,其中当与对照植物相比时,所述靶向修饰导致编码所述多肽的多核苷酸的表达增加。
40.如权利要求38所述的方法,其中所述多核苷酸编码多肽,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少98%同一性的氨基酸序列。
41.如权利要求38所述的方法,其中所述靶向遗传修饰使用基因组修饰技术引入,所述基因组修饰技术选自由以下组成的组:多核苷酸指导的内切核酸酶、CRISPR-Cas内切核酸酶、碱基编辑脱氨酶、锌指核酸酶、转录激活子样效应子核酸酶(TALEN)、工程化位点特异性大范围核酸酶、或Argonaute。
42.如权利要求38所述的方法,其中所述靶向遗传修饰存在于编码所述多肽的基因组基因座的(a)编码区;(b)非编码区;(c)调节序列;(d)非翻译区;或(e)(a)-(d)的任何组合。
43.如权利要求39-43中任一项所述的方法,其中所述植物细胞来自单子叶植物。
44.如权利要求44所述的方法,其中所述单子叶植物是玉蜀黍。
45.一种用于增加植物中光合作用活性的方法,所述方法包括:
a.在可再生植物细胞中表达重组DNA构建体,所述重组DNA构建体包含可操作地连接到编码多肽的多核苷酸的调节元件,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少95%同一性的氨基酸序列;以及
b.产生所述植物,其中所述植物在其基因组中包含所述重组DNA构建体。
46.如权利要求45所述的方法,其中所述调节元件是异源启动子。
47.如权利要求45所述的方法,其中当与对照植物相比时,其中所述植物表现出编码所述多肽的多核苷酸的表达增加。
48.如权利要求45或47所述的方法,其中所述多核苷酸编码多肽,所述多肽包含与选自由SEQ ID NO:1-10和12组成的组的氨基酸序列具有至少98%同一性的氨基酸序列。
49.如权利要求47-48中任一项所述的方法,其中所述植物细胞来自单子叶植物。
50.如权利要求49所述的方法,其中所述单子叶植物是玉蜀黍。
51.一种用于增加植物中光合作用活性的方法,所述方法包括:
a.在可再生植物细胞中引入在基因组基因座处的靶向遗传修饰,所述基因组基因座编码多肽,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少90%同一性的氨基酸序列;以及
b.产生所述植物,其中所编码的多肽的水平和/或活性在所述植物中增加。
52.如权利要求51所述的方法,其中所述多核苷酸编码多肽,所述多肽包含与选自由SEQ ID NO:1-10、12-51组成的组的氨基酸序列具有至少95%同一性的氨基酸序列。
53.如权利要求51所述的方法,其中所述靶向遗传修饰使用基因组修饰技术引入,所述基因组修饰技术选自由以下组成的组:多核苷酸指导的内切核酸酶、CRISPR-Cas内切核酸酶、碱基编辑脱氨酶、锌指核酸酶、转录激活子样效应子核酸酶(TALEN)、工程化位点特异性大范围核酸酶、或Argonaute。
54.如权利要求51所述的方法,其中所述靶向遗传修饰存在于编码所述多肽的基因组基因座的(a)编码区;(b)非编码区;(c)调节序列;(d)非翻译区;或(e)(a)-(d)的任何组合。
55.如权利要求51-54中任一项所述的方法,其中所述植物细胞来自单子叶植物。
56.如权利要求55所述的方法,其中所述单子叶植物是玉蜀黍。
57.如权利要求32所述的方法,其中所述产量是籽粒产量。
58.如权利要求38所述的方法,其中所述产量是籽粒产量。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862659579P | 2018-04-18 | 2018-04-18 | |
US62/659579 | 2018-04-18 | ||
US201862741529P | 2018-10-04 | 2018-10-04 | |
US62/741529 | 2018-10-04 | ||
US201862783309P | 2018-12-21 | 2018-12-21 | |
US62/783309 | 2018-12-21 | ||
PCT/US2019/027782 WO2019204373A1 (en) | 2018-04-18 | 2019-04-17 | Mads box proteins and improving agronomic characteristics in plants |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111989403A true CN111989403A (zh) | 2020-11-24 |
Family
ID=73442045
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980026424.6A Pending CN111989403A (zh) | 2018-04-18 | 2019-04-17 | Mads盒蛋白以及在植物中改善农艺特征 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20210155951A1 (zh) |
CN (1) | CN111989403A (zh) |
BR (1) | BR112020021399A2 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114835788A (zh) * | 2022-05-11 | 2022-08-02 | 西南大学 | 蜡梅CpFUL-like基因及其编码的蛋白与应用 |
CN116640199A (zh) * | 2023-06-12 | 2023-08-25 | 西南大学 | 促进枇杷开花和结果时间提前的EjFUL基因及其编码蛋白与应用 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070270578A1 (en) * | 2004-11-25 | 2007-11-22 | Cropdesign N.V. | Plants Having Increased Yield and a Method for Making the Same |
CN101629184A (zh) * | 2009-08-19 | 2010-01-20 | 中国科学院植物研究所 | 水稻e类基因在培育早花和矮化转基因植物中的应用 |
US20100175146A1 (en) * | 2007-06-06 | 2010-07-08 | Cropdesign N.V. | Yield enhancement in plants by modulation of maize mads box transcription factor zmm28 |
CN107287208A (zh) * | 2016-03-31 | 2017-10-24 | 未名生物农业集团有限公司 | 花期调控基因和相关载体及其应用 |
-
2019
- 2019-04-17 US US17/047,518 patent/US20210155951A1/en not_active Abandoned
- 2019-04-17 BR BR112020021399-3A patent/BR112020021399A2/pt unknown
- 2019-04-17 CN CN201980026424.6A patent/CN111989403A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070270578A1 (en) * | 2004-11-25 | 2007-11-22 | Cropdesign N.V. | Plants Having Increased Yield and a Method for Making the Same |
US20100175146A1 (en) * | 2007-06-06 | 2010-07-08 | Cropdesign N.V. | Yield enhancement in plants by modulation of maize mads box transcription factor zmm28 |
CN101629184A (zh) * | 2009-08-19 | 2010-01-20 | 中国科学院植物研究所 | 水稻e类基因在培育早花和矮化转基因植物中的应用 |
CN107287208A (zh) * | 2016-03-31 | 2017-10-24 | 未名生物农业集团有限公司 | 花期调控基因和相关载体及其应用 |
Non-Patent Citations (1)
Title |
---|
佚名: "XM_002460944.2", 《GENBANK》, pages 1 - 3 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114835788A (zh) * | 2022-05-11 | 2022-08-02 | 西南大学 | 蜡梅CpFUL-like基因及其编码的蛋白与应用 |
CN116640199A (zh) * | 2023-06-12 | 2023-08-25 | 西南大学 | 促进枇杷开花和结果时间提前的EjFUL基因及其编码蛋白与应用 |
Also Published As
Publication number | Publication date |
---|---|
BR112020021399A2 (pt) | 2021-01-19 |
US20210155951A1 (en) | 2021-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240110197A1 (en) | Expression modulating elements and use thereof | |
WO2019204373A1 (en) | Mads box proteins and improving agronomic characteristics in plants | |
WO2019204266A1 (en) | Interactors and targets for improving plant agronomic characteristics | |
US20220119827A1 (en) | Genome editing to increase seed protein content | |
US20200123562A1 (en) | Compositions and methods for improving yield in plants | |
US20210403933A1 (en) | Soybean gene and use for modifying seed composition | |
CN111989403A (zh) | Mads盒蛋白以及在植物中改善农艺特征 | |
WO2020023258A1 (en) | Methods and compositions to increase yield through modifications of fea3 genomic locus and associated ligands | |
US20240018533A1 (en) | Targeting microrna to regulate native gene function by genome editing | |
US20230024164A1 (en) | Compositions and genome editing methods for improving grain yield in plants | |
CN111988989A (zh) | 通过修饰内源性mads盒转录因子改善玉蜀黍中的农艺特征 | |
WO2018228348A1 (en) | Methods to improve plant agronomic trait using bcs1l gene and guide rna/cas endonuclease systems | |
US11286496B1 (en) | Modified genes to increase seed protein content | |
US20230220409A1 (en) | Alteration of seed composition in plants | |
US20210388369A1 (en) | Expression modulating elements and methods of use | |
WO2021183753A1 (en) | Modulating nucleotide expression using expression modulating elements and modified tata and use thereof | |
WO2020237524A1 (en) | Abiotic stress tolerant plants and methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |