CN118302434A - 用于改善小花育性和种子产量的方法 - Google Patents
用于改善小花育性和种子产量的方法 Download PDFInfo
- Publication number
- CN118302434A CN118302434A CN202280078202.0A CN202280078202A CN118302434A CN 118302434 A CN118302434 A CN 118302434A CN 202280078202 A CN202280078202 A CN 202280078202A CN 118302434 A CN118302434 A CN 118302434A
- Authority
- CN
- China
- Prior art keywords
- seq
- plant
- histone demethylase
- sequence
- gene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 149
- 230000035558 fertility Effects 0.000 title claims abstract description 60
- 108010074870 Histone Demethylases Proteins 0.000 claims abstract description 374
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 248
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 238
- 229920001184 polypeptide Polymers 0.000 claims abstract description 230
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 230
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 227
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 227
- 102000008157 Histone Demethylases Human genes 0.000 claims abstract description 180
- 241000196324 Embryophyta Species 0.000 claims description 620
- 230000035772 mutation Effects 0.000 claims description 347
- 108090000623 proteins and genes Proteins 0.000 claims description 344
- 230000001965 increasing effect Effects 0.000 claims description 246
- 125000003729 nucleotide group Chemical group 0.000 claims description 238
- 239000002773 nucleotide Substances 0.000 claims description 237
- 210000004027 cell Anatomy 0.000 claims description 176
- 238000012217 deletion Methods 0.000 claims description 157
- 230000037430 deletion Effects 0.000 claims description 157
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 141
- 102000040430 polynucleotide Human genes 0.000 claims description 136
- 108091033319 polynucleotide Proteins 0.000 claims description 136
- 239000002157 polynucleotide Substances 0.000 claims description 136
- 102000004169 proteins and genes Human genes 0.000 claims description 130
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 124
- 125000000539 amino acid group Chemical group 0.000 claims description 87
- 239000004009 herbicide Substances 0.000 claims description 78
- 230000000694 effects Effects 0.000 claims description 73
- 230000014509 gene expression Effects 0.000 claims description 72
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 63
- 230000002829 reductive effect Effects 0.000 claims description 61
- 230000004568 DNA-binding Effects 0.000 claims description 55
- 230000002363 herbicidal effect Effects 0.000 claims description 55
- 241000238631 Hexapoda Species 0.000 claims description 46
- 101710163270 Nuclease Proteins 0.000 claims description 45
- 108700028369 Alleles Proteins 0.000 claims description 42
- 210000000349 chromosome Anatomy 0.000 claims description 42
- 239000012636 effector Substances 0.000 claims description 42
- 235000010469 Glycine max Nutrition 0.000 claims description 41
- 244000068988 Glycine max Species 0.000 claims description 41
- 108091007494 Nucleic acid- binding domains Proteins 0.000 claims description 36
- 108020004414 DNA Proteins 0.000 claims description 34
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 33
- 235000005822 corn Nutrition 0.000 claims description 33
- 238000006467 substitution reaction Methods 0.000 claims description 33
- 229920000742 Cotton Polymers 0.000 claims description 29
- 241000219146 Gossypium Species 0.000 claims description 29
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 claims description 28
- 235000009973 maize Nutrition 0.000 claims description 28
- 102000016624 JmjC domains Human genes 0.000 claims description 26
- 108050006228 JmjC domains Proteins 0.000 claims description 26
- 230000027455 binding Effects 0.000 claims description 26
- 125000006850 spacer group Chemical group 0.000 claims description 23
- 238000010459 TALEN Methods 0.000 claims description 22
- 230000009261 transgenic effect Effects 0.000 claims description 21
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 claims description 20
- 238000003776 cleavage reaction Methods 0.000 claims description 19
- 238000010362 genome editing Methods 0.000 claims description 19
- 230000007017 scission Effects 0.000 claims description 19
- 108091033409 CRISPR Proteins 0.000 claims description 18
- 238000003780 insertion Methods 0.000 claims description 18
- 230000037431 insertion Effects 0.000 claims description 18
- 108010042407 Endonucleases Proteins 0.000 claims description 17
- 230000012010 growth Effects 0.000 claims description 17
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 claims description 16
- 240000007594 Oryza sativa Species 0.000 claims description 16
- 235000007164 Oryza sativa Nutrition 0.000 claims description 16
- 230000037429 base substitution Effects 0.000 claims description 16
- 230000000295 complement effect Effects 0.000 claims description 16
- 235000009566 rice Nutrition 0.000 claims description 16
- 108700019146 Transgenes Proteins 0.000 claims description 15
- 230000004048 modification Effects 0.000 claims description 15
- 238000012986 modification Methods 0.000 claims description 15
- 230000001335 demethylating effect Effects 0.000 claims description 14
- 108010033040 Histones Proteins 0.000 claims description 13
- 108010017070 Zinc Finger Nucleases Proteins 0.000 claims description 13
- 235000021307 Triticum Nutrition 0.000 claims description 12
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 claims description 12
- 239000011701 zinc Substances 0.000 claims description 12
- 229910052725 zinc Inorganic materials 0.000 claims description 12
- 230000008685 targeting Effects 0.000 claims description 11
- 102000004533 Endonucleases Human genes 0.000 claims description 10
- 230000036961 partial effect Effects 0.000 claims description 9
- 235000007688 Lycopersicon esculentum Nutrition 0.000 claims description 8
- 240000003768 Solanum lycopersicum Species 0.000 claims description 8
- 230000001488 breeding effect Effects 0.000 claims description 8
- 230000004777 loss-of-function mutation Effects 0.000 claims description 8
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 claims description 7
- 241000167854 Bourreria succulenta Species 0.000 claims description 7
- 235000006008 Brassica napus var napus Nutrition 0.000 claims description 7
- 240000005979 Hordeum vulgare Species 0.000 claims description 7
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 7
- 240000007651 Rubus glaucus Species 0.000 claims description 7
- 235000002595 Solanum tuberosum Nutrition 0.000 claims description 7
- 244000061456 Solanum tuberosum Species 0.000 claims description 7
- 235000021536 Sugar beet Nutrition 0.000 claims description 7
- 235000021029 blackberry Nutrition 0.000 claims description 7
- 235000019693 cherries Nutrition 0.000 claims description 7
- 230000001747 exhibiting effect Effects 0.000 claims description 7
- 235000015097 nutrients Nutrition 0.000 claims description 7
- 102000008682 Argonaute Proteins Human genes 0.000 claims description 6
- 108010088141 Argonaute Proteins Proteins 0.000 claims description 6
- 235000004977 Brassica sinapistrum Nutrition 0.000 claims description 6
- 235000002566 Capsicum Nutrition 0.000 claims description 6
- 240000009088 Fragaria x ananassa Species 0.000 claims description 6
- 235000003222 Helianthus annuus Nutrition 0.000 claims description 6
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 6
- 244000061176 Nicotiana tabacum Species 0.000 claims description 6
- 240000000111 Saccharum officinarum Species 0.000 claims description 6
- 235000007201 Saccharum officinarum Nutrition 0.000 claims description 6
- 235000020971 citrus fruits Nutrition 0.000 claims description 6
- 235000007319 Avena orientalis Nutrition 0.000 claims description 5
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 claims description 5
- 240000000385 Brassica napus var. napus Species 0.000 claims description 5
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 claims description 5
- 244000241235 Citrullus lanatus Species 0.000 claims description 5
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 claims description 5
- 241000207199 Citrus Species 0.000 claims description 5
- 235000016623 Fragaria vesca Nutrition 0.000 claims description 5
- 235000011363 Fragaria x ananassa Nutrition 0.000 claims description 5
- 108020005004 Guide RNA Proteins 0.000 claims description 5
- 244000020551 Helianthus annuus Species 0.000 claims description 5
- 241000209510 Liliopsida Species 0.000 claims description 5
- 240000004658 Medicago sativa Species 0.000 claims description 5
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 claims description 5
- 235000017848 Rubus fruticosus Nutrition 0.000 claims description 5
- 235000011034 Rubus glaucus Nutrition 0.000 claims description 5
- 235000009122 Rubus idaeus Nutrition 0.000 claims description 5
- 235000003942 Rubus occidentalis Nutrition 0.000 claims description 5
- 244000111388 Rubus occidentalis Species 0.000 claims description 5
- 235000003434 Sesamum indicum Nutrition 0.000 claims description 5
- 244000040738 Sesamum orientale Species 0.000 claims description 5
- 238000009395 breeding Methods 0.000 claims description 5
- 244000144725 Amygdalus communis Species 0.000 claims description 4
- 235000016068 Berberis vulgaris Nutrition 0.000 claims description 4
- 241000335053 Beta vulgaris Species 0.000 claims description 4
- 241000219198 Brassica Species 0.000 claims description 4
- 235000003255 Carthamus tinctorius Nutrition 0.000 claims description 4
- 244000020518 Carthamus tinctorius Species 0.000 claims description 4
- 244000060011 Cocos nucifera Species 0.000 claims description 4
- 235000013162 Cocos nucifera Nutrition 0.000 claims description 4
- 240000007154 Coffea arabica Species 0.000 claims description 4
- 240000008067 Cucumis sativus Species 0.000 claims description 4
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 claims description 4
- 235000001950 Elaeis guineensis Nutrition 0.000 claims description 4
- 244000127993 Elaeis melanococca Species 0.000 claims description 4
- 108091092584 GDNA Proteins 0.000 claims description 4
- 235000002678 Ipomoea batatas Nutrition 0.000 claims description 4
- 244000017020 Ipomoea batatas Species 0.000 claims description 4
- 240000005561 Musa balbisiana Species 0.000 claims description 4
- 244000025272 Persea americana Species 0.000 claims description 4
- 235000008673 Persea americana Nutrition 0.000 claims description 4
- 235000009827 Prunus armeniaca Nutrition 0.000 claims description 4
- 244000018633 Prunus armeniaca Species 0.000 claims description 4
- 235000006040 Prunus persica var persica Nutrition 0.000 claims description 4
- 235000009470 Theobroma cacao Nutrition 0.000 claims description 4
- 244000299461 Theobroma cacao Species 0.000 claims description 4
- 230000036579 abiotic stress Effects 0.000 claims description 4
- 235000020224 almond Nutrition 0.000 claims description 4
- 235000016213 coffee Nutrition 0.000 claims description 4
- 235000013353 coffee beverage Nutrition 0.000 claims description 4
- 235000020234 walnut Nutrition 0.000 claims description 4
- 235000011437 Amygdalus communis Nutrition 0.000 claims description 3
- 244000144730 Amygdalus persica Species 0.000 claims description 3
- 235000007558 Avena sp Nutrition 0.000 claims description 3
- 240000008574 Capsicum frutescens Species 0.000 claims description 3
- 208000035240 Disease Resistance Diseases 0.000 claims description 3
- 240000007049 Juglans regia Species 0.000 claims description 3
- 235000009496 Juglans regia Nutrition 0.000 claims description 3
- 235000011430 Malus pumila Nutrition 0.000 claims description 3
- 235000015103 Malus silvestris Nutrition 0.000 claims description 3
- 240000003183 Manihot esculenta Species 0.000 claims description 3
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 claims description 3
- 235000018290 Musa x paradisiaca Nutrition 0.000 claims description 3
- 240000007817 Olea europaea Species 0.000 claims description 3
- 235000014443 Pyrus communis Nutrition 0.000 claims description 3
- 235000009754 Vitis X bourquina Nutrition 0.000 claims description 3
- 235000012333 Vitis X labruscana Nutrition 0.000 claims description 3
- 240000006365 Vitis vinifera Species 0.000 claims description 3
- 235000014787 Vitis vinifera Nutrition 0.000 claims description 3
- 239000001390 capsicum minimum Substances 0.000 claims description 3
- 230000001172 regenerating effect Effects 0.000 claims description 3
- 241001233957 eudicotyledons Species 0.000 claims description 2
- 240000008042 Zea mays Species 0.000 claims 11
- 241000209763 Avena sativa Species 0.000 claims 2
- 241000220225 Malus Species 0.000 claims 2
- 208000031888 Mycoses Diseases 0.000 claims 2
- 240000001987 Pyrus communis Species 0.000 claims 2
- 241001092459 Rubus Species 0.000 claims 2
- 244000098338 Triticum aestivum Species 0.000 claims 2
- 238000010354 CRISPR gene editing Methods 0.000 claims 1
- 229940123611 Genome editing Drugs 0.000 claims 1
- 230000000855 fungicidal effect Effects 0.000 claims 1
- 239000000417 fungicide Substances 0.000 claims 1
- 239000002917 insecticide Substances 0.000 claims 1
- 239000000203 mixture Substances 0.000 abstract description 11
- 235000018102 proteins Nutrition 0.000 description 115
- 241000482268 Zea mays subsp. mays Species 0.000 description 71
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 54
- 210000001519 tissue Anatomy 0.000 description 36
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 34
- 102100031780 Endonuclease Human genes 0.000 description 33
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 28
- 229910052757 nitrogen Inorganic materials 0.000 description 27
- 239000013598 vector Substances 0.000 description 26
- 230000002068 genetic effect Effects 0.000 description 25
- 230000009466 transformation Effects 0.000 description 24
- 150000001413 amino acids Chemical class 0.000 description 22
- 239000003550 marker Substances 0.000 description 22
- 239000012634 fragment Substances 0.000 description 21
- 108020001507 fusion proteins Proteins 0.000 description 20
- 102000037865 fusion proteins Human genes 0.000 description 20
- 235000013339 cereals Nutrition 0.000 description 19
- 230000035882 stress Effects 0.000 description 18
- 238000009396 hybridization Methods 0.000 description 17
- 241000894007 species Species 0.000 description 16
- 239000002028 Biomass Substances 0.000 description 15
- 230000001976 improved effect Effects 0.000 description 15
- 230000006870 function Effects 0.000 description 14
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 13
- 108091092195 Intron Proteins 0.000 description 12
- 230000001105 regulatory effect Effects 0.000 description 11
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 10
- 241000209140 Triticum Species 0.000 description 10
- 238000011161 development Methods 0.000 description 9
- 230000018109 developmental process Effects 0.000 description 9
- 235000013399 edible fruits Nutrition 0.000 description 9
- 230000001404 mediated effect Effects 0.000 description 8
- 231100000331 toxic Toxicity 0.000 description 8
- 230000002588 toxic effect Effects 0.000 description 8
- 108091026890 Coding region Proteins 0.000 description 7
- 244000241257 Cucumis melo Species 0.000 description 7
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 7
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 7
- 244000078534 Vaccinium myrtillus Species 0.000 description 7
- 102000044158 nucleic acid binding protein Human genes 0.000 description 7
- 108700020942 nucleic acid binding protein Proteins 0.000 description 7
- 210000001938 protoplast Anatomy 0.000 description 7
- 150000003839 salts Chemical class 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- 244000025254 Cannabis sativa Species 0.000 description 6
- 108090000848 Ubiquitin Proteins 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 6
- -1 canopy area Substances 0.000 description 6
- 239000003623 enhancer Substances 0.000 description 6
- 238000003306 harvesting Methods 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 210000000056 organ Anatomy 0.000 description 6
- 241000219194 Arabidopsis Species 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 5
- 240000007124 Brassica oleracea Species 0.000 description 5
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 5
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 5
- 208000005156 Dehydration Diseases 0.000 description 5
- 102000044159 Ubiquitin Human genes 0.000 description 5
- 238000004113 cell culture Methods 0.000 description 5
- 230000024346 drought recovery Effects 0.000 description 5
- 239000003921 oil Substances 0.000 description 5
- 239000013612 plasmid Substances 0.000 description 5
- 230000000306 recurrent effect Effects 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- 108010052875 Adenine deaminase Proteins 0.000 description 4
- 240000002791 Brassica napus Species 0.000 description 4
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 4
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 4
- 102000000311 Cytosine Deaminase Human genes 0.000 description 4
- 108010080611 Cytosine Deaminase Proteins 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- 241000237858 Gastropoda Species 0.000 description 4
- 244000046052 Phaseolus vulgaris Species 0.000 description 4
- 235000010582 Pisum sativum Nutrition 0.000 description 4
- 240000004713 Pisum sativum Species 0.000 description 4
- 102000004389 Ribonucleoproteins Human genes 0.000 description 4
- 108010081734 Ribonucleoproteins Proteins 0.000 description 4
- 108091023040 Transcription factor Proteins 0.000 description 4
- 241000607479 Yersinia pestis Species 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 230000007812 deficiency Effects 0.000 description 4
- 238000011049 filling Methods 0.000 description 4
- 230000035784 germination Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 230000010152 pollination Effects 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 235000013311 vegetables Nutrition 0.000 description 4
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 4
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- 101150090724 3 gene Proteins 0.000 description 3
- 108010020183 3-phosphoshikimate 1-carboxyvinyltransferase Proteins 0.000 description 3
- 108010000700 Acetolactate synthase Proteins 0.000 description 3
- 241000589158 Agrobacterium Species 0.000 description 3
- 241000234282 Allium Species 0.000 description 3
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 3
- 244000075850 Avena orientalis Species 0.000 description 3
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 3
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 3
- 101100098479 Caenorhabditis elegans glp-4 gene Proteins 0.000 description 3
- 108700004991 Cas12a Proteins 0.000 description 3
- 108060002716 Exonuclease Proteins 0.000 description 3
- 235000003228 Lactuca sativa Nutrition 0.000 description 3
- 240000008415 Lactuca sativa Species 0.000 description 3
- 244000070406 Malus silvestris Species 0.000 description 3
- 241000244206 Nematoda Species 0.000 description 3
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 3
- 241000220324 Pyrus Species 0.000 description 3
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 3
- 101150085784 SGR gene Proteins 0.000 description 3
- 235000002597 Solanum melongena Nutrition 0.000 description 3
- 244000061458 Solanum melongena Species 0.000 description 3
- 244000062793 Sorghum vulgare Species 0.000 description 3
- 241000191967 Staphylococcus aureus Species 0.000 description 3
- 229920002472 Starch Polymers 0.000 description 3
- 102000040945 Transcription factor Human genes 0.000 description 3
- 240000001717 Vaccinium macrocarpon Species 0.000 description 3
- 241000219094 Vitaceae Species 0.000 description 3
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 235000021028 berry Nutrition 0.000 description 3
- 235000009120 camo Nutrition 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 101150059443 cas12a gene Proteins 0.000 description 3
- 101150038500 cas9 gene Proteins 0.000 description 3
- 210000002421 cell wall Anatomy 0.000 description 3
- 235000005607 chanvre indien Nutrition 0.000 description 3
- 210000003763 chloroplast Anatomy 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 230000006735 deficit Effects 0.000 description 3
- 210000002257 embryonic structure Anatomy 0.000 description 3
- 102000013165 exonuclease Human genes 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 102000054766 genetic haplotypes Human genes 0.000 description 3
- 235000021021 grapes Nutrition 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 235000021231 nutrient uptake Nutrition 0.000 description 3
- 235000014571 nuts Nutrition 0.000 description 3
- 230000008635 plant growth Effects 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 230000001850 reproductive effect Effects 0.000 description 3
- 101150071322 ruvC gene Proteins 0.000 description 3
- 235000019698 starch Nutrition 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 230000003612 virological effect Effects 0.000 description 3
- LWTDZKXXJRRKDG-KXBFYZLASA-N (-)-phaseollin Chemical compound C1OC2=CC(O)=CC=C2[C@H]2[C@@H]1C1=CC=C3OC(C)(C)C=CC3=C1O2 LWTDZKXXJRRKDG-KXBFYZLASA-N 0.000 description 2
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid Chemical compound CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 2
- FVFVNNKYKYZTJU-UHFFFAOYSA-N 6-chloro-1,3,5-triazine-2,4-diamine Chemical compound NC1=NC(N)=NC(Cl)=N1 FVFVNNKYKYZTJU-UHFFFAOYSA-N 0.000 description 2
- 101710197633 Actin-1 Proteins 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 2
- 244000105624 Arachis hypogaea Species 0.000 description 2
- 241000239223 Arachnida Species 0.000 description 2
- 241000186000 Bifidobacterium Species 0.000 description 2
- 235000004221 Brassica oleracea var gemmifera Nutrition 0.000 description 2
- 235000017647 Brassica oleracea var italica Nutrition 0.000 description 2
- 235000012905 Brassica oleracea var viridis Nutrition 0.000 description 2
- 244000308368 Brassica oleracea var. gemmifera Species 0.000 description 2
- 244000304217 Brassica oleracea var. gongylodes Species 0.000 description 2
- 235000000536 Brassica rapa subsp pekinensis Nutrition 0.000 description 2
- 241000499436 Brassica rapa subsp. pekinensis Species 0.000 description 2
- 241000186146 Brevibacterium Species 0.000 description 2
- 235000008697 Cannabis sativa Nutrition 0.000 description 2
- 235000012766 Cannabis sativa ssp. sativa var. sativa Nutrition 0.000 description 2
- 235000012765 Cannabis sativa ssp. sativa var. spontanea Nutrition 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 108090000209 Carbonic anhydrases Proteins 0.000 description 2
- 235000009467 Carica papaya Nutrition 0.000 description 2
- 240000006432 Carica papaya Species 0.000 description 2
- 235000007542 Cichorium intybus Nutrition 0.000 description 2
- 244000298479 Cichorium intybus Species 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 235000009847 Cucumis melo var cantalupensis Nutrition 0.000 description 2
- 235000009854 Cucurbita moschata Nutrition 0.000 description 2
- 240000001980 Cucurbita pepo Species 0.000 description 2
- 241000219130 Cucurbita pepo subsp. pepo Species 0.000 description 2
- 235000003954 Cucurbita pepo var melopepo Nutrition 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 108090000652 Flap endonucleases Proteins 0.000 description 2
- 102000004150 Flap endonucleases Human genes 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- 239000005561 Glufosinate Substances 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 239000005562 Glyphosate Substances 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- 206010061217 Infestation Diseases 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- 241000192132 Leuconostoc Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 108090000913 Nitrate Reductases Proteins 0.000 description 2
- 238000000636 Northern blotting Methods 0.000 description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 2
- 108091005461 Nucleic proteins Proteins 0.000 description 2
- 241000202223 Oenococcus Species 0.000 description 2
- 241000192001 Pediococcus Species 0.000 description 2
- 239000006002 Pepper Substances 0.000 description 2
- 108091000041 Phosphoenolpyruvate Carboxylase Proteins 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 2
- 235000016761 Piper aduncum Nutrition 0.000 description 2
- 240000003889 Piper guineense Species 0.000 description 2
- 235000017804 Piper guineense Nutrition 0.000 description 2
- 235000008184 Piper nigrum Nutrition 0.000 description 2
- 240000006711 Pistacia vera Species 0.000 description 2
- 235000014360 Punica granatum Nutrition 0.000 description 2
- 244000294611 Punica granatum Species 0.000 description 2
- 102000009572 RNA Polymerase II Human genes 0.000 description 2
- 108010009460 RNA Polymerase II Proteins 0.000 description 2
- 235000001537 Ribes X gardonianum Nutrition 0.000 description 2
- 235000001535 Ribes X utile Nutrition 0.000 description 2
- 235000002357 Ribes grossularia Nutrition 0.000 description 2
- 240000001890 Ribes hudsonianum Species 0.000 description 2
- 235000016954 Ribes hudsonianum Nutrition 0.000 description 2
- 235000001466 Ribes nigrum Nutrition 0.000 description 2
- 235000016919 Ribes petraeum Nutrition 0.000 description 2
- 244000281247 Ribes rubrum Species 0.000 description 2
- 235000002355 Ribes spicatum Nutrition 0.000 description 2
- 235000007238 Secale cereale Nutrition 0.000 description 2
- 244000082988 Secale cereale Species 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 241000607720 Serratia Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 235000009337 Spinacia oleracea Nutrition 0.000 description 2
- 244000300264 Spinacia oleracea Species 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 241000194020 Streptococcus thermophilus Species 0.000 description 2
- 241000187432 Streptomyces coelicolor Species 0.000 description 2
- 108010043934 Sucrose synthase Proteins 0.000 description 2
- 241001104043 Syringa Species 0.000 description 2
- 235000019714 Triticale Nutrition 0.000 description 2
- 235000012545 Vaccinium macrocarpon Nutrition 0.000 description 2
- 235000017537 Vaccinium myrtillus Nutrition 0.000 description 2
- 235000002118 Vaccinium oxycoccus Nutrition 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 241000607757 Xenorhabdus Species 0.000 description 2
- 229920002494 Zein Polymers 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 235000021016 apples Nutrition 0.000 description 2
- 230000004790 biotic stress Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 229930002875 chlorophyll Natural products 0.000 description 2
- 235000019804 chlorophyll Nutrition 0.000 description 2
- ATNHDLDRLWWWCB-AENOIHSZSA-M chlorophyll a Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 ATNHDLDRLWWWCB-AENOIHSZSA-M 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 235000004634 cranberry Nutrition 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- IWEDIXLBFLAXBO-UHFFFAOYSA-N dicamba Chemical compound COC1=C(Cl)C=CC(Cl)=C1C(O)=O IWEDIXLBFLAXBO-UHFFFAOYSA-N 0.000 description 2
- 235000014113 dietary fatty acids Nutrition 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000006353 environmental stress Effects 0.000 description 2
- 229930195729 fatty acid Natural products 0.000 description 2
- 239000000194 fatty acid Substances 0.000 description 2
- 150000004665 fatty acids Chemical class 0.000 description 2
- 230000037433 frameshift Effects 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 2
- 229940097068 glyphosate Drugs 0.000 description 2
- 210000004209 hair Anatomy 0.000 description 2
- 239000011487 hemp Substances 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- 235000021374 legumes Nutrition 0.000 description 2
- 210000001161 mammalian embryo Anatomy 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 238000007899 nucleic acid hybridization Methods 0.000 description 2
- 239000002853 nucleic acid probe Substances 0.000 description 2
- 230000031787 nutrient reservoir activity Effects 0.000 description 2
- 235000019198 oils Nutrition 0.000 description 2
- 230000008723 osmotic stress Effects 0.000 description 2
- 235000020232 peanut Nutrition 0.000 description 2
- 235000021017 pears Nutrition 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 239000011574 phosphorus Substances 0.000 description 2
- 230000029553 photosynthesis Effects 0.000 description 2
- 238000010672 photosynthesis Methods 0.000 description 2
- 235000020233 pistachio Nutrition 0.000 description 2
- 210000002706 plastid Anatomy 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002035 prolonged effect Effects 0.000 description 2
- 235000021013 raspberries Nutrition 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000002786 root growth Effects 0.000 description 2
- 230000009758 senescence Effects 0.000 description 2
- 102000023888 sequence-specific DNA binding proteins Human genes 0.000 description 2
- 108091008420 sequence-specific DNA binding proteins Proteins 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000001568 sexual effect Effects 0.000 description 2
- 101150026951 shi gene Proteins 0.000 description 2
- 229910001415 sodium ion Inorganic materials 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 230000021918 systemic acquired resistance Effects 0.000 description 2
- 108010050014 systemin Proteins 0.000 description 2
- HOWHQWFXSLOJEF-MGZLOUMQSA-N systemin Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H]2N(CCC2)C(=O)[C@H]2N(CCC2)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)C(C)C)CCC1 HOWHQWFXSLOJEF-MGZLOUMQSA-N 0.000 description 2
- 239000003053 toxin Substances 0.000 description 2
- 231100000765 toxin Toxicity 0.000 description 2
- 108700012359 toxins Proteins 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- 239000011800 void material Substances 0.000 description 2
- 241000228158 x Triticosecale Species 0.000 description 2
- 229940093612 zein Drugs 0.000 description 2
- 239000005019 zein Substances 0.000 description 2
- 108010052418 (N-(2-((4-((2-((4-(9-acridinylamino)phenyl)amino)-2-oxoethyl)amino)-4-oxobutyl)amino)-1-(1H-imidazol-4-ylmethyl)-1-oxoethyl)-6-(((-2-aminoethyl)amino)methyl)-2-pyridinecarboxamidato) iron(1+) Proteins 0.000 description 1
- DSSYKIVIOFKYAU-XCBNKYQSSA-N (R)-camphor Chemical compound C1C[C@@]2(C)C(=O)C[C@@H]1C2(C)C DSSYKIVIOFKYAU-XCBNKYQSSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- OVSKIKFHRZPJSS-UHFFFAOYSA-N 2,4-D Chemical compound OC(=O)COC1=CC=C(Cl)C=C1Cl OVSKIKFHRZPJSS-UHFFFAOYSA-N 0.000 description 1
- 108010041188 2,4-dichlorophenoxyacetic acid monooxygenase Proteins 0.000 description 1
- JLIDBLDQVAYHNE-LXGGSRJLSA-N 2-cis-abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\C1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-LXGGSRJLSA-N 0.000 description 1
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical class O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 1
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- CKOMXBHMKXXTNW-UHFFFAOYSA-N 6-methyladenine Chemical compound CNC1=NC=NC2=C1N=CN2 CKOMXBHMKXXTNW-UHFFFAOYSA-N 0.000 description 1
- 240000004507 Abelmoschus esculentus Species 0.000 description 1
- 241000238876 Acari Species 0.000 description 1
- 241001143500 Aceraceae Species 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 101710103719 Acetolactate synthase large subunit Proteins 0.000 description 1
- 101710182467 Acetolactate synthase large subunit IlvB1 Proteins 0.000 description 1
- 101710171176 Acetolactate synthase large subunit IlvG Proteins 0.000 description 1
- 101710176702 Acetolactate synthase small subunit Proteins 0.000 description 1
- 101710147947 Acetolactate synthase small subunit 1, chloroplastic Proteins 0.000 description 1
- 101710095712 Acetolactate synthase, mitochondrial Proteins 0.000 description 1
- 235000009436 Actinidia deliciosa Nutrition 0.000 description 1
- 244000298697 Actinidia deliciosa Species 0.000 description 1
- 241000186361 Actinobacteria <class> Species 0.000 description 1
- 101710146995 Acyl carrier protein Proteins 0.000 description 1
- 102000055025 Adenosine deaminases Human genes 0.000 description 1
- 241000743339 Agrostis Species 0.000 description 1
- 101710187578 Alcohol dehydrogenase 1 Proteins 0.000 description 1
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 1
- 235000005254 Allium ampeloprasum Nutrition 0.000 description 1
- 240000006108 Allium ampeloprasum Species 0.000 description 1
- 240000002234 Allium sativum Species 0.000 description 1
- 235000001270 Allium sibiricum Nutrition 0.000 description 1
- 244000016163 Allium sibiricum Species 0.000 description 1
- 101100301006 Allochromatium vinosum (strain ATCC 17899 / DSM 180 / NBRC 103801 / NCIMB 10441 / D) cbbL2 gene Proteins 0.000 description 1
- 102000004400 Aminopeptidases Human genes 0.000 description 1
- 108090000915 Aminopeptidases Proteins 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- 244000099147 Ananas comosus Species 0.000 description 1
- 235000007119 Ananas comosus Nutrition 0.000 description 1
- 108020003566 Antisense Oligodeoxyribonucleotides Proteins 0.000 description 1
- 240000007087 Apium graveolens Species 0.000 description 1
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 description 1
- 241000722948 Apocynum cannabinum Species 0.000 description 1
- 235000010591 Appio Nutrition 0.000 description 1
- 101000573149 Arabidopsis thaliana Pectinesterase 7 Proteins 0.000 description 1
- 101100428771 Arabidopsis thaliana VSR3 gene Proteins 0.000 description 1
- 235000011330 Armoracia rusticana Nutrition 0.000 description 1
- 240000003291 Armoracia rusticana Species 0.000 description 1
- 241001494510 Arundo Species 0.000 description 1
- 244000003416 Asparagus officinalis Species 0.000 description 1
- 235000005340 Asparagus officinalis Nutrition 0.000 description 1
- FBMORZZOJSDNRQ-GLQYFDAESA-N Atractylenolide III Chemical compound C=C([C@@H]1C2)CCC[C@]1(C)C[C@@]1(O)C2=C(C)C(=O)O1 FBMORZZOJSDNRQ-GLQYFDAESA-N 0.000 description 1
- 241000132011 Atractylodes lancea Species 0.000 description 1
- 235000000832 Ayote Nutrition 0.000 description 1
- 241000193388 Bacillus thuringiensis Species 0.000 description 1
- 101100114760 Bacillus thuringiensis cry3Bb gene Proteins 0.000 description 1
- 208000035143 Bacterial infection Diseases 0.000 description 1
- 235000018185 Betula X alpestris Nutrition 0.000 description 1
- 235000018212 Betula X uliginosa Nutrition 0.000 description 1
- 235000003351 Brassica cretica Nutrition 0.000 description 1
- 235000011297 Brassica napobrassica Nutrition 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 241000219192 Brassica napus subsp. rapifera Species 0.000 description 1
- 235000001171 Brassica oleracea var gongylodes Nutrition 0.000 description 1
- 244000064816 Brassica oleracea var. acephala Species 0.000 description 1
- 235000010149 Brassica rapa subsp chinensis Nutrition 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 235000003343 Brassica rupestris Nutrition 0.000 description 1
- 235000004936 Bromus mango Nutrition 0.000 description 1
- 101150018129 CSF2 gene Proteins 0.000 description 1
- 101150069031 CSN2 gene Proteins 0.000 description 1
- 241000219357 Cactaceae Species 0.000 description 1
- 241000222122 Candida albicans Species 0.000 description 1
- 206010007134 Candida infections Diseases 0.000 description 1
- 235000009025 Carya illinoensis Nutrition 0.000 description 1
- 244000068645 Carya illinoensis Species 0.000 description 1
- 235000014036 Castanea Nutrition 0.000 description 1
- 241001070941 Castanea Species 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 241000218645 Cedrus Species 0.000 description 1
- 235000003301 Ceiba pentandra Nutrition 0.000 description 1
- 244000146553 Ceiba pentandra Species 0.000 description 1
- 240000006162 Chenopodium quinoa Species 0.000 description 1
- 235000010523 Cicer arietinum Nutrition 0.000 description 1
- 244000045195 Cicer arietinum Species 0.000 description 1
- 240000006740 Cichorium endivia Species 0.000 description 1
- 241000723346 Cinnamomum camphora Species 0.000 description 1
- 244000223760 Cinnamomum zeylanicum Species 0.000 description 1
- 235000008733 Citrus aurantifolia Nutrition 0.000 description 1
- 235000005979 Citrus limon Nutrition 0.000 description 1
- 244000175448 Citrus madurensis Species 0.000 description 1
- 244000131522 Citrus pyriformis Species 0.000 description 1
- 241000675108 Citrus tangerina Species 0.000 description 1
- 240000000560 Citrus x paradisi Species 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 241000218631 Coniferophyta Species 0.000 description 1
- 240000000491 Corchorus aestuans Species 0.000 description 1
- 235000011777 Corchorus aestuans Nutrition 0.000 description 1
- 235000010862 Corchorus capsularis Nutrition 0.000 description 1
- 241000723382 Corylus Species 0.000 description 1
- 235000007466 Corylus avellana Nutrition 0.000 description 1
- 208000011231 Crohn disease Diseases 0.000 description 1
- 235000009852 Cucurbita pepo Nutrition 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- 244000301850 Cupressus sempervirens Species 0.000 description 1
- 229920000858 Cyclodextrin Polymers 0.000 description 1
- 244000019459 Cynara cardunculus Species 0.000 description 1
- 235000019106 Cynara scolymus Nutrition 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 239000005504 Dicamba Substances 0.000 description 1
- 235000011511 Diospyros Nutrition 0.000 description 1
- 241000723267 Diospyros Species 0.000 description 1
- 101100238646 Drosophila melanogaster msl-1 gene Proteins 0.000 description 1
- 241000701832 Enterobacteria phage T3 Species 0.000 description 1
- 244000004281 Eucalyptus maculata Species 0.000 description 1
- 235000009419 Fagopyrum esculentum Nutrition 0.000 description 1
- 240000008620 Fagopyrum esculentum Species 0.000 description 1
- 102000009114 Fatty acid desaturases Human genes 0.000 description 1
- 108010087894 Fatty acid desaturases Proteins 0.000 description 1
- 241000234642 Festuca Species 0.000 description 1
- 235000017317 Fortunella Nutrition 0.000 description 1
- 206010017533 Fungal infection Diseases 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 101710186901 Globulin 1 Proteins 0.000 description 1
- 108010044091 Globulins Proteins 0.000 description 1
- 102000006395 Globulins Human genes 0.000 description 1
- 108700037728 Glycine max beta-conglycinin Proteins 0.000 description 1
- 108030006517 Glyphosate oxidoreductases Proteins 0.000 description 1
- 241001091440 Grossulariaceae Species 0.000 description 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 1
- 244000050907 Hedychium coronarium Species 0.000 description 1
- 241000208818 Helianthus Species 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 244000043261 Hevea brasiliensis Species 0.000 description 1
- 235000015928 Hibiscus cannabinus Nutrition 0.000 description 1
- 108010036115 Histone Methyltransferases Proteins 0.000 description 1
- 101100091360 Homo sapiens RNPC3 gene Proteins 0.000 description 1
- 235000008694 Humulus lupulus Nutrition 0.000 description 1
- 244000025221 Humulus lupulus Species 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 240000007171 Imperata cylindrica Species 0.000 description 1
- 206010021929 Infertility male Diseases 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 235000010702 Insulata Nutrition 0.000 description 1
- 244000165077 Insulata Species 0.000 description 1
- 241000758791 Juglandaceae Species 0.000 description 1
- 241000256560 Kandleria Species 0.000 description 1
- 235000015802 Lactuca sativa var crispa Nutrition 0.000 description 1
- 240000004201 Lactuca sativa var. crispa Species 0.000 description 1
- 241000218195 Lauraceae Species 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- 244000207740 Lemna minor Species 0.000 description 1
- 235000006439 Lemna minor Nutrition 0.000 description 1
- 240000004322 Lens culinaris Species 0.000 description 1
- 235000014647 Lens culinaris subsp culinaris Nutrition 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 241000029603 Leptotrichia shahii Species 0.000 description 1
- 241000830535 Ligustrum lucidum Species 0.000 description 1
- 235000004431 Linum usitatissimum Nutrition 0.000 description 1
- 240000006240 Linum usitatissimum Species 0.000 description 1
- 241000209082 Lolium Species 0.000 description 1
- 241000208467 Macadamia Species 0.000 description 1
- 241000218922 Magnoliophyta Species 0.000 description 1
- 208000007466 Male Infertility Diseases 0.000 description 1
- 235000014826 Mangifera indica Nutrition 0.000 description 1
- 240000007228 Mangifera indica Species 0.000 description 1
- 240000003433 Miscanthus floridulus Species 0.000 description 1
- 101100494762 Mus musculus Nedd9 gene Proteins 0.000 description 1
- 229910002651 NO3 Inorganic materials 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 244000183278 Nephelium litchi Species 0.000 description 1
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 description 1
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 description 1
- 241000219925 Oenothera Species 0.000 description 1
- 235000004496 Oenothera biennis Nutrition 0.000 description 1
- 241000207836 Olea <angiosperm> Species 0.000 description 1
- 101710089395 Oleosin Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 241000927544 Olsenella Species 0.000 description 1
- 240000004371 Panax ginseng Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 241001520808 Panicum virgatum Species 0.000 description 1
- 240000001090 Papaver somniferum Species 0.000 description 1
- 235000008753 Papaver somniferum Nutrition 0.000 description 1
- 240000004370 Pastinaca sativa Species 0.000 description 1
- 235000017769 Pastinaca sativa subsp sativa Nutrition 0.000 description 1
- 244000062780 Petroselinum sativum Species 0.000 description 1
- 240000007377 Petunia x hybrida Species 0.000 description 1
- 101710163504 Phaseolin Proteins 0.000 description 1
- 241001148062 Photorhabdus Species 0.000 description 1
- IHPVFYLOGNNZLA-UHFFFAOYSA-N Phytoalexin Natural products COC1=CC=CC=C1C1OC(C=C2C(OCO2)=C2OC)=C2C(=O)C1 IHPVFYLOGNNZLA-UHFFFAOYSA-N 0.000 description 1
- 241000218657 Picea Species 0.000 description 1
- 235000005205 Pinus Nutrition 0.000 description 1
- 241000218602 Pinus <genus> Species 0.000 description 1
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 1
- 241000018646 Pinus brutia Species 0.000 description 1
- 235000011613 Pinus brutia Nutrition 0.000 description 1
- 241000758706 Piperaceae Species 0.000 description 1
- 241000209504 Poaceae Species 0.000 description 1
- 235000001855 Portulaca oleracea Nutrition 0.000 description 1
- 101710196435 Probable acetolactate synthase large subunit Proteins 0.000 description 1
- 101710181764 Probable acetolactate synthase small subunit Proteins 0.000 description 1
- 240000005809 Prunus persica Species 0.000 description 1
- 235000006029 Prunus persica var nucipersica Nutrition 0.000 description 1
- 244000017714 Prunus persica var. nucipersica Species 0.000 description 1
- 101710104000 Putative acetolactate synthase small subunit Proteins 0.000 description 1
- 241000219492 Quercus Species 0.000 description 1
- 101150090155 R gene Proteins 0.000 description 1
- 102100026085 RNA-binding region-containing protein 3 Human genes 0.000 description 1
- 244000088415 Raphanus sativus Species 0.000 description 1
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 244000171263 Ribes grossularia Species 0.000 description 1
- 101710097247 Ribulose bisphosphate carboxylase large chain Proteins 0.000 description 1
- 101710104360 Ribulose bisphosphate carboxylase large chain, chromosomal Proteins 0.000 description 1
- 240000000528 Ricinus communis Species 0.000 description 1
- 235000004443 Ricinus communis Nutrition 0.000 description 1
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241000124033 Salix Species 0.000 description 1
- 108010016634 Seed Storage Proteins Proteins 0.000 description 1
- 244000044822 Simmondsia californica Species 0.000 description 1
- 235000004433 Simmondsia californica Nutrition 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000208292 Solanaceae Species 0.000 description 1
- 101100020617 Solanum lycopersicum LAT52 gene Proteins 0.000 description 1
- 101100083699 Solanum lycopersicum LAT59 gene Proteins 0.000 description 1
- 235000009184 Spondias indica Nutrition 0.000 description 1
- 101710154134 Stearoyl-[acyl-carrier-protein] 9-desaturase, chloroplastic Proteins 0.000 description 1
- 101000951943 Stenotrophomonas maltophilia Dicamba O-demethylase, oxygenase component Proteins 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 241000194019 Streptococcus mutans Species 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 229940100389 Sulfonylurea Drugs 0.000 description 1
- 235000004338 Syringa vulgaris Nutrition 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 244000269722 Thea sinensis Species 0.000 description 1
- 244000152045 Themeda triandra Species 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 240000006909 Tilia x europaea Species 0.000 description 1
- 235000011941 Tilia x europaea Nutrition 0.000 description 1
- 244000294925 Tragopogon dubius Species 0.000 description 1
- 235000004478 Tragopogon dubius Nutrition 0.000 description 1
- 235000012363 Tragopogon porrifolius Nutrition 0.000 description 1
- 241000219793 Trifolium Species 0.000 description 1
- 101710162629 Trypsin inhibitor Proteins 0.000 description 1
- 102000004243 Tubulin Human genes 0.000 description 1
- 108090000704 Tubulin Proteins 0.000 description 1
- 241000722921 Tulipa gesneriana Species 0.000 description 1
- 241000218220 Ulmaceae Species 0.000 description 1
- 108020004417 Untranslated RNA Proteins 0.000 description 1
- 102000039634 Untranslated RNA Human genes 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Natural products O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 1
- 101150079074 VSR3 gene Proteins 0.000 description 1
- 235000003095 Vaccinium corymbosum Nutrition 0.000 description 1
- 244000071378 Viburnum opulus Species 0.000 description 1
- 244000172533 Viola sororia Species 0.000 description 1
- 241000202221 Weissella Species 0.000 description 1
- 108700041896 Zea mays Ubi-1 Proteins 0.000 description 1
- 108010055615 Zein Proteins 0.000 description 1
- 101710159466 [Pyruvate dehydrogenase (acetyl-transferring)] kinase, mitochondrial Proteins 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 206010000210 abortion Diseases 0.000 description 1
- 231100000176 abortion Toxicity 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000023445 activated T cell autonomous cell death Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000009418 agronomic effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 229930002877 anthocyanin Natural products 0.000 description 1
- 235000010208 anthocyanin Nutrition 0.000 description 1
- 239000004410 anthocyanin Substances 0.000 description 1
- 150000004636 anthocyanins Chemical class 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000840 anti-viral effect Effects 0.000 description 1
- 239000003293 antisense oligodeoxyribonucleotide Substances 0.000 description 1
- 235000016520 artichoke thistle Nutrition 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 101150088806 atpA gene Proteins 0.000 description 1
- 229940097012 bacillus thuringiensis Drugs 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 208000022362 bacterial infectious disease Diseases 0.000 description 1
- 235000021015 bananas Nutrition 0.000 description 1
- 101150103518 bar gene Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000007321 biological mechanism Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- QKSKPIVNLNLAAV-UHFFFAOYSA-N bis(2-chloroethyl) sulfide Chemical compound ClCCSCCCl QKSKPIVNLNLAAV-UHFFFAOYSA-N 0.000 description 1
- 235000021014 blueberries Nutrition 0.000 description 1
- 235000008429 bread Nutrition 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 244000213578 camo Species 0.000 description 1
- 229960000846 camphor Drugs 0.000 description 1
- 229930008380 camphor Natural products 0.000 description 1
- 201000003984 candidiasis Diseases 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 101150004101 cbbL gene Proteins 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 235000003733 chicria Nutrition 0.000 description 1
- 108010031100 chloroplast transit peptides Proteins 0.000 description 1
- 235000017803 cinnamon Nutrition 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 101150055601 cops2 gene Proteins 0.000 description 1
- 239000013601 cosmid vector Substances 0.000 description 1
- 235000021019 cranberries Nutrition 0.000 description 1
- 244000038559 crop plants Species 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000023753 dehiscence Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 101150088049 dna2 gene Proteins 0.000 description 1
- 230000008641 drought stress Effects 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 235000013601 eggs Nutrition 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000005712 elicitor Substances 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 210000001339 epidermal cell Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 239000003925 fat Substances 0.000 description 1
- 235000019197 fats Nutrition 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 244000037666 field crops Species 0.000 description 1
- 108010060641 flavanone synthetase Proteins 0.000 description 1
- 239000004459 forage Substances 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 208000024386 fungal infectious disease Diseases 0.000 description 1
- 235000004611 garlic Nutrition 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000003633 gene expression assay Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 108010039239 glyphosate N-acetyltransferase Proteins 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000000749 insecticidal effect Effects 0.000 description 1
- 235000021332 kidney beans Nutrition 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 239000004571 lime Substances 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 108010083942 mannopine synthase Proteins 0.000 description 1
- 240000004308 marijuana Species 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 210000000473 mesophyll cell Anatomy 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 108091040857 miR-604 stem-loop Proteins 0.000 description 1
- 108091088140 miR162 stem-loop Proteins 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 235000010460 mustard Nutrition 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000014075 nitrogen utilization Effects 0.000 description 1
- 230000024121 nodulation Effects 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 210000004738 parenchymal cell Anatomy 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 101150113864 pat gene Proteins 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 235000011197 perejil Nutrition 0.000 description 1
- LWTDZKXXJRRKDG-UHFFFAOYSA-N phaseollin Natural products C1OC2=CC(O)=CC=C2C2C1C1=CC=C3OC(C)(C)C=CC3=C1O2 LWTDZKXXJRRKDG-UHFFFAOYSA-N 0.000 description 1
- NONJJLVGHLVQQM-JHXYUMNGSA-N phenethicillin Chemical compound N([C@@H]1C(N2[C@H](C(C)(C)S[C@@H]21)C(O)=O)=O)C(=O)C(C)OC1=CC=CC=C1 NONJJLVGHLVQQM-JHXYUMNGSA-N 0.000 description 1
- 150000004713 phosphodiesters Chemical group 0.000 description 1
- 230000000243 photosynthetic effect Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 230000006461 physiological response Effects 0.000 description 1
- 239000000280 phytoalexin Substances 0.000 description 1
- 150000001857 phytoalexin derivatives Chemical class 0.000 description 1
- 230000003032 phytopathogenic effect Effects 0.000 description 1
- 238000003976 plant breeding Methods 0.000 description 1
- 230000001863 plant nutrition Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 235000021018 plums Nutrition 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 101150075980 psbA gene Proteins 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
- 101150074945 rbcL gene Proteins 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- HFHDHCJBZVLPGP-UHFFFAOYSA-N schardinger α-dextrin Chemical compound O1C(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(O)C2O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC2C(O)C(O)C1OC2CO HFHDHCJBZVLPGP-UHFFFAOYSA-N 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000008117 seed development Effects 0.000 description 1
- 230000007226 seed germination Effects 0.000 description 1
- 230000010153 self-pollination Effects 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- HBMJWWWQQXIZIP-UHFFFAOYSA-N silicon carbide Chemical compound [Si+]#[C-] HBMJWWWQQXIZIP-UHFFFAOYSA-N 0.000 description 1
- 229910010271 silicon carbide Inorganic materials 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 235000013599 spices Nutrition 0.000 description 1
- 235000020354 squash Nutrition 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 210000000434 stratum corneum Anatomy 0.000 description 1
- 235000021012 strawberries Nutrition 0.000 description 1
- 239000002438 stress hormone Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000005068 transpiration Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 101150019416 trpA gene Proteins 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 108700026215 vpr Genes Proteins 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 238000004383 yellowing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01C—PLANTING; SOWING; FERTILISING
- A01C1/00—Apparatus, or methods of use thereof, for testing or treating seed, roots, or the like, prior to sowing or planting
- A01C1/08—Immunising seed
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01C—PLANTING; SOWING; FERTILISING
- A01C21/00—Methods of fertilising, sowing or planting
- A01C21/005—Following a specific plan, e.g. pattern
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Soil Sciences (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Environmental Sciences (AREA)
- Cell Biology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Botany (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明涉及用于修饰编码组蛋白去甲基化酶多肽的核酸的组合物和方法,所述组蛋白去甲基化酶多肽调节植物的小花育性、种子数量和/或种子重量。
Description
关于序列表的电子提交的声明
XML文本格式的序列表命名为1499-78_ST26.xml,大小为236,700字节,在2022年9月17日生成并随本申请提交,其公开内容通过引用并入本说明书中。
优先权声明
本申请根据35U.S.C.§119(e)要求于2021年10月7日提交的美国临时申请号63/253,179的权益,该申请的全部内容通过引用并入本文。
技术领域
本发明涉及用于修饰编码组蛋白去甲基化酶多肽的核酸的组合物和方法,所述组蛋白去甲基化酶多肽调节植物的小花育性、种子数量和/或种子重量,任选地,所述组蛋白去甲基化酶是Jumonji C型H3K9me2/me3甲基化酶。本发明还涉及使用本发明的方法和组合物产生的植物。
背景技术
小花育性是产量的关键组成部分,可直接影响单株种子数量或籽粒数量。谷物作物的一个共同特征是不育小花,玉米中的每个小穗有一个不育小花,并且在硬质小麦和面包小麦中有不同数量的不育侧生小花。这种性状被认为是祖传的,并且不育小花可能有助于作物祖先物种的谷粒分散。在小麦和大麦等小粒谷物中,增加的小花育性是驯化的目标,以增加谷粒数量和总产量。大麦和小麦中的几个参与小花育性的基因已进行良好表征,其中一些是通过自然变异研究鉴定的,另一些是通过诱变方法鉴定的。然而,这些直系同源物的功能在包括玉米在内的其它物种中是未知的。
需要用于改善小花育性、种子数量和/或种子重量的新策略来改善作物表现。
发明内容
本发明的一个方面提供了一种植物或其部分,所述植物或其部分包含内源性组蛋白去甲基化酶基因中的至少一个突变,所述组蛋白去甲基化酶基因编码组蛋白去甲基化酶多肽,所述组蛋白去甲基化酶多肽包含锌指DNA结合结构域(ZnF结构域)、Jumonji C型(Jmj-C)结构域和Jumonji N型(Jmj-N)结构域,其中所述突变破坏组蛋白去甲基化酶多肽与DNA的结合和/或降低组蛋白去甲基化酶多肽的组蛋白去甲基化活性,任选地,其中所述突变可以是非天然突变。
本发明的第二方面提供了一种包含编辑系统的植物细胞,所述编辑系统包含:(a)CRISPR相关效应蛋白;和(b)引导核酸(例如,gRNA、gDNA、crRNA、crDNA),所述引导核酸具有与编码组蛋白去甲基化酶的内源性靶基因互补的间隔序列,任选地所述组蛋白去甲基化酶是SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶,任选地是Jumonji C型H3K9me2/me3去甲基化酶。
本发明的第三方面提供了植物细胞,所述植物细胞包含组蛋白去甲基化酶基因的DNA结合位点中的突变,所述突变阻止或减少编码的组蛋白去甲基化酶与DNA的结合或降低编码的组蛋白去甲基化酶的活性,其中所述基因组修饰是使用编辑系统引入的置换、插入和/或缺失,所述编辑系统包含与组蛋白去甲基化酶基因中的靶位点结合的核酸结合结构域,其中所述组蛋白去甲基化酶基因:(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;和/或(b)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽,任选地,其中突变可以是非天然突变。
本发明的第四方面提供了一种提供具有增加的小花育性、增加的种子数量和/或增加的种子重量的多种植物的方法,所述方法包括在生长区域种植两种或更多种本发明的植物,从而提供与不包含突变并种植在生长区域的多种对照植物相比具有增加的小花育性、增加的种子数量和/或增加的种子重量的多种植物。
本发明的第五方面提供了一种产生/育种无转基因的基因组编辑(例如碱基编辑)的植物的方法,所述方法包括:(a)使本发明的植物与无转基因的植物杂交,从而将突变或修饰引入无转基因的(例如,子代)植物;以及(b)选择包含突变或修饰但无转基因的子代植物,从而产生无转基因的基因组编辑的(例如,碱基编辑的)植物。
第六方面提供了一种在植物的内源性组蛋白去甲基化酶基因中产生突变的方法,所述方法包括:(a)使基因编辑系统靶向内源性组蛋白去甲基化酶基因的部分,所述部分:(i)包含与SEQ ID NO:75、76、78、79、81、82、84或85中任一个具有至少80%的序列同一性的核苷酸序列和/或编码与SEQ ID NO:87、88、90或91中任一个具有至少80%的同一性的氨基酸序列,任选地包含与SEQ ID NO:75、78、81或84中任一个具有至少80%的序列同一性的核苷酸序列和/或编码与SEQ ID NO:87或SEQ ID NO:90具有至少80%的同一性的氨基酸序列,和/或(ii)包含与SEQ ID NO:77、80、83或86中任一个具有至少80%的序列同一性的核苷酸序列和/或编码与SEQ ID NO:89或92任一个具有至少80%的同一性的氨基酸序列;以及(b)选择包含位于内源性组蛋白去甲基化酶基因的部分中的修饰的植物,所述部分与SEQID NO:75、76、77、78、79、80、81、82、83、84、85或86中任一个核苷酸序列具有至少80%的序列同一性。
第七方面提供了一种在植物细胞的组蛋白去甲基化酶多肽中产生变异的方法,所述方法包括:将编辑系统引入植物细胞,其中所述编辑系统靶向植物细胞的组蛋白去甲基化酶基因的区域;并使组蛋白去甲基化酶基因的区域与所述编辑系统接触,从而将突变引入组蛋白去甲基化酶基因并在植物细胞的组蛋白去甲基化酶多肽中产生变异。
第八方面提供了一种检测植物的突变组蛋白去甲基化酶基因(内源性组蛋白去甲基化酶基因中的突变)的方法,所述方法包括在植物基因组中检测SEQ ID NO:69、70、72、73或75-87中任一个的核酸序列,所述核酸序列具有至少一个突变,所述突变破坏组蛋白去甲基化酶与DNA的结合或降低组蛋白去甲基化酶的组蛋白去甲基化活性。
本发明的第九方面提供了一种编辑植物细胞基因组中特定位点的方法,所述方法包括:以位点特异性方式切割植物细胞中内源性组蛋白去甲基化酶基因中的靶位点,所述内源性组蛋白去甲基化酶基因:(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;和/或(b)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽,从而在植物细胞的内源性组蛋白去甲基化酶基因中产生编辑。
第十方面提供了一种产生植物的方法,所述方法包括:(a)使包含编码组蛋白去甲基化酶的野生型内源性基因的植物细胞群体与靶向野生型内源性基因的核酸酶接触,其中所述核酸酶与结合野生型内源性基因中的靶位点的核酸结合结构域连接,所述内源性基因:(i)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%序列同一性的序列;和/或(ii)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽;(b)从所述群体中选择包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物细胞,其中所述突变是(i)或(ii)中任一多肽中至少一个氨基酸残基的置换和/或缺失,其中所述突变降低或消除组蛋白去甲基化酶结合DNA的能力或降低组蛋白去甲基化酶的组蛋白去甲基化活性;(c)使选择的植物细胞生长成包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物。
第十一方面提供了一种增加植物小花育性、种子数量和/或种子重量的方法,所述方法包括:(a)使包含编码组蛋白去甲基化酶的野生型内源性基因的植物细胞与靶向野生型内源性基因的核酸酶接触,其中所述核酸酶与结合野生型内源性基因中的靶位点的核酸结合结构域连接,所述野生型内源性基因:(i)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;和/或(ii)编码包含与SEQ ID NO:71或SEQID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽,从而产生包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物细胞;以及(b)使植物细胞生长成包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物,从而增加植物的小花育性、种子数量和/或种子重量。
第十二方面提供了一种产生植物或其部分的方法,所述植物或其部分包含至少一个具有内源性组蛋白去甲基化酶基因中的突变的细胞,所述方法包括使植物或植物部分中的组蛋白去甲基化酶基因中的靶位点与包含切割结构域和核酸结合结构域的核酸酶接触,其中所述核酸结合结构域与组蛋白去甲基化酶基因中的靶位点结合,其中所述组蛋白去甲基化酶基因:(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;和/或(b)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽,从而产生包含至少一个具有内源性组蛋白去甲基化酶基因中的突变的细胞的植物或其部分。
第十三方面提供了一种产生植物或其部分的方法,所述植物或其部分包含内源性组蛋白去甲基化酶中的突变,突变的组蛋白去甲基化酶具有减少的DNA结合或降低的活性,所述方法包括使植物或植物部分中的内源性组蛋白去甲基化酶基因中的靶位点与包含切割结构域和DNA结合结构域的核酸酶接触,其中所述核酸结合结构域与组蛋白去甲基化酶基因中的靶位点结合,其中所述组蛋白去甲基化酶基因:(a)包含与SEQ ID NO:69、70、72或73中任一个的核苷酸序列具有至少80%的序列同一性的序列;和/或(b)编码包含与SEQ IDNO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽,从而产生具有内源性组蛋白去甲基化酶中的突变的植物或其部分,突变的组蛋白去甲基化酶具有减少的DNA结合。
第十四个方面提供了与组蛋白去甲基化酶基因内的靶位点结合的引导核酸,所述组蛋白去甲基化酶基因包含与SEQ ID NO:69、70、72或73中任一个或多个核苷酸序列具有至少80%的同一性的序列;或编码与SEQ ID NO:71或74中任一个或多个氨基酸序列具有至少80%的序列同一性的序列,任选地,其中组蛋白去甲基化酶基因包含:(1)JmjN结构域,所述JmjN结构域:(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80%的序列同一性的多肽,(2)JmjC结构域,所述JmjC结构域:(a)与SEQ ID NO:76、79、82或85中任一个核苷酸具有至少80%的序列同一性,或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80%的序列同一性的多肽,和/或(3)ZnF结构域,所述ZnF结构域:(a)与SEQ IDNO:77、80、83或86中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ IDNO:89或SEQ ID NO:92的氨基酸序列具有至少80%的序列同一性的多肽。
第十五方面提供了一种系统,所述系统包含本发明的引导核酸和与所述引导核酸缔合的CRISPR-Cas效应蛋白。
第十六方面提供了一种基因编辑系统,所述基因编辑系统包含与引导核酸缔合的CRISPR-Cas效应蛋白,其中所述引导核酸包含与内源性组蛋白去甲基化酶基因结合的间隔序列。
在第十七方面,提供了一种包含CRISPR-Cas效应蛋白和引导核酸的复合物,所述CRISPR-Cas效应蛋白包含切割结构域,其中所述引导核酸与组蛋白去甲基化酶基因中的靶位点结合,所述组蛋白去甲基化酶基因包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;和/或编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽,其中所述切割结构域切割组蛋白去甲基化酶基因中的靶链。
在第十八方面,提供了一种表达盒,其包含:(a)编码包含切割结构域的CRISPR-Cas效应蛋白的多核苷酸和(b)与组蛋白去甲基化酶基因中的靶位点结合的引导核酸,其中所述引导核酸包含与组蛋白去甲基化酶基因中的靶位点互补并结合的间隔序列,所述组蛋白去甲基化酶基因包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;和/或编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽。
在另一方面,提供了包含本发明的核酸的植物或其部分,任选地,其中所述植物是玉米植物。
在另一方面,提供了一种植物或其部分,所述植物或其部分包含改善的小花育性和/或增加的种子数量和/或种子重量,任选地,其中所述植物是玉米植物。
在另一方面,提供了一种玉米植物或其部分,所述玉米植物或其部分包含位于1号染色体上且具有基因识别号(基因ID)Zm00001d030108或位于5号染色体上且具有基因IDZm00001d014422的内源性SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶基因中的至少一个非自然突变,任选地,其中所述至少一个突变导致突变的SHI基因,所述突变的SHI基因与SEQ ID NO:107、109、111、113、115、117、119和121中任一个具有至少90%的序列同一性,任选地,其中所述突变的SHI基因编码与SEQ ID NO:108、110、112、114、116、118、120或122中任一个具有至少90%的序列同一性的突变的VRS2多肽序列,任选地,其中所述至少一个突变是非自然突变。
在另一方面,提供了一种引导核酸,所述引导核酸与玉米植物的内源性SIX-ROWEDSPIKE 3(VRS3)组蛋白去甲基化酶基因中的靶核酸结合,其中所述靶核酸位于1号染色体上并具有基因识别号(基因ID)Zm00001d030108或位于5号染色体上并具有基因IDZm00001d014422。
还提供了在其基因组中包含通过本发明方法产生的一个或多个突变的组蛋白去甲基化酶基因的植物,以及用于产生本发明的植物的多肽、多核苷酸、核酸构建体、表达盒和载体。
本发明的这些和其它方面在下文对本发明的描述中更详细地阐述。
序列的简要说明
SEQ ID NO:1-17是用于本发明的示例性Cas12a氨基酸序列。
SEQ ID NO:18-20是用于本发明的示例性Cas12a核苷酸序列。
SEQ ID NO:21-22是编码启动子和内含子的示例性调控序列。
SEQ ID NO:23-29是用于本发明的示例性胞嘧啶脱氨酶序列。
SEQ ID NO:30-40是用于本发明的示例性腺嘌呤脱氨酶氨基酸序列。
SEQ ID NO:41是用于本发明的示例性尿嘧啶DNA糖基化酶抑制剂(UGI)序列。
SEQ ID NO:42-44提供了用于本发明的实例肽标签和亲和多肽。
SEQ ID NO:45-55提供了用于本发明的实例RNA募集基序和相应的亲和多肽。
SEQ ID NO:56-57是用于本发明的示例性Cas9多肽序列。
SEQ ID NO:58-68是用于本发明的示例性Cas9多核苷酸序列。
SEQ ID NO:69和SEQ ID NO:72是实例VRS3基因组序列,分别位于1和5号染色体上。
SEQ ID NO:70和SEQ ID NO:73分别是SEQ ID NO:69和SEQ ID NO:72的实例VRS3编码(cDNA,cds)序列。
SEQ ID NO:71和SEQ ID NO:74是由SEQ ID NO:69和SEQ ID NO:72编码的实例VRS3多肽序列。
SEQ ID NO:75-86是来自VRS3多核苷酸的实例核酸序列(区域)(SEQ ID NO:75,78(JmjN,1号染色体)、SEQ ID NO:76,79(JmjC,1号染色体)、SEQ ID NO:77,80(ZfN,1号染色体)、SEQ ID NO:81,84(JmjN,5号染色体)、SEQ ID NO:82,85(JmjC,5号染色体)、SEQ IDNO:83,86(ZfN,5号染色体))。
SEQ ID NO:87-92是来自VRS3多肽的实例氨基酸序列(区域)(SEQ ID NO:87(JmjN,1号染色体)、SEQ ID NO:88(JmjC,1号染色体)、SEQ ID NO:89(ZfN,1号染色体)、(SEQ ID NO:(JmjN,5号染色体)、SEQ ID NO:91(JmjC,5号染色体)、SEQ ID NO:92(ZfN,5号染色体))。
SEQ ID NO:93-103是用于本发明的核酸引导物的实例间隔序列。
SEQ ID NO:104、106或108是编辑的VRS2基因组序列,分别编码SEQ ID NO:105、107或109的突变的VRS2多肽序列。
具体实施方式
现在将在下文中参考所附的实施例来描述本发明,在实施例中示出了本发明的实施方案。该描述并不旨在成为可实施本发明的所有不同方式或可添加到本发明的所有特征的详细目录。例如,关于一个实施方案示出的特征可以合并到其它实施方案中,并且关于特定实施方案示出的特征可以从该实施方案中删除。因此,本发明预期在本发明的一些实施方案中,可以排除或省略本文阐述的任何特征或特征的组合。另外,根据本公开,对本文提出的各种实施方案的多种变化和添加对于本领域技术人员来说将是显而易见的,这些变化和添加不背离本发明。因此,以下描述旨在说明本发明的一些特定实施方案,而不是穷举地指定其所有排列、组合和变化。
除非另外定义,本文中使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同含义。本文中在本发明的描述中使用的术语仅用于描述特定实施方案的目的,并且不旨在限制本发明。
本文引用的所有出版物、专利申请、专利和其它参考文献均通过引用以其整体并入,以用于与其中呈现参考文献的句子和/或段落相关的教导。
除非上下文另有说明,否则具体意在本文描述的本发明的各种特征可以以任何组合使用。此外,本发明还考虑到在本发明的一些实施方案中,可以排除或省略本文阐述的任何特征或特征的组合。为了说明,如果说明书陈述组合物包含组分A、B和C,则具体意在A、B或C中的任一个或其组合可以单独地或以任何组合地被省略和放弃。
如本发明的描述和所附权利要求中所使用的,单数形式“一种”、“一个”和“该/所述”也旨在包括复数形式,除非上下文明确地另有说明。
同样如本文所使用的,“和/或”是指并涵盖一个或多个相关的列出项目的任何和所有可能的组合,以及当以替代方式(“或”)解释时缺少组合。
如本文所用的术语“约”当指可测量值诸如量或浓度等时,意在涵盖规定值的±10%、±5%、±1%、±0.5%或甚至±0.1%的变化以及规定值。例如,“约X”,其中X是可测量值,意在包括X以及X的±10%、±5%、±1%、±0.5%或甚至±0.1%的变化。本文提供的可测量值的范围可以包括其中的任何其它范围和/或单个值。
如本文所用,短语诸如“在X和Y之间”和“在约X和Y之间”应当解释为包括X和Y。如本文所用,短语诸如“在约X和Y之间”是指“在约X和约Y之间”,短语诸如“从约X到Y”是指“从约X到约Y”。
除非本文另有说明,本文中数值范围的列举仅旨在用作单独提及落入该范围内的每个单独值的简写方法,并且每个单独值并入说明书中,如同其在本文中被单独描述一样。例如,如果公开了范围10至15,则也公开了11、12、13和14。
如本文所用的术语“包含”指定所陈述的特征、整数、步骤、操作、元件和/或组件的存在,但不排除一个或多个其它特征、整数、步骤、操作、元件、组件和/或其组的存在或添加。
如本文所用,过渡短语“基本上由......组成”意味着权利要求的范围应被解释为涵盖权利要求中列举的指定材料或步骤以及不实质上影响所要求保护的发明的基本和新颖特征的那些材料或步骤。因此,当用在本发明的权利要求中时,术语“基本上由......组成”不旨在被解释为等同于“包含”。
如本文所用,术语“增加”、“增强”(及其语法变体)描述了与对照相比,至少约5%、10%、15%、20%、25%、50%、75%、100%、150%、200%、300%、400%、500%或更多的升高。例如,如本文所述的包含VRS3基因中的突变的植物可以表现出增加的小花育性或增加的种子产量,包括增加的种子重量和/或种子数量,比没有相同突变的植物(例如,与不包含突变的同基因植物(例如,野生型未编辑的植物或空缺分离体)相比)高至少约5%(例如,增加约5%至约100%,任选地,增加约10%至约30%)。
如本文所用,术语“减少”、“减小”和“降低”(及其语法变体)描述,例如,与对照相比,至少约5%、10%、15%、20%、25%、35%、50%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的减少。在特定实施方案中,减少可导致没有或基本上没有(即,不显著的量,例如,小于约10%或甚至5%)可检测的活性或量。例如,如本文所述的包含VRS3基因中的突变的植物可以包含产生具有减少的DNA结合和/或降低的去甲基化酶活性的VRS3多肽的VRS3基因,与没有相同突变的植物相比(例如,与不包含突变的同基因植物(例如,野生型未编辑的植物或空缺分离体)相比),DNA结合和/或去甲基化酶活性降低至少约5%。在一些实施方案中,具有如本文所述的突变的VRS3基因的表达可以降低至少5%。
如本文所用,关于核酸分子和/或核苷酸序列(例如,RNA或DNA)的术语“表达”等表示核酸分子和/或核苷酸序列被转录并且任选地被翻译。因此,核酸分子和/或核苷酸序列可以表达感兴趣的多肽或例如功能性非翻译RNA。
“异源”或“重组”核苷酸序列是与其引入的宿主细胞不天然相关的核苷酸序列,包括天然存在的核苷酸序列的非天然存在的多个拷贝。
“天然”或“野生型”核酸、核苷酸序列、多肽或氨基酸序列是指天然存在的或内源的核酸、核苷酸序列、多肽或氨基酸序列。因此,例如,“野生型内源性VRS3基因”是在参考生物体(例如植物)中天然存在或是参考生物体(例如植物)内源的VRS3基因。
如本文所用,术语“杂合的”是指其中不同等位基因位于同源染色体上的相应基因座处的遗传状态。
如本文所用,术语“纯合的”是指其中相同等位基因位于同源染色体上的相应基因座处的遗传状态。
如本文所用,术语“等位基因”是指在特定基因座处出现的两种或更多种不同核苷酸或核苷酸序列之一。
“无效等位基因”是由基因突变引起的无功能等位基因,其导致相应蛋白质的产生完全缺乏或产生无功能的蛋白质。
“隐性突变”是基因中的当纯合时产生表型但当基因座杂合时表型不可观察到的突变。
“显性负性突变”是产生改变的基因产物(例如,相对于野生型具有异常功能)的突变,该基因产物不利地影响野生型等位基因或基因产物的功能。例如,“显性负性突变”可以阻断野生型基因产物的功能。显性负性突变也可称为“反效等位基因突变”。
“半显性突变”是指杂合生物体中表型的外显率小于纯合生物体中观察到的表型外显率的突变。
“弱功能丧失突变”是导致基因产物与野生型基因产物相比具有部分功能或功能降低(部分失活)的突变。
“亚效等位基因突变”是导致基因功能部分丧失的突变,其可以通过表达减少(例如,蛋白质减少和/或RNA减少)或功能性能降低(例如,活性降低)而发生,但不是完全丧失功能/活性。“亚效”等位基因是由基因突变引起的半功能等位基因,其导致产生以正常效率的1%-99%之间的任何水平发挥作用的相应蛋白质。
“超等位基因突变”是导致基因产物的表达增加和/或基因产物的活性增加的突变。
“基因座”是染色体上基因或标记或等位基因所在的位置。在一些实施方案中,基因座可涵盖一个或多个核苷酸。
如本文所用,术语“所需等位基因”、“靶等位基因”和/或“感兴趣的等位基因”可互换使用,指与所需性状相关的等位基因。在一些实施方案中,所需等位基因可以与给定性状的增加或减少(相对于对照)相关,这取决于所需表型的性质。
当性状与标记连锁时,并且当该标记的存在是包含该标记的植物/种质中是否和/或以何种程度出现所需性状或性状形式的指示时,该标记与该性状“相关”。类似地,当标记与等位基因或染色体区间连锁并且当标记的存在是等位基因或染色体区间是否存在于包含标记的植物/种质中的指示时,该标记与该等位基因或染色体区间“相关”。
如本文所用,术语“回交”是指子代植物与其亲本之一杂交一次或多次(例如1、2、3、4、5、6、7、8次等)。在回交方案中,“供体”亲本是指具有要渗入的所需基因或基因座的亲本植物。“受体亲本(使用一次或多次)或“轮回”亲本(使用两次或更多次)是指基因或基因座渗入其中的亲本植物。例如,参见Ragot,M.等人,Marker-assisted Backcrossing:APractical Example,in TECHNIQUES ET UTILISATIONSDES MARQUEURS MOLECULAIRES LESCOLLOQUES,Vol.72,第45-56页(1995);和Openshaw等人,Marker-assisted Selection inBackcross Breeding,in PROCEEDINGS OF THE SYMPOSIUM"ANALYSIS OF MOLECULARMARKER DATA,"第41-43页(1994)。初始的杂交产生F1代。术语“BC1”是指轮回亲本的第二次使用,“BC2”是指轮回亲本的第三次使用,依此类推。
如本文所用,术语“杂交”是指通过授粉的配子融合以产生子代(例如,细胞、种子或植物)。该术语涵盖有性杂交(一株植物通过另一株植物授粉)和自交(自花授粉,例如当花粉和胚珠来自同一植物时)。术语“杂交”是指通过授粉融合配子以产生子代的行为。
如本文所用,术语“基因渗入”是指一个或多个遗传基因座的所需等位基因或所需等位基因的组合从一种遗传背景到另一种遗传背景的天然和人工传递。例如,特定基因座处的所需等位基因可以通过同一物种的两个亲本之间的有性杂交传递给至少一个子代,其中至少一个亲本在其基因中具有所需等位基因。备选地,例如,等位基因的传递可以通过两个供体基因组之间的重组而发生,例如在融合的原生质体中,其中至少一个供体原生质体在其基因组中具有所需的等位基因。所需的等位基因可以是标记、QTL、转基因等的选定等位基因。包含所需等位基因的子代可以与具有所需遗传背景的品系回交一次或多次(例如,1、2、3、4或更多次),针对所需等位基因进行选择,结果是所需等位基因固定在所需的遗传背景中。例如,与非水胁迫条件下增加的产量相关的标记可以从供体渗入到不包含该标记并且在非水胁迫条件下不表现出增加的产量的轮回亲本中。然后可以使所得子代回交一次或多次并进行选择,直到子代在轮回亲本背景中拥有与非水胁迫条件下产量增加相关的遗传标记为止。
“遗传图谱”是对给定物种内一个或多个染色体上的基因座之间遗传连锁关系的描述,通常以图表或表格形式描绘。对于每个遗传图谱,基因座之间的距离是通过它们之间的重组频率来测量的。可以使用多种标记来检测基因座之间的重组。遗传图谱是做图群体、所用标记类型以及不同群体之间每个标记的多态性潜力的产物。基因座之间的顺序和遗传距离可以因遗传图谱而异。
如本文所用,术语“基因型”是指个体(或个体群体)在一个或多个遗传基因座处的遗传构成,与可观察和/或可检测和/或表现的性状(表型)形成对比。基因型是由个体从其亲本遗传的一个或多个已知基因座的等位基因定义的。术语基因型可用于指代个体在单个基因座、多个基因座处的遗传构成,或更一般地,术语基因型可用于指个体基因组中所有基因的遗传组成。基因型可以例如使用标记间接表征和/或通过核酸测序直接表征。
如本文所用,术语“种质”是指个体(例如植物)、一组个体(例如植物品系、品种或科)或衍生自品系、品种、物种或培养物的克隆的遗传物质或来自个体(例如植物)、一组个体(例如植物品系、品种或科)或衍生自品系、品种、物种或培养物的克隆的遗传物质。种质可以是生物体或细胞的一部分或者可以与生物体或细胞分开。一般来说,种质提供具有特定遗传组成的遗传物质,为生物体或细胞培养物的部分或全部遗传品质提供基础。如本文所用,种质包括可生长新植物的细胞、种子或组织,以及可培养成完整植物的植物部分(例如叶、茎、芽、根、花粉、细胞等)。
如本文所用,术语“栽培品种”和“品种”是指通过结构或遗传特征和/或性能可与同一物种内的其它品种区分开的一组相似植物。
如本文所用,术语“外来”、“外来品系”和“外来种质”是指非良种的任何植物、品系或种质。一般而言,外来植物/种质并非源自任何已知的优良植物或种质,而是被选择以将一种或多种所需的遗传元件引入育种计划中(例如,将新的等位基因引入育种计划中)。
如本文所用,术语“杂种”在植物育种的背景下是指通过使不同品系或品种或物种的植物杂交产生的遗传上不同的亲本的子代的植物,所述杂交包括但不限于两个自交系之间的杂交。
如本文所用,术语“近交”是指基本上纯合的植物或品种。该术语可以指在整个基因组中基本上纯合的植物或植物品种,或者关于特别感兴趣的基因组的一部分基本上纯合的植物或植物品种。
“单倍型”是个体在多个遗传基因座处的基因型,即等位基因的组合。通常,定义单倍型的遗传基因座在物理上和遗传上是连锁的,即在相同的染色体节段上。术语“单倍型”可以指特定基因座处的多态性,诸如单个标记基因座,或者沿着染色体节段的多个基因座处的多态性。
如本文所用,术语“异源”是指源自外来物种的核苷酸/多肽,或者如果来自同一物种,则通过人为干预在组成和/或基因组位点上从其天然形式进行实质性修饰。
如本文所用,“对照植物”是指不包含本文所述的编辑的组蛋白去甲基化酶基因的植物,所述编辑的组蛋白去甲基化酶基因赋予增强/改善的性状或改变的表型(例如减少的收获后黄化/减少的叶绿素降解)。对照植物用于鉴别和选择如本文所述进行编辑的并且与对照植物相比具有增强的性状或改变的表型的植物。合适的对照植物可以是用于产生包含突变的去甲基化酶基因的植物的亲本系的植物,例如,缺乏如本文所述的内源性去甲基化酶基因中的编辑的野生型植物。合适的对照植物还可以是含有赋予其它性状的重组核酸的植物,例如,具有增强的除草剂耐受性的转基因植物。在一些情况下,合适的对照植物可以是缺乏如本文所述的突变的甲基化酶基因的杂合或半合转基因植物品系的子代,称为负分离体或负同基因系。
增强的性状(例如,改善的产量性状)可以包括,例如,与对照植物相比,从种植到成熟的天数减少、增加的茎大小、增加的叶数、增加的营养阶段株高生长速率、增加的穗大小、增加的每株植物穗干重、增加的每穗籽粒数、增加的每籽粒重量、增加的每株籽粒数、减少的穗空、延长的灌浆期、降低的株高、增加的根分枝数量、增加的总根长、增加的产量、提高的氮利用效率和/或提高的水利用效率。改变的表型可以是,例如,株高、生物量、冠层面积、花青素含量、叶绿素含量、施用的水、含水量和水利用效率。
在一些实施方案中,本发明的植物可以包含一种或多种改善的产量性状,包括但不限于,在一些实施方案中,一种或多种改善的产量性状包括:与没有至少一个突变的对照植物相比,更高的产量(蒲式耳/英亩)、增加的生物量、增加的株高、增加的茎直径、增加的叶面积、增加的花数、增加的籽粒行数(任选地其中穗长没有显著减少)、增加的籽粒数、增加的籽粒大小、增加的穗长、减少的分蘖数、减少的雄穗分枝数、增加的荚果数量(包括增加的每个节点的荚果数和/或增加的每株植物的荚果数)、每个荚果增加的种子数量、增加的种子数量、增加的种子大小和/或增加的种子重量(例如,增加的百粒种子重量)。在一些实施方案中,与对照植物或其部分相比,本发明的植物可以包含一种或多种改善的产量性状,包括但不限于,任选地,增加的产量(蒲式耳/英亩)、种子大小(包括籽粒大小)、种子重量(包括籽粒重量)、增加的籽粒行数(任选地其中穗长不显著减少)、增加的荚果数量、每个荚果增加的种子数量以及增加的穗长。
如本文所用,“性状”是植物或特定植物材料或细胞的生理学、形态学、生物化学或物理特征。在一些情况下,该特征是人眼可见的并且可以机械地测量,诸如种子或植物的大小、重量、形状、形式、长度、高度、生长速率和发育阶段,或者可以通过生物化学技术测量,诸如检测种子或叶的蛋白质、淀粉、某些代谢物或油含量,或通过观察代谢或生理过程而测量,例如,通过测量对缺水或特定盐或糖浓度的耐受性,或通过测量一个或多个基因的表达水平而测量,例如,通过采用Northern分析、RT-PCR、微阵列基因表达测定或报告基因表达系统,或通过农业观察诸如高渗胁迫耐受性或产量而测量。然而,任何技术都可以用来测量转基因植物中任何选定的化学化合物或大分子的量、比较水平或差异。
如本文所用,“增强的性状”是指由如本文所述的SGR基因中的突变引起的植物特征。此类性状包括但不限于,增强的农艺性状,其特征在于增强的植物形态学、生理学、生长和发育、产量、营养增强、病害或害虫抗性、或环境或化学耐受性。在一些实施方案中,增强的性状/改变的表型可以是,例如,从种植到成熟的天数减少、增加的茎大小、增加的叶数、增加的营养阶段株高生长速率、增加的穗大小、增加的每株植物穗干重、增加的每穗籽粒数、增加的每籽粒重量、增加的每株植物籽粒数、减少的穗空、延长的灌浆期、降低的株高、增加的根分枝数量、增加的总根长、耐旱性、提高的水利用效率、耐寒性、提高的氮利用效率和/或增加的产量。在一些实施方案中,性状是在非胁迫条件下增加的产量或在环境胁迫条件下增加的产量。胁迫条件可包括生物胁迫和非生物胁迫,例如,干旱、荫蔽、真菌病、病毒病、细菌病、昆虫侵扰、线虫侵扰、低温暴露、热暴露、渗透胁迫、氮养分利用度降低、磷养分利用度降低和高植株密度。“产量”可以受到许多特性的影响,包括但不限于株高、植物生物量、荚果数、植株上的荚果位置、节间数、荚果开裂的发生率、籽粒大小、穗大小、穗尖灌浆度、籽粒败育、结瘤和固氮效率、养分同化效率、生物和非生物胁迫抗性、碳同化、植物结构、抗倒伏性、种子发芽率、幼苗活力和子苗性状。产量还可能受到以下因素的影响:发芽效率(包括胁迫条件下的发芽)、生长速率(包括胁迫条件下的生长速率)、开花时间和持续时间、穗数、穗大小、穗重量、每穗或荚果的种子数、种子大小、种子的成分(淀粉、油、蛋白质)和种子饱满的特征。
还如本文所用,术语“性状修饰”涵盖通过在包含如本文所述的内源性SGR基因中的突变的植物中相对于不包含该突变的植物(诸如野生植型物,或负分离体)产生可检测到的特征差异来改变天然存在的性状。在一些情况下,可以定量评估性状修饰。例如,与对照植物相比,性状修饰可以导致观察到的性状特征或表型的增加或减少。众所周知,在经过修饰的性状中可以存在自然变异。因此,与对照植物相比,观察到的性状修饰可以导致植物中性状特征或表型的正态分布和幅度的变化。
本公开涉及一种具有改善的经济相关特性、更具体是具有增加的产量和/或改善的植物结构(其有助于改善的产量性状)的植物。更具体地,本公开涉及如本文所述的包含SGR基因中的突变的植物,其中与没有所述突变的对照植物相比,所述植物具有增加的产量。在一些实施方案中,如本文所述产生的植物与对照植物相比表现出增加的产量或改善的产量性状成分,任选地,改善的植物结构(例如,增加的分枝、增加的节数、半矮小的株高)。在一些实施方案中,本公开的植物表现出与产量有关的改善的性状,包括但不限于增加的氮利用效率、增加的氮胁迫耐受性、增加的水利用效率和/或增加的耐旱性,如下文所定义和讨论的。
产量可以定义为作物的可测量的经济价值产生。产量可以在数量和/或质量的范围内定义。产量可以直接取决于几个因素,例如器官的数量和大小(例如花数)、植物结构(诸如分枝数、植物生物量,例如增加的根生物量、更陡的根角和/或更长的根等)、开花时间和持续时间、谷物灌浆期。根系结构和发育、光合效率、养分吸收、胁迫耐受性、早期活力、延迟衰老和功能性滞绿表型可能是决定产量的因素。因此,优化上述因素有助于提高作物产量。
本文提及的产量相关性状的增加/改善也可以被认为是指植物的一个或多个部分的生物量(重量)的增加,其可以包括地上和/或地下(可收获的)植物部分。具体地,此类可收获部分是种子,并且本公开的方法的实施导致相对于合适的对照植物的种子产量具有增加的产量、特别是增加的种子产量的植物。术语植物的“产量”可以涉及该植物的营养生物量(根和/或枝条生物量)、繁殖器官和/或繁殖体(诸如种子)。
本公开的植物增加的产量可以通过多种方式测量,包括测试重量、每株植物的种子数、种子重量、每单位面积的种子数(例如,每英亩的种子或种子的重量)、每英亩蒲式耳数、每英亩吨数或每公顷公斤数。增加的产量可以通过改善关键生化化合物(诸如氮、磷和碳水化合物)的利用,或改善对环境胁迫(诸如冷、热、干旱、盐、荫蔽、高植株密度以及害虫或病原体攻击)的反应来实现。
“增加的产量”可以表现为以下一种或多种:(i)植物的一个或多个部分,特别是植物的地上(可收获)部分的增加的植物生物量(重量),增加的根生物量(增加的根数、增加根厚度、增加根长度)或增加的任何其它可收获部分的生物量;或(ii)增加的早期活力,本文定义为发芽后约三周的幼苗地上面积的提高。
“早期活力”是指活跃健康的植物生长,尤其是在植物生长的早期阶段,并且可以由于例如植物更好地适应其环境(例如,优化对能源的利用、对养分的吸收以及在芽和根之间分配碳)引起的植物适应度增加产生。例如,早期活力可以是种子在种植后发芽和出苗的能力以及幼苗在出苗后生长和发育的能力的组合。具有早期活力的植物还表现出增加的幼苗存活率和更好的作物种植,这通常导致高度均匀的田地,其中大多数植物基本上同时达到各个发育阶段,这通常导致产量增加。因此,早期活力可以通过测量各种因素来确定,诸如籽粒重量、发芽率、出苗率、幼苗生长、幼苗高度、根长、根和芽生物量、冠层大小和颜色等。
此外,增加的产量还可以表现为增加的总种子产量,这可以由于下列中的一种或多种所致:由于基于每株植物和/或单个种子的种子重量的增加所致的种子生物量(种子重量)的增加,例如,每株植物的花/圆锥花序数量增加;荚果数量增加;节数量增加;每个圆锥花序/植物的花(“小花”)数量增加;种子饱满率提高;饱满种子的数量增加;种子大小(长度、宽度、面积、周长和/或重量)的增加,这也会影响种子的组成;和/或种子体积增加,这也会影响种子的组成。在一个实施方案中,增加的产量可以是增加的种子产量,例如,增加的种子重量;增加的饱满种子数量;和/或增加的收获指数。
增加的产量还可以导致结构改变,或者可以由于植物结构改变而发生。
增加的产量也可以表现为收获指数的增加,收获指数表示为可收获部分(诸如种子)的产量与总生物量的比率。
本公开还延伸至植物的可收获部分,诸如但不限于种子、叶、果实、花、棉铃、荚果、长角果、坚果、茎、根茎、块茎和球茎。本公开还涉及源自此类植物的可收获部分的产品,诸如干颗粒、粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
本公开提供了用于增加植物的“产量”或植物或植物部分的“泛英亩产量(broadacre yield)”的方法,其被定义为每单位面积可收获的植物部分,例如种子,或种子的重量,每英亩,每英亩磅数、每英亩蒲式耳数、每英亩吨数(tones per acre)、每英亩吨数、每公顷公斤数。
如本文所用,“氮利用效率”是指导致施用的每单位氮的植物产量、生物量、活力和生长速率增加的过程。这些过程可以包括植物对氮的吸收、同化、积累、信号传导、传感、再转移(在植物内)和利用。
如本文所用,“提高的氮利用效率”是指在经受与正常或标准条件下相同的可利用/施用量的氮时,植物比正常情况更快或更好地生长、发育或产出的能力;在经受低于最适的可利用/施用量的氮,或在氮限制条件下植物正常生长、发育或产出的能力,或更快或更好地生长、发育或产出的能力。
如本文所用,“氮限制条件”是指提供低于植物充分或成功的代谢、生长、繁殖成功和/或存活所需的最适氮量的生长条件或环境。
如本文所用,“增加的氮胁迫耐受性”是指在经受低于最适的可利用/施用量的氮时,或在氮限制条件下植物正常生长、发育或产出的能力,或更快或更好地生长、发育或产出的能力。
增加的植物氮利用效率可以在田间转化为在供应较少的氮的同时收获相似数量的产量,或者通过供应最适/足够量的氮来获得增加的产量。提高的氮利用效率可以提高植物氮胁迫耐受性,还可以改善作物品质和种子的生化成分,诸如蛋白质产量和油产量。术语“增加的氮利用效率”、“提高的氮利用效率”和“氮胁迫耐受性”在本公开中可互换使用,是指在氮限制条件下具有提高的生产力的植物。
如本文所用,“水利用效率”是指每单位蒸腾的水蒸气被叶子同化的二氧化碳的量。它是控制干燥环境中植物生产力的最重要性状之一。“耐旱性”是指植物适应干旱或干旱条件的程度。植物对缺水的生理反应包括叶子枯萎、叶面积减小、叶离现象以及通过将养分引导到植物的地下部分来刺激根部生长。通常,植物在开花和种子发育(繁殖阶段)期间更容易受到干旱的影响,因为植物的资源被用来支持根系生长。此外,脱落酸(ABA)是一种植物应激激素,诱导叶片气孔(参与气体交换的微孔)关闭,从而减少蒸腾作用造成的水分损失,并降低光合作用速率。这些反应在短期内提高了植物的水利用效率。术语“增加的水利用效率”、“提高的水利用效率”和“增加的耐旱性”在本公开中可互换使用,是指在水限制条件下具有改善的生产力的植物。
如本文所用,“增加的水利用效率”是指在经受与正常或标准条件下相同的可利用/施用量的水时,植物比正常情况更快或更好地生长、发育或产出的能力;在经受减少的可利用/施用量的水(水输入)时,或在水分胁迫或缺水胁迫的条件下植物正常生长、发育或产出的能力,或更快或更好地生长、发育或产出的能力。
如本文所用,“增强的耐旱性”是指在经受减少的可利用/施用量的水和/或在短期或长期干旱的条件下,植物正常生长、发育或产出的能力,或者比正常情况更快或更好地生长、发育或产出的能力;在经受减少的可利用/施用量的水(水输入)时,或在缺水胁迫的条件下或短期或长期干旱的条件下植物正常生长、发育或产出的能力。
如本文所用,“干旱胁迫”是指导致缺水并使植物受到胁迫和/或对植物组织造成损害和/或对谷物/作物产量产生负面影响的干旱期(短期或长期/延长);导致缺水和/或温度升高并使植物受到胁迫和/或对植物组织造成损害和/或对谷物/作物产量产生负面影响的干旱期(短期或长期/延长)。
如本文所用,“缺水”是指提供低于植物充分/成功的生长和发育所需的最适水量的条件或环境。
如本文所用,“水分胁迫”是指提供相对于植物/作物充分/成功的生长和发育所需的水量不适当(较少/不足或更多/过量)的水量的条件或环境,从而使植物受到胁迫和/或对植物组织造成损害和/或对谷物/作物产量产生负面影响。
如本文所用,“缺水胁迫”是指提供相对于植物/作物充分/成功的生长和发育所需的水量较少/不足的水量的条件或环境,从而使植物受到胁迫和/或对植物组织造成损害和/或对谷物产量产生负面影响。
如本文所用,术语“核酸”、“核酸分子”、“核苷酸序列”和“多核苷酸”是指线性或支链、单链或双链的RNA或DNA,或其杂交体。该术语还涵盖RNA/DNA杂交体。当合成产生dsRNA时,不太常见的碱基,诸如肌苷、5-甲基胞嘧啶、6-甲基腺嘌呤、次黄嘌呤等也可用于反义、dsRNA和核酶配对。例如,含有尿苷和胞苷的C-5丙炔类似物的多核苷酸已被证明以高亲和力结合RNA,并且是基因表达的有效反义抑制剂。也可以进行其它修饰,诸如对磷酸二酯骨架或RNA核糖基团中的2'-羟基的修饰。
如本文所用,术语“核苷酸序列”是指核苷酸的异聚物或这些核苷酸从核酸分子的5'至3'端的序列,包括DNA或RNA分子,包括cDNA、DNA片段或部分、基因组DNA、合成(例如化学合成)DNA、质粒DNA、mRNA和反义RNA,其中任一个都可以是单链或双链。术语“核苷酸序列”、“核酸”、“核酸分子”、“核酸构建体”、“寡核苷酸”和“多核苷酸”在本文中也可互换使用,以指代核苷酸的异聚物。本文提供的核酸分子和/或核苷酸序列在此从左到右以5'至3'方向呈现,并使用美国序列规则37CFR§§1.821-1.825中规定的用于表示核苷酸字符的标准代码和世界知识产权组织(WIPO)标准ST.25表示。本文中使用的“5'区域”可以表示最接近多核苷酸5'端的多核苷酸区域。因此,例如,多核苷酸5'区域中的元素可以位于从位于多核苷酸5'端的第一个核苷酸到位于多核苷酸中间的核苷酸的任何位置。如本文中使用的“3'区域”可以表示最接近多核苷酸3'端的多核苷酸区域。因此,例如,多核苷酸3'区域中的元素可以位于从位于多核苷酸3'端的第一个核苷酸到位于多核苷酸中间的核苷酸的任何位置。
如本文所用,关于核酸,术语“片段”或“部分”是指相对于参考核酸长度减少的核酸(例如,减少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、400、450、500、550、600、650、700、750、800、850、900、950或1000个或更多个核苷酸,或其中的任何范围或值),并且包含下列核苷酸序列,或基本上由下列核苷酸序列组成和/或由下列核苷酸序列组成:与参考核酸的对应部分相同或几乎相同(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同)的连续核苷酸的核苷酸序列。在适当情况下,这种核酸片段可以包含在较大的多核苷酸中。作为实例,本发明的引导核酸的重复序列可以包含野生型CRISPR-Cas重复序列的“部分”(例如,野生型CRISPR-Cas重复序列;例如,来自例如Cas9、Cas12a(Cpf1)、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b和/或Cas14c等的CRISPR Cas系统的重复序列。在一些实施方案中,核酸片段可包含下列连续核苷酸、基本上由下列连续核苷酸组成或由下列连续核苷酸组成:编码VRS3多肽的核酸(例如,基因组DNA或编码区)的20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、101、102、103、104、105、106、107、108、109、110、120、140、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、166、167、168、169、170、180、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、220、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、300、350、360、361、362、363、364、365、366、367、368、369、370、380、390、400、450、500、510、520、530、531、532、533、534、535、536、537、538、539、540、550、560、570、580、590或600个或更多个连续核苷酸,或其中的任何范围或值,任选地,VRS3多核苷酸的片段可以是约20个核苷酸至约120个核苷酸,约20个核苷酸至约250个核苷酸,约20个核苷酸至约600个核苷酸,约100个核苷酸至约250个核苷酸,约100个核苷酸至约400个核苷酸,约150个核苷酸至约400个核苷酸,约200个核苷酸至约600个核苷酸,例如,约20、40、60、80、100、120、140、160、180或200个核苷酸至约210、220、240、260、280、300、350、400、450、500、550或600个或更多个连续核苷酸。
在一些实施方案中,VRS3基因的核酸片段可以是从3'端/区域、5'端/区域和/或从编码VRS3基因的基因内缺失核苷酸的结果。在一些实施方案中,VRS3核酸的缺失包括从VRS3基因的JmjN结构域、JmjC结构域和/或锌指(ZnF)结构域缺失部分连续核苷酸,其中所述VRS3基因包含例如SEQ ID NO:69、70、72或73的核苷酸序列或包含与SEQ ID NO:69、70、72或73具有至少80%分序列同一性的序列的核酸。在一些实施方案中,VRS3基因的JmjN结构域包含SEQ ID NO:75、78、81或84中任一个的核苷酸序列,或与SEQ ID NO:75、78、81或84中任一个具有至少80%序列同一性的序列,VRS3基因的JmjC结构域包含SEQ ID NO:76、79、82或85中任一个的核苷酸序列,或与SEQ ID NO:76、79、82或85中任一个具有至少80%序列同一性的序列,和/或VRS3基因的锌指(ZnF)结构域包含SEQ ID NO:77、80、83或86中任一个的核苷酸序列,或与SEQ ID NO:77、80、83或86中任一个具有至少80%序列同一性的序列。在一些实施方案中,这种缺失可以是点突变,当其包含在植物中时,可以导致植物具有增加的小花育性、增加的种子重量和/或增加的种子数量。在一些实施方案中,这种缺失可以是显性负性突变、半显性突变、弱功能丧失突变、亚效等位基因突变或无效突变,当包含在植物中时,可以导致植物具有增加的小花育性、增加的种子数量(例如,籽粒数量)和/或增加的种子重量(例如,籽粒重量)(与没有相同突变的植物相比,例如,不包含突变的同基因植物(例如,野生型未编辑的植物或空缺分离体))。
如本文所用,关于多肽,术语“片段”或“部分”可以指相对于参考多肽长度减少的多肽,并且包含下列氨基酸序列,基本上由下列氨基酸序列组成和/或由下列氨基酸序列组成:与参考多肽的对应部分相同或几乎相同(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同)的连续氨基酸的氨基酸序列。在适当情况下,这种多肽片段可以包含在较大的多肽中,所述多肽片段是所述较大的多肽的组成部分。在一些实施方案中,多肽片段可以包含下列连续氨基酸,基本上由下列连续氨基酸组成或由下列连续氨基酸组成:参考多肽的至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、300、350、400个或更多个连续氨基酸。在一些实施方案中,VRS3多肽片段可以包含以下连续氨基酸残基、基本上由以下连续氨基酸残基组成或由以下连续氨基酸残基组成:VRS3多肽的约2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125或更多个连续氨基酸(例如,VRS3多肽的约20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54,55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、80、90、100、110、111、112、113、114、116、117、118、119、120、121、122、123、124、125、126、127、128、129或130个或更多个连续氨基酸)。
在一些实施方案中,“部分”可以与从多肽中缺失的氨基酸的数量有关。因此,例如,VRS3多肽的缺失的“部分”可以包含从SEQ ID NO:71或SEQ ID NO:74的氨基酸序列中(或从与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性(例如,至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性)的序列中)缺失的至少一个(例如,一个或多个)氨基酸残基(例如,至少1个或至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、80、90、100、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129或130个或更多个连续氨基酸残基)。在一些实施方案中,VRS3多肽的缺失的部分可以是框内突变或框外突变,其中至少一个(例如,一个或多个)氨基酸缺失。在一些实施方案中,这种缺失可以是显性负性突变、半显性突变、弱功能丧失突变、亚效等位基因突变或无效突变,当其包含在植物中时,与不包含所述缺失的植物相比,可导致植物表现出增加的小花育性、增加的种子数量和/或增加的种子重量。在一些实施方案中,这种突变导致VRS3多肽具有减少的DNA结合或降低的组蛋白去甲基化酶活性。
多核苷酸或多肽的“区域”分别是指该多核苷酸或多肽的连续核苷酸或连续氨基酸残基的部分。例如,多核苷酸序列的区域可以是SEQ ID NO:69的核苷酸序列的连续核苷酸3927-4165、3100-3631或2216-2424,SEQ ID NO:72的核苷酸序列的连续核苷酸3987-4233、3162-3692或2268-2477,SEQ ID NO:70的核苷酸序列的连续核苷酸1495-1654、832-1199或301-402,SEQ ID NO:73的核苷酸序列的连续核苷酸1498-1656、835-1203或305-405;或者,例如,多肽序列的区域可以是SEQ ID NO:71的氨基酸序列的连续氨基酸残基499-551、278-400或101-135或SEQ ID NO:74的氨基酸序列的连续氨基酸残基500-552、123-401或102-136。VRS3多核苷酸的区域也可以是指SEQ ID NO:75-86中任一个核苷酸序列。VRS3多肽的区域也可以是指SEQ ID NO:87-92中任一个氨基酸序列。
在一些实施方案中,“序列特异性核酸结合结构域”或“序列特异性DNA结合结构域”可以结合VRS3核酸(例如,SEQ ID NO:75-86)的一个或多个片段或部分或如本文所述的VRS3基因组序列(例如,SEQ ID NO:69、70、72或73)的非翻译区。
如本文中关于核酸所使用的,术语“功能性片段”是指编码多肽的功能性片段的核酸。关于多肽的“功能性片段”是保留天然参考多肽的一种或多种活性的多肽片段。
如本文所用,术语“基因”是指能够用于产生mRNA、反义RNA、miRNA、抗微小RNA反义寡脱氧核糖核苷酸(AMO)等的核酸分子。基因可以或不可以能够用于产生功能性蛋白质或基因产物。基因可以包括编码区和非编码区(例如,内含子、调控元件、启动子、增强子、终止序列和/或5'和3'非翻译区)两者。基因可以是“分离的”,这意味着基本上或实质上不含通常与天然状态的核酸相关的组分的核酸。这些组分包括其它细胞材料、来自重组产生的培养基和/或用于化学合成核酸的各种化学品。
术语“突变”是指点突变(例如,错义或无义,或导致移码的单个碱基对的插入或缺失)、插入、缺失和/或截短。当突变是氨基酸序列中的一个残基被另一个残基置换,或者序列中的一个或多个残基的缺失或插入时,突变通常通过标示原始残基、然后是残基在序列中的位置以及新置换的残基的身份来描述。截短可以包括在多肽的C末端或多肽的N末端的截短。多肽的截短可能是编码多肽的基因的相应的5'端或3'端缺失的结果。
如本文所用,术语“互补的”或“互补性”是指多核苷酸在允许的盐和温度条件下通过碱基配对的天然结合。例如,序列“A-G-T”(5'至3')与互补序列“T-C-A”(3'至5')结合。两个单链分子之间的互补性可以是“部分的”,其中只有一些核苷酸结合,或者当单链分子之间存在完全互补性时,它可以是完全的。核酸链之间的互补程度对核酸链之间的杂交效率和强度有显著影响。
如本文所用,“互补体”可以表示与比较核苷酸序列的100%互补性,或者它可以表示与比较核苷酸序列的互补性小于100%(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%等的互补性;例如,基本互补性)。
具有同源性的不同核酸或蛋白质在本文中称为“同源物”。术语同源物包括来自同一物种和其它物种的同源序列以及来自同一物种和其它物种的直系同源序列。“同源性”是指两个或更多个核酸和/或氨基酸序列之间的相似程度,以位置同一性(即序列相似性或同一性)的百分比表示。同源性也指不同核酸或蛋白质之间具有相似功能特性的概念。因此,本发明的组合物和方法还包括本发明的核苷酸序列和多肽序列的同源物。如本文所用,“直系同源”是指不同物种中的同源核苷酸序列和/或氨基酸序列,这些序列在物种形成过程中产生于共同的祖先基因。本发明的核苷酸序列的同源物与本发明的所述核苷酸序列具有基本的序列同一性(例如,至少约70%、71%、72%、73%、74%、75%、76%、77%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)。
如本文所用,“序列同一性”是指两个最佳比对的多核苷酸或多肽序列在整个组分(例如核苷酸或氨基酸)比对窗中不变的程度。“同一性”可以很容易地通过已知的方法计算,包括但不限于以下方法:Computational Molecular Biology(Lesk,A.M.编辑)OxfordUniversity Press、New York(1988);Biocomputing:Informatics and Genome Projects(Smith,D.W.编辑)Academic Press、New York(1993);Computer Analysis of SequenceData、Part I(Griffin,A.M.和Griffin,H.G.编辑)Humana Press、New Jersey(1994);Sequence Analysis in Molecular Biology(von Heinje,G.编辑)Academic Press(1987);和Sequence Analysis Primer(Gribskov,M.和Devereux,J.编辑)StocktonPress、New York(1991)。
如本文所用,术语“百分比序列同一性”或“百分比同一性”是指当两个序列最佳比对时,与测试(“对象”)多核苷酸分子(或其互补链)相比,参考(“查询”)多核苷酸分子(或其互补链)的线性多核苷酸序列中相同核苷酸的百分比。在一些实施方案中,“百分比序列同一性”可以指与参考多肽相比,氨基酸序列中相同氨基酸的百分比。
如本文所用,短语“基本上相同”或“基本同一性”在两个核酸分子、核苷酸序列或多肽序列的情形中,是指两个或更多个序列或子序列,当比较和比对最大对应关系时,使用以下序列比较算法之一或目视检查进行测量,其具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%的核苷酸或氨基酸残基同一性。在本发明的一些实施方案中,在本发明的核苷酸序列的连续核苷酸区域存在基本同一性,所述区域的长度为约10个核苷酸至约20个核苷酸,约10个核苷酸至约25个核苷酸,约10个核苷酸至约30个核苷酸,约15个核苷酸至约25个核苷酸,约30个核苷酸至约40个核苷酸,约50个核苷酸至约60个核苷酸,约70个核苷酸至约80个核苷酸,约90个核苷酸至约100个核苷酸,约100个核苷酸至约200个核苷酸,约100个核苷酸至约300个核苷酸,约100个核苷酸至约400个核苷酸,约100个核苷酸至约500个核苷酸,约100个核苷酸至约600个核苷酸,约100个核苷酸至约800个核苷酸,约100个核苷酸至约900个核苷酸,或更多个核苷酸,或其中的任何范围,至多达全长序列。在一些实施方案中,核苷酸序列可以在至少约20个核苷酸(例如,约20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2500、3000、3500、4000、4500、5000、5500、6000或5500个核苷酸或更多个核苷酸)是基本上相同的。
在本发明的一些实施方案中,在本发明的多肽的连续氨基酸残基区域存在基本同一性,所述区域包含约3个氨基酸残基至约20个氨基酸残基,约5个氨基酸残基至约25个氨基酸残基,约7个氨基酸残基至约30个氨基酸残基,约10个氨基酸残基至约25个氨基酸残基,约15个氨基酸残基至约30个氨基酸残基,约20个氨基酸残基至约40个氨基酸残基,约25个氨基酸残基至约40个氨基酸残基,约25个氨基酸残基至约50个氨基酸残基,约30个氨基酸残基至约50个氨基酸残基,约40个氨基酸残基至约50个氨基酸残基,约40个氨基酸残基至约70个氨基酸残基,约50个氨基酸残基至约70个氨基酸残基,约60个氨基酸残基至约80个氨基酸残基,约70个氨基酸残基至约80个氨基酸残基,约90个氨基酸残基至约100个氨基酸残基,或其中的任何长度或范围,至多达全长序列。在一些实施方案中,多肽序列可以在至少约8个连续氨基酸残基(例如,长度为约8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、130、140、150、175、200、225、230、235、240、245、250、260、270、280、290、300、350、400、450、500、550、600、650、700、750、800或850个或更多个氨基酸或更多个连续氨基酸残基)的范围与另一个序列基本上相同。在一些实施方案中,两种或更多种VRS3多肽可以是相同或基本上相同的(例如,至少70%至99.9%相同;例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%相同,或其中的任何范围或值)。
对于序列比较,通常一个序列充当与测试序列比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入计算机,必要时指定子序列坐标,并指定序列算法程序参数。然后,序列比较算法根据指定的程序参数计算测试序列相对于参考序列的序列同一性百分比。
用于比对比较窗口的序列最佳比对是本领域技术人员所熟知的,并且可以通过诸如Smith和Waterman的局部同源算法,Needleman和Wunsch的同源比对算法,Pearson和Lipman的相似性搜索方法等工具进行,并且任选地通过这些算法的计算机化形式来实施,诸如GAP、BESTFIT、FASTA和TFASTA,它们可作为Wisconsin(AccelrysInc.,San Diego,CA)的一部分获得。用于测试序列和参考序列的比对节段的“同一性分数”是两个比对序列共享的相同组分的数量除以参考序列节段(例如,整个参考序列或参考序列的较小定义部分)中的组分总数。百分比序列同一性表示为同一性分数乘以100。一个或多个多核苷酸序列的比较可以是全长多核苷酸序列或其部分,或者是较长的多核苷酸序列。就本发明的目的而言,还可以使用BLASTX 2.0版为翻译的核苷酸序列确定“百分比同一性”,以及使用BLASTN 2.0版为多核苷酸序列确定“百分比同一性”。
当两个核苷酸序列在严格条件下彼此杂交时,也可以认为这两个核苷酸序列基本上是互补的。在一些实施方案中,被认为基本上互补的两个核苷酸序列在高度严格的条件下彼此杂交。
在核酸杂交实验(诸如Southern和Northern杂交)的背景下,“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的,并且在不同的环境参数下是不同的。在TijssenLaboratory Techniques in Biochemistry and Molecular Biology-Hybridizationwith Nucleic Acid Probes第I部分第2章"Overview of principles of hybridizationand the strategy of nucleic acid probe assays"Elsevier、New York(1993)中提供了有关核酸杂交的广泛指南。通常,高度严格的杂交和洗涤条件选择为,在规定的离子强度和pH值下,比具体序列的解链温度(Tm)低约5℃。
Tm是50%靶序列与完美匹配的探针杂交时的温度(在规定的离子强度和pH值下)。非常严格的条件选择为等于特定探针的Tm。在Southern或Northern印迹中,具有超过100个互补残基的互补核苷酸序列在滤器上杂交的严格杂交条件的实例是50%甲酰胺与1mg肝素在42℃,杂交过夜。高度严格的洗涤条件的实例是0.1 5M NaCl在72℃约15分钟。严格洗涤条件的实例是在65℃用0.2x SSC洗涤15分钟(对于SSC缓冲液的描述,参见Sambrook,同前所述)。通常,在进行高度严格清洗之前,先进行低严格清洗,以去除背景探针信号。例如,超过100个核苷酸的双联体的中等严格洗涤的实例是在45℃ 1x SSC 15分钟。例如,超过100个核苷酸的双联体的低严格洗涤的实例是在40℃ 4-6x SSC 15分钟。对于短探针(例如,约10个至50个核苷酸),严格的条件通常涉及低于约1.0M Na离子的盐浓度,通常约0.01至1.0M Na离子浓度(或其它盐)在pH 7.0至8.3,温度通常至少为约30℃。通过添加诸如甲酰胺等去稳定剂也可以达到严格的条件。通常,在特定的杂交测定中,为对不相关探针观察到的信噪比2倍(或更高)的信噪比表明检测到特异性杂交。如果核苷酸序列编码的蛋白质基本相同,则在严格条件下彼此不杂交的核苷酸序列仍然基本相同。例如,当使用遗传密码允许的最大密码子简并性生成核苷酸序列的拷贝时,就会发生这种情况。
本发明的多核苷酸和/或重组核酸构建体(例如,表达盒和/或载体)可以针对表达进行密码子优化。在一些实施方案中,本发明的编辑系统的多核苷酸、核酸构建体、表达盒和/或载体(例如,包含/编码序列特异性核酸结合结构域(例如,来自以下的序列特异性核酸结合结构域:多核苷酸引导的核酸内切酶、锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)、Argonaute蛋白和/或CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)(例如,I型CRISPR-Cas效应蛋白、II型CRISPR-Cas效应蛋白、III型CRISPR-Cas效应蛋白、IV型CRISPR-Cas效应蛋白、V型CRISPR-Cas效应蛋白或VI型CRISPR-Cas效应蛋白)),核酸酶(例如,核酸内切酶(例如,Fok1),多核苷酸引导的核酸内切酶,CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白),锌指核酸酶和/或转录激活因子样效应物核酸酶(TALEN)),脱氨酶蛋白/结构域(例如,腺嘌呤脱氨酶,胞嘧啶脱氨酶),编码逆转录酶蛋白或结构域的多核苷酸,编码5'-3'核酸外切酶多肽的多核苷酸,和/或亲和多肽,肽标签等)可以对植物中的表达进行密码子优化。在一些实施方案中,本发明的密码子优化的核酸、多核苷酸、表达盒和/或载体与没有进行密码子优化的参考核酸、多核苷酸、表达盒和/或载体具有约70%至约99.9%(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%或100%)或更高的同一性。
在本文描述的任何实施方案中,本发明的多核苷酸或核酸构建体可以与多种启动子和/或其它调控元件可操作缔合以用于在植物和/或植物细胞中表达。因此,在一些实施方案中,本发明的多核苷酸或核酸构建体还可以包含与一个或多个核苷酸序列可操作连接的一个或多个启动子、内含子、增强子和/或终止子。在一些实施方案中,启动子可以与内含子可操作地缔合(例如,Ubi1启动子和内含子)。在一些实施方案中,与内含子缔合的启动子可以被称为“启动子区域”(例如,Ubi1启动子和内含子)。
如本文所用,提及多核苷酸时“可操作地连接”或“可操作地缔合”,意指所指示的元件在功能上彼此相关,并且通常也在物理上相关。因此,如本文所用的术语“可操作地连接”或“可操作地缔合”是指单个核酸分子上功能上关联的核苷酸序列。因此,可操作地连接到第二核苷酸序列的第一核苷酸序列意指第一核苷酸序列以与第二核苷酸序列功能相关的关系进行定位的情形。例如,如果启动子影响所述核苷酸序列的转录或表达,则启动子与该核苷酸序列可操作地缔合。本领域技术人员将理解,控制序列(例如,启动子)不必和与其可操作地缔合的核苷酸序列相邻,只要控制序列的功能是指导其表达即可。因此,例如,启动子和核苷酸序列之间可以存在介于中间的不翻译但转录的核酸序列,并且启动子仍可被视为与核苷酸序列“可操作地连接”。
如本文所用,在提及多肽时,术语“连接”是指一个多肽与另一个多肽的连接。多肽可以直接(例如,通过肽键)或通过接头与另一个多肽(在N-末端或C-末端)连接。
术语“接头”是本领域公认的,是指连接两个分子或部分的化学基团或分子,所述两个分子或部分例如融合蛋白的两个结构域,诸如,例如,核酸结合多肽或结构域(例如,DNA结合多肽或结构域)和肽标签和/或逆转录酶和与肽标签结合的亲和多肽;或DNA核酸内切酶多肽或结构域和肽标签和/或逆转录酶和与肽标签结合的亲和多肽。接头可以由单个连接分子组成,或可以包含多于一个连接分子。在一些实施方案中,接头可以是有机分子、基团、聚合物或化学部分,诸如二价有机部分。在一些实施方案中,接头可以是氨基酸,或者也可以是肽。在一些实施方案中,接头是肽。
在一些实施方案中,可用于本发明的肽接头可以是约2至约100个或更多个氨基酸的长度,例如,约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个或更多个氨基酸的长度(例如,约2至约40、约2至约50、约2至约60、约4至约40、约4至约50、约4至约60、约5至约40、约5至约50、约5至约60、约9至约40、约9至约50、约9至约60、约10至约40、约10至约50、约10至约60,或约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25个氨基酸至约26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个或更多个氨基酸的长度(例如,约105、110、115、120、130、140、150个或更多个氨基酸的长度)。在一些实施方案中,肽接头可以是GS接头。
如本文所用,在提及多核苷酸时,术语“连接”或“融合”是指一个多核苷酸与另一个多核苷酸的连接。在一些实施方案中,两个或更多个多核苷酸分子可以通过接头连接,接头可以是有机分子、基团、聚合物或化学部分,诸如二价有机部分。多核苷酸可以通过共价或非共价键或结合与另一个多核苷酸(在5'端或3'端)连接或融合,包括例如通过Watson-Crick碱基配对或通过一个或多个连接核苷酸连接或融合。在一些实施方案中,某种结构的多核苷酸基序可以插入到另一个多核苷酸序列中(例如,引导RNA中发夹结构的延伸)。在一些实施方案中,连接核苷酸可以是天然存在的核苷酸。在一些实施方案中,连接核苷酸可以是非天然存在的核苷酸。
“启动子”是控制或调节与启动子可操作地缔合的核苷酸序列(例如,编码序列)转录的核苷酸序列。由启动子控制或调节的编码序列可以编码多肽和/或功能性RNA。通常,“启动子”是指包含RNA聚合酶II的结合位点并指导转录起始的核苷酸序列。通常,启动子位于相对于对应编码序列的编码区起点的5'或上游。启动子可以包含作为基因表达调节物的其它元件;例如,启动子区。这些包括TATA盒共有序列,通常还包括CAAT盒共有序列(Breathnach和Chambon,(1981)Annu.Rev.Biochem.50:349)。在植物中,CAAT盒可以被AGGA盒替代(Messing等人,(1983)在Genetic Engineering of Plants中,T.Kosuge,C.Meredith和A.Hollaender(编辑),Plenum Press,第211-227页)。
可用于本发明的启动子可以包括,例如,组成性、诱导性、时间调控性、发育调控性、化学调控性、组织偏好性和/或组织特异性的启动子,用于制备重组核酸分子,例如,“合成核酸构建体”或“蛋白质-RNA复合物”。这些不同类型的启动子是本领域已知的。
对启动子的选择可以因表达的时间和空间要求而异,也可以因要转化的宿主细胞而异。许多不同生物体的启动子在本领域是众所周知的。基于本领域存在的广泛知识,可以为感兴趣的特定宿主生物体选择适当的启动子。因此,例如,模式生物体中高度组成性表达的基因上游的启动子是已知的,并且这些知识可以很容易地获得,并酌情在其它系统中实施。
在一些实施方案中,在植物中有功能的启动子可以与本发明的构建体一起使用。可用于驱动在植物中表达的启动子的非限制性实例包括RubisCo小亚基基因1的启动子(PrbcS1)、肌动蛋白基因的启动子(Pactin)、硝酸还原酶基因的启动子(Pnr)和双拷贝碳酸酐酶基因1的启动子(Pdca1)(参见Walker等人,Plant Cell Rep.23:727-735(2005);Li等人,Gene 403:132-142(2007);Li等人,Mol Biol.Rep.37:1143-1154(2010))。PrbcS1和Pactin是组成性启动子,Pnr和Pdca1是诱导性启动子。Pnr由硝酸盐诱导并被铵抑制(Li等人,Gene 403:132-142(2007)),Pdca1由盐诱导(Li等人,Mol Biol.Rep.37:1143-1154(2010))。在一些实施方案中,可用于本发明的启动子是RNA聚合酶II(Pol II)启动子。在一些实施方案中,来自玉米的U6启动子或7SL启动子可以用于本发明的构建体。在一些实施方案中,来自玉米的U6c启动子和/或7SL启动子可以用于驱动引导核酸的表达。在一些实施方案中,来自大豆(Glycine max)的U6c启动子、U6i启动子和/或7SL启动子可用于本发明的构建体。在一些实施方案中,来自大豆的U6c启动子、U6i启动子和/或7SL启动子可以用于驱动引导核酸的表达。
对植物有用的组成性启动子的实例包括但不限于,洋丁香病毒启动子(cmp)(美国专利号7,166,770)、水稻肌动蛋白1启动子(Wang等人,(1992)Mol.Cell.Biol.12:3399-3406;以及美国专利号5,641,876)、CaMV 35S启动子(Odell等人,(1985)Nature 313:810-812)、CaMV 19S启动子(Lawton等人,(1987)Plant Mol.Biol.9:315-324)、nos启动子(Ebert等人(1987)Proc.Natl.Acad.Sci USA 84:5745-5749)、Adh启动子(Walker等人(1987)Proc.Natl.Acad.Sci.USA 84:6624-6629)、蔗糖合酶启动子(Yang&Russell(1990)Proc.Natl.Acad.Sci.USA 87:4144-4148)和泛素启动子。源自泛素的组成性启动子在许多细胞类型中积累。泛素启动子已从几种植物物种中克隆出来,用于转基因植物,例如,向日葵(Binet等人,1991.Plant Science 79:87-94),玉米(Christensen等人,1989.PlantMolec.Biol.12:619-632)和拟南芥(Norris等人1993.Plant Molec.Biol.21:895-906)。玉米泛素启动子(UbiP)已在转基因单子叶植物系统中开发,构建用于单子叶植物转化的其序列和载体在专利公布EP 0 342 926中公开。泛素启动子适用于本发明的核苷酸序列在转基因植物中的表达,特别是单子叶植物。此外,McElroy等人(Mol.Gen.Genet.231:150-160(1991))描述的启动子表达盒可以很容易地被改良用于本发明的核苷酸序列的表达,并且特别适用于单子叶植物宿主。
在一些实施方案中,组织特异性/组织偏好性启动子可用于在植物细胞中表达异源多核苷酸。组织特异性或偏好表达模式包括但不限于,绿色组织特异性或偏好性、根特异性或偏好性、茎特异性或偏好性、花特异性或偏好性或花粉特异性或偏好性。适合在绿色组织中表达的启动子包括调节参与光合作用的基因的许多启动子,其中许多是从单子叶植物和双子叶植物克隆而来的。在一个实施方案中,可用于本发明的启动子是来自磷酸烯醇羧化酶基因的玉米PEPC启动子(Hudspeth&Grula、Plant Molec.Biol.12:579-589(1989))。组织特异性启动子的非限制性实例包括与编码种子储存蛋白(诸如β-伴大豆球蛋白、十字花科蛋白、油菜贮藏蛋白和菜豆蛋白)、玉米醇溶蛋白或油体蛋白(诸如油质蛋白)或参与脂肪酸生物合成的蛋白(包括酰基载体蛋白、硬脂酰-ACP去饱和酶和脂肪酸去饱和酶(fad 2-1))的基因缔合的那些,以及胚发育过程中表达的其它核酸(诸如Bce4,参见,例如,Kridl等人(1991)Seed Sci.Res.1:209-219;以及EP专利号255378)。可用于在植物、特别是玉米中表达本发明的核苷酸序列的组织特异性或组织偏好性启动子包括但不限于那些指导在根、髓、叶或花粉中表达的启动子。例如,在WO 93/07278(其全部内容通过引用并入本文)中公开了此类启动子。可用于本发明的组织特异性或组织偏好性启动子的其它非限制性实例是美国专利6,040,504中公开的棉花rubisco启动子;在美国专利5,604,121中公开的水稻蔗糖合酶启动子;由de Framond(FEBS290:103-106(1991);Ciba-Geigy的EP 0 452 269)所述的根特异性启动子;在美国专利5,625,136(Ciba-Geigy)中描述的茎特异性启动子,其可驱动玉米trpA基因的表达;在WO 01/73087中公开的洋丁香黄曲叶病毒启动子;以及花粉特异性或偏好性启动子,包括但不限于,来自水稻的ProOsLPS10和ProOsLPS11(Nguyen等人Plant Biotechnol.Reports 9(5):297-306(2015)),来自玉米的ZmSTK2_USP(Wang等人Genome 60(6):485-495(2017))、来自番茄的LAT52和LAT59(Twell等人Development 109(3):705-713(1990))、Zm13(美国专利号10,421,972)、来自拟南芥的PLA2-δ启动子(美国专利号7,141,424)和/或来自玉米的ZmC5启动子(国际PCT公开号WO1999/042587)。
植物组织特异性/组织偏好性启动子的其它实例包括但不限于,根毛特异性顺式元件(RHE)(Kim等人The Plant Cell 18:2958-2970(2006))、根特异性启动子RCc3(Jeong等人Plant Physiol.153:185-197(2010))和RB7(美国专利号5459252)、凝集素启动子(Lindstrom等人(1990)Der.Genet.11:160-167;和Vodkin(1983)Prog.Clin.Biol.Res.138:87-98)、玉米醇脱氢酶1启动子(Dennis等人(1984)NucleicAcids Res.12:3983-4000)、S-腺苷-L-蛋氨酸合成酶(SAMS)(Vander Mijnsbrugge等人(1996)Plant and Cell Physiology,37(8):1108-1115)、玉米光捕获复合物启动子(Bansal等人(1992)Proc.Natl.Acad.Sci.USA 89:3654-3658)、玉米热休克蛋白启动子(O'Dell等人(1985)EMBO J.5:451-458;和Rochester等人(1986)EMBO J.5:451-458)、豌豆小亚基RuBP羧化酶启动子(Cashmore,"Nuclear genes encoding the small subunit ofribulose-l,5-bisphosphate carboxylase"第29-39页,In:Genetic Engineering ofPlants(Hollaender编辑,Plenum Press 1983;和Poulsen等人(1986)Mol.Gen.Genet.205:193-200)、Ti质粒甘露糖碱合酶启动子(Langridge等人(1989)Proc.Natl.Acad.Sci.USA86:3219-3223)、Ti质粒胭脂碱合酶启动子(Langridge等人(1989),见上)、矮牵牛查尔酮异构酶启动子(van Tunen等人(1988)EMBO J.7:1257-1263)、豆类富甘氨酸蛋白1启动子(Keller等人(1989)Genes Dev.3:1639-1646)、截短的CaMV 35S启动子(O'Dell等人(1985)Nature 313:810-812)、马铃薯块茎储藏蛋白启动子(Wenzler等人(1989)PlantMol.Biol.13:347-354)、根细胞启动子(Yamamoto等人(1990)Nucleic Acids Res.18:7449)、玉米醇溶蛋白启动子(Kriz等人(1987)Mol.Gen.Genet.207:90-98;Langridge等人(1983)Cell 34:1015-1022;Reina等人(1990)Nucleic Acids Res.18:6425;Reina等人(1990)Nucleic Acids Res.18:7449;和Wandelt等人(1989)Nucleic Acids Res.17:2354)、球蛋白-1启动子(Belanger等人(1991)Genetics 129:863-872)、α-微管蛋白cab启动子(Sullivan等人(1989)Mol.Gen.Genet.215:431-440)、PEPCase启动子(Hudspeth&Grula(1989)Plant Mol.Biol.12:579-589)、R基因复合物相关启动子(Chandler等人(1989)Plant Cell 1:1175-1183)和查尔酮合酶启动子(Franken等人(1991)EMBO J.10:2605-2612)。
可用于种子特异性表达的是豌豆球蛋白启动子(Czako等人(1992)Mol.Gen.Genet.235:33-40);以及美国专利号5,625,136中公开的种子特异性启动子。可用于在成熟叶片中表达的启动子是那些在衰老开始时切换的启动子,诸如来自拟南芥的SAG启动子(Gan等人(1995)Science 270:1986-1988)。
此外,还可以使用叶绿体中起作用的启动子。这种启动子的非限制性实例包括噬菌体T3基因9 5'UTR和美国专利号7,579,516中公开的其它启动子。可用于本发明的其它启动子包括但不限于S-E9小亚基RuBP羧化酶启动子和Kunitz胰蛋白酶抑制剂基因启动子(Kti3)。
可用于本发明的其它调控元件包括但不限于内含子、增强子、终止序列和/或5'和3'非翻译区。
可用于本发明的内含子可以是在植物中鉴定并从中分离、然后插入到用于植物转化的表达盒中的内含子。正如本领域技术人员所理解的那样,内含子可以包含自我切除所需的序列,并被框内掺入到核酸构建体/表达盒中。内含子可以用作间隔子以在一个核酸构建体中分开多个蛋白质编码序列,或者也可以在一个蛋白质编码序列内使用内含子,例如,以稳定mRNA。如果它们在蛋白质编码序列中使用,则将它们“框内”插入,并包括切除位点。内含子也可以与启动子缔合以改善或修饰表达。作为实例,可用于本发明的启动子/内含子组合包括但不限于玉米Ubi1启动子和内含子的启动子/内含子组合(参见,例如,SEQ IDNO:21和SEQ ID NO:22)。
可用于本发明的内含子的非限制性实例包括来自以下的内含子:ADHI基因(例如,Adh1-S内含子1、2和6),泛素基因(Ubi1),RuBisCO小亚基(rbcS)基因,RuBisCO大亚基(rbcL)基因,肌动蛋白基因(例如,肌动蛋白-1内含子),丙酮酸脱氢酶激酶基因(pdk),硝酸还原酶基因(nr),双拷贝碳酸酐酶基因1(Tdca1),psbA基因、atpA基因或其任意组合。
在一些实施方案中,本发明的多核苷酸和/或核酸构建体可以是“表达盒”,或可以包含在表达盒内。如本文所用,“表达盒”是指重组核酸分子,包含例如,本发明的一个或多个多核苷酸(例如,编码序列特异性核酸结合结构域的多核苷酸、编码脱氨酶蛋白或结构域的多核苷酸、编码逆转录酶蛋白或结构域的多核苷酸、编码5'-3'核酸外切酶多肽或结构域的多核苷酸、引导核酸和/或逆转录酶(RT)模板),其中多核苷酸可操作地缔合一个或多个控制序列(例如,启动子、终止子等)。因此,在一些实施方案中,可以提供一个或多个表达盒,其设计用于表达,例如,本发明的核酸构建体(例如,编码序列特异性核酸结合结构域的多核苷酸、编码核酸酶多肽/结构域的多核苷酸、编码脱氨酶蛋白/结构域的多核苷酸、编码逆转录酶蛋白/结构域的多核苷酸、编码5'-3'核酸外切酶多肽/结构域的多核苷酸、编码肽标签的多核苷酸和/或编码亲和多肽的多核苷酸等,或包含引导核酸、延伸的引导核酸和/或RT模板等)。当本发明的表达盒包含多于一个多核苷酸时,多核苷酸可以可操作地连接到驱动所有多核苷酸表达的单个启动子,或者该多核苷酸可以可操作地连接到一个或多个单独的启动子(例如,三个多核苷酸可以由一个、两个或三个启动子以任意组合驱动)。当使用两个或更多个单独的启动子时,启动子可以是相同的启动子,或它们可以是不同的启动子。因此,当包含在单个表达盒中时,编码序列特异性核酸结合结构域的多核苷酸、编码核酸酶蛋白/结构域的多核苷酸、编码CRISPR-Cas效应蛋白/结构域的多核苷酸、编码脱氨酶蛋白/结构域的多核苷酸、编码逆转录酶多肽/结构域的多核苷酸(例如,RNA依赖性DNA聚合酶)和/或编码5'-3'核酸外切酶多肽/结构域的多核苷酸、引导核酸、延伸的引导核酸和/或RT模板可以各自可操作地连接单个启动子或任意组合的独立启动子。
包含本发明的核酸构建体的表达盒可以是嵌合的,这意味着其至少一个组分相对于其至少一个其它组分是异源的(例如,来自宿主生物体的启动子可操作地连接到要在宿主生物体中表达的感兴趣多核苷酸,其中所述感兴趣多核苷酸来自与宿主不同的生物体,或者通常不与该启动子缔合)。表达盒也可以是天然存在的,但已以可用于异源表达的重组形式获得。
表达盒可以任选地包括转录和/或翻译终止区(即终止区)和/或在所选宿主细胞中起作用的增强子区。本领域已知的多种转录终止子和增强子可用于表达盒。转录终止子负责终止转录和纠正mRNA多聚腺苷酸化。终止区和/或增强子区可以对转录起始区来说是天然的,可以对下列来说是天然的:例如,编码序列特异性核酸结合蛋白的基因、编码核酸酶的基因、编码逆转录酶的基因、编码脱氨酶的基因等,或者可以对宿主细胞来说天然的,或者可以对另一来源(例如,外源的或异源的,例如,对启动子、编码序列特异性核酸结合蛋白的基因、编码核酸酶的基因、编码逆转录酶的基因、编码脱氨酶的基因等,或对宿主细胞,或它们的任意组合)来说是天然的。
本发明的表达盒还可以包括编码可选择标记物的多核苷酸,其可用于选择转化的宿主细胞。如本文所用,“可选择标记物”是指这样的多核苷酸序列:当表达时,赋予表达该标记物的宿主细胞独特的表型,从而允许将这种转化的细胞与没有该标记物的细胞区分开来。这种多核苷酸序列可以编码可选择或可筛选的标记物,这取决于该标记物是否赋予可以通过化学手段选择的性状,诸如使用选择性剂(例如,抗生素等),或者该标记物是否只是人们可以通过观察或测试识别的性状,诸如通过筛选(例如,荧光)识别。许多合适的可选择标记物的实例是本领域已知的,并且可用于本文所述的表达盒中。
除表达盒外,本文所述的核酸分子/构建体和多核苷酸序列可与载体结合使用。术语“载体”是指用于将核酸(或多个核酸)转移、递送或引入细胞的组合物。载体包括包含要转移、递送或引入的核苷酸序列的核酸构建体(例如,表达盒)。用于转化宿主生物体的载体是本领域公知的。一般类别载体的非限制性实例包括病毒载体、质粒载体、噬菌体载体、噬菌粒载体、粘粒载体、fosmid载体、噬菌体、人工染色体、微环或双链或单链线性或环状形式的农杆菌二元载体,这些载体可以是或可以不是可自主转移或可动员的。在一些实施方案中,病毒载体可以包括但不限于逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹病毒载体。本文定义的载体可以通过整合到细胞基因组中或染色体外存在(例如,具有复制起点的自主复制质粒)来转化原核或真核宿主。此外,还包括穿梭载体,其是指天然地或通过设计能够在两种不同的宿主生物体中复制的DNA载体,其可以选自放线菌和相关物种、细菌和真核生物(例如,高等植物、哺乳动物、酵母或真菌细胞)。在一些实施方案中,载体中的核酸受适当的启动子或其它调控元件的控制,并可操作地与适当的启动子或其它调控元件连接,以便在宿主细胞中进行转录。该载体可以是在多个宿主中起作用的双功能表达载体。在基因组DNA的情况下,这可以包含其自己的启动子和/或其它调控元件,而在cDNA的情况下,这可以在适当的启动子和/或其它调控元件的控制下,以便在宿主细胞中表达。因此,本发明的核酸或多核苷酸和/或包含所述核酸或多核苷酸的表达盒可以包含在本文所述和本领域已知的载体中。
如本文所用,“接触”及其语法变体,是指在适合进行所需反应(例如,转化、转录控制、基因组编辑、做切口和/或裂解)的条件下将所需反应的组分放在一起。作为实例,靶核酸可以与序列特异性核酸结合蛋白(例如,多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)和/或Argonaute蛋白))和脱氨酶或编码这些的核酸构建体在以下的条件下接触:序列特异性核酸结合蛋白、逆转录酶和/或脱氨酶表达,序列特异性核酸结合蛋白与靶核酸结合,逆转录酶和/或脱氨酶可以与序列特异性核酸结合蛋白融合或募集到序列特异性核酸结合蛋白(例如,通过与序列特异性核酸结合蛋白融合的肽标签和与逆转录酶和/或脱氨酶融合的亲和标签),因此,脱氨酶和/或逆转录酶位于靶核酸附近,从而修饰靶核酸。可以使用其它募集逆转录酶和/或脱氨酶的方法,利用其它蛋白质-蛋白质相互作用,并且RNA-蛋白质相互作用和化学相互作用也可用于蛋白质-蛋白质和蛋白质-核酸募集。
如本文所用,提及靶核酸,“修饰”包括编辑(例如,突变)、共价修饰、交换/置换核酸/核苷酸碱基、缺失、裂解、做切口和/或改变对靶核酸的转录控制。在一些实施方案中,修饰可以包括任何类型的一个或多个单碱基变化(SNP)。
在转录因子“调控”表型(例如,小花育性、种子数量和/或种子重量)的情形下使用的术语“调控”意指转录因子影响一种或多种基因的表达的能力,从而使诸如小花育性、种子数量和/或种子重量的表型被改变。
在感兴趣多核苷酸的背景下,“引入”(及其语法变体)意指使感兴趣的核苷酸序列(例如,多核苷酸、RT模板、核酸构建体和/或引导核酸)呈递给植物、其植物部分或其细胞,以这种方式使核苷酸序列能够进入细胞内部。
术语“转化”或“转染”可以互换使用,如本文所用是指将异源核酸引入细胞。细胞的转化可以是稳定的或瞬时的。因此,在一些实施方案中,宿主细胞或宿主生物体(例如,植物)可以用本发明的多核苷酸/核酸分子稳定地转化。在一些实施方案中,宿主细胞或宿主生物体可以用本发明的多核苷酸/核酸分子瞬时转化。
在多核苷酸的背景下,“瞬时转化”意指多核苷酸被引入细胞中,并且不整合到细胞的基因组中。
在将多核苷酸引入细胞的背景下,通过“稳定引入”或“被稳定引入”,意指将引入的多核苷酸稳定地掺入细胞的基因组中,从而使细胞被多核苷酸稳定地转化。
如本文所用,“稳定转化”或“稳定地转化”意指将核酸分子引入细胞并整合到细胞的基因组中。因此,整合的核酸分子能够被其子代继承,更具体地说,能够被连续多代的子代继承。如本文所用的“基因组”包括核基因组和质体基因组,因此包括将核酸整合到例如叶绿体或线粒体基因组中。如本文所用的稳定转化也可以指在染色体外维持的转基因,例如,作为微染色体或质粒。
瞬时转化可以通过例如酶联免疫吸附测定(ELISA)或蛋白质印迹法来检测,其可以检测由引入生物体的一个或多个转基因编码的肽或多肽的存在。例如,可以通过对细胞的基因组DNA与核酸序列进行Southern印迹杂交测定来检测细胞的稳定转化,所述核酸序列与引入生物体(例如,植物)的转基因的核苷酸序列特异性杂交。例如,可以通过对细胞的RNA与核酸序列进行Northern印迹杂交测定来检测细胞的稳定转化,所述核酸序列与引入宿主生物体的转基因的核苷酸序列特异性杂交。细胞的稳定转化也可以通过,例如,聚合酶链反应(PCR)或本领域公知的其它扩增反应来检测,采用与转基因的靶序列杂交的特异性引物序列,从而扩增转基因序列,其可以根据标准方法检测。转化也可以通过本领域公知的直接测序和/或杂交方案来检测。
因此,在一些实施方案中,本发明的核苷酸序列、多核苷酸、核酸构建体和/或表达盒可以被瞬时表达和/或它们可以稳定地掺入宿主生物体的基因组中。因此,在一些实施方案中,本发明的核酸构建体(例如,一个或多个包含如本文所述的用于编辑的多核苷酸的表达盒)可以瞬时引入到具有引导核酸的细胞中,因此,没有DNA在细胞中维持。
本发明的核酸构建体可以通过本领域技术人员已知的任何方法引入植物细胞中。转化方法的非限制性实例包括通过细菌介导的核酸递送(例如,通过农杆菌)的转化、病毒介导的核酸递送、碳化硅或核酸晶须介导的核酸递送、脂质体介导的核酸递送、显微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米颗粒介导的转化、超声处理、浸润、PEG介导的核酸摄取,以及导致将核酸引入植物细胞的任何其它电、化学、物理(机械)和/或生物机制,包括它们的任意组合。转化真核生物和原核生物的程序在本领域是众所周知和常规的,并且其描述遍布文献(参见,例如,Jiang等人2013.Nat.Biotechnol.31:233-239;Ran等人Nature Protocols8:2281–2308(2013))。对本领域已知的各种植物转化方法的一般指南包括Miki等人("Procedures for Introducing Foreign DNA intoPlants"in Methods in Plant Molecular Biology and Biotechnology,Glick,B.R.和Thompson,J.E.编辑(CRC Press,Inc.,Boca Raton,1993),第67-88页)和Rakowoczy-Trojanowska(Cell.Mol.Biol.Lett.7:849-858(2002))。
在本发明的一些实施方案中,细胞的转化可以包括核转化。在其它实施方案中,细胞的转化可以包括质体转化(例如,叶绿体转化)。在进一步的实施方案中,本发明的核酸可以通过常规育种技术引入细胞中。在一些实施方案中,一种或多种多核苷酸、表达盒和/或载体可以通过农杆菌转化引入植物细胞中。
因此,多核苷酸可以以本领域公知的任意数量的方式引入植物、植物部分、植物细胞中。本发明的方法不依赖于将一个或多个核苷酸序列引入植物的特定方法,只要它们能够进入细胞内部即可。如果要引入多个多核苷酸,它们可以组装为单个核酸构建体的一部分,也可以组装为单独的核酸构建体,并且可以位于相同或不同的核酸构建体上。因此,多核苷酸可以在单个转化事件中引入感兴趣细胞,或者,也可以在单独的转化事件中引入感兴趣细胞,或者,备选地,可以将多核苷酸作为育种方案的一部分掺入植物中。
在一些实施方案中,本发明提供了一种植物或其部分,所述植物或其部分包含内源性组蛋白去甲基化酶基因中的至少一个(例如,一个或多个)突变(任选地,非天然突变),所述内源性组蛋白去甲基化酶基因编码组蛋白去甲基化酶多肽,所述组蛋白去甲基化酶多肽包含锌指DNA结合结构域(ZnF结构域)、Jumonji C型(Jmj-C)结构域和Jumonji N型(Jmj-N)结构域,其中所述突变破坏组蛋白去甲基化酶多肽与DNA的结合和/或降低组蛋白去甲基化酶多肽的组蛋白去甲基化活性,任选地,VRS3基因可能由于突变而减少表达(例如,与对照相比减少了至少约5%,例如,减少了约5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)。在一些实施方案中,内源性组蛋白去甲基化酶是SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶,任选地是Jumonji C型H3K9me2/me3去甲基化酶。在一些实施方案中,由内源性组蛋白去甲基化酶基因编码的组蛋白去甲基化酶多肽调节小花育性,种子数量(例如,籽粒数量)和/或种子重量(例如,籽粒重),任选地,其中所述调节小花育性、种子数量和/或种子重量的组蛋白去甲基化酶是SIX-ROWED SPIKE 3(VRS3)转录因子,任选地是Jumonji C型H3K9me2/me3去甲基化酶。种子数量和种子重量也可以称为“种子产量”
如本文所用,“非自然突变”是指通过人类干预产生的突变,其不同于在自然界中发生的相同基因中发现的突变(例如,自然发生的突变)。
如本文所述,编辑技术用于靶向植物中的内源性去甲基化酶组蛋白基因,任选地SIX-ROWED SPIKE 3(VRS3)(任选地Jumonji C型H3K9me2/me3去甲基化酶)基因,以产生具有增加的小花育性、增加的种子产量(例如,种子(例如籽粒)数量和/或重量)的植物。在一些方面,由编辑技术产生的突变可以是显性负性突变、半显性突变、弱功能丧失突变、亚效等位基因突变或无效突变。在一些实施方案中,突变可以在VRS3基因的锌指结合结构域(ZnF,ZnF区域)中、在Jumonji C型(Jmj-C)结构域和/或Jumonji N型(Jmj-N)结构域中,其中所述突变破坏组蛋白去甲基化酶多肽与DNA的结合和/或降低组蛋白去甲基化酶多肽的组蛋白去甲基化活性。VSR3基因中的突变类型可用于产生表现出增加的小花育性、增加的种子(例如籽粒)数量和/或增加的种子(例如籽粒)重量的植物,所述突变包括,例如置换、缺失和插入。在一些实施方案中,突变可以是框内缺失或框外缺失。
在一些实施方案中,用于玉米VRS3直系同源物和其它植物的VRS3直系同源物的编辑策略可能涉及破坏VRS3多核苷酸的ZnF DNA结合结构域、Jumonji C型(Jmj-C)结构域和/或Jumonji N型(Jmj-N)结构域,以产生例如,显性负性VSR3等位基因。作为实例,玉米在1号和5号染色体上有两个VRS3直系同源物。在一些实施方案中,可以同时编辑两个VRS3直系同源物。为了破坏DNA结合结构域和/或降低组蛋白去甲基化酶多肽(VRS3)的组蛋白去甲基化活性,编辑策略包括但不限于使用CRISPR-Cas(例如Cas12a、Cas9等)以去除以下的至少一部分或全部:ZnF DNA结合结构域,Jumonji C型(Jmj-C)结构域和/或Jumonji N型(Jmj-N)结构域,或被靶向的框内缺失JmjN结构域5'端附近的和/或JmjC结构域5'端附近的残基或JmjN结构域的其它位置的残基和/或JmjC结构域的其它位置(例如,JmjC结构域的中间)的残基和/或ZnF结构域的3'端附近的残基。使用这种策略破坏ZnF DNA结合结构域、Jmj-C结构域和/或Jmj-N结构域有望增加小花育性、籽粒大小和籽粒数量(例如籽粒或种子产量)。可使用的其它编辑策略包括但不限于兆核酸酶、锌指核酸酶(ZFN)、转录激活因子样效应物核酸酶(TALEN)、碱基编辑和/或先导编辑,所述编辑策略可用于实现如本文所述的内源性组蛋白甲基酶基因的这些突变。
在一些实施方案中,本发明提供了一种植物或其植物部分,所述植物或植物部分在编码组蛋白去甲基化酶多肽的内源性组蛋白去甲基化酶基因中包含至少一个突变(例如,一个或多个突变,例如1、2、3、4、5或更多个突变)。在一些实施方案中,所述突变是非天然突变。在一些实施方案中,所述内源性组蛋白去甲基化酶基因:(a)编码与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%(例如,80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)的序列同一性的多肽;或(b)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%(例如,80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)的序列同一性的序列。在一些实施方案中,内源性组蛋白去甲基化酶基因包含:(1)JmjN结构域,所述JmjN结构域:(a)与SEQ IDNO:75、78、81或84中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ IDNO:87或SEQ ID NO:90的氨基酸序列具有至少80%的序列同一性的多肽,(2)JmjC结构域,所述JmjC结构域:(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80%的序列同一性的多肽,和/或(3)ZnF结构域,所述ZnF结构域:(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80%的序列同一性的多肽。
在一些实施方案中,至少一个突变是碱基置换、碱基缺失和/或碱基插入。在一些实施方案中,至少一个突变包含对A、T、G或C的碱基置换。在一些实施方案中,至少一个突变是至少一个(例如,1、2、3、4、5、6、7、8、9或10个或更多个)碱基对的置换。在一些实施方案中,编码组蛋白去甲基化酶的内源性基因中的至少一个突变包括碱基缺失(例如,至少一个(例如,1、2、3、4、5、6、7、8、9或10个或更多个)碱基对的缺失),任选地,其中所述碱基缺失是框内缺失或框外缺失。在一些实施方案中,所述至少一个突变是非天然突变。
在一些实施方案中,至少一个突变可以是点突变(例如,缺失、置换、添加)。在一些实施方案中,突变可以是一个或多个碱基或氨基酸的缺失。在一些实施方案中,突变可以是一个或多个碱基或氨基酸的置换。在一些实施方案中,至少一个突变是碱基置换,其中所述碱基置换导致氨基酸置换。在一些实施方案中,至少一个突变是碱基缺失,其中所述碱基缺失导致移码突变。在一些实施方案中,至少一个突变产生显性负性突变、半显性突变、弱功能丧失突变、亚效等位基因突变或无效突变。在一些实施方案中,至少一个突变是显性负性突变或半显性突变。在一些实施方案中,至少一个突变是非天然突变。
在一些实施方案中,内源性组蛋白去甲基化酶基因可以存在于多于一条染色体(例如,多于一个拷贝)上,并且组蛋白去甲基化酶基因包含一个拷贝或两个拷贝中的突变。当内源性组蛋白去甲基化酶基因包含多于一个拷贝中的突变时,所述突变可能与另一个拷贝中的突变相同,也可能是不同的突变。在一些实施方案中,内源性组蛋白去甲基化酶基因是位于1号染色体上的VRS3基因(SEQ ID NO:69、70;Zm00001d030180)和5号染色体上的VRS3基因(SEQ ID NO:72、73;Zm00001d014422),其中一种或两种内源性VRS3基因包含突变(例如,一个或多个突变),任选地,其中所述突变在一种或两种VRS3基因的ZnF结构域中,在一种或两种VRS3基因的JmjN结构域中,和/或一种或两种VRS3基因的JmjC结构域中。
在一些实施方案中,提供了一种植物或其部分,所述植物或其部分在编码组蛋白去甲基化酶多肽的内源性组蛋白去甲基化酶基因中包含至少一个(例如,一个或多个)突变,其中所述突变导致组蛋白去甲基化酶多肽具有被破坏的(例如,减少或丧失)DNA结合和/或降低的组蛋白去甲基化活性。
在一些实施方案中,提供了在编码组蛋白去甲基化酶多肽的内源性组蛋白去甲基化酶基因中包含至少一个(例如,一个或多个)突变的植物或其部分,其中所述突变破坏组蛋白去甲基化酶多肽与DNA的结合和/或降低组蛋白去甲基化酶多肽的组蛋白去甲基化活性,任选地减少组蛋白去甲基化酶基因的表达,并导致植物或其部分中的籽粒数量增加。在一些实施方案中,至少一个突变是组蛋白去甲基化酶基因的部分ZnF结构域或整个ZnF结构域的缺失,组蛋白去甲基化酶基因的部分JmjC结构域或整个JmjC结构域的缺失和/或组蛋白去甲基化酶基因的部分JmjN结构域或整个JmjN结构域的缺失。在一些实施方案中,缺失可以是至少一个核苷酸(例如,1、2、3、4、5、6、7、8、9、10、12、15、18、21、24、27、30、35、40、45、50、55、60、65、70、75、80、90、100、110、120、130、140、150、160、170、180、190或200个或更多个核苷酸,或其中的任何值或范围)。在一些实施方案中,碱基缺失包括三个或更多个连续核苷酸(例如,3、4、5、6、7、8、9、10、12、15、18、21、24、27、30、35、40、45、50、55、60、65、70、75、80、90、100、110、120、130、140、150、160或更多个核苷酸,或其中的任何值或范围)的缺失。在一些实施方案中,至少一个突变是非天然突变。
在一些实施方案中,碱基缺失包括从组蛋白去甲基化酶基因的ZnF结构域缺失至少一个碱基对或缺失三个或更多个连续核苷酸(例如,参考SEQ ID NO:69的核苷酸位置编号,从位置3927到位置4165缺失至少一个核苷酸,参考SEQ ID NO:70的核苷酸位置编号,从位置1495到位置1654缺失至少一个核苷酸,参考SEQ ID NO:72的核苷酸位置编号,从位置3987到位置4233缺失至少一个核苷酸,和/或参考SEQ ID NO:73的核苷酸位置编号,从位置1498到位置1656缺失至少一个核苷酸)。
在一些实施方案中,碱基缺失包括从组蛋白去甲基化酶基因的JmjC结构域缺失至少一个碱基对或缺失三个或更多个连续核苷酸(例如,参考SEQ ID NO:69的核苷酸位置编号,从位置3100到位置3631缺失至少一个核苷酸,参考SEQ ID NO:70的核苷酸位置编号,从位置832到位置1199缺失至少一个核苷酸,参考SEQ ID NO:72的核苷酸位置编号,从位置3162到位置3692缺失至少一个核苷酸,和/或参考SEQ ID NO:73的核苷酸位置编号,从位置835到位置1203缺失至少一个核苷酸)。
在一些实施方案中,碱基缺失包括从组蛋白去甲基化酶基因的JmjN结构域缺失至少一个碱基对或缺失三个或更多个连续核苷酸(例如,参考SEQ ID NO:69的核苷酸位置编号,从位置2216到位置2424缺失至少一个核苷酸,参考SEQ ID NO:70的核苷酸位置编号,从位置301到位置402缺失至少一个核苷酸,参考SEQ ID NO:72的核苷酸位置编号,从位置2268到位置2477缺失至少一个核苷酸,和/或参考SEQ ID NO:73的核苷酸位置编号,从位置305到位置405缺失至少一个核苷酸)。
在一些实施方案中,碱基缺失导致组蛋白去甲基化酶的ZnF结构域的一个或多个氨基酸残基、组蛋白去甲基化酶的JmjN结构域的一个或多个氨基酸残基和/或组蛋白去甲基化酶的JmjC结构域的一个或多个氨基酸残基的缺失(例如,来自组蛋白去甲基化酶(例如VRS3多肽,例如SEQ ID NO:71或SEQ ID NO:74)的ZnF结构域、JmjN结构域或JmjC结构域的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83或84个氨基酸残基的缺失,任选地,其中所缺失的氨基酸是连续的,或者是连续和非连续氨基酸残基的组合)。
在一些实施方案中,碱基缺失导致组蛋白去甲基化酶的ZnF结构域的一个或多个氨基酸残基的缺失,即,参考SEQ ID NO:71的氨基酸位置编号,从位置499到位置551缺失一个或多个氨基酸残基,和/或参考SEQ ID NO:74的氨基酸位置编号,从位置500到位置552缺失一个或多个氨基酸残基。在一些实施方案中,碱基缺失导致组蛋白去甲基化酶的JmjC结构域的一个或多个氨基酸残基的缺失,即,参考SEQ ID NO:71的氨基酸位置编号,从位置278到位置400缺失一个或多个氨基酸残基,和/或参考SEQ ID NO:74的氨基酸位置编号,从位置123到位置401缺失一个或多个氨基酸残基。在一些实施方案中,碱基缺失导致组蛋白去甲基化酶的JmjN结构域的一个或多个氨基酸残基的缺失,即,参考SEQ ID NO:71的氨基酸位置编号,从位置101到位置135缺失一个或多个氨基酸残基,和/或参考SEQ ID NO:74的氨基酸位置编号,从位置101到位置136缺失一个或多个氨基酸残基。
本发明有用的突变(例如,内源性组蛋白去甲基化酶基因中一个或多个核苷酸的置换或缺失,或内源性组蛋白去甲基化酶中一个或多个氨基酸的置换或缺失)可能导致显性负性突变、半显性突变、弱功能丧失突变、亚效等位基因突变或无效突变,任选地,其中所述突变可能是非自然突变。在一些实施方案中,突变导致显性负性突变、半显性和/或亚效等位基因突变。在一些实施方案中,突变破坏组蛋白去甲基化酶多肽与DNA的结合和/或降低组蛋白去甲基化酶多肽的组蛋白去甲基化活性,任选地,其中所述突变导致显性负性突变或半显性突变。
在一些实施方案中,提供了一种植物细胞,所述植物细胞包含编辑系统,所述编辑系统包含:(a)CRISPR相关效应蛋白;和(b)引导核酸(例如,gRNA、gDNA、crRNA、crDNA、sgRNA和sgDNA),所述引导核酸包含与编码组蛋白去甲基化酶的内源性靶基因互补的间隔序列。在一些实施方案中,组蛋白去甲基化酶是SIX-ROWED SPIKE 3(VRS3),任选地是Jumonji C型H3K9me2/me3去甲基化酶。在一些实施方案中,编码组蛋白去甲基化酶(例如VRS3)的内源性靶基因:(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;和/或(b)编码与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的多肽序列。在一些实施方案中,编码组蛋白去甲基化酶(例如VRS3)的内源性靶基因包含:(1)JmjN结构域、所述JmjN结构域:(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80%的序列同一性的多肽,(2)JmjC结构域,所述JmjC结构域:(a)与SEQID NO:76、79、82或85中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQID NO:88或SEQ ID NO:91的氨基酸序列具有至少80%的序列同一性的多肽,和/或(3)ZnF结构域,所述ZnF结构域:(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80%的序列同一性的多肽。在一些实施方案中,植物细胞可以来自玉米植物。
在一些实施方案中,所述编辑系统在编码VRS3蛋白的内源性靶基因中产生突变。在一些实施方案中,突变是非天然突变。在一些实施方案中,编辑系统的引导核酸可以包含SEQ ID NO:93-103(即SEQ ID NO:93、94、95、96、97、98、99、100、101、102、103)中任一个的核苷酸序列(例如,间隔序列),其中所述包含SEQ ID NO:93-103的间隔子可以用于靶向VRS3基因,任选地靶向例如,玉米植物的1号染色体和/或5号染色体上的VRS3基因。在一些实施方案中,包含含有SEQ ID NO:93-96(即SEQ ID NO:93、94、95、96)中任一个或多个核苷酸序列的间隔子的引导核酸可用于靶向VRS3多核苷酸的JmjN区域,以例如产生框内缺失。在一些实施方案中,包含含有SEQ ID NO:97-99(即SEQ ID NO:97、98、99)中任一个或多个核苷酸序列的间隔子的引导核酸可用于靶向VRS3多核苷酸的JmjN区域,以例如产生框内缺失和/或框外缺失。在一些实施方案中,可以使用包含含有SEQ ID NO:100-103(即SEQ IDNO:100、101、102、103)中任一个或多个核苷酸序列的间隔子的引导核酸,所述间隔子包含,例如,以缺失VRS3多核苷酸的ZnF结构域。
在一些实施方案中,提供了一种植物细胞,所述植物细胞包含组蛋白去甲基化酶基因的DNA结合位点中的突变,突变的组蛋白去甲基化酶基因的DNA结合位点阻止或减少编码的组蛋白去甲基化酶与DNA的结合或降低编码的组蛋白去甲基化酶的活性,其中所述基因组修饰是使用编辑系统引入的置换、插入和/或缺失,所述编辑系统包含与组蛋白去甲基化酶基因中的靶位点结合的核酸结合结构域,其中所述组蛋白去甲基化酶基因:(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%序列同一性的序列;(b)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽。在一些实施方案中,组蛋白去甲基化酶基因编码SIX-ROWED SPIKE 3(VRS3),任选地是Jumonji C型H3K9me2/me3去甲基化酶。在一些实施方案中,组蛋白去甲基化酶基因包括:(1)JmjN结构域,所述JmjN结构域:(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80%的序列同一性的多肽,(2)JmjC结构域,所述JmjC结构域:(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:88或SEQID NO:91具有至少80%的序列同一性的多肽的氨基酸序列,和/或(3)ZnF结构域,所述ZnF结构域:(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80%序列同一性的多肽。在一些实施方案中,编辑系统的核酸结合结构域来自多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)和/或Argonaute蛋白。在一些实施方案中,植物可以从植物细胞再生,任选地,其中所述植物表现出增加的小花育性、增加的种子数量和/或增加的种子重量。在一些实施方案中,植物细胞可以来自玉米植物。
植物或其部分或植物细胞的内源性VRS3基因中的突变可以是任何类型的突变,包括碱基置换、缺失和/或插入。在一些实施方案中,突变可以是非天然突变。在一些实施方案中,至少一个突变可以是点突变。在一些实施方案中,突变可以包含对A、T、G或C的碱基置换。在一些实施方案中,突变可以是至少一个碱基对的缺失或至少一个碱基对的插入。在一些实施方案中,突变可导致VRS3蛋白中氨基酸残基的置换。在一些实施方案中,突变可以是内源性组蛋白去甲基化酶的锌指DNA结合结构域(ZnF结构域)、Jumonji C型(Jmj-C)结构域和Jumonji N型(Jmj-N)结构域的全部或部分缺失。在一些实施方案中,缺失可以是框内缺失或框外缺失。
在一些实施方案中,本发明有用的缺失可以是VRS3基因座的锌指DNA结合结构域(ZnF结构域)、Jumonji C型(Jmj-C)结构域和Jumonji N型(Jmj-N)结构域中的缺失。在一些实施方案中,缺失可以包含至少1个碱基对和/或至少2个连续碱基对(例如,1个碱基对和/或约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70,71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、110、120、121、122、123、124、125、126、127、128、129、130、140、150、151、152、153、154、155、156、157、158、159、160、180、200、201、202、203、204、205、206、207、208、209、210、220、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、260、270、280、290、300、310、320、330、340、350、360、361、362、363、364、365、366、367、368、369、370、380、390、400、450、500、510、520、530、531或532个或更多个连续碱基对,或其中的任何范围或值)。在一些实施方案中,缺失可以是:至少1个碱基对至约3、4、5、6个连续碱基对,至少1个碱基对至约10个连续碱基对,约10个连续碱基对至约15个连续碱基对,约10个连续碱基对至约30个连续碱基对,约10个连续碱基对至约50个连续碱基对,约50个连续碱基对至约100、101、102、103、104或105个或更多个连续碱基对,约50个连续碱基对至约200、201、202、203、204、205、206、207、208、209或210个或更多个连续碱基对,约50、100、150或200个连续碱基对至约250、300、350、360、361、362、363、364、365、366、367、368、369或370个或更多个连续碱基对,或约100、150、200、250、300或350个连续碱基对至约400、410、420、430、440、450、460、470、480、490、500、510、520、530、531、532、533、534、535、536、537、538、539或540个或更多个连续碱基对。在一些实施方案中,缺失可以包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71,72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98或99个连续碱基对至约100、101、102、103、104、105、110、120、121、122、123、124、126、127、128、129、130、140、150、151、152、153、154、155、156、158、159、160、180、200、201、202、203、204、205、207、209、210、220、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、260、270、280、290、300、310、320、330、340、350、360、361、362、363、364、365、366、367、368、369、370、380、390、400、450、500、510、520、530、531或532个或更多个连续碱基对,或其中的任何范围或值。
在一些实施方案中,本发明提供了一种植物或植物部分,所述植物或植物部分包含编码修饰的组蛋白去甲基化酶多肽的修饰的内源性组蛋白去甲基化酶基因。在一些实施方案中,植物或植物部分可以是玉米植物。
在一些实施方案中,提供了一种产生/育种无转基因的编辑的植物的方法,所述方法包括:使本发明的植物(例如,包含VRS3基因中的突变并具有增加的小花育性、增加的种子数量(例如,籽粒数)和/或增加的种子重量(例如,粒籽重量))与无转基因的植物杂交,从而使至少一个突变(任选地,非天然突变)引入无转基因的植物(例如,引入子代植物)中;以及选择包含至少一个突变并且无转基因的子代植物,从而产生无转基因的编辑的植物。
本文还提供了一种提供具有增加的产量(例如,增加的小花育性、增加的种子数量和/或增加的种子重量)的多种植物的方法,所述方法包括在生长区域(例如,田地(例如,耕地,农田)、生长室、温室、休闲区、草坪和/或路边等)种植本发明的两种或更多种植物(例如,2、3、4、5、6、7、8、9、10种或更多种植物,所述植物包含VRS3多肽中的突变,并且具有例如增加的小花育性、增加的种子数量和/或增加的种子重量),从而提供与不包含突变的多种对照植物相比(例如,与不包含突变的同基因植物(例如,野生型未编辑的植物或空缺分离体)相比)具有增加的产量的多种植物。
在一些实施方案中,提供了一种用于编辑植物细胞基因组中特定位点的方法,所述方法包括:以位点特异性方式切割植物细胞中的内源性组蛋白去甲基化酶基因中的靶位点,所述内源性组蛋白去甲基化酶基因:(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;和/或(b)编码包含与SEQ ID NO:71或SEQ IDNO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽,从而在植物细胞的内源性组蛋白去甲基化酶基因(例如VRS3基因)中产生编辑。在一些实施方案中,组蛋白去甲基化酶基因包括:(1)JmjN结构域,所述JmjN结构域:(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80%的序列同一性的多肽,(2)JmjC结构域,所述JmjC结构域:(a)与SEQ IDNO:76、79、82或85中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ IDNO:88或SEQ ID NO:91的氨基酸序列具有至少80%的序列同一性的多肽,和/或(3)ZnF结构域,所述ZnF结构域:(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80%的序列同一性的多肽。在一些实施方案中,内源性组蛋白去甲基化酶基因中的编辑导致突变,包括但不限于缺失、置换或插入,其中所述编辑可以是点突变和/或框内突变和/或框外缺失,任选地,其中所述突变可以是显性负性突变或半显性突变。在一些实施方案中,突变是缺失,任选地,其中所述缺失包含如本文所述的VRS3基因的ZnF区域、JmjC区域和/或JmjN区域中至少1个碱基对或更多个碱基对的缺失。在一些实施方案中,参考SEQ ID NO:71的氨基酸位置编号,从位置499到位置551和/或参考SEQ ID NO:74的氨基酸位置编号,从位置500到位置552,缺失组蛋白去甲基化酶的ZnF结构域的一个或多个氨基酸残基,参考SEQ ID NO:71的氨基酸位置编号,从位置278到位置400和/或参考SEQ ID NO:74的氨基酸位置编号,从位置123到位置401,缺失组蛋白去甲基化酶的JmjC结构域的一个或多个氨基酸残基,和/或参考SEQ ID NO:71的氨基酸位置编号,从位置101到位置135和/或参考SEQ ID NO:74的氨基酸位置编号,从位置101到位置136,缺失组蛋白去甲基化酶的JmjN结构域的一个或多个氨基酸残基。
在一些实施方案中,编辑方法还可以包括从包含内源性组蛋白去甲基化酶基因(例如VRS3基因)中的编辑的植物细胞再生植物,从而产生包含其内源性组蛋白去甲基化酶基因中的编辑的植物,任选地,其中包含其内源性组蛋白去甲基化酶基因中的编辑的所述植物与不包含编辑的对照植物(例如,不包含编辑的同基因植物(例如野生型未编辑的植物或空缺分离体))相比,表现出增加的小花育性、增加的种子数量和/或增加的种子重量。在一些实施方案中,所述编辑提供内源性组蛋白去甲基化酶基因中的突变(任选的,非天然突变),突变的组蛋白去甲基化酶基因产生具有减少的DNA结合和/或降低的组蛋白去甲基化活性的组蛋白去甲基化酶多肽,任选地,其中所述突变是显性负性突变或半显性突变。
在一些实施方案中,提供了一种产生植物的方法,所述方法包括:(a)使包含编码组蛋白去甲基化酶的野生型内源性基因的植物细胞群体与靶向野生型内源性基因的核酸酶接触,其中所述核酸酶与结合野生型内源性基因中靶位点的核酸结合结构域(例如DNA结合结构域)连接,所述野生型内源性基因:(i)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;或(ii)编码包含与SEQ ID NO:71或SEQ IDNO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽;(b)从所述群体中选择包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物细胞,其中所述突变是(i)或(ii)中任一项的多肽中至少一个氨基酸残基的置换和/或缺失,其中所述突变降低或消除组蛋白去甲基化酶结合DNA的能力或降低组蛋白去甲基化酶的组蛋白去甲基化活性;以及(c)使选择的植物细胞生长成包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物。
在一些实施方案中,提供了一种增加植物的小花育性、种子数量和/或种子重量的方法,所述方法包括:(a)使包含编码组蛋白去甲基化酶的野生型内源性基因的植物细胞与靶向野生型内源性基因的核酸酶接触,其中所述核酸酶与结合野生型内源性基因中靶位点的核酸结合结构域连接,所述野生型内源性基因:(i)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;或(ii)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽,从而产生包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物细胞;(b)使植物细胞生长成包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物,从而增加植物的小花育性、种子数量和/或种子重量。
在一些实施方案中,提供了一种产生植物或其部分的方法,所述植物或其部分包含至少一个具有内源性组蛋白去甲基化酶基因中的突变的细胞,所述方法包括使植物或植物部分中的组蛋白去甲基化酶基因中的靶位点与包含切割结构域和DNA结合结构域的核酸酶接触,其中所述核酸结合结构域与组蛋白去甲基化酶基因中的靶位点结合,其中所述组蛋白去甲基化酶基因:(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;或(b)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽,从而产生包含至少一个具有内源性组蛋白去甲基化酶基因中的突变的细胞的植物或其部分。在一些实施方案中,突变的内源性组蛋白去甲基化酶基因产生具有减少的DNA结合和/或降低的组蛋白去甲基化活性的组蛋白去甲基化酶多肽。
本文还提供了一种产生植物或其部分的方法,所述植物或其部分包含内源性组蛋白去甲基化酶中的突变,突变的内源性组蛋白去甲基化酶具有减少的DNA结合和/或降低的组蛋白去甲基化活性,所述方法包括使植物或植物部分中的内源性组蛋白去甲基化酶基因中的靶位点与包含切割结构域和核酸结合结构域的核酸酶接触,其中所述核酸结合结构域与组蛋白去甲基化酶基因中的靶位点结合,其中所述组蛋白去甲基化酶基因:(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;或(b)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽,从而产生具有内源性组蛋白去甲基化酶中的突变的植物或其部分,突变的内源性组蛋白去甲基化酶具有减少的DNA结合和/或降低的组蛋白去甲基化活性。
在一些实施方案中,可用于本发明的组蛋白去甲基化酶基因包含JmjN结构域、JMjC结构域和/或锌指结合(ZnF)结构域,(1)JmjN结构域,所述JmjN结构域:(a)与SEQ IDNO:75、78、81或84中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ IDNO:87或SEQ ID NO:90的氨基酸序列具有至少80%的序列同一性的多肽,(2)JMjC结构域,所述JMjC结构域:(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80%的序列同一性的多肽,和/或(3)ZnF结构域,所述ZnF结构域:(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80%的序列同一性的多肽。
在一些实施方案中,核酸酶可以切割内源性组蛋白去甲基化酶基因(例如,VRS3),从而将突变引入内源性组蛋白去甲基化酶基因。本发明有用的核酸酶可以是可用于编辑/修饰靶核酸的任何核酸酶。这种核酸酶包括但不限于锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)、核酸内切酶(例如,Fok1)和/或CRISPR-Cas效应蛋白。同样,本发明有用的任何核酸结合结构域(例如,DNA结合结构域)可以是可用于编辑/修饰靶核酸的任何核酸结合结构域。此类核酸结合结构域包括但不限于锌指、转录激活因子样DNA结合结构域(TAL)、argonaute和/或CRISPR-Cas效应物DNA结合结构域。
在一些实施方案中,提供了一种编辑植物或植物部分的内源性VRS3基因的方法,所述方法包括使植物或植物部分的VRS3基因中的靶位点与胞嘧啶碱基编辑系统接触,所述胞嘧啶碱基编辑系统包含胞嘧啶脱氨酶和与VRS3基因中的靶位点结合的核酸结合结构域,所述VRS3基因包含与SEQ ID NO:75、76、77、78、79、80、81、82、83、84、85或86中任一个核苷酸序列具有至少80%的序列同一性的区域,和/或编码(i)与SEQ ID NO:87、88、89、90、91或92中任一个氨基酸序列具有至少80%序列同一性的多肽,从而产生包含具有突变的内源性VRS3基因的植物或其部分,所述突变减少VRS3多肽的DNA结合和/或降低组蛋白去甲基化活性,并且任选地,其中所述植物表现出增加的小花育性、增加的种子数量(例如籽粒数量)和/或增加的种子重量。
在一些实施方案中,提供了一种编辑植物或植物部分的内源性VRS3基因的方法,所述方法包括使植物或植物部分的VRS3基因中的靶位点与胞嘧啶碱基编辑系统接触,所述胞嘧啶碱基编辑系统包含腺苷脱氨酶和与VRS3基因中的靶位点结合的核酸结合结构域,所述VRS3基因包含与SEQ ID NO:75、76、77、78、79、80、81、82、83、84、85或86中任一个核苷酸序列具有至少80%序列同一性的区域,和/或编码(i)与SEQ ID NO:87、88、89、90、91或92中任一个氨基酸序列具有至少80%的序列同一性的多肽,从而产生包含具有突变的内源性VRS3基因的植物或其部分,所述突变减少VRS3多肽的DNA结合和/或降低VRS3多肽的组蛋白去甲基化活性,并且任选地,其中所述植物表现出增加的小花育性、增加的种子数量(例如,籽粒数量)和/或增加的种子重量。
在一些实施方案中,提供了一种检测突变VRS3基因(内源性VRS3基因中的突变)的方法,所述方法包括在植物基因组中检测编码例如SEQ ID NO:71、74、87、88、89、90、91或92中任一个的氨基酸序列的核酸中的突变,所述突变导致氨基酸序列的氨基酸残基置换或编码的氨基酸序列的部分缺失。
在一些实施方案中,提供了一种检测突变VRS3基因(内源性VRS3基因中的突变)的方法,所述方法包括在植物基因组中检测例如SEQ ID NO:69、70、72、73、75、76、77、78、79、80、81、82、83、84、85或86中任一个核苷酸序列中的突变,任选地其中所述突变是至少一个(例如1、2、3、4、5、6、7、8、9、10个或更多个)核苷酸的置换或缺失。
在一些实施方案中,本发明提供了一种检测内源性VRS3基因中的突变的方法,所述方法包括在植物基因组中检测如本文所述产生的突变的VRS3基因。
在一些实施方案中,本发明提供了一种产生包含内源性VRS3基因中的突变和至少一个感兴趣的多核苷酸的植物的方法,所述方法包括使包含内源性VRS3基因中的至少一个突变的本发明植物(第一植物)与包含至少一个感兴趣的多核苷酸的第二植物杂交以产生子代植物;以及选择包含VRS3基因中的至少一个突变和至少一个感兴趣的多核苷酸的子代植物,从而产生包含内源性VRS3基因中的突变和至少一个感兴趣的多核苷酸的植物。
本发明还提供了一种产生包含内源性VRS3基因中的突变和至少一个感兴趣的多核苷酸的植物的方法,所述方法包括将至少一个感兴趣的多核苷酸引入包含VRS3基因中的至少一个突变的本发明的植物中,从而产生包含VRS3基因中的至少一个突变和至少一个感兴趣的多核苷酸的植物。
在一些实施方案中,本发明提供了一种产生包含内源性VRS3基因中的突变和至少一个感兴趣的多核苷酸的植物的方法,所述方法包括将至少一个感兴趣的多核苷酸引入包含内源性VRS3基因中的至少一个突变的本发明的植物中,从而产生包含VRS3基因中的至少一个突变和至少一个感兴趣的多核苷酸的植物。
感兴趣的多核苷酸可以是可以赋予植物以期望的表型或另外改变表型或基因型的任何多核苷酸。在一些实施方案中,感兴趣的多核苷酸可以是赋予除草剂耐受性、抗虫性、抗病性、增加的产量、增加的养分利用效率和/或非生物胁迫抗性的多核苷酸。因此,根据本发明优选的待处理的植物或植物栽培种包括通过基因修饰获得遗传物质的所有植物,这些遗传物质赋予这些植物特别有利的有用特性(“性状”)。这些特性的例子是更好的植物生长、活力、抗胁迫性、站立性、抗倒伏性、养分吸收、植物营养和/或产量,特别是改善的生长、增加的对高温或低温的耐受性、增加的对干旱或对水或土壤盐度的耐受性、增强的开花性能、更容易收获、加速成熟、更高的产量、更高的质量和/或收获产品的更高营养价值,更长的储存寿命和/或收获产品的可加工性。
这些特性的进一步实例是对动物和微生物害虫的抵抗力提高,诸如对昆虫、蛛形纲动物、线虫、螨虫、蛞蝓和蜗牛的抵抗力,例如,因植物中形成的毒素所致。在编码赋予对此类动物和微生物害虫,特别是昆虫的耐受性特性的蛋白质的DNA序列中,将特别提到来自苏云金芽孢杆菌的编码Bt蛋白的遗传物质,Bt蛋白在文献中被广泛描述并为本领域技术人员所熟知。还将提到从细菌中提取的蛋白质,所述细菌诸如发光杆菌属(Photorhabdus)(WO97/17432和WO98/08932)。特别要提到的是Bt Cry或VIP蛋白,包括CrylA、CryIAb、CryIAc、CryIIA、CryIIIA、CryIIIB2、Cry9c Cry2Ab、Cry3Bb和CryIF蛋白或其毒性片段,以及它们的杂交体或组合,特别是CrylF蛋白或源自CrylF蛋白的杂交体(例如杂交CrylA-CrylF蛋白或其毒性片段)、CrylA型蛋白或其毒性片段,优选CrylAc蛋白或衍生自CrylAc蛋白的杂交体(例如,杂交CrylAb-CrylAc蛋白)或CrylAb或Bt2蛋白或其毒性片段、Cry2Ae、Cry2Af或Cry2Ag蛋白或其毒性片段、CrylA.105蛋白或其毒性片段、VIP3Aa19蛋白、VIP3Aa20蛋白、在COT202或COT203棉花事件中产生的VIP3A蛋白、VIP3Aa蛋白或其毒性片段,如Estruch等人(1996),Proc Natl Acad Sci USA.28;93(11):5389-94中所述,如WO2001/47952中所述的Cry蛋白,来自致病杆菌属(Xenorhabdus)的杀虫蛋白(如WO98/50427中所述)、沙雷氏菌属(特别是来自嗜虫沙雷氏菌)或发光杆菌属菌株,诸如WO98/08932中所述的来自发光杆菌属的Tc蛋白。此外,这些蛋白质中任一个在某些氨基酸(1-10个,优选1-5个)上与上述命名的序列中任一个不同的任何变体或突变体,特别是它们的毒性片段的序列,或与转运肽(诸如质体转运肽)融合,或另一种蛋白质或肽,都包括在本文中。
这种特性的另一个特别强调的实例是赋予对一种或多种除草剂的耐受性,所述除草剂例如咪唑啉酮、磺酰脲类、草甘膦或草丁膦。在编码蛋白质(即,感兴趣的多核苷酸)的DNA序列中,这些蛋白质赋予经转化的植物细胞和植物对某些除草剂的耐受性的特性,将特别提到WO2009/152359中描述的bar或PAT基因或天蓝链霉菌(Streptomyces coelicolor)基因,该基因赋予对草铵膦除草剂的耐受性;编码合适的EPSPS(5-烯醇丙酮酰莽草酸-3-磷酸-合酶)的基因赋予对以EPSPS为靶标的除草剂的耐受性,特别是诸如草甘膦及其盐类的除草剂;编码草甘膦-n-乙酰转移酶的基因,或编码草甘膦氧化还原酶的基因。其它合适的耐除草剂性状包括至少一种ALS(乙酰乳酸合酶)抑制剂(例如,WO2007/024782),突变的拟南芥ALS/AHAS基因(例如,美国专利6,855,533),编码2,4-D-单加氧酶的基因赋予对2,4-D(2,4-二氯苯氧乙酸)的耐受性和编码麦草畏单加氧酶的基因赋予对麦草畏(3,6-二氯-2-甲氧基苯甲酸)的耐受性。
这些特性的进一步实例是对植物病原真菌、细菌和/或病毒的抗性增强,例如,因系统获得性抗性(SAR)、系统素(systemin)、植物抗毒素、诱导子以及抗性基因和相应表达的蛋白质和毒素所致。
可以优先地根据本发明处理的转基因植物或植物栽培种中的特别有用的转基因事件包括:事件531/PV-GHBK04(棉花,昆虫防治,记载于WO2002/040677),事件1143-14A(棉花,昆虫防治,未保藏,记载于WO2006/128569);事件1143-51B(棉花,昆虫防治,未保藏,记载于WO2006/128570);事件1445(棉花,除草剂耐受性,未保藏,记载于US-A2002-120964或WO2002/034946);事件17053(水稻,除草剂耐受性,保藏为PTA-9843,记载于WO2010/117737);事件17314(水稻,除草剂耐受性,保藏为PTA-9844,记载于WO2010/117735);事件281-24-236(棉花,昆虫防治-除草剂耐受性,保藏为PTA-6233,记载于WO2005/103266或US-A 2005-216969);事件3006-210-23(棉花,昆虫防治-除草剂耐受性,保藏为PTA-6233,记载于US-A 2007-143876或WO2005/103266);事件3272(玉米,质量性状,保藏为PTA-9972,记载于WO2006/098952或US-A 2006-230473);事件33391(小麦,除草剂耐受性,保藏为PTA-2347,记载于WO2002/027004),事件40416(玉米,昆虫防治-除草剂耐受性,保藏为ATCCPTA-11508,记载于WO 11/075593);事件43A47(玉米,昆虫防治-除草剂耐受性,保藏为ATCCPTA-11509,记载于WO2011/075595);事件5307(玉米,昆虫防治,保藏为ATCC PTA-9561,记载于WO2010/077816);事件ASR-368(翦股颖,除草剂耐受性,保藏为ATCC PTA-4816,记载于US-A 2006-162007或WO2004/053062);事件B16(玉米,除草剂耐受性,未保藏,记载于US-A2003-126634);事件BPS-CV127-9(大豆,除草剂耐受性,保藏为NCIMB No.41603,记载于WO2010/080829);事件BLRl(油菜,恢复雄性不育,保藏为NCIMB 41193,记载于WO2005/074671),事件CE43-67B(棉花,昆虫防治,保藏为DSMACC2724,记载于US-A 2009-217423或WO2006/128573);事件CE44-69D(棉花,昆虫防治,未保藏,记载于US-A 2010-0024077);事件CE44-69D(棉花,昆虫防治,未保藏,记载于WO2006/128571);事件CE46-02A(棉花,昆虫防治,未保藏,记载于WO2006/128572);事件COT102(棉花,昆虫防治,未保藏,记载于US-A2006-130175或WO2004/039986);事件COT202(棉花,昆虫防治,未保藏,记载于US-A2007-067868或WO2005/054479);事件COT203(棉花,昆虫防治,未保藏,记载于WO2005/054480););事件DAS21606-3/1606(大豆,除草剂耐受性,保藏为PTA-11028,记载于WO2012/033794),事件DAS40278(玉米,除草剂耐受性,保藏为ATCC PTA-10244,记载于WO2011/022469);事件DAS-44406-6/pDAB8264.44.06.l(大豆,除草剂耐受性,保藏为PTA-11336,记载于WO2012/075426),事件DAS-14536-7/pDAB8291.45.36.2(大豆,除草剂耐受性,保藏为PTA-11335,记载于WO2012/075429),事件DAS-59122-7(玉米,昆虫防治-除草剂耐受性,保藏为ATCC PTA 11384,记载于US-A 2006-070139);事件DAS-59132(玉米,昆虫防治-除草剂耐受性,未保藏,记载于WO2009/100188);事件DAS68416(大豆,除草剂耐受性,保藏为ATCCPTA-10442,记载于WO2011/066384或WO2011/066360);事件DP-098140-6(玉米,除草剂耐受性,保藏为ATCC PTA-8296,记载于US-A 2009-137395或WO 08/112019);事件DP-305423-1(大豆,质量性状,未保藏,记载于US-A 2008-312082或WO2008/054747);事件DP-32138-1(玉米,杂交系统,保藏为ATCC PTA-9158,记载于US-A 2009-0210970或WO2009/103049);事件DP-356043-5(大豆,除草剂耐受性,保藏为ATCC PTA-8287,记载于US-A 2010-0184079或WO2008/002872);事件EE-I(茄子,昆虫防治,未保藏,记载于WO 07/091277);事件Fil 17(玉米,除草剂耐受性,保藏为ATCC 209031,记载于US-A 2006-059581或WO 98/044140);事件FG72(大豆,除草剂耐受性,保藏为PTA-11041,记载于WO2011/063413),事件GA21(玉米,除草剂耐受性,保藏为ATCC 209033,记载于US-A 2005-086719或WO 98/044140);事件GG25(玉米,除草剂耐受性,保藏为ATCC 209032,记载于US-A 2005-188434或WO98/044140);事件GHB119(棉花,昆虫防治-除草剂耐受性,保藏为ATCC PTA-8398,记载于WO2008/151780);事件GHB614(棉花,除草剂耐受性,保藏为ATCC PTA-6878,记载于US-A 2010-050282或WO2007/017186);事件GJ11(玉米,除草剂耐受性,保藏为ATCC 209030,记载于US-A 2005-188434或WO98/044140);事件GM RZ13(糖用甜菜,抗病毒性,保藏为NCIMB-41601,记载于WO2010/076212);事件H7-l(糖用甜菜,除草剂耐受性,保藏为NCIMB 41158或NCIMB 41159,记载于US-A 2004-172669或WO 2004/074492);事件JOPLINl(小麦,抗病性,未保藏,记载于US-A 2008-064032);事件LL27(大豆,除草剂耐受性,保藏为NCIMB41658,记载于WO2006/108674或US-A2008-320616);事件LL55(大豆,除草剂耐受性,保藏为NCIMB 41660,记载于WO 2006/108675或US-A2008-196127);事件LLcotton25(棉花,除草剂耐受性,保藏为ATCCPTA-3343,记载于WO2003/013224或US-A 2003-097687);事件LLRICE06(水稻,除草剂耐受性,保藏为ATCC 203353,记载于US 6,468,747或WO2000/026345);事件LLRice62(水稻,除草剂耐受性,保藏为ATCC 203352,记载于WO2000/026345),事件LLRICE601(水稻,除草剂耐受性,保藏为ATCC PTA-2600,记载于US-A 2008-2289060或WO2000/026356);事件LY038(玉米,质量性状,保藏为ATCC PTA-5623,记载于US-A2007-028322或WO2005/061720);事件MIR162(玉米,昆虫防治,保藏为PTA-8166,记载于US-A 2009-300784或WO2007/142840);事件MIR604(玉米,昆虫防治,未保藏,记载于US-A 2008-167456或WO2005/103301);事件MON15985(棉花,昆虫防治,保藏为ATCC PTA-2516,记载于US-A 2004-250317或WO2002/100163);事件MON810(玉米,昆虫防治,未保藏,记载于US-A2002-102582);事件MON863(玉米,昆虫防治,保藏为ATCC PTA-2605,记载于WO2004/011601或US-A 2006-095986);事件MON87427(玉米,人工授粉,保藏为ATCC PTA-7899,记载于WO2011/062904);事件MON87460(玉米,胁迫抗性,保藏为ATCC PTA-8910,记载于WO2009/111263或US-A 2011-0138504);事件MON87701(大豆,昆虫防治,保藏为ATCC PTA-8194,记载于US-A 2009-130071或WO2009/064652);事件MON87705(大豆,质量性状-除草剂耐受性,保藏为ATCC PTA-9241,记载于US-A 2010-0080887或WO2010/037016);事件MON87708(大豆,除草剂耐受性,保藏为ATCC PTA-9670,记载于WO2011/034704);事件MON87712(大豆,产量,保藏为PTA-10296,记载于WO2012/051199),事件MON87754(大豆,质量性状,保藏为ATCC PTA-9385,记载于WO2010/024976);事件MON87769(大豆,质量性状,保藏为ATCC PTA-8911,记载于US-A 2011-0067141或WO2009/102873);事件MON88017(玉米,昆虫防治-除草剂耐受性,保藏为ATCCPTA-5582,记载于US-A 2008-028482或WO2005/059103);事件MON88913(棉花,除草剂耐受性,保藏为ATCC PTA-4854,记载于WO2004/072235或US-A2006-059590);事件MON88302(油菜,除草剂耐受性,保藏为PTA-10955,记载于WO2011/153186),事件MON88701(棉花,除草剂耐受性,保藏为PTA-11754,记载于WO2012/134808),事件MON89034(玉米,昆虫防治,保藏为ATCC PTA-7455,记载于WO 07/140256或US-A 2008-260932);事件MON89788(大豆,除草剂耐受性,保藏为ATCC PTA-6708,记载于US-A 2006-282915或WO2006/130436);事件MSl 1(油菜,人工授粉-除草剂耐受性,保藏为ATCC PTA-850或PTA-2485,记载于WO2001/031042);事件MS8(油菜,人工授粉-除草剂耐受性,保藏为ATCC PTA-730,记载于WO2001/041558或US-A 2003-188347);事件NK603(玉米,除草剂耐受性,保藏为ATCC PTA-2478,记载于US-A 2007-292854);事件PE-7(水稻,昆虫防治,未保藏,记载于WO2008/114282);事件RF3(油菜,人工授粉-除草剂耐受性,保藏为ATCC PTA-730,记载于WO2001/041558或US-A2003-188347);事件RT73(油菜,除草剂耐受性,未保藏,记载于WO2002/036831或US-A2008-070260);事件SYHT0H2/SYN-000H2-5(大豆,除草剂耐受性,保藏为PTA-11226,记载于WO2012/082548),事件T227-1(糖用甜菜,除草剂耐受性,未保藏,记载于WO2002/44407或US-A 2009-265817);事件T25(玉米,除草剂耐受性,未保藏,记载于US-A 2001-029014或WO2001/051654);事件T304-40(棉花,昆虫防治-除草剂耐受性,保藏为ATCC PTA-8171,记载于US-A 2010-077501或WO2008/122406);事件T342-142(棉花,昆虫防治,未保藏,记载于WO2006/128568);事件TC1507(玉米,昆虫防治-除草剂耐受性,未保藏,记载于US-A 2005-039226或WO2004/099447);事件VIP1034(玉米,昆虫防治-除草剂耐受性,保藏为ATCC PTA-3925,记载于WO2003/052073),事件32316(玉米,昆虫防治-除草剂耐受性,保藏为PTA-11507,记载于WO2011/084632),事件4114(玉米,昆虫防治-除草剂耐受性,保藏为PTA-11506,记载于WO2011/084621),事件EE-GM3/FG72(大豆,除草剂耐受性,ATCC登录号N°PTA-11041)任选地叠加事件EE-GM1/LL27或事件EE-GM2/LL55(WO2011/063413A2),事件DAS-68416-4(大豆,除草剂耐受性,ATCC登录号N°PTA-10442,WO2011/066360A1),事件DAS-68416-4(大豆,除草剂耐受性,ATCC登录号N°PTA-10442,WO2011/066384A1),事件DP-040416-8(玉米,昆虫防治,ATCC登录号N°PTA-11508,WO2011/075593A1),事件DP-043A47-3(玉米,昆虫防治,ATCC登录号N°PTA-11509,WO2011/075595A1),事件DP-004114-3(玉米,昆虫防治,ATCC登录号N°PTA-11506,WO2011/084621A1),事件DP-032316-8(玉米,昆虫防治,ATCC登录号N°PTA-11507,WO2011/084632A1),事件MON-88302-9(油菜,除草剂耐受性,ATCC登录号N°PTA-10955,WO2011/153186A1),事件DAS-21606-3(大豆,除草剂耐受性,ATCC登录号No.PTA-11028,WO2012/033794A2),事件MON-87712-4(大豆,质量性状,ATCC登录号N°.PTA-10296,WO2012/051199A2),事件DAS-44406-6(大豆,叠加了除草剂耐受性,ATCC登录号N°.PTA-11336,WO2012/075426A1),事件DAS-14536-7(大豆,叠加了除草剂耐受性,ATCC登录号N°.PTA-11335,WO2012/075429A1),事件SYN-000H2-5(大豆,除草剂耐受性,ATCC登录号N°.PTA-11226,WO2012/082548A2),事件DP-061061-7(油菜,除草剂耐受性,无保藏N°可获得,WO2012071039A1),事件DP-073496-4(油菜,除草剂耐受性,无保藏N°可获得,US2012131692),事件8264.44.06.1(大豆,叠加了除草剂耐受性,登录号N°PTA-11336,WO2012075426A2),事件8291.45.36.2(大豆,叠加了除草剂耐受性,登录号N°.PTA-11335,WO2012075429A2),事件SYHT0H2(大豆,ATCC登录号N°.PTA-11226,WO2012/082548A2),事件MON88701(棉花,ATCC登录号N°PTA-11754,WO2012/134808A1),事件KK179-2(苜蓿,ATCC登录号N°PTA-11833,WO2013/003558A1),事件pDAB8264.42.32.1(大豆,叠加了除草剂耐受性,ATCC登录号N°PTA-11993,WO2013/010094A1),事件MZDT09Y(玉米,ATCC登录号N°PTA-13025,WO2013/012775A1)。
赋予关心的期望性状的基因/事件(例如,感兴趣的多核苷酸)也可以在转基因植物中与另一基因/事件彼此组合存在。可以提及的转基因植物的实例是重要作物植物,诸如谷物(小麦、水稻、黑小麦、大麦、黑麦、燕麦)、玉米、大豆、马铃薯、糖用甜菜、甘蔗、番茄、豌豆和其它类型的蔬菜、棉花、烟草、油菜和水果植物(水果有苹果、梨、柑橘类水果和葡萄),特别强调玉米、大豆、小麦、水稻、马铃薯、棉花、甘蔗、烟草和油菜。特别强调的性状是植物对昆虫、蛛形纲动物、线虫、蛞蝓和蜗牛的抗性增强,以及植物对一种或多种除草剂的耐受性增强。
根据本发明可以优先处理的此类植物、植物部分或植物种子的市售实例包括商业产品,诸如以 和/或XTENDFLEXTM商品名销售或分销的植物种子。
本发明有用的组蛋白去甲基化酶基因包括任何组蛋白去甲基化酶基因,其中如本文所述的突变可以赋予包含所述突变的植物或其部分增加的小花育性、增加的种子数量和/或增加的种子重量。在一些实施方案中,组蛋白去甲基化酶基因是SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶基因,任选地是Jumonji C型H3K9me2/me3去甲基化酶。在一些实施方案中,组蛋白去甲基化酶(例如VRS3)多肽包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的氨基酸序列,或包含与SEQ ID NO:87、88、89、90、91或92中任一个或多个氨基酸序列具有至少80%的序列同一性的区域的多肽;和/或由与SEQID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列编码;或由与SEQ ID NO:75、76、77、78、79、80、81、82、83、84、85或86中任一个或多个核苷酸序列具有至少80%的同一性的区域编码。
在一些实施方案中,内源性组蛋白去甲基化酶(例如SIX-ROWED SPIKE 3(VRS3);例如,任选地,Jumonji C型H3K9me2/me3去甲基化酶)基因中的至少一个突变是点突变。在一些实施方案中,至少一个突变可以是非天然突变。在一些实施方案中,内源性组蛋白去甲基化酶基因中的至少一个突变是显性负性突变。在一些实施方案中,植物的内源性组蛋白去甲基化酶基因中的至少一个突变可以是置换、缺失和/或插入。在一些实施方案中,植物的内源性组蛋白去甲基化酶基因中的至少一个突变可以是导致点突变的置换、缺失和/或插入,并且使植物具有增加的小花育性、增加的种子数量和/或增加的种子重量。在一些实施方案中,植物的内源性组蛋白去甲基化酶基因中的至少一个突变可以是导致显性负性突变或半显性突变的置换、缺失和/或插入,并且使植物具有增加的小花育性、增加的种子数量和/或增加的种子重量。例如,突变可以是1、2、3、4、5个或更多个氨基酸残基的置换、缺失和/或插入,或者是约1、2、3、4、5个或更多个核苷酸的置换、缺失和/或插入。在一些实施方案中,至少一个突变可以是对A、T、G或C的碱基置换。在一些实施方案中,至少一个突变可以是组蛋白去甲基化酶基因或蛋白质(例如VRS3基因或多肽)的部分或整个同源结构域的缺失。在一些实施方案中,至少一个突变可以是框内缺失。在一些实施方案中,至少一个突变可以是框外缺失。在一些实施方案中,突变可以是导致VRS3蛋白中的氨基酸残基置换的编辑。
在一些实施方案中,对本发明有用的缺失可以是一个碱基对和/或至少2个连续碱基对(例如,1个碱基对和/或约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70,71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、110、120、121、122、123、124、125、126、127、128、129、130、140、150、151、152、153、154、155、156、158、159、160、180、200、201、202、203、204、205、206、208、209、210、220、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、260、270、280、290、300、310、320、330、340、350、360、361、362、363、364、365、366、367、368、369、370、380、390、400、450、500、510、520、530、531或532个或更多个连续碱基对,或其中的任何范围或值)的碱基缺失。在一些实施方案中,缺失在VRS3基因的ZnF区域(例如,SEQ ID NO:69、70、72或73的区域;例如,SEQ ID NO:77或SEQID NO:80)中。在一些实施方案中,缺失包括丢失来自编码VRS3基因(例如,SEQ ID NO:69、70、72或73,例如,SEQ ID NO:77或SEQ ID NO:80)的内源性基因的ZnF结构域的1个碱基对和/或约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95或100个连续碱基对至约110、120、130、140、150,151、152、153、154、155、156、157、158、159、160、180、200、201、202、203、204、205、206、207、208、209、210、220、230、231、232、233、234、235、236、237、238或239个碱基对或更多个连续碱基对。在一些实施方案中,缺失在VRS3基因的JmjN区域(例如,SEQ ID NO:69、70、72或73的区域;例如,SEQ IDNO:78或SEQ ID NO:81)中。在一些实施方案中,缺失包括丢失来自编码VRS3基因(例如,SEQID NO:69、70、72或73,例如,SEQ ID NO:78或SEQ ID NO:81)的内源性基因的JmjN结构域的1个碱基对和/或约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95或100个碱基对至约110、120、130、140、150、151、152、153、154、155、156、157、158、159、160、180、200、201、202、203、204、205、206、207、208、209、210、220、230、231、232、233、234、235、236、237、238或239个或更多个连续碱基对。在一些实施方案中,缺失在VRS3基因的JmjC区域(例如,SEQ ID NO:69、70、72或73的区域;例如,SEQID NO:79或SEQ ID NO:82)中。在一些实施方案中,缺失包括丢失来自编码VRS3基因(例如,SEQ ID NO:69、70、72或73,例如,SEQ ID NO:79或SEQ ID NO:82)的内源性基因的JmjC结构域的1个碱基对和/或约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95个或100个至约150、200、250、250、300、350、360、361、362、363、364、365、366、367、368、369、370、380、390、400、420、440、460、480、500、510、520、530或531个或更多个连续碱基对。在一些实施方案中,碱基缺失包含框内缺失或框外缺失。
在一些实施方案中,碱基缺失可以包括内源性组蛋白去甲基化酶的锌指DNA结合结构域(ZnF结构域)、Jumonji C型(Jmj-C)结构域和Jumonji N型(Jmj-N)结构域的全部或部分缺失,任选地,其中所述缺失是从组蛋白去甲基化酶基因的ZnF结构域缺失至少一个核苷酸或缺失三个或更多个连续核苷酸(例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95或100个),即,参考SEQ ID NO:69的核苷酸位置编号,从3927位置到4165位置缺失至少一个核苷酸,参考SEQID NO:70的核苷酸位置编号,从1495位置到1654位置缺失至少一个核苷酸,参考SEQ IDNO:72的核苷酸位置编号,从3987位置到4233位置缺失至少一个核苷酸,和/或参考SEQ IDNO:73的核苷酸位置编号,从1498位到1656位缺失至少一个核苷酸;从组蛋白去甲基化酶基因的JmjC结构域缺失至少一个核苷酸或缺失三个或更多个连续核苷酸(例如,参考SEQ IDNO:69的核苷酸位置编号,从位置3100到位置3631缺失至少一个核苷酸,参考SEQ ID NO:70的核苷酸位置编号,从位置832位到位置1199缺失至少一个核苷酸,参考SEQ ID NO:72的核苷酸位置编号,从位置3162到位置3692缺失至少一个核苷酸,和/或参考SEQ ID NO:73的核苷酸位置编号,从位置835位到位置1203位缺失至少一个核苷酸);或从组蛋白去甲基化酶基因的JmjN结构域中缺失至少一个核苷酸或缺失三个或更多个连续核苷酸(例如,参考SEQID NO:69的核苷酸位置编号,从位置2216到位置2424缺失至少一个核苷酸,参考SEQ IDNO:70的核苷酸位置编号,从位置301到位置402缺失至少一个核苷酸,参考SEQ ID NO:72的核苷酸位置编号,从位置2268到位置2477缺失至少一个核苷酸,和/或参考SEQ ID NO:73的核苷酸位置编号,从位置305到位置405缺失至少一个核苷酸)。
在一些实施方案中,缺失VRS3基因的一个或多个核苷酸可能导致VRS3多肽的一个或多个氨基酸残基的缺失(例如,缺失SEQ ID NO:71或SEQ ID NO:74的ZnF结构域的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52或53个或更多个氨基酸残基;例如,缺失SEQ ID NO:89或SEQ ID NO:92的全部或部分)。在一些实施方案中,碱基缺失导致组蛋白去甲基化酶的ZnF结构域(即,参考SEQ ID NO:71的氨基酸位置编号,从位置499到位置551,和/或参考SEQ ID NO:74的氨基酸位置编号,从位置500到位置552)的一个或多个氨基酸残基缺失。在一些实施方案中,缺失VRS3基因的一个或多个核苷酸可能导致VRS3多肽的一个或多个氨基酸残基的缺失(例如,缺失SEQ ID NO:71或SEQID NO:74的JmjC结构域的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、70、80、90、100、110、120、121或123个或更多个氨基酸残基;例如,缺失SEQ ID NO:88或SEQ ID NO:91的全部或部分)。在一些实施方案中,碱基缺失导致组蛋白去甲基化酶的JmjC结构域(即,参考SEQ ID NO:71的氨基酸位置编号,从位置278到位置400,和/或参考SEQ ID NO:74的氨基酸位置编号,从位置279到位置401)的一个或多个氨基酸残基缺失。在一些实施方案中,缺失VRS3基因的一个或多个核苷酸可能导致VRS3多肽的一个或多个氨基酸残基的缺失(例如,缺失SEQ ID NO:71或SEQID NO:74的JmjN结构域的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个或更多个氨基酸残基;例如,缺失SEQ ID NO:87或SEQ ID NO:90的全部或部分)。在一些实施方案中,碱基缺失导致组蛋白去甲基化酶的JmjC结构域(即,参考SEQ ID NO:71的氨基酸位置编号,从位置101到位置135,和/或参考SEQ ID NO:74的氨基酸位置编号,从位置101到位置136)的一个或多个氨基酸残基缺失。
如本文所述,编码VRS3的内源性基因中的突变(例如,碱基缺失、碱基置换、氨基酸置换、氨基酸缺失)可能破坏VRS3多肽结合DNA的能力(例如,破坏ZnF DNA结合结构域)或降低组蛋白去甲基化活性。在一些实施方案中,VRS3基因的突变可以是显性负性突变、半显性突变、弱功能丧失突变、亚效等位基因突变或无效突变。在一些实施方案中,VRS3基因的突变可以是显性隐性突变或半显性突变。在一些实施方案中,产生具有减少的DNA结合的VRS3多肽的突变可以是显性负性突变或半显性突变。在一些实施方案中,产生具有降低的去甲基化活性的VRS3多肽的突变可以是显性负性突变或半显性突变。如本文所述的VRS3基因的突变可以提供与没有VRS3基因的突变的植物相比(例如,与不包含突变的同基因植物(例如,野生型未编辑的植物或空缺分离体)相比),表现出增加的小花育性、增加的种子重量和/或增加的种子数量的植物。在一些实施方案中,如本文所述的VRS3基因的突变可以是非自然突变。
在一些实施方案中,内源性VRS3基因中的突变可以在编辑系统切割后进行,所述编辑系统包含核酸酶和与内源性VRS3基因中的靶位点结合的DNA结合结构域,其中所述内源性VRS3基因:(a)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽和/或包含与SEQ ID NO:87-92中任一个氨基酸序列具有至少80%的序列同一性的区域的多肽;或(b)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;或包含与SEQ ID NO:75-86中任一个核苷酸序列具有至少80%的同一性的区域,从而产生包含具有突变的内源性VRS3基因并表现出增加的小花育性、种子重量和/或种子数量的植物或其部分。
本文还提供了与内源性组蛋白去甲基化酶基因(例如VRS3基因)中的靶位点结合的引导核酸(例如gRNA、gDNA、crRNA、crDNA),其中所述内源性组蛋白去甲基化酶基因:(a)包含与SEQ ID NO:75、76、77、78、79、80、81、82、83、84、85或86中任一个或多个核苷酸序列具有至少80%的同一性的序列;或编码与SEQ ID NO:87-92中任一个或多个氨基酸序列具有至少80%的序列同一性的序列。在一些实施方案中,内源性组蛋白去甲基化酶基因(例如VRS3基因)中的靶位点在组蛋白去甲基化酶基因的ZnF结构域中(参见例如SEQ ID NO:77、80、83或86)。在一些实施方案中,内源性组蛋白去甲基化酶基因(例如VRS3基因)中的靶位点在组蛋白去甲基化酶基因的JmjC结构域中(参见例如,SEQ ID NO:76、79、82或85)。在一些实施方案中,内源性组蛋白去甲基化酶基因(例如VRS3基因)中的靶位点在组蛋白去甲基化酶基因的JmjN结构域中(参见例如,SEQ ID NO:75、78、81或84)。
在一些实施方案中,靶位点在内源性组蛋白去甲基化酶基因(例如VRS3基因)的JmjN结构域的5'区域中、JmjC结构域的5'或3'区域中和/或ZnF结构域的3'区域中。在一些实施方案中,引导核酸可以包含具有SEQ ID NO:93-103中任一个核苷酸序列的间隔子。
在一些实施方案中,本发明的引导核酸与玉米植物的至少一个内源性SIX-ROWEDSPIKE 3(VRS3)转录因子基因中的靶核酸结合,其中所述靶核酸位于1号染色体上,并且具有基因识别号(基因ID)Zm00001d030108,或位于5号染色体上,并且具有基因IDZm00001d014422。
另外提供了一种系统,所述系统包含本发明的引导核酸和与引导核酸缔合的CRISPR-Cas效应蛋白,任选地,其中所述引导核酸包含具有SEQ ID NO:93-103的核苷酸序列的间隔序列。在一些实施方案中,系统还包含与引导核酸缔合的tracr核酸和CRISPR-Cas效应蛋白,任选地,其中所述tracr核酸和引导核酸共价连接。
如本文所用,“与引导核酸缔合的CRISPR-Cas效应蛋白”是指在CRISPR-Cas效应蛋白和引导核酸之间形成的复合物,以将CRISPR-Cas效应蛋白引导至基因中的靶位点。
本发明还提供了一种基因编辑系统,所述基因编辑系统包含与引导核酸缔合的CRISPR-Cas效应蛋白,其中所述引导核酸包含与内源性组蛋白去甲基化酶基因结合的间隔序列。在一些实施方案中,组蛋白去甲基化酶基因是VRS3基因,任选地是Jumonji C型H3K9me2/me3去甲基化酶基因,所述去甲基化酶基因:(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;和/或(b)编码与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的多肽序列。在一些实施方案中,组蛋白去甲基化酶基因包含:(1)JmjN结构域,所述JmjN结构域:(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:87或SEQID NO:90的氨基酸序列具有至少80%的序列同一性的多肽,(2)JmjC结构域,所述JmjC结构域:(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80%的序列同一性的多肽,和/或(3)ZnF结构域,所述ZnF结构域:(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80%序列同一性的多肽。在一些实施方案中,引导核酸包含具有SEQ ID NO:93-103中任一个的核苷酸序列的间隔序列。在一些实施方案中,基因编辑系统可以还包含与引导核酸缔合的tracr核酸和CRISPR-Cas效应蛋白,任选地,其中所述tracr核酸和引导核酸共价连接。
本发明还提供了一种复合物,所述复合物包含CRISPR-Cas效应蛋白和引导核酸,所述CRISPR-Cas效应蛋白包含切割结构域,其中所述引导核酸与组蛋白去甲基化酶基因中的靶位点结合,所述组蛋白去甲基化酶基因包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;或编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽,其中所述切割结构域切割组蛋白去甲基化酶基因中的靶链。
在一些实施方案中,提供了表达盒,所述表达盒包含:(a)编码包含切割结构域的CRISPR-Cas效应蛋白的多核苷酸和(b)与组蛋白去甲基化酶基因中的靶位点结合的引导核酸,其中所述引导核酸包含与组蛋白去甲基化酶基因中的靶位点互补并结合的间隔序列,所述组蛋白去甲基化酶基因包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;或编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽。在一些实施方案中,引导核酸的间隔序列与编码SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶(任选地是Jumonji C型H3K9me2/me3去甲基化酶)的组蛋白去甲基化酶互补并结合。在一些实施方案中,引导核酸的间隔序列与组蛋白去甲基化酶基因的JmjN结构域、JmjC结构域或ZnF区域互补并结合,(1)所述JmjN结构域:(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80%的序列同一性的多肽,(2)所述JmjC结构域:(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80%的序列同一性的多肽,和/或(3)所述ZnF结构域:(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80%的序列同一性的多肽。
本文还提供了编码组蛋白去甲基化酶基因(例如VRS3基因)中的突变的核酸,其中当存在于植物或植物部分(例如玉米植物)中时,与没有突变的植物或植物部分相比(例如,与没有突变的同基因植物(例如,野生型未编辑的植物或空缺分离体)相比),所述突变导致植物表现出增加的小花育性、增加的种子重量和/或增加的种子数量。
在一些实施方案中,提供了一种玉米植物或其部分,所述玉米植物或其部分包含位于1号染色体上且具有基因识别号(基因ID)Zm00001d030108或位于5号染色体上且具有基因ID Zm00001d014422的至少一个内源性SIX-ROWED SPIKE 3(VRS3)基因中的至少一个突变,任选地,其中所述突变可以是非自然突变。
本发明的核酸构建体(例如,包含序列特异性核酸结合结构域、CRISPR-Cas效应结构域、脱氨酶结构域、逆转录酶(RT)、RT模板和/或引导核酸等的构建体)和包含其的表达盒/载体可用作本发明的编辑系统,以用于修饰靶核酸(例如内源性VRS3基因)和/或其表达。
包含能够赋予小花育性和/或种子产量增加(例如,增加的种子/籽粒数量和/或重量)的内源性组蛋白去甲基化酶基因(例如,VRS3基因)的任何植物可以如本文所述(例如,使用本发明的多肽、多核苷酸、RNP、核酸构建体、表达盒和/或载体)进行修饰(例如,突变,例如,碱基编辑、切割、切口等)以增加植物的小花育性和/或种子产量。
与不包含突变的内源性组蛋白去甲基化酶基因(例如VRS3基因)的植物或其部分相比,具有增加的小花育性和/或种子产量(例如,增加的种子/籽粒数量和/或重量)的植物的育性或种子产量可能增加约5%至约100%(例如,约5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%或更多,或其中的任何范围或值)。在一些实施方案中,种子数量可以增加约5%至约100%(例如,约5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68,69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%或更多,或其中的任何范围或值),任选地,种子数量增加约10%至约30%(例如,约10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%或30%或更多,或其中的任何范围或值)。在一些实施方案中,种子重量可以增加约5%至约100%(例如,约5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68,69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%或更多,或其中的任何范围或值),任选地种子数量增加约10%至约30%(例如,约10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%或30%或更多,或其中的任何范围或值)。
如本文所用,术语“植物部分”包括但不限于繁殖组织(例如,花瓣、萼片、雄蕊、雌蕊、花托、花药、花粉、花、果实、花蕾、胚珠、种子和胚);营养组织(例如,叶柄、茎、根、根毛、根尖、髓、胚芽、茎杆、芽、枝、树皮、顶端分生组织、腋芽、子叶、下胚轴和叶);维管组织(例如,韧皮部和木质部);特化细胞,诸如表皮细胞、薄壁细胞、厚角细胞(chollenchymacells)、厚壁组织细胞、气孔细胞、保卫细胞、角质层、叶肉细胞;愈伤组织;和插条。术语“植物部分”还包括植物细胞,包括在植物和/或植物部分中完整的植物细胞、植物原生质体、植物组织、植物器官、植物细胞组织培养物、植物愈伤组织、植物团块等。如本文所用,“枝条”是指地上部分,包括叶和茎。如本文所用,术语“组织培养物”包括组织、细胞、原生质体和愈伤组织的培养物。
如本文所用,“植物细胞”是指植物的结构和生理单元,其通常包含细胞壁但也包含原生质体。本发明的植物细胞可以是分离的单细胞的形式,或可以是培养的细胞,或者可以是更高组织单元的一部分,诸如,例如,植物组织(包括愈伤组织)或植物器官的一部分。“原生质体”是一种分离的植物细胞,没有细胞壁或只有部分细胞壁。因此,在本发明的一些实施方案中,包含本发明的核酸分子和/或核苷酸序列的转基因细胞是任何植物或植物部分的细胞,包括但不限于,根细胞、叶细胞、组织培养细胞、种子细胞、花细胞、果实细胞、花粉细胞等。在本发明的某些方面,植物部分可以是植物种质。在某些方面,植物细胞可以是不繁殖的植物细胞,不会再生为植物。
“植物细胞培养物”是指植物单元的培养物,诸如,例如,原生质体、细胞培养物细胞、植物组织中的细胞、花粉、花粉管、胚珠、胚囊、受精卵和处于不同发育阶段的胚。
如本文所用,“植物器官”是植物的独特且可见的结构和分化部分(诸如根、茎、叶、花蕾或胚)。
如本文所用,“植物组织”是指一组组织成结构和功能单元的植物细胞。原位植物或培养物中的任何组织都包括在内。该术语包括但不限于,整个植物、植物器官、植物种子、组织培养物和组织成结构和/或功能单元的任何植物细胞组。将该术语与上述任何特定类型的植物组织结合使用或在缺少上述任何特定类型的植物组织,或在本定义所包含的任何特定类型的植物组织的情况下使用,并不意味着排除任何其它类型的植物组织。
在本发明的一些实施方案中,提供了转基因组织培养物或转基因植物细胞培养物,其中所述转基因组织或细胞培养物包含本发明的核酸分子/核苷酸序列。在一些实施方案中,转基因可以从由转基因组织或细胞发育的植物中消除,方法是使转基因植物与非转基因植物杂交,并在子代中选择包含所需基因编辑而不含用于产生该编辑的转基因的植物。
具有内源性组蛋白去甲基化酶基因(例如VRS3基因)的任何植物(或植物细胞或其植物部分)均可与本发明一起使用。在一些实施方案中,可用于本发明的植物可包括但不限于玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、红薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、扁桃、核桃、草莓、西瓜、辣椒、葡萄、番茄、黄瓜、黑莓、覆盆子、黑覆盆子或芸苔属物种。
在一些实施方案中,用于本发明的植物可以是例如绿叶植物(例如莴苣、羽衣甘蓝、甘蓝、芝麻菜、菠菜等)。在一些实施方案中,用于本发明的植物可以是十字花科植物,包括但不限于西兰花、抱子甘蓝、卷心菜、花椰菜等植物。在一些实施方案中,本发明还可用于产生深色水果,包括。但不限于茄科植物(例如番茄、辣椒、茄子等)和/或产生浆果和核果(例如樱桃)的植物。在一些实施方案中,用于本发明的植物可以是行播作物种类(例如玉米、大豆等)。
用于本发明的植物的其它非限制性实例包括草坪草(例如,蓝草、本特草、黑麦草、羊茅),羽苇草,簇毛草,芒草属,芒草(arundo),柳枝稷,蔬菜作物,包括洋蓟、大头菜、芝麻菜、韭菜、芦笋、莴苣(例如,结球莴苣、散叶莴苣、长叶莴苣)、马兰加、瓜(例如,甜瓜、西瓜、克伦肖瓜、蜜瓜、哈密瓜),菜类作物(如抱子甘蓝、卷心菜、花椰菜、西兰花、散叶甘蓝、羽衣甘蓝、大白菜、小白菜),cardoni,胡萝卜,纳帕(napa),秋葵,洋葱,芹菜,欧芹,鹰嘴豆,欧洲防风草,菊苣,辣椒,马铃薯,葫芦(如西葫芦(marrow)、黄瓜、密生西葫芦、笋瓜、南瓜、蜜瓜、西瓜、哈密瓜),萝卜,干球洋葱,芜菁甘蓝(rutabaga),茄子,婆罗门参(salsify),茅菜(escarole),小葱,菊苣,大蒜,菠菜,大葱,南瓜,绿色蔬菜,甜菜(糖用甜菜和饲料甜菜),红薯,莙荙菜,辣根,番茄,芜菁和香料;水果作物,如苹果,杏,樱桃,油桃,桃,梨,李子,梅子,樱桃,木瓜,无花果,坚果(如栗子、山核桃、开心果、榛子、开心果、花生、核桃、澳洲坚果、扁桃等),柑橘(如小柑桔,金桔,橙子,葡萄柚,橘子,柑橘,柠檬,酸橙等),蓝莓,黑覆盆子,博伊森莓,蔓越莓,醋栗,鹅莓,罗根莓,覆盆子,草莓,黑莓,葡萄(酿酒葡萄和鲜食葡萄),鳄梨,香蕉,猕猴桃,柿子,石榴,菠萝,热带水果,梨果,甜瓜,芒果,木瓜和荔枝,大田作物,如三叶草、苜蓿、梯牧草(timothy)、月见草、白池花、玉米/玉蜀黍(饲料玉米、甜玉米、爆米花)、蛇麻草、荷荷巴、荞麦、红花、藜麦、小麦、水稻、大麦、黑麦、小米、高粱、燕麦、黑小麦、高粱、烟草、木棉,豆科植物(豆类(如四季豆和干豆),扁豆,豌豆,大豆),油料植物(油菜、油菜籽、芥菜、罂粟、橄榄、向日葵、椰子、蓖麻油植物、可可豆、花生、油棕),浮萍,拟南芥,纤维植物(棉花、亚麻、麻类植物、黄麻),大麻属(如大麻(Cannabis sativa)、印度大麻(Cannabisindica)和莠草大麻(Cannabis ruderalis)),月桂科(肉桂、樟脑),或咖啡、甘蔗、茶和天然橡胶植物等植物;和/或花坛植物,如开花植物、仙人掌、多肉植物和/或观赏植物(如玫瑰、郁金香、紫罗兰),以及树木,如森林树木(阔叶树和常青树,如针叶树;如榆树、白蜡树、橡树、枫树、冷杉、云杉、雪松、松树、桦树、柏树、桉树、柳树),以及灌木和其它苗木。在一些实施方案中,本发明的核酸构建体和/或编码其的表达盒和/或载体可用于修饰玉米、大豆、小麦、油菜、水稻、番茄、辣椒、向日葵、覆盆子、黑莓、黑覆盆子和/或樱桃。在一些实施方案中,本发明的核酸构建体和/或编码其的表达盒和/或载体可用于修饰悬钩子属(例如黑莓、黑覆盆子、博伊森莓、罗根莓、覆盆子,例如蔓越莓)、越桔属(例如蔓越莓)、茶藨子属(例如鹅莓、醋栗(例如红醋栗、黑醋栗))或草莓属(例如草莓)。
可用于本发明的编辑系统可以是现在已知或以后开发的任何位点特异性(序列特异性)基因组编辑系统,所述系统可以以靶标特异性的方式引入突变。例如,编辑系统(例如,位点或序列特异性编辑系统)可以包括但不限于,CRISPR-Cas编辑系统、兆核酸酶编辑系统、锌指核酸酶(ZFN)编辑系统、转录激活因子样效应物核酸酶(TALEN)编辑系统、碱基编辑系统和/或先导编辑系统,其中每个系统可以包含一个或多个多肽和/或一个或多个多核苷酸,当在细胞中作为一个系统表达时可以以序列特异性方式修饰(突变)靶核酸。在一些实施方案中,编辑系统(例如,位点或序列特异性编辑系统)可以包含一个或多个多核苷酸和/或一个或多个多肽,包括但不限于核酸结合结构域(DNA结合结构域)、核酸酶、和/或其它多肽、和/或多核苷酸。
在一些实施方案中,编辑系统可以包含一个或多个序列特异性核酸结合结构域(DNA结合结构域),这些结构域可以来自,例如,多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)和/或Argonaute蛋白。在一些实施方案中,编辑系统可以包含一个或多个切割结构域(例如,核酸酶),包括但不限于,核酸内切酶(例如,Fok1)、多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)、锌指核酸酶和/或转录激活因子样效应物核酸酶(TALEN)。在一些实施方案中,编辑系统可以包含一种或多种多肽,包括但不限于,脱氨酶(例如,胞嘧啶脱氨酶、腺嘌呤脱氨酶)、逆转录酶、Dna2多肽和/或5'flap核酸内切酶(FEN)。在一些实施方案中,编辑系统可以包含一个或多个多核苷酸,包括但不限于,CRISPR阵列(CRISPR引导)核酸、延伸的引导核酸和/或逆转录酶模板。
在一些实施方案中,修饰或编辑组蛋白去甲基化酶基因(VRS3基因)的方法可以包括使靶核酸(例如编码VRS3蛋白的核酸)与融合到脱氨酶结构域(例如,腺嘌呤脱氨酶和/或胞嘧啶脱氨酶)和引导核酸的碱基编辑融合蛋白(例如,序列特异性DNA结合蛋白(例如,CRISPR-Cas效应蛋白或结构域))接触,其中所述引导核酸能够引导碱基编辑融合蛋白至靶核酸/使碱基编辑融合蛋白靶向靶核酸,从而编辑靶核酸内的位点。在一些实施方案中,碱基编辑融合蛋白和引导核酸可以包含在一个或多个表达盒中。在一些实施方案中,靶核酸可以与碱基编辑融合蛋白和包含引导核酸的表达盒接触。在一些实施方案中,序列特异性DNA结合融合蛋白和引导物可以作为核糖核蛋白(RNP)提供。在一些实施方案中,细胞可以与多于一个碱基编辑融合蛋白和/或一个或多个引导核酸接触,所述引导核酸可以靶向细胞中的一个或多个靶核酸。
在一些实施方案中,修饰或编辑组蛋白去甲基化酶基因(VRS3基因)的方法可以包括使靶核酸(例如编码VRS3蛋白的核酸)与融合至肽标签的序列特异性DNA结合融合蛋白(例如,序列特异性DNA结合蛋白(例如,CRISPR-Cas效应蛋白或结构域))、包含融合至能够结合肽标签的亲和多肽的脱氨酶结构域(例如,腺嘌呤脱氨酶和/或胞嘧啶脱氨酶)的脱氨酶融合蛋白、以及引导核酸接触,其中所述引导核酸能够将序列特异性DNA结合融合蛋白引导/靶向至靶核酸,并且所述序列特异性DNA结合融合蛋白能够通过肽标签-亲和多肽相互作用将脱氨酶融合蛋白募集至靶核酸,从而编辑靶核酸内的基因座。在一些实施方案中,序列特异性DNA结合融合蛋白可以与结合肽标签的亲和多肽融合,并且脱氨酶可以与肽标签融合,从而将脱氨酶募集到序列特异性DNA结合融合蛋白和靶核酸上。在一些实施方案中,序列特异性结合融合蛋白、脱氨酶融合蛋白和引导核酸可以包含在一个或多个表达盒中。在一些实施方案中,靶核酸可以与序列特异性结合融合蛋白、脱氨酶融合蛋白和包含引导核酸的表达盒接触。在一些实施方案中,序列特异性DNA结合融合蛋白、脱氨酶融合蛋白和引导物可以作为核糖核蛋白(RNP)提供。
在一些实施方案中,诸如先导编辑的方法可用于在内源性组蛋白去甲基化酶基因(VRS3基因)中产生突变。在先导编辑中,RNA依赖性DNA聚合酶(逆转录酶,RT)和逆转录酶模板(RT模板)与序列特异性核酸结合结构域组合使用,这些结构域赋予以序列特异性方式识别和结合靶标的能力,并且还可以导致靶标内含PAM的链出现缺口。核酸结合结构域可以是CRISPR-Cas效应蛋白,在这种情况下,CRISPR阵列或引导RNA可以是延伸的引导物,其包括包含引物结合位点(PSB)和要掺入基因组的编辑(模板)的延伸部分。与碱基编辑类似,先导编辑可以利用各种募集蛋白质的方法用于对靶位点进行编辑,这些方法包括在选定的基因组编辑过程中使用的蛋白质和核酸之间的非共价和共价相互作用两者。
如本文所用,“CRISPR-Cas效应蛋白”是裂解或切割核酸、结合核酸(例如,靶核酸和/或引导核酸)和/或鉴定、识别或结合如本文定义的引导核酸的蛋白质或多肽或其结构域。在一些实施方案中,CRISPR-Cas效应蛋白可以是酶(例如,核酸酶、核酸内切酶、切口酶等)或其部分和/或可以作为酶起作用。在一些实施方案中,CRISPR-Cas效应蛋白是指CRISPR-Cas核酸酶多肽或其结构域,其包含核酸酶活性或其中核酸酶活性已降低或消除,和/或包含切口酶活性或其中切口酶已降低或消除,和/或包含单链DNA裂解活性(ss DNAse活性)或其中ss DNAse活性已降低或消除,和/或包含自加工RNAse活性或其中自加工RNAse活性已降低或消除。CRISPR-Cas效应蛋白可以与靶核酸结合。
在一些实施方案中,序列特异性核酸结合结构域可以是CRISPR-Cas效应蛋白。在一些实施方案中,CRISPR-Cas效应蛋白可以来自I型CRISPR-Cas系统、II型CRISPR-Cas系统、III型CRISPR-Cas系统、IV型CRISPR-Cas系统、V型CRISPR-Cas系统或VI型CRISPR-Cas系统。在一些实施方案中,本发明的CRISPR-Cas效应蛋白可以来自II型CRISPR-Cas系统或V型CRISPR-Cas系统。在一些实施方案中,CRISPR-Cas效应蛋白可以是II型CRISPR-Cas效应蛋白,例如,Cas9效应蛋白。在一些实施方案中,CRISPR-Cas效应蛋白可以是V型CRISPR-Cas效应蛋白,例如Cas12效应蛋白。
在一些实施方案中,CRISPR-Cas效应蛋白可以包括但不限于,Cas9、C2c1、C2c3、Cas12a(也称为Cpf1)、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3'、Cas3”、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csnl和Csx12)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG),和/或Csf5核酸酶,任选地其中CRISPR-Cas效应蛋白可以是Cas9、Cas12a(Cpf1)、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b和/或Cas14c效应蛋白。
在一些实施方案中,可用于本发明的CRISPR-Cas效应蛋白可以包含在其核酸酶活性位点(例如,RuvC、HNH,例如,Cas12a核酸酶结构域的RuvC位点;例如,Cas9核酸酶结构域的RuvC位点和/或HNH位点)中的突变。CRISPR-Cas效应蛋白在其核酸酶活性位点发生突变,因此不再包含核酸酶活性,通常称为“死”,例如,dCas。在一些实施方案中,与没有突变的相同CRISPR-Cas效应蛋白(例如,切口酶,例如,Cas9切口酶,Cas12a切口酶)相比,在其核酸酶活性位点中具有突变的CRISPR-Cas效应蛋白结构域或多肽可以具有受损的活性或降低的活性。
可用于本发明的CRISPR Cas9效应蛋白或CRISPR Cas9效应结构域可以是任何已知或后来鉴定的Cas9核酸酶。在一些实施方案中,CRISPR Cas9多肽可以是来自例如链球菌属(例如,酿脓链球菌、嗜热链球菌)、乳杆菌属(Lactobacillus spp.)、双歧杆菌属(Bifidobacterium spp.)、坎德尔菌属(Kandleria spp.)、明串珠菌属(Leuconostocspp.)、酒球菌属(Oenococcus spp.)、片球菌属(Pediococcus spp.)、魏斯氏菌属(Weissella spp.)和/或欧鲁森氏菌属(Olsenella spp.)的Cas9多肽。示例性Cas9序列包括但不限于,SEQ ID NO:56和SEQ ID NO:57的氨基酸序列或SEQ ID NO:58-68的核苷酸序列。
在一些实施方案中,CRISPR-Cas效应蛋白可以是源自酿脓链球菌的Cas9多肽,并识别PAM序列基序NGG、NAG、NGA(Mali等人,Science2013;339(6121):823-826)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自嗜热链球菌的Cas9多肽,并识别PAM序列基序NGGNG和/或NNAGAAW(W=A或T)(参见,例如,Horvath等人,Science,2010;327(5962):167-170,和Deveau等人,J Bacteriol 2008;190(4):1390-1400)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自变形链球菌的Cas9多肽,并识别PAM序列基序NGG和/或NAAR(R=A或G)(参见,例如,Deveau等人,J BACTERIOL 2008;190(4):1390-1400)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自金黄色葡萄球菌的Cas9多肽,并识别PAM序列基序NNGRR(R=A或G)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自金黄色葡萄球菌的Cas9蛋白,其识别PAM序列基序N GRRT(R=A或G)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自金黄色葡萄球菌的Cas9多肽,其识别PAM序列基序N GRRV(R=A或G)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自脑膜炎奈瑟氏菌的Cas9多肽,并识别PAM序列基序N GATT或N GCTT(R=A或G,V=A、G或C)(参见,例如,Hou等人,PNAS2013,1-6)。在上述实施方案中,N可以是任何核苷酸残基,例如,A、G、C或T中的任一种。在一些实施方案中,CRISPR-Cas效应蛋白可以是来源于沙氏纤毛菌(Leptotrichia shahii)的Cas13a蛋白,其识别单个3'A、U或C的原间隔子侧翼序列(PFS)(或RNA PAM(rPAM))序列基序,其可以位于靶核酸内。
在一些实施方案中,CRISPR-Cas效应蛋白可衍生自Cas12a,其为V型成簇规则间隔短回文重复序列(CRISPR)-Cas核酸酶(参见,例如SEQ ID NO:1-17的氨基酸序列,SEQ IDNO:18-20的核酸序列)。Cas12a在几个方面与更知名的II型CRISPR Cas9核酸酶不同。例如,Cas9识别富含G的原间隔子邻接基序(PAM),该基序在其引导RNA(gRNA、sgRNA、crRNA、crDNA、CRISPR阵列)结合位点(原间隔子、靶核酸、靶DNA)的3'(3'-NGG),而Cas12a识别富含T的PAM,其位于靶核酸的5'(5'-TTN,5'-TTTN)。事实上,Cas9和Cas12a结合其引导RNA的方向相对于它们的N和C末端几乎是相反的。此外,Cas12a酶使用单一引导RNA(gRNA、CRISPR阵列、crRNA)而不是天然Cas9系统中发现的双引导RNA(sgRNA(例如,crRNA和tracrRNA)),并且Cas12a处理其自身的gRNA。此外,Cas12a核酸酶活性产生交错的DNA双链断裂,而不是Cas9核酸酶活性产生的平端,Cas12a依靠单个RuvC结构域切割两条DNA链,而Cas9利用HNH结构域和RuvC结构域进行切割。
可用于本发明的CRISPR Cas12a效应蛋白/结构域可以是任何已知的或后来鉴定的Cas12a多肽(以前称为Cpf1)(参见,例如,美国专利号9,790,490,其公开的Cpf1(Cas12a)序列通过引用并入)。术语“Cas12a”、“Cas12a多肽”或“Cas12a结构域”是指包含Cas12a多肽或其片段的RNA引导的核酸酶,其包含Cas12a的引导核酸结合结构域和/或Cas12a的活性、无活性或部分活性DNA切割结构域。在一些实施方案中,可用于本发明的Cas12a可以包含核酸酶活性位点(例如,Cas12a结构域的RuvC位点)中的突变。Cas12a结构域或Cas12a多肽在其核酸酶活性位点具有突变,因此不再包含核酸酶活性,通常称为deadCas12a(例如,dCas12a)。在一些实施方案中,在其核酸酶活性位点具有突变的Cas12a结构域或Cas12a多肽可以具有受损的活性,例如,可以具有切口酶活性。
任何可用于碱基编辑的脱氨酶结构域/多肽都可以用于本发明。在一些实施方案中,脱氨酶结构域可以是胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域。可用于本发明的胞嘧啶脱氨酶(或胞苷脱氨酶)可以是来自任何生物体的任何已知或后来鉴定的胞嘧啶脱氨酶(参见,例如,美国专利号10,167,457和Thuronyi等人Nat.Biotechnol.37:1070–1079(2019),其中每一篇文献关于胞嘧啶脱氨酶的公开内容通过引用并入本文)。胞嘧啶脱氨酶可分别催化胞苷或脱氧胞苷水解脱氨为尿苷或脱氧尿苷。因此,在一些实施方案中,可用于本发明的脱氨酶或脱氨酶结构域可以是胞苷脱氨酶结构域,催化胞嘧啶水解脱氨为尿嘧啶。在一些实施方案中,胞嘧啶脱氨酶可以是天然存在的胞嘧啶脱氨酶的变体,包括但不限于,灵长类动物(例如,人、猴、黑猩猩、大猩猩)、狗、牛、大鼠或小鼠。因此,在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以与野生型胞嘧啶脱氨酶约70%至约100%相同(例如,与天然存在的胞嘧啶脱氨酶约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同,以及其中的任何范围或值)。
在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以是载脂蛋白B mRNA-编辑复合物(APOBEC)家族脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是APOBEC1脱氨酶、APOBEC2脱氨酶、APOBEC3A脱氨酶、APOBEC3B脱氨酶、APOBEC3C脱氨酶、APOBEC3D脱氨酶、APOBEC3F脱氨酶、APOBEC3G脱氨酶、APOBEC3H脱氨酶、APOBEC4脱氨酶、人激活诱导脱氨酶(hAID)、rAPOBEC1、FERNY和/或CDA1,任选地pmCDA1、atCDA1(例如,At2g19570)及其进化形式(例如,SEQ ID NO:27、SEQ ID NO:28或SEQ ID NO:29)。在一些实施方案中,胞嘧啶脱氨酶可以是具有SEQ ID NO:23的氨基酸序列的APOBEC1脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是具有SEQ ID NO:24的氨基酸序列的APOBEC3A脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是CDA1脱氨酶,任选地是具有SEQ ID NO:25的氨基酸序列的CDA1。在一些实施方案中,胞嘧啶脱氨酶可以是FERNY脱氨酶,任选地是具有SEQ ID NO:26的氨基酸序列的FERNY。在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以与天然存在的胞嘧啶脱氨酶(例如,进化的脱氨酶)的氨基酸序列约70%至约100%相同(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%相同)。在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以与SEQ ID NO:23、SEQ ID NO:24、SEQID NO:25或SEQ ID NO:26的氨基酸序列约70%至约99.5%相同(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%相同)(例如,与SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28或SEQ ID NO:29的氨基酸序列至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同)。在一些实施方案中,编码胞嘧啶脱氨酶的多核苷酸可以进行密码子优化以在植物中表达,并且密码子优化的多肽可以与参考多核苷酸约70%至99.5%相同。
在一些实施方案中,本发明的核酸构建体可以进一步编码尿嘧啶糖基化酶抑制剂(UGI)(例如,尿嘧啶-DNA糖基化酶抑制剂)多肽/结构域。因此,在一些实施方案中,编码CRISPR-Cas效应蛋白和胞嘧啶脱氨酶结构域的核酸构建体(例如,编码融合蛋白,所述融合蛋白包含融合到胞嘧啶脱氨酶结构域的CRISPR-Cas效应蛋白结构域,和/或融合到肽标签或融合到能够结合肽标签的亲和多肽的CRISPR-Cas效应蛋白结构域和/或融合到肽标签或融合到能够结合肽标签的亲和多肽的脱氨酶蛋白结构域)可以进一步编码尿嘧啶-DNA糖基化酶抑制剂(UGI),任选地其中UGI可以进行密码子优化以在植物中表达。在一些实施方案中,本发明提供融合蛋白,其包含CRISPR-Cas效应多肽、脱氨酶结构域和UGI和/或编码它们的一个或多个多核苷酸,任选地其中一个或多个多核苷酸可以进行密码子优化以在植物中表达。在一些实施方案中,本发明提供融合蛋白,其中CRISPR-Cas效应多肽、脱氨酶结构域和UGI可以融合到如本文所述的肽标签和亲和多肽的任意组合,从而将脱氨酶结构域和UGI募集到CRISPR-Cas效应多肽和靶核酸。在一些实施方案中,引导核酸可以与募集RNA基序连接,并且脱氨酶结构域和/或UGI中的一个或多个可以融合到能够与募集RNA基序相互作用的亲和多肽,从而将脱氨酶结构域和UGI募集到靶核酸。
可用于本发明的“尿嘧啶糖基化酶抑制剂”可以是能够抑制尿嘧啶-DNA糖基化酶碱基切除修复酶的任何蛋白质。在一些实施方案中,UGI结构域包括野生型UGI或其片段。在一些实施方案中,可用于本发明的UGI结构域可以与天然存在的UGI结构域的氨基酸序列约70%至约100%相同(例如,70%、71%、72%、73%、75%、76%、77%、79%、80%、81%、82%、83%、84%、85%、86%、87%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%相同,以及其中的任何范围或值)。在一些实施方案中,UGI结构域可以包含SEQ ID NO:41的氨基酸序列或与SEQ ID NO:41的氨基酸序列具有约70%至约99.5%序列同一性的多肽(例如,与SEQ ID NO:41的氨基酸序列至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同)。例如,在一些实施方案中,UGI结构域可以包含SEQ ID NO:41的氨基酸序列片段,该片段与SEQ ID NO:41的氨基酸序列的一部分连续核苷酸(例如,10、15、20、25、30、35、40、45、50、55、60、65、70、75、80个连续核苷酸;例如,约10、15、20、25、30、35、40、45至约50、55、60、65、70、75、80个连续核苷酸)100%相同。在一些实施方案中,UGI结构域可以是已知UGI(例如,SEQ ID NO:41)的变体,与已知UGI具有约70%至约99.5%的序列同一性(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%的序列同一性,以及其中的任何范围或值)。在一些实施方案中,编码UGI的多核苷酸可以进行密码子优化以在植物(例如,植物)中表达,并且密码子优化的多肽可以与参考多核苷酸约70%至约99.5%相同。
可用于本发明的腺嘌呤脱氨酶(或腺苷脱氨酶)可以是任何已知或后来鉴定的来自任何生物体的腺嘌呤脱氨酶(参见,例如,美国专利号10,113,163,其关于腺嘌呤脱氨酶的公开内容通过引用并入本文)。腺嘌呤脱氨酶可以催化腺嘌呤或腺苷的水解脱氨反应。在一些实施方案中,腺嘌呤脱氨酶可分别催化腺苷或脱氧腺苷的水解脱氨为肌苷或脱氧肌苷。在一些实施方案中,腺苷脱氨酶可以催化DNA中腺嘌呤或腺苷的水解脱氨反应。在一些实施方案中,由本发明的核酸构建体编码的腺嘌呤脱氨酶可以产生靶核酸的有义(例如,“+”;模板)链中的A→G转换或靶核酸的反义(例如,“-”,互补)链中的T→C转换。
在一些实施方案中,腺苷脱氨酶可以是天然存在的腺嘌呤脱氨酶的变体。因此,在一些实施方案中,腺苷脱氨酶可以与野生型腺嘌呤脱氨酶约70%至100%相同(例如,与天然存在的腺嘌呤脱氨酶约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同,以及其中的任何范围或值)。在一些实施方案中,腺嘌呤脱氨酶或腺苷脱氨酶在自然界中不存在,可称为工程化、突变或进化的腺苷脱氨酶。因此,例如,工程化、突变或进化的腺嘌呤脱氨酶多肽或腺嘌呤脱氨酶结构域可以与天然存在的腺嘌呤脱氨酶多肽/结构域约70%至99.9%相同(例如,与天然存在的腺嘌呤脱氨酶多肽或腺嘌呤脱氨酶结构域约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%相同,以及其中的任何范围或值)。在一些实施方案中,腺苷脱氨酶可以来自细菌,(例如,大肠杆菌、金黄色葡萄球菌(Staphylococcus aureus)、流感嗜血杆菌(Haemophilusinfluenzae)、新月柄杆菌(Caulobacter crescentus)等)。在一些实施方案中,编码腺嘌呤脱氨酶多肽/结构域的多核苷酸可以进行密码子优化以在植物中表达。
在一些实施方案中,腺嘌呤脱氨酶结构域可以是野生型tRNA特异性腺苷脱氨酶结构域,例如,tRNA-特异性腺苷脱氨酶(TadA)和/或突变/进化的腺苷脱氨酶结构域,例如,突变/进化的tRNA-特异性腺苷脱氨酶结构域(TadA*)。在一些实施方案中,TadA结构域可以来自大肠杆菌。在一些实施方案中,TadA可以被修饰,例如,截短,相对于全长TadA丢失一个或多个N-末端和/或C末端氨基酸(例如,可以相对于全长TadA缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个N-末端和/或C末端氨基酸残基)。在一些实施方案中,TadA多肽或TadA结构域不包含N-末端蛋氨酸。在一些实施方案中,野生型大肠杆菌TadA包含SEQ ID NO:30的氨基酸序列。在一些实施方案中,突变/进化的大肠杆菌TadA*包含SEQID NO:31-40的氨基酸序列(例如,SEQ ID NO:31、32、33、34、35、36、37、38、39或40)。在一些实施方案中,编码TadA/TadA*的多核苷酸可以进行密码子优化以在植物中表达。
胞嘧啶脱氨酶催化胞嘧啶脱氨并产生胸苷(通过尿嘧啶中间体),导致基因组中的互补链中C到T转换或G到A转换。因此,在一些实施方案中,由本发明的多核苷酸编码的胞嘧啶脱氨酶产生靶核酸的有义(例如,“+”;模板)链中的C→T转换或靶核酸的反义(例如,“-”,互补)链中的G→A转换。
在一些实施方案中,由本发明的核酸构建体编码的腺嘌呤脱氨酶产生靶核酸的有义(例如,“+”;模板)链中的A→G转换或靶核酸的反义(例如,“-”,互补)链中的T→C转换。
编码包含序列特异性核酸结合蛋白和胞嘧啶脱氨酶多肽的碱基编辑器的本发明的核酸构建体,以及编码它们的核酸构建体/表达盒/载体,可以与引导核酸组合用于修饰靶核酸,包括但不限于,在靶核酸(包括,但不限于质粒序列)中产生C→T或G→A突变;在编码序列中产生C→T或G→A突变以改变氨基酸身份;在编码序列中产生C→T或G→A突变以产生终止密码子;在编码序列中产生C→T或G→A突变以破坏起始密码子;在基因组DNA中产生点突变以破坏功能;和/或在基因组DNA中产生点突变以破坏剪接连接。
编码包含序列特异性核酸结合蛋白和腺嘌呤脱氨酶多肽的碱基编辑器的本发明的核酸构建体,以及编码它们的表达盒和/或载体,可以与引导核酸组合用于修饰靶核酸,包括但不限于,在靶核酸(包括,但不限于质粒序列)中产生A→G或T→C突变;在编码序列中产生A→G或T→C突变以改变氨基酸身份;在编码序列中产生A→G或T→C突变以产生终止密码子;在编码序列中产生A→G或T→C突变以破坏起始密码子;在基因组DNA中产生点突变以破坏功能;和/或在基因组DNA中产生点突变以破坏剪接连接。
包含CRISPR-Cas效应蛋白或其融合蛋白的本发明的核酸构建体可以与引导RNA(gRNA,CRISPR阵列,CRISPR RNA,crRNA)组合使用,引导RNA设计用于与编码的CRISPR-Cas效应蛋白或结构域一起发挥作用,以修饰靶核酸。可用于本发明的引导核酸包含至少一个间隔序列和至少一个重复序列。引导核酸能够与CRISPR-Cas核酸酶结构域形成复合物,CRISPR-Cas核酸酶结构域由本发明的核酸构建体编码和表达,并且间隔序列能够与靶核酸杂交,从而引导复合物(例如,CRISPR-Cas效应融合蛋白(例如,融合到脱氨酶结构域的CRISPR-Cas效应结构域和/或融合到肽标签或亲和多肽的CRISPR-Cas效应结构域以募集脱氨酶结构域和任选地,UGI)到靶核酸,其中靶核酸可以被脱氨酶结构域修饰(例如,裂解或编辑)或调节(例如,调节转录)。
作为实例,编码与胞嘧啶脱氨酶结构域(例如,融合蛋白)相连的Cas9结构域的核酸构建体可以与Cas9引导核酸组合使用来修饰靶核酸,其中融合蛋白的胞嘧啶脱氨酶结构域使靶核酸中的胞嘧啶碱基脱氨,从而编辑靶核酸。在另一个实例中,编码与腺嘌呤脱氨酶结构域(例如,融合蛋白)相连的Cas9结构域的核酸构建体可以与Cas9引导核酸组合使用以修饰靶核酸,其中融合蛋白的腺嘌呤脱氨酶结构域使靶核酸中的腺苷碱基脱氨,从而编辑靶核酸。
同样,编码与胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域(例如,融合蛋白)相连的Cas12a结构域(或其它选定的CRISPR-Cas核酸酶,例如,C2c1,C2c3,Cas12b,Cas12c,Cas12d,Cas12e,Cas13a,Cas13b,Cas13c,Cas13d,Casl,CaslB,Cas2,Cas3,Cas3',Cas3",Cas4,Cas5,Cas6,Cas7,Cas8,Cas9(也称为Csnl和Csx12),Cas10,Csyl,Csy2,Csy3,Csel,Cse2,Cscl,Csc2,Csa5,Csn2,Csm2,Csm3,Csm4,Csm5,Csm6,Cmrl,Cmr3,Cmr4,Cmr5,Cmr6,Csbl,Csb2,Csb3,Csxl7,Csxl4,Csx10,Csx16,CsaX,Csx3,Csxl,Csxl5,Csfl,Csf2,Csf3,Csf4(dinG)和/或Csf5)的核酸构建体可以与Cas12a引导核酸(或其它选定的CRISPR-Cas核酸酶的引导核酸)组合使用来修饰靶核酸,其中融合蛋白的胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域将靶核酸中的胞嘧啶碱基脱氨,从而编辑靶核酸。
本文所用的“引导核酸”、“引导RNA”、“gRNA”、CRISPR RNA/DNA”、“crRNA”或“crDNA”是指包含至少一个间隔序列和至少一个重复序列的核酸,所述间隔序列与靶DNA(例如,原间隔子)互补(并杂交),(所述至少一个重复序列例如:V型Cas12a CRISPR-Cas系统的重复序列,或其片段或部分;II型Cas9 CRISPR-Cas系统的重复序列,或其片段;V型C2c1 CRISPR Cas系统的重复序列,或其片段;CRISPR-Cas系统的重复序列或其片段,所述CRISPR-Cas系统例如,C2c3,Cas12a(也称为Cpf1),Cas12b,Cas12c,Cas12d,Cas12e,Cas13a,Cas13b,Cas13c,Cas13d,Casl,CaslB,Cas2,Cas3,Cas3',Cas3",Cas4,Cas5,Cas6,Cas7,Cas8,Cas9(也称为Csnl和Csx12),Cas10,Csyl,Csy2,Csy3,Csel,Cse2,Cscl,Csc2,Csa5,Csn2,Csm2,Csm3,Csm4,Csm5,Csm6,Cmrl,Cmr3,Cmr4,Cmr5,Cmr6,Csbl,Csb2,Csb3,Csxl7,Csxl4,Csx10,Csx16,CsaX,Csx3,Csxl,Csxl5,Csfl,Csf2,Csf3,Csf4(dinG)和/或Csf5),其中重复序列可以连接到间隔序列的5'端和/或3'端。本发明的gRNA的设计可以基于I型、II型、III型、IV型、V型或VI型CRISPR-Cas系统。
在一些实施方案中,Cas12a gRNA可以在5'至3'包含重复序列(全长或其部分(“手柄”);例如,假结样结构)和间隔序列。
在一些实施方案中,引导核酸可以包含多于一个重复序列-间隔序列(例如,2、3、4、5、6、7、8、9、10个或更多个重复序列-间隔序列)(例如,重复序列-间隔序列-重复序列,例如,重复序列-间隔序列-重复序列-间隔序列-重复序列-间隔序列-重复序列-间隔序列-重复序列-间隔序列等)。本发明的引导核酸是合成的、人造的,在自然界中没有发现。gRNA可以很长,可以用作适配体(如MS2募集策略)或是悬挂间隔序列的其它RNA结构。
如本文所用,“重复序列”是指,例如,野生型CRISPR Cas基因座(例如,Cas9基因座、Cas12a基因座、C2c1基因座等)的任何重复序列,或与由本发明的核酸构建体编码的CRISPR-Cas效应蛋白一起发挥作用的合成crRNA的重复序列。可用于本发明的重复序列可以是CRISPR-Cas基因座(例如,I型、II型、III型、IV型、V型或VI型)的任何已知或后来鉴定的重复序列,或可以是设计用于在I、II、III、IV、V或VI型CRISPR-Cas系统中起作用的合成重复序列。重复序列可以包含发夹结构和/或茎环结构。在一些实施方案中,重复序列可以在其5'端形成假结样结构(即“手柄”)。因此,在一些实施方案中,重复序列可以与来自野生型I型CRISPR-Cas基因座、II型CRISPR-Cas基因座、III型CRISPR-Cas基因座、IV型CRISPR-Cas基因座、V型CRISPR-Cas基因座和/或VI型CRISPR-Cas基因座的重复序列相同或基本相同。来自野生型CRISPR-Cas基因座的重复序列可以通过已建立的算法来确定,诸如使用CRISPRdb提供的CRISPRfinder(参见,Grissa等人Nucleic Acids Res.35(Web Serverissue):W52-7)。在一些实施方案中,重复序列或其部分在其3'端与间隔序列的5'端相连,从而形成重复序列-间隔序列(例如,引导核酸、引导RNA/DNA、crRNA、crDNA)。
在一些实施方案中,重复序列包括至少10个核苷酸,基本上由或由至少10个核苷酸组成,这取决于特定的重复序列以及包含该重复序列的引导核酸是经过处理还是未处理(例如,约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50至100个或更多个核苷酸,或其中的任何范围或值)。在一些实施方案中,重复序列包含约10至约20、约10至约30、约10至约45、约10至约50、约15至约30、约15至约40、约15至约45、约15至约50、约20至约30、约20至约40、约20至约50、约30至约40、约40至约80、约50至约100个或更多个核苷酸,基本上由或由约10至约20、约10至约30、约10至约45、约10至约50、约15至约30、约15至约40、约15至约45、约15至约50、约20至约30、约20至约40、约20至约50、约30至约40、约40至约80、约50至约100个或更多个核苷酸组成。
连接到间隔序列的5'端的重复序列可以包含重复序列的一部分(例如,野生型重复序列的5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35或更多个连续核苷酸)。在一些实施方案中,连接到间隔序列的5'端的重复序列的一部分可以是约5至约10个连续核苷酸的长度(例如,约5、6、7、8、9、10个核苷酸)并且与野生型CRISPR Cas重复核苷酸序列的相同区域(例如,5'端)具有至少90%(例如,至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)的序列同一性。在一些实施方案中,重复序列的一部分可以在其5'端包含假结样结构(例如,“手柄”)。
本文使用的“间隔序列”是与靶核酸(例如靶DNA)(例如原间隔序列)(例如VRS3基因的连续核苷酸的部分)互补的核苷酸序列,其中所述VRS3基因:(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;或与SEQ ID NO:75-86中任一个或多个核苷酸序列具有至少80%的同一性的区域,和/或(b)编码与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的多肽序列,或包含与SEQ IDNO:87-92中任一个或多个氨基酸序列具有至少80%的序列同一性的区域的多肽。在一些实施方案中,间隔序列与VRS3基因的区域的至少15个连续核苷酸具有至少70%的互补性,所述区域与SEQ ID NO:75-86中任一个或多个核苷酸序列具有至少80%的同一性,或(b)编码与SEQ ID NO:87-92中任一个氨基酸序列具有至少80%的序列同一性的多肽序列。在一些实施方案中,间隔序列可以包括但不限于SEQ ID NO:93-103(即SEQ ID NO:93、94、95、96、97、98、99、100、101、102、103)中任一个的核苷酸序列。间隔序列可以与靶核酸完全互补或基本上互补(例如,至少约70%互补(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多)。因此,在一些实施方案中,与靶核酸相比,间隔序列可以有一个、两个、三个、四个或五个错配,这些错配可以是连续的或不连续的。在一些实施方案中,间隔序列可以与靶核酸有70%的互补性。在其它实施方案中,间隔子核苷酸序列可以与靶核酸具有80%的互补性。在其它实施方案中,间隔核苷酸序列可以与靶核酸(原间隔子)具有85%、90%、95%、96%、97%、98%、99%或99.5%的互补性,等等。在一些实施方案中,间隔序列与靶核酸100%互补。间隔序列的长度可以为约15个核苷酸到约30个核苷酸(例如,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸,或其中的任何范围或值)。因此,在一些实施方案中,间隔序列可以在靶核酸(例如,原间隔子)长度至少为约15个核苷酸至约30个核苷酸的区域上具有完全互补性或基本互补性。在一些实施方案中,间隔子长度约为20个核苷酸。在一些实施方案中,间隔子的长度为约21、22或23个核苷酸。
在一些实施方案中,引导核酸的间隔序列的5'区可以与靶DNA相同,而间隔子的3'区可以与靶DNA基本上互补(例如,参见V型CRISPR-Cas系统的间隔序列),或者引导核酸的间隔序列的3'区可以与靶DNA相同,而间隔子的5'区可以与靶DNA基本上互补(例如,参见II型CRISPR-Cas系统的间隔序列),因此,间隔序列与靶DNA的整体互补性可以小于100%。因此,例如,在V型CRISPR-Cas系统的引导物中,例如,20个核苷酸间隔序列的5'区域(即种子区域)中的前1、2、3、4、5、6、7、8、9、10个核苷酸可以与靶DNA 100%互补,而间隔序列的3'区域中的剩余核苷酸与靶DNA基本上互补(例如,至少约70%互补)。在一些实施方案中,间隔序列的5'端的前1至8个核苷酸(例如,前1、2、3、4、5、6、7、8个核苷酸,以及其中的任何范围)可以与靶DNA100%互补,而间隔序列的3'区域中的剩余核苷酸与靶DNA基本上互补(例如,至少约50%互补(例如,50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多))。
作为另一个实例,在II型CRISPR-Cas系统的引导物中,例如,20个核苷酸间隔序列的3'区域(即种子区域)中的前1、2、3、4、5、6、7、8、9、10个核苷酸可以与靶DNA 100%互补,而间隔序列的5'区域中的剩余核苷酸与靶DNA基本上互补(例如,至少约70%互补)。在一些实施方案中,间隔序列的3'端的前1至10个核苷酸(例如,前1、2、3、4、5、6、7、8、9、10个核苷酸,以及其中的任何范围)可以与靶DNA 100%互补,而间隔序列的5'区域中的剩余核苷酸与靶DNA基本上互补(例如,至少约50%互补(例如,至少约50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多,或其中的任何范围或值))。
在一些实施方案中,间隔子的种子区域的长度可以为约8至约10个核苷酸,长度为约5至约6个核苷酸,或长度为约6个核苷酸。
如本文所用,“靶核酸”、“靶DNA”、“靶核苷酸序列”、“靶区”或“基因组中的靶区”是指植物基因组中与本发明的引导核酸中的间隔序列完全互补(100%互补)或基本上互补(例如,至少70%互补(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多))的区域。可用于CRISPR-Cas系统的靶区可以位于生物体基因组(例如,植物基因组)中PAM序列的紧邻3'(例如V型CRISPR-Cas系统)或紧邻5'(例如II型CRISPR-Cas系统)的位置。靶区可以选自紧邻PAM序列的至少15个连续核苷酸(例如,16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个核苷酸等)的任何区域。
“原间隔序列”是指靶双链DNA,特别是靶DNA中与CRISPR重复序列-间隔序列(例如,引导核酸、CRISPR阵列、crRNA)的间隔序列完全或基本上互补(和杂交)的部分(例如,或基因组中的靶区)。
在V型CRISPR-Cas(例如,Cas12a)系统和II型CRISPR-Cas(Cas9)系统的情况下,原间隔序列的两侧是(例如,紧邻)原间隔子邻接基序(PAM)。对于IV型CRISPR-Cas系统,PAM位于非靶链的5'端和靶链的3'端(见下文,作为实例)。
在II型CRISPR-Cas(例如,Cas9)系统的情况下,PAM紧邻靶区的3'。I型CRISPR-Cas系统的PAM位于靶链的5'。目前尚无针对III型CRISPR-Cas系统的已知PAM。Makarova等人描述了CRISPR系统的所有类别、类型和亚型的命名法(Nature Reviews Microbiology 13:722–736(2015))。R.Barrangou(Genome Biol.16:247(2015))描述了引导结构和PAM。
经典的Cas12a PAM富含T。在一些实施方案中,经典的Cas12a PAM序列可以是5'-TTN、5'-TTTN或5'-TTTV。在一些实施方案中,经典的Cas9(例如,酿脓链球菌)PAM可以是5'-NGG-3'。在一些实施方案中,可以使用非经典PAM,但效率可能较低。
其它PAM序列可由本领域技术人员通过已建立的实验和计算方法确定。因此,例如,实验方法包括靶向侧翼为所有可能的核苷酸序列的序列,并鉴别不进行靶向的序列成员,诸如通过对靶质粒DNA的转化(Esvelt等人2013.Nat.Methods 10:1116-1121;Jiang等人2013.Nat.Biotechnol.31:233-239)。在某些方面,计算方法可以包括对天然间隔子进行BLAST搜索,以鉴别噬菌体或质粒中的原始靶DNA序列,并对这些序列进行比对以确定与靶序列相邻的保守序列(Briner和Barrangou.2014.Appl.Environ.Microbiol.80:994-1001;Mojica等人2009.Microbiology 155:733-740)。
在一些实施方案中,本发明提供包含本发明的核酸构建体(例如,本发明编辑系统的一个或多个组分)的表达盒和/或载体。在一些实施方案中,可以提供包含本发明的核酸构建体和/或一种或多种引导核酸的表达盒和/或载体。在一些实施方案中,本发明的编码碱基编辑器的核酸构建体(例如,包含CRISPR-Cas效应蛋白和脱氨酶结构域(例如,融合蛋白)的构建体)或用于碱基编辑的组分(例如,融合到肽标签或亲和多肽的CRISPR-Cas效应蛋白,融合到肽标签或亲和多肽的脱氨酶结构域,和/或融合到肽标签或亲和多肽的UGI)可以包含在与包含一种或多种引导核酸的表达盒或载体相同的或分开的表达盒或载体上。当编码碱基编辑器的核酸构建体或用于碱基编辑的组分包含在与包含所述引导核酸的表达盒或载体分开的表达盒或载体上时,靶核酸可以与编码碱基编辑器的表达盒或载体或用于碱基编辑的组分以彼此的任何顺序以及引导核酸接触(例如,向所述靶核酸提供后者),例如,在提供包含引导核酸的表达盒之前、同时或之后(例如,与靶核酸接触)。
本发明的融合蛋白可以包含序列特异性核酸结合结构域(例如,DNA结合结构域)、CRISPR-Cas多肽、和/或融合到肽标签或亲和多肽(亲和多肽与肽标签相互作用)的脱氨酶结构域,如本领域所知,用于将脱氨酶募集到靶核酸。募集方法还可以包括与RNA募集基序相连的引导核酸和与能够与RNA募集基序相互作用的亲和多肽融合的脱氨酶,从而将脱氨酶募集到靶核酸。备选地,化学相互作用可用于将多肽(例如,脱氨酶)募集到靶核酸。
可用于本发明的肽标签(例如表位)可以包括但不限于,GCN4肽标签(例如Sun-Tag)、c-Myc亲和标签、HA亲和标签、His亲和标签、S亲和标签、蛋氨酸-His亲和标签、RGD-His亲和标签、FLAG八肽、strep标签或strep标签II、V5标签、和/或VSV-g表位。在一些实施方案中,肽标签还可以包括SH2结构域识别的特定序列情况下的磷酸化酪氨酸、含有由14-3-3蛋白识别的磷酸丝氨酸的特征共有序列、由SH3结构域识别的富含脯氨酸的肽基序、PDZ蛋白相互作用结构域或PDZ信号序列、以及来自植物的AGO hook基序。肽标签在WO2018/136783和美国专利申请公开号2017/0219596中公开,其通过引用将其关于肽标签的公开内容并入本文。可以与多肽连接并且具有可以与另一多肽连接的相应亲和多肽的任何表位可以与本发明一起用作肽标签。肽标签可以包含或存在于肽标签(例如,多聚肽标签或多聚表位)(例如,约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、9、20、21、22、23、24或25或更多个肽标签)的一个拷贝或2个或更多个拷贝中。当多聚时,肽标签可以直接彼此融合,或者可以通过一个或多个氨基酸(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个氨基酸,任选约3至约10、约4至约10、约5至约10、约5至约15或约5至约20个氨基酸等,以及其中的任何值或范围)彼此连接。在一些实施方案中,与肽标签相互作用/结合的亲和多肽可以是抗体。在一些实施方案中,所述抗体可以是scFv抗体。在一些实施方案中,与肽标签结合的亲和多肽可以是合成的(例如,进化为亲和相互作用),包括但不限于,亲和体、抗运载蛋白、monobody和/或DARPin(参见,例如,Sha等人,Protein Sci.26(5):910-924(2017));Gilbreth(Curr Opin Struc Biol 22(4):413-420(2013)),美国专利号9,982,053,每一项关于与亲和体、抗运载蛋白、monobodies和/或DARPin相关的教导通过引用全部并入)。肽标签序列及其亲和多肽实例包括但不限于SEQ ID NO:42-44的氨基酸序列。
在一些实施方案中,引导核酸可以与RNA募集基序连接,并且要募集的多肽(例如,脱氨酶)可以融合到与RNA募集基序结合的亲和多肽,其中引导与靶核酸结合,RNA募集基序与亲和多肽结合,从而将多肽募集到引导物并使靶核酸与多肽(例如,脱氨酶)接触。在一些实施方案中,可以将两个或更多个多肽募集到引导核酸,从而使两个或更多个多肽(例如,脱氨酶)接触靶核酸。RNA募集基序及其亲和多肽的实例包括但不限于SEQ ID NO:45-55的序列。
在一些实施方案中,与亲和多肽融合的多肽可以是逆转录酶,而引导核酸可以是与RNA募集基序相连的延伸的引导核酸。在一些实施方案中,RNA募集基序可以位于延伸的引导核酸的延伸部分的3'端(例如,5'-3',重复序列-间隔序列-延伸部分(RT模板-引物结合位点)-RNA募集基序)。在一些实施方案中,RNA募集基序可以嵌入到延伸部分中。
在本发明的一些实施方案中,延伸的引导RNA和/或引导RNA可以连接到一个或连接到两个或更多个RNA募集基序(例如,1、2、3、4、5、6、7、8、9、10个或更多个基序;例如,至少10至约25个基序),任选地,其中两个或更多个RNA募集基序可以是相同的RNA募集基序或不同的RNA募集基序。在一些实施方案中,RNA募集基序和相应的亲和多肽可以包括但不限于,端粒酶Ku结合基序(例如,Ku结合发夹)和相应的亲和多肽Ku(例如,Ku异二聚体),端粒酶Sm7结合基序和相应的亲和多肽Sm7,MS2噬菌体操纵子茎环和相应的亲和多肽MS2外壳蛋白(MCP),PP7噬菌体操纵子茎环和相应的亲和多肽PP7外壳蛋白(PCP),SfMu噬菌体Com茎环和相应的亲和多肽Com RNA结合蛋白,PUF结合位点(PBS)和亲和多肽Pumilio/fem-3mRNA结合因子(PUF),和/或合成RNA适配体和作为相应的亲和多肽的适配体配体。在一些实施方案中,RNA募集基序和相应的亲和多肽可以是MS2噬菌体操纵子茎环和亲和多肽MS2外壳蛋白(MCP)。在一些实施方案中,RNA募集基序和相应的亲和多肽可以是PUF结合位点(PBS)和亲和多肽Pumilio/fem-3mRNA结合因子(PUF)。
在一些实施方案中,用于募集多肽和核酸的组分可以是那些通过化学相互作用起作用的组分,其可以包括但不限于,雷帕霉素诱导的FRB–FKBP二聚化;生物素-链霉亲和素;SNAP标签;Halo标签;CLIP标签;化合物诱导的DmrA-DmrC异二聚体;双功能配体(例如,将两个结合蛋白质的化学物质融合在一起,例如,二氢叶酸还原酶(DHFR)。
在一些实施方案中,被优化以在植物中表达的本发明的核酸构建体、表达盒或载体与包含相同的多核苷酸但没有针对在植物中表达进行密码子优化的核酸构建体、表达盒或载体可以约70%至100%相同(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)。
本文还提供包含本发明的一种或多种多核苷酸、引导核酸、核酸构建体、表达盒或载体的细胞。
现在将参照以下实施例来描述本发明。应当理解,这些实施例并不旨在将权利要求的范围限制到本发明,而是旨在作为某些实施方案的示例。本领域技术人员想到的示例方法中的任何变化都将落入本发明的范围中。
实施例
实施例1.用于VRS3编辑的编辑构建体的设计
设计了一种策略,以在玉米VRS3基因Zm00001d014422(SEQ ID NO:72)和Zm00001d030108(SEQ ID NO:69)中产生改变的等位基因,以改变分生组织的大小和/或形态。为了产生一系列等位基因,设计了包含间隔子PWsp581(SEQ ID NO:93)、PWsp582(SEQID NO:94)、PWsp583(SEQ ID NO:95)和PWsp584(SEQ ID NO:96)的CRISPR-Cas引导核酸,所述CRISPR-Cas引导核酸与任一种或两种VRS3基因内的靶标具有互补性(或反向互补性),并置于构建体中,并使用农杆菌将其引入干燥的切开的玉米胚中。通过抗生素选择在体外维持转化的组织以再生阳性转化体。选择健康的非嵌合植物(E0)并种植在生长托盘中。从再生的植物(E0代)中收集组织用于DNA提取,随后进行分子筛选以鉴定靶VRS3基因中的编辑。被鉴定为(1)健康的非嵌合、可育的、具有(2)低转基因拷贝和(3)在任一种或两种VRS3基因中包含编辑的植物被推进到下一代。
产生了一系列靶基因的编辑的等位基因,并在下面的表1中进一步描述。
表1.编辑的等位基因
实施例2.性状活动的表型评估
种子在平地上播种,然后在幼苗形成后转移到盆中。所有植物均在标准温室条件下培养并生长至生殖成熟。按照标准做法,在出现穗丝之前,用小纸袋覆盖新发的穗,在开花期间覆盖穗状雄花,以便逐个植物捕获花粉。在一些情况下,开花期和穗丝期不同步,并且没有对穗授粉。我们将这些称为“未授粉”的穗,并在干燥后从植物中取出所有穗后,分别对它们进行评估以确定籽粒行数(如下所述)。
将穗收获并干燥后,人工计数所有穗的籽粒行数。数据代表每穗的三行计数的平均值,所述三行计数取自最完整定义的行谱系的穗的中段。为了防止行重复计数,在开始计数前的行之间插入了一个标记(例如回形针),以指示应该停止行计数的位置。
所有的穗都用佳能数码相机和EOS应用程序进行了照片记录。随后将图像导入ImageJ,并使用线条追踪功能测量所有穗。穗长是通过图像分析程序中的设置比例(以厘米为单位)确定的,以厘米为单位输出距离,然后沿着从穗尖端到穗底部的穗长用线条追踪穗。未编辑的种质以及用Gus质粒转化的品系用作表型分析的对照。表2和表3分别显示了来自自花授粉植物的E1家族和E2家族的籽粒行数(KRN)和穗长的测量值。
表2.E1
表3.E2
上述内容是对本发明的示例说明,而不应被解释为对本发明的限制。本发明由后附权利要求以及其中所包括的权利要求的等同物所定义。
Claims (125)
1.一种植物或其部分,所述植物或其部分包含内源性组蛋白去甲基化酶基因中的至少一个突变,所述组蛋白去甲基化酶基因编码组蛋白去甲基化酶多肽,所述组蛋白去甲基化酶多肽包含锌指DNA结合结构域(ZnF结构域)、Jumonji C型(Jmj-C)结构域和Jumonji N型(Jmj-N)结构域,其中所述突变破坏组蛋白去甲基化酶多肽与DNA的结合和/或降低组蛋白去甲基化酶多肽的组蛋白去甲基化活性。
2.根据权利要求1所述的植物或其部分,其中所述内源性组蛋白去甲基化酶调节小花育性、种子数量和/或种子重量。
3.根据权利要求1和权利要求2所述的植物或其部分,其中所述内源性组蛋白去甲基化酶是SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶,任选地是Jumonji C型H3K9me2/me3去甲基化酶。
4.根据权利要求1-3所述的植物或其部分,其中所述植物是单子叶植物。
5.根据权利要求1-3所述的植物或其部分,其中所述植物是双子叶植物。
6.根据前述权利要求中任一项所述的植物或其部分,其中所述植物是玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、红薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、扁桃、核桃、草莓、西瓜、辣椒、葡萄、番茄、黄瓜、黑莓、覆盆子、黑覆盆子或芸苔属物种。
7.根据权利要求1-5所述的植物或其部分,其中所述植物是玉米。
8.根据权利要求5所述的植物或其部分,其中所述内源性组蛋白去甲基化酶基因位于1号染色体和/或5号染色体上。
9.根据前述权利要求中任一项所述的植物或其部分,其中所述内源性组蛋白去甲基化酶基因:
(a)编码与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的多肽;和/或
(b)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列。
10.根据前述权利要求中任一项所述的植物或其部分,其中所述组蛋白去甲基化酶基因包含:(1)JmjN结构域,所述JmjN结构域:(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80%的序列同一性的多肽,(2)JmjC结构域,所述JmjC结构域:(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80%的序列同一性的多肽,和/或(3)ZnF结构域,所述ZnF结构域:(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80%的序列同一性的多肽。
11.根据前述权利要求中任一项所述的植物或其部分,其中所述至少一个突变是碱基置换、碱基缺失和/或碱基插入。
12.根据前述权利要求中任一项所述的植物或其部分,其中所述至少一个突变包含对A、T、G或C的碱基置换。
13.根据前述权利要求中任一项所述的植物或其部分,其中所述至少突变是至少一个碱基对的置换。
14.根据权利要求1至12中任一项所述的植物或其部分,其中编码组蛋白去甲基化酶的内源性基因中的所述至少一个突变包含碱基缺失。
15.根据权利要求11或权利要求14所述的植物或其部分,其中所述碱基缺失是框内缺失或框外缺失。
16.根据权利要求11或权利要求14所述的植物或其部分,其中所述碱基缺失包括从组蛋白去甲基化酶基因的ZnF结构域中缺失至少一个碱基对(例如,参考SEQ ID NO:69的核苷酸位置编号,从位置3927到位置4165缺失至少一个核苷酸,参考SEQ ID NO:70的核苷酸位置编号,从位置1495到位置1654缺失至少一个核苷酸,参考SEQ ID NO:72的核苷酸位置编号,从位置3987到位置4233缺失至少一个核苷酸,和/或参考SEQ ID NO:73的核苷酸位置编号,从位置1498到位置1656缺失至少一个核苷酸)。
17.根据权利要求11或权利要求14所述的植物或其部分,其中所述碱基缺失包括从组蛋白去甲基化酶基因的JmjC结构域中缺失至少一个碱基对(例如,参考SEQ ID NO:69的核苷酸位置编号,从位置3100到位置3631缺失至少一个核苷酸,参考SEQ ID NO:70的核苷酸位置编号,从位置832到位置1199缺失至少一个核苷酸,参考SEQ ID NO:72的核苷酸位置编号,从位置3162到位置3692缺失至少一个核苷酸,和/或参考SEQ ID NO:73的核苷酸位置编号,从位置835到位置1203缺失至少一个核苷酸)。
18.根据权利要求11或权利要求14所述的植物或其部分,其中所述碱基缺失包括从组蛋白去甲基化酶基因的JmjN结构域中缺失至少一个碱基对(例如,参考SEQ ID NO:69的核苷酸位置编号,从位置2216到位置2424缺失至少一个核苷酸,参考SEQ ID NO:70的核苷酸位置编号,从位置301到位置402缺失至少一个核苷酸,参考SEQ ID NO:72的核苷酸位置编号,从位置2268到位置2477缺失至少一个核苷酸,和/或参考SEQ ID NO:73的核苷酸位置编号,从位置305到位置405缺失至少一个核苷酸)。
19.根据权利要求11或14-18中任一项所述的植物或其部分,其中所述碱基缺失导致组蛋白去甲基化酶的ZnF结构域的一个或多个氨基酸残基、组蛋白去甲基化酶的JmjN结构域的一个或多个氨基酸残基和/或组蛋白去甲基化酶的JmjC结构域的一个或多个氨基酸残基的缺失(例如,来自组蛋白去甲基化酶(例如VRS3多肽,例如,SEQ ID NO:71或SEQ ID NO:74)的ZnF结构域、JmjN结构域或JmjC结构域的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58,59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83或84个氨基酸残基的缺失)。
20.根据权利要求12或15-18中任一项所述的植物或其部分,其中所述碱基缺失导致组蛋白去甲基化酶的ZnF结构域的一个或多个氨基酸残基的缺失,即,参考SEQ ID NO:71的氨基酸位置编号,从位置499到位置551缺失一个或多个氨基酸残基,和/或参考SEQ ID NO:74的氨基酸位置编号,从位置500到位置552缺失一个或多个氨基酸残基。
21.根据权利要求12或15-18中任一项所述的植物或其部分,其中所述碱基缺失导致组蛋白去甲基化酶的JmjC结构域的一个或多个氨基酸残基的缺失,即,参考SEQ ID NO:71的氨基酸位置编号,从位置278到位置400缺失一个或多个氨基酸残基,和/或参考SEQ ID NO:74的氨基酸位置编号,从位置123到位置401缺失一个或多个氨基酸残基。
22.根据权利要求12或15-18中任一项所述的植物或其部分,其中所述碱基缺失导致组蛋白去甲基化酶的JmjN结构域的一个或多个氨基酸残基的缺失,即,参考SEQ ID NO:71的氨基酸位置编号,从位置101到位置135缺失一个或多个氨基酸残基,和/或参考SEQ ID NO:74的氨基酸位置编号,从位置101到位置136缺失一个或多个氨基酸残基。
23.根据权利要求11-13中任一项所述的植物或其部分,其中所述碱基置换导致氨基酸置换。
24.根据权利要求23所述的植物或其部分,其中所述氨基酸置换破坏组蛋白去甲基化酶与DNA的结合或降低组蛋白去甲基化酶的组蛋白去甲基化活性。
25.根据前述权利要求中任一项所述的植物或其部分,其中所述至少一个突变是显性负性突变、半显性突变、弱功能丧失突变、亚效等位基因突变或无效突变,任选地,其中所述突变是显性负性突变。
26.根据前述权利要求中任一项所述的植物或其部分,其中所述至少一个突变导致突变的组蛋白去甲基化酶基因,所述突变的组蛋白去甲基化酶基因与SEQ ID NO:104、106或108中任一个具有至少90%的序列同一性,任选地,其中所述突变的组蛋白去甲基化酶基因编码与SEQ ID NO:105、107或109中任一个具有至少90%的序列同一性的突变的组蛋白去甲基化酶多肽序列。
27.根据前述权利要求中任一项所述的植物或其部分,其中所述至少一个突变是非自然突变。
28.一种包含编辑系统的植物细胞,所述编辑系统包含:
(a)CRISPR相关效应蛋白;和
(b)引导核酸(例如gRNA、gDNA、crRNA、crDNA),所述引导核酸具有与编码组蛋白去甲基化酶的内源性靶基因互补的间隔序列。
29.根据权利要求28所述的植物细胞,其中所述组蛋白去甲基化酶是SIX-ROWED SPIKE3(VRS3)组蛋白去甲基化酶,任选地是Jumonji C型H3K9me2/me3去甲基化酶。
30.根据权利要求28或权利要求29所述的植物细胞,其中所述编码组蛋白去甲基化酶的内源性靶基因:
(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;和/或
(b)编码与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的多肽序列。
31.根据权利要求28-30中任一项所述的植物细胞,其中所述编码组蛋白去甲基化酶的所述内源性靶基因包含:(1)JmjN结构域,所述JmjN结构域:(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:87或SEQ IDNO:90的氨基酸序列具有至少80%的序列同一性的多肽,(2)JmjC结构域,所述JmjC结构域:(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80%的序列同一性的多肽,和/或(3)ZnF结构域,所述ZnF结构域:(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80%的序列同一性的多肽。
32.根据权利要求28-31中任一项所述的植物细胞,其中所述引导核酸包含SEQ ID NO:93-103中任一个的核苷酸序列(例如,间隔序列)。
33.根据权利要求28-32中任一项所述的植物细胞,其中所述植物细胞是玉米植物细胞。
34.从权利要求1-27中任一项所述的植物部分或从权利要求28-33中任一项所述的植物细胞再生的植物。
35.根据权利要求34所述的植物,其中所述植物表现出增加的小花育性、增加的种子数量和/或增加的种子重量。
36.一种植物细胞,所述植物细胞包含组蛋白去甲基化酶基因的DNA结合位点中的突变,所述突变阻止或减少编码的组蛋白去甲基化酶与DNA的结合或降低编码的组蛋白去甲基化酶的活性,
其中基因组修饰是使用编辑系统引入的置换、插入和/或缺失,所述编辑系统包含与组蛋白去甲基化酶基因中的靶位点结合的核酸结合结构域,
其中所述组蛋白去甲基化酶基因:
(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;和/或
(b)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽。
37.根据权利要求36所述的植物细胞,其中组蛋白去甲基化酶基因包含:(1)JmjN结构域,所述JmjN结构域:(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80%的序列同一性的多肽,(2)JmjC结构域,所述JmjC结构域:(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80%的序列同一性的多肽,和/或(3)ZnF结构域,所述ZnF结构域:(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80%的序列同一性的多肽。
38.根据权利要求36或权利要求37所述的植物细胞,其中所述编辑系统的核酸结合结构域来自多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)和/或Argonaute蛋白。
39.根据权利要求36-38中任一项所述的植物细胞,其中所述突变是置换和/或缺失。
40.根据权利要求39所述的植物细胞,其中所述缺失是内源性组蛋白去甲基化酶的锌指DNA结合结构域(ZnF结构域)、Jumonji C型(Jmj-C)结构域和Jumonji N型(Jmj-N)结构域的全部或部分缺失。
41.根据权利要求39或权利要求40所述的植物细胞,其中所述缺失是框内缺失或框外缺失。
42.根据权利要求36-39中任一项所述的植物细胞,其中所述突变包含对A、T、G或C的碱基置换,任选地,其中所述碱基置换导致氨基酸置换。
43.根据权利要求36-42中任一项所述的植物细胞,其中所述组蛋白去甲基化酶基因编码SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶。
44.根据权利要求36-43中任一项所述的植物细胞,其中所述植物细胞是来自玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、红薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、扁桃、核桃、草莓、西瓜、辣椒、葡萄、番茄、黄瓜、黑莓、覆盆子、黑覆盆子或芸苔属植物的细胞。
45.根据权利要求36-44中任一项所述的植物细胞,其中所述细胞是玉米植物细胞。
46.根据权利要求36-45中任一项所述的植物细胞,其中所述突变导致突变的组蛋白去甲基化酶基因,所述突变的组蛋白去甲基化酶基因与SEQ ID NO:104、106或108中任一个具有至少90%的序列同一性,任选地,其中所述突变的组蛋白去甲基化酶基因编码与SEQ IDNO:105、107或109中任一个具有至少90%的序列同一性的突变的组蛋白去甲基化酶多肽序列。
47.根据权利要求36-46中任一项所述的植物细胞,其中所述突变是非自然突变。
48.从权利要求34-47中任一项所述的植物细胞再生的植物,其中所述植物表现出增加的小花育性、增加的种子数量和/或增加的种子重量。
49.根据权利要求48所述的植物,其中所述植物包含突变的组蛋白去甲基化酶基因,所述突变的组蛋白去甲基化酶基因与SEQ ID NO:104、106或108中任一个的核苷酸序列具有至少90%的序列同一性,任选地,其中所述突变的组蛋白去甲基化酶基因编码与SEQ IDNO:105、107或109中任一个具有至少90%的序列同一性的突变的组蛋白去甲基化酶多肽序列。
50.根据权利要求48或权利要求49所述的植物,其中所述突变是非自然突变。
51.一种提供具有增加的小花育性、增加的种子数量和/或增加的种子重量的多种植物的方法,所述方法包括:
在生长区域种植权利要求1-27、34、35或48-50中任一项所述的两种或更多种植物,从而提供与不包含突变的多种对照植物相比具有增加的小花繁育性、增加的种子数量和/或增加的种子重量的多种植物。
52.一种产生/育种无转基因的基因组编辑的(例如碱基编辑的)植物的方法,所述方法包括:
(a)使权利要求1-27、34、35或48-50中任一项所述的植物与无转基因的植物杂交,从而将突变或修饰引入无转基因的植物中;和
(b)选择包含所述突变或修饰但无转基因的子代植物,从而产生无转基因的基因组编辑的植物。
53.一种在植物的内源性组蛋白去甲基化酶基因中产生突变的方法,所述方法包括:
(a)使基因编辑系统靶向内源性组蛋白去甲基化酶基因的部分,所述部分:
(i)包含与SEQ ID NO:75、76、78、79、81、82、84或85中任一个具有至少80%的序列同一性的核苷酸序列和/或编码与SEQ ID NO:87、88、90或91中任一个具有至少80%的同一性的氨基酸序列,任选地包含与SEQ ID NO:75、78、81或84中任一个具有至少80%的序列同一性的核苷酸序列和/或编码与SEQ ID NO:87或SEQ ID NO:90具有至少80%的同一性的氨基酸序列,和/或
(ii)包含与SEQ ID NO:77、80、83或86中任一个具有至少80%的序列同一性的核苷酸序列和/或编码与SEQ ID NO:89或92中任一个具有至少80%的同一性的氨基酸序列;和
(b)选择包含位于内源性组蛋白去甲基化酶基因的部分中的修饰的植物,所述内源性组蛋白去甲基化酶基因的部分与SEQ ID NO:75、76、77、78、79、80、81、82、83、84、85或86中任一个核苷酸序列具有至少80%的序列同一性。
54.根据权利要求53所述的方法,其中检测到的所述突变位于突变的组蛋白去甲基化酶基因中,所述突变的组蛋白去甲基化酶基因与SEQ ID NO:104、106或108中任一个具有至少90%的序列同一性,任选地,其中所述突变的组蛋白去甲基化酶基因编码突变的组蛋白去甲基化酶多肽序列,所述突变的组蛋白去甲基化酶多肽序列与SEQ ID NO:105、107或109中任一个具有至少90%的序列同一性。
55.一种在植物细胞的组蛋白去甲基化酶多肽中产生变异的方法,所述方法包括:
将编辑系统引入植物细胞,其中所述编辑系统靶向植物细胞中的组蛋白去甲基化酶基因的区域;和
使所述组蛋白去甲基化酶基因的区域与所述编辑系统接触,从而将突变引入组蛋白去甲基化酶基因,并在植物细胞的组蛋白去甲基化酶多肽中产生变异。
56.根据权利要求55所述的方法,其中所述组蛋白去甲基化酶多肽包含锌指DNA结合结构域(ZnF结构域)、Jumonji C型(Jmj-C)结构域和Jumonji N型(Jmj-N)结构域,并且组蛋白去甲基化酶基因中的突变破坏组蛋白去甲基化酶多肽与DNA的结合和/或降低组蛋白去甲基化酶多肽的组蛋白去甲基化活性。
57.根据权利要求55或权利要求56所述的方法,其中所述组蛋白去甲基化酶基因包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列和/或包含与SEQ ID NO:75-86中任一个核苷酸序列具有至少80%的序列同一性的区域。
58.根据权利要求55-57中任一项所述的方法,其中所述组蛋白去甲基化酶多肽包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的氨基酸序列,和/或产生变异的所述组蛋白去甲基化酶多肽的区域包含与SEQ ID NO:87-92中任一个具有至少80%的序列同一性的氨基酸序列。
59.根据权利要求55-58中任一项所述的方法,其中在植物的组蛋白去甲基化酶多肽中产生变异导致植物表现出增加的小花育性、增加的种子数量和/或增加的种子重量。
60.根据权利要求55-59中任一项所述的方法,其中使植物细胞中所述内源性组蛋白去甲基化酶基因的区域与所述编辑系统接触产生在基因组中包含编辑的内源性组蛋白去甲基化酶基因的植物细胞,所述方法还包括:(a)从所述植物细胞再生植物;(b)自交植物以产生子代植物(E1);(c)测定(b)的子代植物的增加的小花育性、增加的种子数量和/或增加的种子重量;以及(d)选择表现出增加的小花育性、增加的种子数量和/或增加的种子重量的子代植物,以产生与对照植物相比表现出增加的小花育性、增加的种子数量和/或增加的种子重量的子代植物。
61.根据权利要求60所述的方法,所述方法还包括:(e)自交(d)的选择的子代植物以产生子代植物(E2);(f)测定(e)的子代植物的增加的小花育性、增加的种子数量和/或增加的种子重量;以及(g)选择表现出增加的小花育性、增加的种子数量和/或增加的种子重量的子代植物,以产生与对照植物相比表现出增加的小花育性、增加的种子数量和/或增加的种子重量的选择的子代植物,任选地重复(e)至(g)额外的一次或多次。
62.一种检测植物的突变组蛋白去甲基化酶基因(内源性组蛋白去甲基化酶基因中的突变)的方法,所述方法包括在植物基因组中检测SEQ ID NO:69、70、72、73或75-87中任一个的核酸序列,所述核酸序列具有至少一个突变,所述突变破坏组蛋白去甲基化酶与DNA的结合或降低组蛋白去甲基化酶的组蛋白去甲基化活性。
63.一种用于编辑植物细胞基因组中特定位点的方法,所述方法包括:以位点特异性方式切割植物细胞中内源性组蛋白去甲基化酶基因中的靶位点,所述内源性组蛋白去甲基化酶基因:
(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;和/或
(b)编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽,
从而在植物细胞的内源性组蛋白去甲基化酶基因中产生编辑。
64.根据权利要求63所述的方法,其中组蛋白去甲基化酶基因包含:(1)JmjN结构域,所述JmjN结构域:(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80%的序列同一性的多肽,(2)JmjC结构域,所述JmjC结构域:(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80%的序列同一性的多肽,和/或(3)ZnF结构域,所述ZnF结构域:(a)与SEQID NO:77、80、83或86中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQID NO:89或SEQ ID NO:92的氨基酸序列具有至少80%的序列同一性的多肽。
65.根据权利要求63或权利要求64所述的方法,所述方法还包括从包含内源性组蛋白去甲基化酶基因中的编辑的植物细胞再生植物,以产生在其内源性组蛋白去甲基化酶基因中包含所述编辑的植物。
66.根据权利要求63-65中任一项所述的方法,其中与不包含所述编辑的对照植物相比,在其内源性组蛋白去甲基化酶基因中包含所述编辑的植物表现出增加的小花育性、增加的种子数量和/或增加的种子重量。
67.根据权利要求63-66中任一项所述的方法,其中所述编辑导致内源性组蛋白去甲基化酶基因中的突变,突变的组蛋白去甲基化酶基因产生具有减少的DNA结合和/或降低的组蛋白去甲基化活性的组蛋白去甲基化酶。
68.根据权利要求63-67中任一项所述的方法,其中所述编辑产生突变的组蛋白去甲基化酶基因,所述突变的组蛋白去甲基化酶基因与SEQ ID NO:104、106或108中任一个具有至少90%的序列同一性,其中所述突变的组蛋白去甲基化酶基因编码突变的组蛋白去甲基化酶多肽序列,所述突变的组蛋白去甲基化酶多肽序列与SEQ ID NO:105、107或109中任一个具有至少90%的序列同一性,任选地,其中所述编辑产生非自然突变。
69.一种产生植物的方法,所述方法包括:
(a)使包含编码组蛋白去甲基化酶的野生型内源性基因的植物细胞群体与靶向野生型内源性基因的核酸酶接触,其中所述核酸酶与核酸结合结构域连接,所述核酸结合结构域与野生型内源性基因中的靶位点结合,所述野生型内源性基因:(i)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;或(ii)编码包含与SEQID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽;
(b)从所述群体中选择包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物细胞,其中所述突变是(i)或(ii)中任一项的多肽中的至少一个氨基酸残基的置换和/或缺失,其中所述突变降低或消除组蛋白去甲基化酶结合DNA的能力或降低组蛋白去甲基化酶的组蛋白去甲基化活性;和
(c)使选择的植物细胞生长成包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物。
70.一种增加植物的小花育性、种子数量和/或种子重量的方法,所述方法包括:
(a)使包含编码组蛋白去甲基化酶的野生型内源性基因的植物细胞与靶向野生型内源性基因的核酸酶接触,其中所述核酸酶与核酸结合结构域连接,所述核酸结合结构域与野生型内源性基因中的靶位点结合,所述野生型内源性基因:(i)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;和/或(ii)编码包含与SEQID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽,从而产生包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物细胞;和
(b)使所述植物细胞生长成包含编码组蛋白去甲基化酶的野生型内源性基因中的突变的植物,从而增加植物的小花育性、种子数量和/或种子重量。
71.一种产生植物或其部分的方法,所述植物或其部分包含至少一个具有内源性组蛋白去甲基化酶基因中的突变的细胞,所述方法包括:
使植物或植物部分的组蛋白去甲基化酶基因中的靶位点与包含切割结构域和DNA结合结构域的核酸酶接触,其中所述核酸酶的核酸结合结构域与组蛋白去甲基化酶基因中的靶位点结合,
其中所述组蛋白去甲基化酶基因:(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;和/或(b)编码包含与SEQ ID NO:71或SEQ IDNO:74具有至少80%的序列同一性的序列的多肽,
从而产生包含至少一个具有内源性组蛋白去甲基化酶基因中的突变的细胞的植物或其部分。
72.根据权利要求69-71中任一项所述的方法,其中内源性组蛋白去甲基化酶基因中的所述突变产生具有减少的DNA结合或降低的活性的组蛋白去甲基化酶。
73.一种产生植物或其部分的方法,所述植物或其部分包含内源性组蛋白去甲基化酶中的突变,突变的组蛋白去甲基化酶具有减少的DNA结合和/或降低的组蛋白去甲基化活性,所述方法包括使植物或植物部分的内源性组蛋白去甲基化酶基因中的靶位点与包含切割结构域和核酸结合结构域的核酸酶接触,其中所述核酸结合结构域与组蛋白去甲基化酶基因中的靶位点结合,
其中所述组蛋白去甲基化酶基因:(a)包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;和/或(b)编码包含与SEQ ID NO:71或SEQ IDNO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽,
从而产生具有内源性组蛋白去甲基化酶中的突变的植物或其部分,突变的组蛋白去甲基化酶具有减少的DNA结合和/或降低的组蛋白去甲基化活性。
74.根据权利要求69-73中任一项所述的方法,其中组蛋白去甲基化酶基因包含:(1)JmjN结构域,所述JmjN结构域:(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80%的序列同一性的多肽,(2)JmjC结构域,所述JmjC结构域:(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:88或SEQ IDNO:91的氨基酸序列具有至少80%的序列同一性的多肽,和/或(3)ZnF结构域,所述ZnF结构域:(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80%的序列同一性的多肽。
75.根据权利要求69-74中任一项所述的方法,其中所述突变是非自然突变,任选地是碱基置换、碱基缺失和/或碱基插入。
76.根据权利要求69-75中任一项所述的方法,其中所述突变包含对A、T、G或C的碱基置换。
77.根据权利要求69-76中任一权利要求所述的方法,其中所述突变是至少一个碱基对的置换。
78.根据权利要求69-76中任一项所述的方法,其中编码组蛋白去甲基化酶的内源性基因中的所述突变包含碱基缺失。
79.根据权利要求75或权利要求78所述的方法,其中所述碱基缺失包括框内缺失和/或框外缺失。
80.根据权利要求75、78或79中任一项所述的方法,其中所述碱基缺失包括从组蛋白去甲基化酶基因的ZnF结构域中缺失至少一个碱基对(例如,参考SEQ ID NO:69的核苷酸位置编号,从位置3927到位置4165缺失至少一个核苷酸,参考SEQ ID NO:70的核苷酸位置编号,从位置1495位到位置1654缺失至少一个核苷酸,参考SEQ ID NO:72的核苷酸位置编号,从位置3987到位置4233缺失至少一个核苷酸,和/或参考SEQ ID NO:73的核苷酸位置编号,从位置1498到位置1656缺失至少一个核苷酸)。
81.根据权利要求75、78或79中任一项所述的方法,其中所述碱基缺失包括从组蛋白去甲基化酶基因的JmjC结构域中缺失至少一个碱基对(例如,参考SEQ ID NO:69的核苷酸位置编号,从位置3100到位置3631缺失至少一个核苷酸,参考SEQ ID NO:70的核苷酸位置编号,从位置832到位置1199缺失至少一个核苷酸,参考SEQ ID NO:72的核苷酸位置编号,从位置3162到位置3692缺失至少一个核苷酸,和/或参考SEQ ID NO:73的核苷酸位置编号,从位置835到位置1203缺失至少一个核苷酸)。
82.根据权利要求75、77或79中任一项所述的方法,其中所述碱基缺失包括从组蛋白去甲基化酶基因的JmjN结构域中缺失至少一个碱基对(例如,参考SEQ ID NO:72的核苷酸位置编号,从位置2216到位置2424缺失至少一个核苷酸,参考SEQ ID NO:70的核苷酸位置编号,从位置301到位置402缺失至少一个核苷酸,参考SEQ ID NO:72的核苷酸位置编号,从位置2268到位置2477缺失至少一个核苷酸,和/或参考SEQ ID NO:73的核苷酸位置编号,从位置305到位置405缺失至少一个核苷酸)。
83.根据权利要求75或77-82中任一项所述的方法,其中所述碱基缺失导致组蛋白去甲基化酶的ZnF结构域的一个或多个氨基酸残基、组蛋白去甲基化酶的JmjN结构域的一个或多个氨基酸残基和/或组蛋白去甲基化酶的JmjC结构域的一个或多个氨基酸残基的缺失(例如,来自组蛋白去甲基化酶(例如,VRS3多肽,例如,SEQ ID NO:71或SEQ ID NO:74)的ZnF结构域、JmjN结构域或JmjC结构域的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58,59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83或84个氨基酸残基的缺失)。
84.根据权利要求75-77中任一项所述的方法,其中所述碱基置换导致氨基酸置换。
85.根据权利要求84中任一项所述的方法,其中所述氨基酸置换破坏组蛋白去甲基化酶与DNA的结合或降低组蛋白去甲基化酶的组蛋白去甲基化活性。
86.根据权利要求69-85中任一项所述的方法,其中所述突变是显性负性突变、半显性突变、弱功能丧失突变、亚效等位基因突变或无效突变,任选地,其中所述突变是显性负性突变。
87.根据权利要求69-86中任一项所述的方法,其中与不包含内源性组蛋白去甲基化酶中的突变的对照植物相比,具有内源性组蛋白去甲基化酶中的突变的所述植物表现出增加的小花育性、增加的种子数量和/或增加的种子重量。
88.根据权利要求69-87中任一项所述的方法,其中所述核酸酶切割内源性组蛋白去甲基化酶基因,并将突变引入内源性组蛋白去甲基化酶基因编码的内源性组蛋白去甲基化酶的ZnF结构域、JmjC结构域和/或JmjN结构域。
89.根据权利要求69-88中任一项所述的方法,其中所述核酸酶是锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)、核酸内切酶(例如Fok1)或CRISPR-Cas效应蛋白。
90.根据权利要求69-89中任一项所述的方法,其中所述组蛋白去甲基化酶能够调节小花育性、种子数量和种子重量。
91.根据权利要求69-90中任一项所述的方法,其中所述组蛋白去甲基化酶是SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶,任选地是Jumonji C型H3K9me2/me3去甲基化酶。
92.根据权利要求69-91中任一项所述的方法,其中所述突变导致突变的组蛋白去甲基化酶基因,所述突变的组蛋白去甲基化酶基因与SEQ ID NO:104、106或108中任一个具有至少90%的序列同一性,任选地,其中所述突变的组蛋白去甲基化酶基因编码与SEQ ID NO:105、107或109中任一个具有至少90%的序列同一性的突变的组蛋白去甲基化酶多肽序列。
93.与组蛋白去甲基化酶基因中的靶位点结合的引导核酸,所述组蛋白去甲基化酶基因包含与SEQ ID NO:69、70、72或73中任一个或多个核苷酸序列具有至少80%的同一性的序列;或编码与SEQ ID NO:71或74中任一个或多个氨基酸序列具有至少80%的序列同一性的序列。
94.根据权利要求93所述的引导核酸,其中组蛋白去甲基化酶基因包含:(1)JmjN结构域,所述JmjN结构域:(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80%的序列同一性的多肽,(2)JmjC结构域,所述JmjC结构域:(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80%的序列同一性的多肽,和/或(3)ZnF结构域,所述ZnF结构域:(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80%的序列同一性的多肽。
95.根据权利要求94所述的引导核酸,其中所述引导核酸包含间隔子,所述间隔子具有SEQ ID NO:92、93、94、95、96、97、98、99、100、101、102或103中任一个的核苷酸序列。
96.根据权利要求93-95中任一项所述的引导核酸,其中所述组蛋白去甲基化酶基因编码SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶,任选地是Jumonji C型H3K9me2/me3去甲基化酶。
97.一种系统,所述系统包含权利要求93-96中任一项所述的引导核酸和与引导核酸缔合的CRISPR-Cas效应蛋白。
98.根据权利要求97所述的系统,所述系统还包含与引导核酸缔合的tracr核酸和CRISPR-Cas效应蛋白,任选地,其中所述tracr核酸和引导核酸共价连接。
99.一种基因编辑系统,所述基因编辑系统包含与引导核酸缔合的CRISPR-Cas效应蛋白,其中所述引导核酸包含与组蛋白去甲基化酶基因结合的间隔序列。
100.根据权利要求99所述的基因编辑系统,其中所述组蛋白去甲基化酶包含与SEQ IDNO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;或编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽。
101.根据权利要求99或权利要求100所述的基因编辑系统,其中组蛋白去甲基化酶基因包含:(1)JmjN结构域,所述JmjN结构域:(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80%的序列同一性的多肽,(2)JmjC结构域,所述JmjC结构域:(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80%的序列同一性的多肽,和/或(3)ZnF结构域,所述ZnF结构域:(a)与SEQ ID NO:77、80、86或86中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80%的序列同一性的多肽。
102.根据权利要求99-101中任一项所述的基因编辑系统,其中所述引导核酸包含间隔序列,所述间隔序列具有SEQ ID NO:92、93、94、95、96、97、98、99、100、101、102或103中任一个核苷酸序列。
103.根据权利要求99-102中任一项所述的基因编辑系统,所述基因编辑系统还包含与引导核酸缔合的tracr核酸和CRISPR-Cas效应蛋白,任选地,其中所述tracr核酸和引导核酸共价连接。
104.根据权利要求99-103中任一项所述的基因编辑系统,其中所述组蛋白去甲基化酶编码SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶。
105.一种包含CRISPR-Cas效应蛋白和引导核酸的复合物,所述CRISPR-Cas效应蛋白包含切割结构域,其中所述引导核酸与组蛋白去甲基化酶基因中的靶位点结合,所述组蛋白去甲基化酶基因包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;或编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽,其中所述切割结构域切割组蛋白去甲基化酶基因中的靶链。
106.一种表达盒,所述表达盒包含:(a)编码包含切割结构域的CRISPR-Cas效应蛋白的多核苷酸和(b)与组蛋白去甲基化酶基因中的靶位点结合的引导核酸,其中所述引导核酸包含与组蛋白去甲基化酶基因中的靶位点互补并结合的间隔序列,所述组蛋白去甲基化酶基因包含与SEQ ID NO:69、70、72或73中任一个核苷酸序列具有至少80%的序列同一性的序列;和/或编码包含与SEQ ID NO:71或SEQ ID NO:74的氨基酸序列具有至少80%的序列同一性的序列的多肽。
107.根据权利要求105所述的复合物或根据权利要求104所述的表达盒,其中组蛋白去甲基化酶基因包含:(1)JmjN结构域,所述JmjN结构域:(a)与SEQ ID NO:75、78、81或84中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:87或SEQ ID NO:90的氨基酸序列具有至少80%的序列同一性的多肽,(2)JmjC结构域,所述JmjC结构域:(a)与SEQ ID NO:76、79、82或85中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:88或SEQ ID NO:91的氨基酸序列具有至少80%的序列同一性的多肽,和/或(3)ZnF结构域,所述ZnF结构域:(a)与SEQ ID NO:77、80、83或86中任一个核苷酸序列具有至少80%的序列同一性,或(b)编码与SEQ ID NO:89或SEQ ID NO:92的氨基酸序列具有至少80%的序列同一性的多肽。
108.根据权利要求105或权利要求107所述的复合物,或根据权利要求104或权利要求105所述的表达盒,其中所述组蛋白去甲基化酶编码SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶,任选地是Jumonji C型H3K9me2/me3去甲基化酶。
109.一种编码具有突变的DNA结合位点的组蛋白去甲基化酶的核酸,其中所述突变的DNA结合位点包含破坏组蛋白去甲基化酶的DNA结合和/或降低组蛋白去甲基化酶的组蛋白去甲基化活性的突变。
110.根据权利要求109所述的核酸,其中所述突变消除组蛋白去甲基化酶与DNA的结合。
111.根据权利要求109或权利要求110所述的核酸,其中所述组蛋白去甲基化酶编码SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶,任选地是Jumonji C型H3K9me2/me3去甲基化酶。
112.一种植物或其部分,所述植物或其部分包含权利要求109-111中任一项所述的核酸。
113.一种玉米植物或其部分,所述玉米植物或其部分包含权利要求109-111中任一项所述的核酸。
114.根据权利要求113所述的玉米植物或其部分,其中所述组蛋白去甲基化酶在1号染色体和/或5号染色体上,所述组蛋白去甲基化酶在ZnF结构域、JmjC结构域和/或JmjN结构域中具有突变,并且具有减少的DNA结合和/或降低的组蛋白去甲基化活性。
115.根据权利要求112所述的植物或根据权利要求113或权利要求114所述的玉米植物,与不包含在ZnF结构域、JmjC结构域和/或JmjN结构域中具有突变的组蛋白去甲基化酶的植物相比,所述植物或玉米植物包含增加的小花育性、增加的种子数量和/或增加的种子重量。
116.一种玉米植物或其植物部分,所述玉米植物或其植物部分包含内源性SIX-ROWEDSPIKE 3(VRS3)组蛋白去甲基化酶基因中的至少一个突变,所述组蛋白去甲基化酶基因位于1号染色体上并且具有基因识别号(基因ID)Zm00001d030108,或位于5号染色体上并且具有基因ID Zm00001d014422,任选地,其中所述至少一个突变导致突变的VRS3基因,所述突变的VRS3基因与SEQ ID NO:104、106和108中任一个具有至少90%的序列同一性,任选地,其中所述突变的VRS3基因编码突变的VRS3多肽序列,所述突变的VRS3多肽序列与SEQ IDNO:105、107和109中任一个具有至少90%的序列同一性,任选地,其中所述至少一个突变是非自然突变。
117.一种引导核酸,所述引导核酸与玉米植物的内源性SIX-ROWED SPIKE 3(VRS3)组蛋白去甲基化酶基因中的靶核酸结合,其中所述靶核酸位于1号染色体上并且具有基因识别号(基因ID)Zm00001d030108,或位于5号染色体上并且具有基因ID Zm00001d014422。
118.一种产生植物的方法,所述植物包含内源性组蛋白去甲基化酶基因中的突变和至少一个感兴趣的多核苷酸,所述方法包括:
使第一植物与包含至少一个感兴趣的多核苷酸的第二植物杂交以产生子代植物,所述第一植物是根据权利要求1-27、34、35或48-50或112-116中任一项所述的植物;和
选择包含组蛋白去甲基化酶基因中的突变和至少一个感兴趣的多核苷酸的子代植物,从而产生包含内源性组蛋白去甲基化酶基因中的突变和至少一个感兴趣的多核苷酸的植物。
119.一种产生植物的方法,所述植物包含内源性组蛋白去甲基化酶基因中的突变和至少一个感兴趣的多核苷酸,所述方法包括:
将至少一个感兴趣的多核苷酸引入权利要求1-27、34、35、48-50或112-116中任一项所述的植物中,从而产生包含内源性组蛋白去甲基化酶基因中的突变和至少一个感兴趣的多核苷酸的植物。
120.一种产生植物的方法,所述植物包含内源性组蛋白去甲基化酶基因中的突变并表现出增加的小花育性、增加的种子数量和/或增加的种子重量的表型,所述方法包括:
使第一植物与表现出增加的小花育性、增加的种子数量和/或增加的种子重量的表型第二植物杂交,所述第一植物是权利要求1-27、34、35、48-50或112-116中任一项所述的植物;和
选择包含内源性组蛋白去甲基化酶基因中的突变和增加的小花育性、增加的种子数量和/或增加的种子重量的表型的子代植物,从而产生包含内源性组蛋白去甲基化酶基因中的突变并且与对照植物相比表现出增加的小花育性、增加的种子数量和/或增加的种子重量的表型的植物。
121.一种防治容器(例如花盆或育苗盘等)、生长室、温室、田地、休闲区、草坪或路边杂草的方法,所述方法包括:
对在容器、生长室、温室、田地、休闲区、草坪或路边生长的权利要求1-27、34、35、48-50或112-116中任一项所述的一种或多种(多株)植物施用除草剂,从而防治其中生长有所述一种或多种植物的容器、生长室、温室、田地、休闲区、草坪或路边的杂草。
122.一种减少昆虫对植物的捕食的方法,所述方法包括向权利要求1-27、34、35、48-50或112-116中任一项所述的一种或多种植物施用杀虫剂,从而减少昆虫对所述一种或多种植物的捕食。
123.一种减少植物上的真菌病害的方法,所述方法包括将杀真菌剂施用于权利要求1-27、34、35、48-50或112-116中任一项所述的一种或多种植物,从而减少所述一种或多种植物上的真菌病害。
124.根据权利要求122或权利要求123所述的方法,其中所述一种或多种植物生长在容器、生长室、温室、田地、休闲区、草坪或路边。
125.根据权利要求115-124中任一项所述的方法,其中所述感兴趣的多核苷酸是赋予除草剂耐受性、抗虫性、抗病性、增加的产量、提高养分利用效率或非生物胁迫抗性的多核苷酸。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163253179P | 2021-10-07 | 2021-10-07 | |
US63/253,179 | 2021-10-07 | ||
PCT/US2022/077639 WO2023060152A2 (en) | 2021-10-07 | 2022-10-06 | Methods for improving floret fertility and seed yield |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118302434A true CN118302434A (zh) | 2024-07-05 |
Family
ID=84245902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280078202.0A Pending CN118302434A (zh) | 2021-10-07 | 2022-10-06 | 用于改善小花育性和种子产量的方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20230116819A1 (zh) |
EP (1) | EP4413022A2 (zh) |
CN (1) | CN118302434A (zh) |
AR (1) | AR127300A1 (zh) |
CA (1) | CA3234455A1 (zh) |
MX (1) | MX2024004058A (zh) |
WO (1) | WO2023060152A2 (zh) |
Family Cites Families (123)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US137395A (en) | 1873-04-01 | Improvement in nuts | ||
US2010A (en) | 1841-03-18 | Machine foe | ||
US24077A (en) | 1859-05-17 | Window-sash supporter | ||
US2009A (en) | 1841-03-18 | Improvement in machines for boring war-rockets | ||
NZ221259A (en) | 1986-07-31 | 1990-05-28 | Calgene Inc | Seed specific transcriptional regulation |
US6040504A (en) | 1987-11-18 | 2000-03-21 | Novartis Finance Corporation | Cotton promoter |
ATE112314T1 (de) | 1988-05-17 | 1994-10-15 | Lubrizol Genetics Inc | Pflanzliches ubiquitinpromotorsystem. |
US5641876A (en) | 1990-01-05 | 1997-06-24 | Cornell Research Foundation, Inc. | Rice actin gene and promoter |
ES2187497T3 (es) | 1990-04-12 | 2003-06-16 | Syngenta Participations Ag | Promotores preferentemente en tejidos. |
US6395966B1 (en) | 1990-08-09 | 2002-05-28 | Dekalb Genetics Corp. | Fertile transgenic maize plants containing a gene encoding the pat protein |
US5459252A (en) | 1991-01-31 | 1995-10-17 | North Carolina State University | Root specific gene promoter |
DE69230290T2 (de) | 1991-08-27 | 2000-07-20 | Novartis Ag, Basel | Proteine mit insektiziden eigenschaften gegen homopteran insekten und ihre verwendung im pflanzenschutz |
UA48104C2 (uk) | 1991-10-04 | 2002-08-15 | Новартіс Аг | Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника |
MX9705101A (es) | 1995-11-06 | 1997-10-31 | Wisconsin Alumni Res Found | Toxinas proteinicas insecticidas obtenidas a partir de photorhabdus luminescens. |
SK24699A3 (en) | 1996-08-29 | 2000-04-10 | Dow Agrosciences Llc | Insecticidal protein toxins from photorhabdus |
BR9808475A (pt) | 1997-04-03 | 2000-05-23 | Dekalb Genetics Corp | Linhagens de milho resistentes à glifosato. |
CN1137137C (zh) | 1997-05-05 | 2004-02-04 | 道农业科学公司 | 来自致病杆菌的杀昆虫蛋白毒素 |
EP1054970A1 (en) | 1998-02-20 | 2000-11-29 | Zeneca Limited | Pollen specific promoter |
AU1336200A (en) | 1998-11-03 | 2000-05-22 | Aventis Cropscience N.V. | Glufosinate tolerant rice |
US6333449B1 (en) | 1998-11-03 | 2001-12-25 | Plant Genetic Systems, N.V. | Glufosinate tolerant rice |
US6509516B1 (en) | 1999-10-29 | 2003-01-21 | Plant Genetic Systems N.V. | Male-sterile brassica plants and methods for producing same |
US6506963B1 (en) | 1999-12-08 | 2003-01-14 | Plant Genetic Systems, N.V. | Hybrid winter oilseed rape and methods for producing same |
CA2395897C (en) | 1999-12-28 | 2011-11-15 | Bayer Cropscience N.V. | Insecticidal proteins from bacillus thuringiensis |
US6395485B1 (en) | 2000-01-11 | 2002-05-28 | Aventis Cropscience N.V. | Methods and kits for identifying elite event GAT-ZM1 in biological samples |
IL151886A (en) | 2000-03-27 | 2010-11-30 | Syngenta Participations Ag | Promoters of a virus that causes curling of a yellow leaf of a cyst |
AR044724A1 (es) | 2000-03-27 | 2005-10-05 | Syngenta Participations Ag | Promotores del virus de la rizadura amarilla del cestrum |
BR122013026754B1 (pt) | 2000-06-22 | 2018-02-27 | Monsanto Company | Molécula de dna e processos para produzir uma planta de milho tolerante à aplicação do herbicida glifosato |
US6713259B2 (en) | 2000-09-13 | 2004-03-30 | Monsanto Technology Llc | Corn event MON810 and compositions and methods for detection thereof |
CA2420406C (en) | 2000-09-29 | 2014-12-09 | Monsanto Technology Llc | Glyphosate tolerant wheat plant 33391 and compositions and methods for detection thereof |
US6740488B2 (en) | 2000-10-25 | 2004-05-25 | Monsanto Technology Llc | Cotton event PV-GHGT07(1445) compositions and methods for detection thereof |
EP1417318B1 (en) | 2000-10-30 | 2011-05-11 | Monsanto Technology LLC | Canola event pv-bngt04(rt73) and compositions and methods for detection thereof |
WO2002040677A2 (en) | 2000-11-20 | 2002-05-23 | Monsanto Technology Llc | Cotton event pv-ghbk04 (531) and compositions and methods for detection thereof |
EP1337669A2 (en) | 2000-11-30 | 2003-08-27 | Ses Europe N.V./S.A. | Glyphosate resistant transgenic sugar beet characterised by a specific transgene insertion (t227-1), methods and primers for the detection of said insertion |
EG26529A (en) | 2001-06-11 | 2014-01-27 | مونسانتو تكنولوجى ل ل سى | Prefixes for detection of DNA molecule in cotton plant MON15985 which gives resistance to damage caused by insect of squamous lepidoptera |
US6818807B2 (en) | 2001-08-06 | 2004-11-16 | Bayer Bioscience N.V. | Herbicide tolerant cotton plants having event EE-GH1 |
AR037856A1 (es) | 2001-12-17 | 2004-12-09 | Syngenta Participations Ag | Evento de maiz |
US7705216B2 (en) | 2002-07-29 | 2010-04-27 | Monsanto Technology Llc | Corn event PV-ZMIR13 (MON863) plants and compositions and methods for detection thereof |
GB0225129D0 (en) | 2002-10-29 | 2002-12-11 | Syngenta Participations Ag | Improvements in or relating to organic compounds |
US7569747B2 (en) | 2002-12-05 | 2009-08-04 | Monsanto Technology Llc | Bentgrass event ASR-368 and compositions and methods for detection thereof |
EP2298921B1 (en) | 2003-02-12 | 2016-12-21 | Monsanto Technology LLC | Cotton event mon 88913 and compositions and methods for detection thereof |
CA2502981C (en) | 2003-02-20 | 2012-09-11 | Kws Saat Ag | Transgenic glyphosate tolerant sugar beet event h7-1 |
US7335816B2 (en) | 2003-02-28 | 2008-02-26 | Kws Saat Ag | Glyphosate tolerant sugar beet |
PL1620571T3 (pl) | 2003-05-02 | 2015-10-30 | Dow Agrosciences Llc | Zdarzenie kukurydzy TC1507 i sposoby jego wykrywania |
DE602004031041D1 (de) | 2003-10-06 | 2011-02-24 | Syngenta Participations Ag | In pflanzenplastiden funktionsfähiger promotor |
KR100537955B1 (ko) | 2003-10-29 | 2005-12-20 | 학교법인고려중앙학원 | 꽃가루 특이적 유전자 발현 프로모터 |
AU2004295386A1 (en) | 2003-12-01 | 2005-06-16 | Syngenta Participations Ag | Insect resistant cotton plants and methods of detecting the same |
WO2005054480A2 (en) | 2003-12-01 | 2005-06-16 | Syngenta Participations Ag | Insect resistant cotton plants and methods of detecting the same |
US7157281B2 (en) | 2003-12-11 | 2007-01-02 | Monsanto Technology Llc | High lysine maize compositions and event LY038 maize plants |
PL1708560T3 (pl) | 2003-12-15 | 2015-10-30 | Monsanto Technology Llc | Roślina kukurydzy MON88017 oraz kompozycje i sposoby ich wykrywania |
GB0402106D0 (en) | 2004-01-30 | 2004-03-03 | Syngenta Participations Ag | Improved fertility restoration for ogura cytoplasmic male sterile brassica and method |
KR101303110B1 (ko) | 2004-03-25 | 2013-09-06 | 신젠타 파티서페이션즈 아게 | 옥수수 이벤트 mir604 |
AU2004318788B2 (en) | 2004-03-26 | 2011-12-22 | Corteva Agriscience Llc | Cry1F and Cry1Ac transgenic cotton lines and event-specific identification thereof |
WO2006039376A2 (en) | 2004-09-29 | 2006-04-13 | Pioneer Hi-Bred International, Inc. | Corn event das-59122-7 and methods for detection thereof |
EP1868426B1 (en) | 2005-03-16 | 2018-02-21 | Syngenta Participations AG | Corn event 3272 and methods of detection thereof |
ES2388548T3 (es) | 2005-04-08 | 2012-10-16 | Bayer Cropscience Nv | Suceso de élite A2704-12 y métodos y estuches para identificar a dicho suceso en muestras biológicas |
ES2369032T3 (es) | 2005-04-11 | 2011-11-24 | Bayer Bioscience N.V. | Suceso élite a5547-127 y kits para identificar tal suceso en muestras biológicas. |
PT1885176T (pt) | 2005-05-27 | 2016-11-28 | Monsanto Technology Llc | Evento mon89788 de soja e métodos para a sua deteção |
WO2006128569A2 (en) | 2005-06-02 | 2006-12-07 | Syngenta Participations Ag | 1143-14a, insecticidal transgenic cotton expressing cry1ab |
EP1917358A2 (en) | 2005-06-02 | 2008-05-07 | Syngeta Participations AG | Ce44-69d insecticidal transgenic cotton expressing cry1ab |
WO2006128572A1 (en) | 2005-06-02 | 2006-12-07 | Syngenta Participations Ag | Ce46-02a insecticidal cotton |
EP1917359A2 (en) | 2005-06-02 | 2008-05-07 | Syngeta Participations AG | Ce43-67b, insecticidal transgenic cotton expressing cry1ab |
WO2006128570A1 (en) | 2005-06-02 | 2006-12-07 | Syngenta Participations Ag | 1143-51b insecticidal cotton |
WO2006128568A2 (en) | 2005-06-02 | 2006-12-07 | Syngenta Participations Ag | T342-142, insecticidal transgenic cotton expressing cry1ab |
CN101238217B (zh) | 2005-08-08 | 2016-01-20 | 拜尔作物科学公司 | 耐受除草剂的棉花植物和用于鉴定其的方法 |
UY29761A1 (es) | 2005-08-24 | 2007-03-30 | Du Pont | Composiciones que proporcionan tolerancia a múltiples herbicidas y métodos para usarlas |
WO2011066360A1 (en) | 2009-11-24 | 2011-06-03 | Dow Agrosciences Llc | Detection of aad-12 soybean event 416 |
TR200805941T2 (tr) | 2006-02-10 | 2009-02-23 | Maharashtra Hybrid Seeds Company Limited (Mahyco) | Transgenik brinjal (solanum melongena) içeren EE-1 olgusu |
AR061131A1 (es) | 2006-05-26 | 2008-08-06 | Monsanto Technology Llc | Planta y semilla de maiz correspondientes al evento transgenico mon89034, y metodos para su deteccion y uso |
CN107603990B (zh) | 2006-06-03 | 2021-09-03 | 先正达参股股份有限公司 | 玉米事件mir162 |
US7951995B2 (en) | 2006-06-28 | 2011-05-31 | Pioneer Hi-Bred International, Inc. | Soybean event 3560.4.3.5 and compositions and methods for the identification and detection thereof |
US7928295B2 (en) | 2006-08-24 | 2011-04-19 | Bayer Bioscience N.V. | Herbicide tolerant rice plants and methods for identifying same |
US20080064032A1 (en) | 2006-09-13 | 2008-03-13 | Syngenta Participations Ag | Polynucleotides and uses thereof |
US7928296B2 (en) | 2006-10-30 | 2011-04-19 | Pioneer Hi-Bred International, Inc. | Maize event DP-098140-6 and compositions and methods for the identification and/or detection thereof |
CA2666754C (en) | 2006-10-31 | 2016-11-29 | E. I. Du Pont De Nemours And Company | Soybean event dp-305423-1 and compositions and methods for the identification and/or detection thereof |
WO2008114282A2 (en) | 2007-03-19 | 2008-09-25 | Maharashtra Hybrid Seeds Company Limited | Transgenic rice (oryza sativa) comprising pe-7 event and method of detection thereof |
AU2008235035B2 (en) | 2007-04-05 | 2013-10-10 | BASF Agricultural Solutions Seed US LLC | Insect resistant cotton plants and methods for identifying same |
ES2403281T3 (es) * | 2007-05-03 | 2013-05-17 | Basf Plant Science Gmbh | Plantas que tienen rasgos relacionados con producción mejorada y un método para elaborarlas |
EP2615173B1 (en) | 2007-06-11 | 2020-09-16 | Basf Agricultural Solutions Seed Us Llc | Insect resistant cotton plants and methods for identifying same |
BRPI0820373B1 (pt) | 2007-11-15 | 2024-01-02 | Monsanto Technology Llc | Método de produção de uma planta de soja resistente a inseto, composições derivadas de células de tal planta, método para proteção de uma planta de soja de infestação de inseto, moléculas de dna, métodos de detectar a presença de tais moléculas e de determinar a zigozidade de tais plantas e kit de detecção de dna |
US8273535B2 (en) | 2008-02-08 | 2012-09-25 | Dow Agrosciences, Llc | Methods for detection of corn event DAS-59132 |
CN104805115A (zh) | 2008-02-14 | 2015-07-29 | 先锋国际良种公司 | Spt事件侧翼的植物基因组dna及用于鉴定spt事件的方法 |
KR101597376B1 (ko) | 2008-02-15 | 2016-02-26 | 몬산토 테크놀로지 엘엘씨 | 트랜스제닉 계통 mon87769에 상응하는 대두 식물 및 종자, 및 그의 검출 방법 |
US8450561B2 (en) | 2008-02-29 | 2013-05-28 | Monsanto Technology Llc | Corn plant event MON87460 and compositions and methods for detection thereof |
CA2727430C (en) | 2008-06-11 | 2018-10-02 | Dow Agrosciences Llc | Constructs for expressing herbicide tolerance genes, related plants, and related trait combinations |
US9078406B2 (en) | 2008-08-29 | 2015-07-14 | Monsanto Technology Llc | Soybean plant and seed corresponding to transgenic event MON87754 and methods for detection thereof |
MX356687B (es) | 2008-09-29 | 2018-06-07 | Monsanto Technology Llc | Evento transgénico de frijol de soya mon87705 y métodos para detección del mismo. |
MX346321B (es) | 2008-12-16 | 2017-03-15 | Syngenta Participations Ag | Evento 5307 del maiz. |
CA2747676A1 (en) | 2008-12-19 | 2010-07-08 | Syngenta Participations Ag | Transgenic sugar beet event gm rz13 |
WO2010080829A1 (en) | 2009-01-07 | 2010-07-15 | Basf Agrochemical Products B.V. | Soybean event 127 and methods related thereto |
JP5769698B2 (ja) | 2009-03-30 | 2015-08-26 | モンサント テクノロジー エルエルシー | 遺伝子組換えイネ事象17314およびその使用方法 |
JP5762400B2 (ja) | 2009-03-30 | 2015-08-12 | モンサント テクノロジー エルエルシー | イネ遺伝子組換え事象17053およびその使用方法 |
UA114882C2 (uk) | 2009-08-19 | 2017-08-28 | Дау Аґросаєнсиз Елелсі | Трансгенна рослина кукурудзи, стійка до гербіцидів, та спосіб її ідентифікації |
DK3127425T3 (da) | 2009-09-17 | 2021-04-26 | Monsanto Technology Llc | Transgen sojabønnehændelse mon87708 og fremgangsmåder til anvendelse deraf |
EP3144391A3 (en) | 2009-11-23 | 2017-06-21 | Monsanto Technology LLC | Transgenic maize event mon 87427 and the relative development scale |
WO2011063413A2 (en) | 2009-11-23 | 2011-05-26 | Bayer Bioscience N.V. | Herbicide tolerant soybean plants and methods for identifying same |
US8581046B2 (en) | 2010-11-24 | 2013-11-12 | Pioneer Hi-Bred International, Inc. | Brassica gat event DP-073496-4 and compositions and methods for the identification and/or detection thereof |
RU2603252C2 (ru) | 2009-11-24 | 2016-11-27 | ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи | Событие 416 aad-12, родственные линии трансгенной сои и их событиеспецифичная идентификация |
WO2011075593A1 (en) | 2009-12-17 | 2011-06-23 | Pioneer Hi-Bred International, Inc. | Maize event dp-040416-8 and methods for detection thereof |
ES2730684T3 (es) | 2009-12-17 | 2019-11-12 | Pioneer Hi Bred Int | Evento de maíz DP-004114-3 y métodos para la detección del mismo |
US20110154526A1 (en) | 2009-12-17 | 2011-06-23 | Pioneer Hi-Bred International, Inc. | Maize event DP-043A47-3 and methods for detection thereof |
US20110154524A1 (en) | 2009-12-17 | 2011-06-23 | Pioneer Hi-Bred International, Inc. | Maize event DP-032316-8 and methods for detection thereof |
EP2575431B1 (en) | 2010-06-04 | 2018-03-14 | Monsanto Technology LLC | Transgenic brassica event mon 88302 and methods of use thereof |
WO2012033794A2 (en) | 2010-09-08 | 2012-03-15 | Dow Agrosciences Llc | Aad-12 event 1606 and related transgenic soybean lines |
MX346994B (es) | 2010-10-12 | 2017-04-06 | Monsanto Technology Llc | Planta y semilla de soja correspondiente al evento transgénico mon87712 y métodos para su detección. |
CA2818918A1 (en) | 2010-11-24 | 2012-05-31 | Pioneer Hi-Bred International, Inc. | Brassica gat event dp-061061-7 and compositions and methods for the identification and/or detection thereof |
BR112013015745B1 (pt) | 2010-12-03 | 2021-01-19 | Ms Technologies, Llc | polinucleotídeos referente ao evento de tolerância a herbicida 8291.45.36.2, cassete de expressão, sonda, bem como processos para identificação do evento, determinação da zigosidade, produção de uma planta de soja transgênica e produção de uma proteína em uma célula de planta |
AU2011336364B2 (en) | 2010-12-03 | 2017-04-13 | Corteva Agriscience Llc | Stacked herbicide tolerance event 8264.44.06.1, related transgenic soybean lines, and detection thereof |
TWI667347B (zh) | 2010-12-15 | 2019-08-01 | 瑞士商先正達合夥公司 | 大豆品種syht0h2及偵測其之組合物及方法 |
WO2012134808A1 (en) | 2011-03-30 | 2012-10-04 | Monsanto Technology Llc | Cotton transgenic event mon 88701 and methods of use thereof |
CA2840630C (en) | 2011-06-30 | 2021-11-30 | Monsanto Technology Llc | Alfalfa plant and seed corresponding to transgenic event kk 179-2 and methods for detection thereof |
AU2012280941B2 (en) | 2011-07-13 | 2017-06-22 | Dow Agrosciences Llc | Stacked herbicide tolerance event 8264.42.32.1, related transgenic soybean lines, and detection thereof |
WO2013012643A1 (en) | 2011-07-15 | 2013-01-24 | Syngenta Participations Ag | Polynucleotides encoding trehalose-6-phosphate phosphatase and methods of use thereof |
CN108192901A (zh) | 2012-02-01 | 2018-06-22 | 陶氏益农公司 | 人造叶绿体转运肽 |
US20150315605A1 (en) * | 2014-02-21 | 2015-11-05 | E I Du Pont De Nemours And Company | Novel transcripts and uses thereof for improvement of agronomic characteristics in crop plants |
EP3169702A4 (en) | 2014-07-14 | 2018-04-18 | The Regents of The University of California | A protein tagging system for in vivo single molecule imaging and control of gene transcription |
WO2016020856A2 (en) | 2014-08-05 | 2016-02-11 | MabQuest SA | Immunological reagents |
WO2016130087A1 (en) * | 2015-02-11 | 2016-08-18 | Temasek Life Sciences Laboratory Limited | Controlling timing of plant flowering |
US9790490B2 (en) | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
WO2017070632A2 (en) | 2015-10-23 | 2017-04-27 | President And Fellows Of Harvard College | Nucleobase editors and uses thereof |
EP3445853A1 (en) * | 2016-04-19 | 2019-02-27 | The Broad Institute, Inc. | Cpf1 complexes with reduced indel activity |
CA3032699A1 (en) | 2016-08-03 | 2018-02-08 | President And Fellows Of Harvard College | Adenosine nucleobase editors and uses thereof |
EP3571304A4 (en) | 2017-01-20 | 2020-08-19 | The Regents of the University of California | TARGETED ACTIVATION IN PLANTS |
US10776905B2 (en) | 2018-02-28 | 2020-09-15 | Microsoft Technology Licensing, Llc | Adaptive interface transformation across display screens |
-
2022
- 2022-10-06 AR ARP220102728A patent/AR127300A1/es unknown
- 2022-10-06 CA CA3234455A patent/CA3234455A1/en active Pending
- 2022-10-06 US US17/938,334 patent/US20230116819A1/en active Pending
- 2022-10-06 CN CN202280078202.0A patent/CN118302434A/zh active Pending
- 2022-10-06 EP EP22800521.1A patent/EP4413022A2/en active Pending
- 2022-10-06 WO PCT/US2022/077639 patent/WO2023060152A2/en active Application Filing
- 2022-10-06 MX MX2024004058A patent/MX2024004058A/es unknown
Also Published As
Publication number | Publication date |
---|---|
CA3234455A1 (en) | 2023-04-13 |
MX2024004058A (es) | 2024-04-25 |
EP4413022A2 (en) | 2024-08-14 |
WO2023060152A2 (en) | 2023-04-13 |
WO2023060152A3 (en) | 2023-05-19 |
AR127300A1 (es) | 2024-01-10 |
US20230116819A1 (en) | 2023-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN118076742A (zh) | 修饰油菜素内酯受体基因以改善产量性状 | |
US20230212600A1 (en) | Methods for controlling meristem size for crop improvement | |
US11959072B2 (en) | Suppression of shade avoidance response in plants | |
EP4291641A1 (en) | Methods and compositions for modifying cytokinin oxidase levels in plants | |
US20210395767A1 (en) | Methods for controlling meristem size for crop improvement | |
US20230284577A1 (en) | Suppression of shade avoidance response in plants | |
CN118302434A (zh) | 用于改善小花育性和种子产量的方法 | |
EP4298118A1 (en) | Methods and compositions for modifying root architecture in plants | |
CN118176205A (zh) | 用于改善植物结构和产量性状的方法和组合物 | |
WO2022271892A1 (en) | Modification of hect e3 ubiquitin ligase genes to improve yield traits | |
CN118434850A (zh) | 用于改善小花能育性和种子产量的方法 | |
US20240294933A1 (en) | Methods and compositions for modifying shade avoidance in plants | |
US20230383305A1 (en) | Methods and compositions for improving yield traits | |
WO2024036240A1 (en) | Methods and compositions for controlling meristem size for crop improvement | |
CN118613495A (zh) | 用于改善小花育性和种子产量的方法 | |
WO2023215809A1 (en) | Methods and compositions for modifying root architecture and/or improving plant yield traits | |
WO2023168217A1 (en) | Modification of brassinosteroid receptor genes to improve yield traits | |
WO2024054880A1 (en) | Methods and compositions for improving yield characteristics in plants | |
WO2023215704A1 (en) | Methods and compositions for enhancing yield and disease resistance | |
WO2023034731A1 (en) | Modification of ubiquitin binding peptidase genes in plants for yield trait improvement | |
EP4362663A1 (en) | Methods and compositions for enhancing root system development | |
CN118355126A (zh) | 用于修饰植物中的细胞分裂素受体组氨酸激酶基因的组合物和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |