CN110832074A - CRISPR-Cas核酸内切酶在植物基因组工程中的应用 - Google Patents
CRISPR-Cas核酸内切酶在植物基因组工程中的应用 Download PDFInfo
- Publication number
- CN110832074A CN110832074A CN201880044965.7A CN201880044965A CN110832074A CN 110832074 A CN110832074 A CN 110832074A CN 201880044965 A CN201880044965 A CN 201880044965A CN 110832074 A CN110832074 A CN 110832074A
- Authority
- CN
- China
- Prior art keywords
- crispr
- lys
- leu
- gene
- arg
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102000004533 Endonucleases Human genes 0.000 title claims description 140
- 108010042407 Endonucleases Proteins 0.000 title claims description 140
- 238000010362 genome editing Methods 0.000 title abstract description 24
- 238000000034 method Methods 0.000 claims abstract description 138
- 239000000203 mixture Substances 0.000 claims abstract description 42
- 150000007523 nucleic acids Chemical class 0.000 claims description 402
- 102000039446 nucleic acids Human genes 0.000 claims description 400
- 108020004707 nucleic acids Proteins 0.000 claims description 400
- 108090000623 proteins and genes Proteins 0.000 claims description 343
- 241000196324 Embryophyta Species 0.000 claims description 330
- 210000004027 cell Anatomy 0.000 claims description 189
- 102000004169 proteins and genes Human genes 0.000 claims description 100
- 125000003729 nucleotide group Chemical group 0.000 claims description 99
- 108020004414 DNA Proteins 0.000 claims description 91
- 239000002773 nucleotide Substances 0.000 claims description 91
- 102000053602 DNA Human genes 0.000 claims description 88
- 230000014509 gene expression Effects 0.000 claims description 76
- 230000008685 targeting Effects 0.000 claims description 72
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 69
- 230000004048 modification Effects 0.000 claims description 59
- 238000012986 modification Methods 0.000 claims description 59
- 240000008042 Zea mays Species 0.000 claims description 44
- 240000007124 Brassica oleracea Species 0.000 claims description 41
- 239000004009 herbicide Substances 0.000 claims description 41
- 235000011331 Brassica Nutrition 0.000 claims description 39
- 241000219198 Brassica Species 0.000 claims description 39
- 235000011303 Brassica alboglabra Nutrition 0.000 claims description 39
- 235000011302 Brassica oleracea Nutrition 0.000 claims description 39
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 39
- 230000002363 herbicidal effect Effects 0.000 claims description 38
- 241000219195 Arabidopsis thaliana Species 0.000 claims description 36
- 240000005979 Hordeum vulgare Species 0.000 claims description 35
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 35
- 150000001413 amino acids Chemical group 0.000 claims description 35
- 230000009466 transformation Effects 0.000 claims description 33
- 240000007594 Oryza sativa Species 0.000 claims description 31
- 235000007164 Oryza sativa Nutrition 0.000 claims description 31
- 230000000694 effects Effects 0.000 claims description 30
- 230000005782 double-strand break Effects 0.000 claims description 28
- 241000238631 Hexapoda Species 0.000 claims description 26
- 235000010469 Glycine max Nutrition 0.000 claims description 25
- 244000068988 Glycine max Species 0.000 claims description 25
- 235000002634 Solanum Nutrition 0.000 claims description 25
- 241000207763 Solanum Species 0.000 claims description 25
- 230000001404 mediated effect Effects 0.000 claims description 24
- 230000002103 transcriptional effect Effects 0.000 claims description 24
- 241000209140 Triticum Species 0.000 claims description 23
- 235000021307 Triticum Nutrition 0.000 claims description 23
- 241000700605 Viruses Species 0.000 claims description 22
- 230000035558 fertility Effects 0.000 claims description 21
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 claims description 20
- 241001135761 Deltaproteobacteria Species 0.000 claims description 20
- 240000006394 Sorghum bicolor Species 0.000 claims description 18
- 230000000295 complement effect Effects 0.000 claims description 18
- 241000209510 Liliopsida Species 0.000 claims description 16
- 235000019714 Triticale Nutrition 0.000 claims description 16
- 230000012010 growth Effects 0.000 claims description 16
- 108020004999 messenger RNA Proteins 0.000 claims description 16
- 241000228158 x Triticosecale Species 0.000 claims description 16
- 108010000700 Acetolactate synthase Proteins 0.000 claims description 15
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 15
- 240000002791 Brassica napus Species 0.000 claims description 14
- 240000000111 Saccharum officinarum Species 0.000 claims description 14
- 235000007201 Saccharum officinarum Nutrition 0.000 claims description 14
- 240000006365 Vitis vinifera Species 0.000 claims description 14
- 235000014787 Vitis vinifera Nutrition 0.000 claims description 14
- 235000009566 rice Nutrition 0.000 claims description 14
- 241000589158 Agrobacterium Species 0.000 claims description 13
- 235000003222 Helianthus annuus Nutrition 0.000 claims description 13
- 244000046052 Phaseolus vulgaris Species 0.000 claims description 13
- 244000062793 Sorghum vulgare Species 0.000 claims description 13
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 claims description 13
- 235000009973 maize Nutrition 0.000 claims description 13
- 238000004519 manufacturing process Methods 0.000 claims description 13
- 125000006850 spacer group Chemical group 0.000 claims description 13
- 244000291564 Allium cepa Species 0.000 claims description 12
- 241000220225 Malus Species 0.000 claims description 12
- 108700001094 Plant Genes Proteins 0.000 claims description 12
- 230000002255 enzymatic effect Effects 0.000 claims description 12
- 229910052757 nitrogen Inorganic materials 0.000 claims description 12
- 230000008439 repair process Effects 0.000 claims description 12
- 206010021929 Infertility male Diseases 0.000 claims description 11
- 208000007466 Male Infertility Diseases 0.000 claims description 11
- 241000233614 Phytophthora Species 0.000 claims description 11
- 235000011684 Sorghum saccharatum Nutrition 0.000 claims description 11
- 230000002759 chromosomal effect Effects 0.000 claims description 11
- 230000001939 inductive effect Effects 0.000 claims description 11
- 235000019713 millet Nutrition 0.000 claims description 11
- 229920001223 polyethylene glycol Polymers 0.000 claims description 11
- 240000002234 Allium sativum Species 0.000 claims description 10
- 241000894006 Bacteria Species 0.000 claims description 10
- 235000011293 Brassica napus Nutrition 0.000 claims description 10
- 241000220244 Capsella <angiosperm> Species 0.000 claims description 10
- 240000008067 Cucumis sativus Species 0.000 claims description 10
- 102000007260 Deoxyribonuclease I Human genes 0.000 claims description 10
- 108010008532 Deoxyribonuclease I Proteins 0.000 claims description 10
- 235000003230 Helianthus tuberosus Nutrition 0.000 claims description 10
- 240000008892 Helianthus tuberosus Species 0.000 claims description 10
- 241000209219 Hordeum Species 0.000 claims description 10
- 241001480167 Lotus japonicus Species 0.000 claims description 10
- 108060004795 Methyltransferase Proteins 0.000 claims description 10
- 239000002202 Polyethylene glycol Substances 0.000 claims description 10
- 241000209056 Secale Species 0.000 claims description 10
- 241001233957 eudicotyledons Species 0.000 claims description 10
- 230000002538 fungal effect Effects 0.000 claims description 10
- 235000004611 garlic Nutrition 0.000 claims description 10
- 208000000509 infertility Diseases 0.000 claims description 10
- 230000036512 infertility Effects 0.000 claims description 10
- 208000021267 infertility disease Diseases 0.000 claims description 10
- 230000004807 localization Effects 0.000 claims description 10
- 235000002732 Allium cepa var. cepa Nutrition 0.000 claims description 9
- 239000002028 Biomass Substances 0.000 claims description 9
- 241001301148 Brassica rapa subsp. oleifera Species 0.000 claims description 9
- 241000219193 Brassicaceae Species 0.000 claims description 9
- 241001260012 Bursa Species 0.000 claims description 9
- 241000219146 Gossypium Species 0.000 claims description 9
- 235000011430 Malus pumila Nutrition 0.000 claims description 9
- 240000000125 Oryza minuta Species 0.000 claims description 9
- 229910019142 PO4 Inorganic materials 0.000 claims description 9
- 235000007230 Sorghum bicolor Nutrition 0.000 claims description 9
- 235000009754 Vitis X bourquina Nutrition 0.000 claims description 9
- 235000012333 Vitis X labruscana Nutrition 0.000 claims description 9
- 238000001514 detection method Methods 0.000 claims description 9
- 229910052698 phosphorus Inorganic materials 0.000 claims description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 9
- 229910001868 water Inorganic materials 0.000 claims description 9
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 claims description 8
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 claims description 8
- 108060002716 Exonuclease Proteins 0.000 claims description 8
- 241000208818 Helianthus Species 0.000 claims description 8
- 235000015103 Malus silvestris Nutrition 0.000 claims description 8
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims description 8
- 238000004520 electroporation Methods 0.000 claims description 8
- 102000013165 exonuclease Human genes 0.000 claims description 8
- 239000011574 phosphorus Substances 0.000 claims description 8
- 210000002706 plastid Anatomy 0.000 claims description 8
- 108020001580 protein domains Proteins 0.000 claims description 8
- 241000894007 species Species 0.000 claims description 8
- 241000219194 Arabidopsis Species 0.000 claims description 7
- 235000005637 Brassica campestris Nutrition 0.000 claims description 7
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 claims description 7
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 claims description 7
- 235000010627 Phaseolus vulgaris Nutrition 0.000 claims description 7
- 230000024346 drought recovery Effects 0.000 claims description 7
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 6
- 241000213948 Astragalus sinicus Species 0.000 claims description 6
- 244000178993 Brassica juncea Species 0.000 claims description 6
- 235000011332 Brassica juncea Nutrition 0.000 claims description 6
- 235000014700 Brassica juncea var napiformis Nutrition 0.000 claims description 6
- 241000490499 Cardamine Species 0.000 claims description 6
- 241001180199 Planctomycetes Species 0.000 claims description 6
- 108700040121 Protein Methyltransferases Proteins 0.000 claims description 6
- 102000055027 Protein Methyltransferases Human genes 0.000 claims description 6
- 244000098338 Triticum aestivum Species 0.000 claims description 6
- 239000012190 activator Substances 0.000 claims description 6
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 claims description 6
- 239000010452 phosphate Substances 0.000 claims description 6
- 238000000746 purification Methods 0.000 claims description 6
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 claims description 6
- 240000006108 Allium ampeloprasum Species 0.000 claims description 5
- 235000005254 Allium ampeloprasum Nutrition 0.000 claims description 5
- 235000005255 Allium cepa Nutrition 0.000 claims description 5
- 235000008553 Allium fistulosum Nutrition 0.000 claims description 5
- 244000257727 Allium fistulosum Species 0.000 claims description 5
- 235000005338 Allium tuberosum Nutrition 0.000 claims description 5
- 244000003377 Allium tuberosum Species 0.000 claims description 5
- 235000009849 Cucumis sativus Nutrition 0.000 claims description 5
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 claims description 5
- 235000009438 Gossypium Nutrition 0.000 claims description 5
- 244000020551 Helianthus annuus Species 0.000 claims description 5
- 235000018081 Hibiscus syriacus Nutrition 0.000 claims description 5
- 244000130592 Hibiscus syriacus Species 0.000 claims description 5
- 206010021928 Infertility female Diseases 0.000 claims description 5
- 235000008708 Morus alba Nutrition 0.000 claims description 5
- 240000000249 Morus alba Species 0.000 claims description 5
- 241000209094 Oryza Species 0.000 claims description 5
- 240000005498 Setaria italica Species 0.000 claims description 5
- 235000007226 Setaria italica Nutrition 0.000 claims description 5
- 241000220261 Sinapis Species 0.000 claims description 5
- 235000007244 Zea mays Nutrition 0.000 claims description 5
- 235000002532 grape seed extract Nutrition 0.000 claims description 5
- 235000021332 kidney beans Nutrition 0.000 claims description 5
- VGONTNSXDCQUGY-RRKCRQDMSA-N 2'-deoxyinosine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 VGONTNSXDCQUGY-RRKCRQDMSA-N 0.000 claims description 4
- FSNZJUXFQIHPSA-HBNTYKKESA-N 5-(4-hydroxybutyl)-1-[(2R,4S,5R)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidine-2,4-dione Chemical compound OCCCCc1cn([C@H]2C[C@H](O)[C@@H](CO)O2)c(=O)[nH]c1=O FSNZJUXFQIHPSA-HBNTYKKESA-N 0.000 claims description 4
- OZFPSOBLQZPIAV-UHFFFAOYSA-N 5-nitro-1h-indole Chemical compound [O-][N+](=O)C1=CC=C2NC=CC2=C1 OZFPSOBLQZPIAV-UHFFFAOYSA-N 0.000 claims description 4
- 241000534456 Arenaria <Aves> Species 0.000 claims description 4
- 241001061264 Astragalus Species 0.000 claims description 4
- 235000010110 Astragalus glycyphyllos Nutrition 0.000 claims description 4
- 241000743774 Brachypodium Species 0.000 claims description 4
- 241001441850 Genlisea Species 0.000 claims description 4
- 241000218213 Morus <angiosperm> Species 0.000 claims description 4
- WREGKURFCTUGRC-POYBYMJQSA-N Zalcitabine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)CC1 WREGKURFCTUGRC-POYBYMJQSA-N 0.000 claims description 4
- 235000006533 astragalus Nutrition 0.000 claims description 4
- 235000011655 cotton Nutrition 0.000 claims description 4
- VGONTNSXDCQUGY-UHFFFAOYSA-N desoxyinosine Natural products C1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 VGONTNSXDCQUGY-UHFFFAOYSA-N 0.000 claims description 4
- 210000000130 stem cell Anatomy 0.000 claims description 4
- 229960000523 zalcitabine Drugs 0.000 claims description 4
- 241000702463 Geminiviridae Species 0.000 claims description 3
- 241000723573 Tobacco rattle virus Species 0.000 claims description 3
- 241000746716 Typhonium Species 0.000 claims description 3
- 108091026890 Coding region Proteins 0.000 claims description 2
- 206010010144 Completed suicide Diseases 0.000 claims description 2
- 108091027544 Subgenomic mRNA Proteins 0.000 claims 20
- 241000234282 Allium Species 0.000 claims 4
- 241000610258 Arabidopsis lyrata Species 0.000 claims 2
- 244000182213 Lepidium virginicum Species 0.000 claims 2
- 235000003611 Lepidium virginicum Nutrition 0.000 claims 2
- 244000061176 Nicotiana tabacum Species 0.000 claims 2
- 108091033409 CRISPR Proteins 0.000 abstract description 6
- 238000010354 CRISPR gene editing Methods 0.000 abstract 1
- 235000018102 proteins Nutrition 0.000 description 90
- 102000040430 polynucleotide Human genes 0.000 description 65
- 108091033319 polynucleotide Proteins 0.000 description 65
- 239000002157 polynucleotide Substances 0.000 description 65
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 52
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 51
- 108090000765 processed proteins & peptides Proteins 0.000 description 51
- 201000010099 disease Diseases 0.000 description 50
- 102000004196 processed proteins & peptides Human genes 0.000 description 47
- 229920001184 polypeptide Polymers 0.000 description 41
- -1 ethylene glycol nucleic acids Chemical class 0.000 description 36
- 230000009261 transgenic effect Effects 0.000 description 36
- 235000001014 amino acid Nutrition 0.000 description 31
- 230000004927 fusion Effects 0.000 description 31
- 229940024606 amino acid Drugs 0.000 description 28
- 238000003776 cleavage reaction Methods 0.000 description 28
- 230000007017 scission Effects 0.000 description 28
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 26
- 235000005822 corn Nutrition 0.000 description 26
- 102000004190 Enzymes Human genes 0.000 description 25
- 108090000790 Enzymes Proteins 0.000 description 25
- 229940088598 enzyme Drugs 0.000 description 25
- 239000003550 marker Substances 0.000 description 25
- 108091028043 Nucleic acid sequence Proteins 0.000 description 24
- 239000012634 fragment Substances 0.000 description 24
- 239000013598 vector Substances 0.000 description 23
- 230000035772 mutation Effects 0.000 description 22
- 238000002744 homologous recombination Methods 0.000 description 20
- 230000006801 homologous recombination Effects 0.000 description 20
- 210000001519 tissue Anatomy 0.000 description 20
- 235000000346 sugar Nutrition 0.000 description 18
- 108091007494 Nucleic acid- binding domains Proteins 0.000 description 17
- 238000012217 deletion Methods 0.000 description 17
- 230000037430 deletion Effects 0.000 description 17
- 238000003780 insertion Methods 0.000 description 17
- 230000037431 insertion Effects 0.000 description 17
- 150000001875 compounds Chemical class 0.000 description 16
- 101710163270 Nuclease Proteins 0.000 description 15
- 241000813090 Rhizoctonia solani Species 0.000 description 15
- 108700019146 Transgenes Proteins 0.000 description 15
- 230000006780 non-homologous end joining Effects 0.000 description 15
- 210000001938 protoplast Anatomy 0.000 description 15
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 14
- 238000009396 hybridization Methods 0.000 description 14
- 239000000463 material Substances 0.000 description 14
- 239000000047 product Substances 0.000 description 14
- 241000192041 Micrococcus Species 0.000 description 13
- 241000208125 Nicotiana Species 0.000 description 13
- 125000003275 alpha amino acid group Chemical group 0.000 description 13
- 238000006467 substitution reaction Methods 0.000 description 13
- 230000010354 integration Effects 0.000 description 12
- 125000005647 linker group Chemical group 0.000 description 12
- 108020005004 Guide RNA Proteins 0.000 description 11
- 230000027455 binding Effects 0.000 description 11
- 241000223218 Fusarium Species 0.000 description 10
- 230000001965 increasing effect Effects 0.000 description 10
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 10
- 230000037039 plant physiology Effects 0.000 description 10
- 238000011426 transformation method Methods 0.000 description 10
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 9
- 240000003768 Solanum lycopersicum Species 0.000 description 9
- 241000607479 Yersinia pestis Species 0.000 description 9
- 230000002068 genetic effect Effects 0.000 description 9
- 125000000623 heterocyclic group Chemical group 0.000 description 9
- 230000001105 regulatory effect Effects 0.000 description 9
- 108700028369 Alleles Proteins 0.000 description 8
- 108091093037 Peptide nucleic acid Proteins 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 8
- 210000003763 chloroplast Anatomy 0.000 description 8
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 8
- JEIPFZHSYJVQDO-UHFFFAOYSA-N iron(III) oxide Inorganic materials O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 8
- 239000002777 nucleoside Substances 0.000 description 8
- 239000002245 particle Substances 0.000 description 8
- 230000037361 pathway Effects 0.000 description 8
- 239000013612 plasmid Substances 0.000 description 8
- 238000013518 transcription Methods 0.000 description 8
- 230000035897 transcription Effects 0.000 description 8
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 7
- 241000223602 Alternaria alternata Species 0.000 description 7
- 241000254173 Coleoptera Species 0.000 description 7
- 241000221785 Erysiphales Species 0.000 description 7
- 241000233679 Peronosporaceae Species 0.000 description 7
- 125000000217 alkyl group Chemical group 0.000 description 7
- 230000000692 anti-sense effect Effects 0.000 description 7
- 229940104302 cytosine Drugs 0.000 description 7
- 238000010348 incorporation Methods 0.000 description 7
- 235000021317 phosphate Nutrition 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 230000001052 transient effect Effects 0.000 description 7
- 108700026220 vif Genes Proteins 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- 241000756998 Alismatales Species 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 6
- 230000033616 DNA repair Effects 0.000 description 6
- 208000035240 Disease Resistance Diseases 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 6
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 6
- 235000007238 Secale cereale Nutrition 0.000 description 6
- 241000256251 Spodoptera frugiperda Species 0.000 description 6
- 230000036579 abiotic stress Effects 0.000 description 6
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 239000005090 green fluorescent protein Substances 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 229920000642 polymer Polymers 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 5
- ZBMRKNMTMPPMMK-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid;azane Chemical compound [NH4+].CP(O)(=O)CCC(N)C([O-])=O ZBMRKNMTMPPMMK-UHFFFAOYSA-N 0.000 description 5
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 5
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 5
- 241000209507 Camellia Species 0.000 description 5
- 241000222199 Colletotrichum Species 0.000 description 5
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 5
- 241000223195 Fusarium graminearum Species 0.000 description 5
- 108010025815 Kanamycin Kinase Proteins 0.000 description 5
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 5
- 239000004472 Lysine Substances 0.000 description 5
- 241000234295 Musa Species 0.000 description 5
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 5
- 241000233622 Phytophthora infestans Species 0.000 description 5
- 241001536628 Poales Species 0.000 description 5
- 108020004511 Recombinant DNA Proteins 0.000 description 5
- 241000221696 Sclerotinia sclerotiorum Species 0.000 description 5
- 150000001408 amides Chemical group 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 230000003115 biocidal effect Effects 0.000 description 5
- 235000018597 common camellia Nutrition 0.000 description 5
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 235000013305 food Nutrition 0.000 description 5
- 150000002243 furanoses Chemical group 0.000 description 5
- 239000005556 hormone Substances 0.000 description 5
- 229940088597 hormone Drugs 0.000 description 5
- 230000001976 improved effect Effects 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 208000015181 infectious disease Diseases 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 229930027917 kanamycin Natural products 0.000 description 5
- 229960000318 kanamycin Drugs 0.000 description 5
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 5
- 229930182823 kanamycin A Natural products 0.000 description 5
- 235000018977 lysine Nutrition 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 230000001293 nucleolytic effect Effects 0.000 description 5
- 150000003833 nucleoside derivatives Chemical class 0.000 description 5
- 210000003463 organelle Anatomy 0.000 description 5
- 230000001568 sexual effect Effects 0.000 description 5
- 125000001424 substituent group Chemical group 0.000 description 5
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 description 4
- 241000213004 Alternaria solani Species 0.000 description 4
- 244000075850 Avena orientalis Species 0.000 description 4
- 241000219504 Caryophyllales Species 0.000 description 4
- 241001157813 Cercospora Species 0.000 description 4
- 229920000742 Cotton Polymers 0.000 description 4
- 244000236655 Diospyros kaki Species 0.000 description 4
- 241000223194 Fusarium culmorum Species 0.000 description 4
- 206010020649 Hyperkeratosis Diseases 0.000 description 4
- 206010061217 Infestation Diseases 0.000 description 4
- 241000244206 Nematoda Species 0.000 description 4
- 241001147398 Ostrinia nubilalis Species 0.000 description 4
- 241001123583 Puccinia striiformis Species 0.000 description 4
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 4
- 241000220324 Pyrus Species 0.000 description 4
- 241000233639 Pythium Species 0.000 description 4
- 241000220221 Rosales Species 0.000 description 4
- 241001533598 Septoria Species 0.000 description 4
- 108020004682 Single-Stranded DNA Proteins 0.000 description 4
- 241000941602 Solanum annuum Species 0.000 description 4
- 235000002595 Solanum tuberosum Nutrition 0.000 description 4
- 244000061456 Solanum tuberosum Species 0.000 description 4
- 229920002472 Starch Polymers 0.000 description 4
- 238000010459 TALEN Methods 0.000 description 4
- 241000605118 Thiobacillus Species 0.000 description 4
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 229920002494 Zein Polymers 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- 125000000304 alkynyl group Chemical group 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 235000009697 arginine Nutrition 0.000 description 4
- 125000000637 arginyl group Chemical class N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 4
- 239000011616 biotin Substances 0.000 description 4
- 229960002685 biotin Drugs 0.000 description 4
- 210000004899 c-terminal region Anatomy 0.000 description 4
- 150000001720 carbohydrates Chemical class 0.000 description 4
- 230000010261 cell growth Effects 0.000 description 4
- 235000013339 cereals Nutrition 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 210000002257 embryonic structure Anatomy 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- 108091006047 fluorescent proteins Proteins 0.000 description 4
- 102000034287 fluorescent proteins Human genes 0.000 description 4
- 108010002685 hygromycin-B kinase Proteins 0.000 description 4
- 230000002401 inhibitory effect Effects 0.000 description 4
- 235000019198 oils Nutrition 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 210000000056 organ Anatomy 0.000 description 4
- 244000052769 pathogen Species 0.000 description 4
- 230000001717 pathogenic effect Effects 0.000 description 4
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 4
- 108010082527 phosphinothricin N-acetyltransferase Proteins 0.000 description 4
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 4
- 230000006798 recombination Effects 0.000 description 4
- 238000005215 recombination Methods 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 108091008146 restriction endonucleases Proteins 0.000 description 4
- 238000002741 site-directed mutagenesis Methods 0.000 description 4
- 235000019698 starch Nutrition 0.000 description 4
- 239000008107 starch Substances 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 238000001890 transfection Methods 0.000 description 4
- 229940093612 zein Drugs 0.000 description 4
- 239000005019 zein Substances 0.000 description 4
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 3
- 229930024421 Adenine Natural products 0.000 description 3
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 3
- 241000223600 Alternaria Species 0.000 description 3
- 235000007319 Avena orientalis Nutrition 0.000 description 3
- 108090001008 Avidin Proteins 0.000 description 3
- 241000193388 Bacillus thuringiensis Species 0.000 description 3
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 3
- 235000008477 Cardamine flexuosa Nutrition 0.000 description 3
- 244000079471 Cardamine flexuosa Species 0.000 description 3
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 3
- 244000020518 Carthamus tinctorius Species 0.000 description 3
- 108010022172 Chitinases Proteins 0.000 description 3
- 102000012286 Chitinases Human genes 0.000 description 3
- 235000007516 Chrysanthemum Nutrition 0.000 description 3
- 241000207199 Citrus Species 0.000 description 3
- 235000011511 Diospyros Nutrition 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- 241000219427 Fagales Species 0.000 description 3
- 241000122692 Fusarium avenaceum Species 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 3
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 3
- 240000008415 Lactuca sativa Species 0.000 description 3
- 108090001090 Lectins Proteins 0.000 description 3
- 102000004856 Lectins Human genes 0.000 description 3
- 241000234269 Liliales Species 0.000 description 3
- 240000004658 Medicago sativa Species 0.000 description 3
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 3
- 206010034133 Pathogen resistance Diseases 0.000 description 3
- 241000228143 Penicillium Species 0.000 description 3
- 235000010582 Pisum sativum Nutrition 0.000 description 3
- 240000004713 Pisum sativum Species 0.000 description 3
- 241000209504 Poaceae Species 0.000 description 3
- 102000001253 Protein Kinase Human genes 0.000 description 3
- 235000014443 Pyrus communis Nutrition 0.000 description 3
- 108010083644 Ribonucleases Proteins 0.000 description 3
- 102000006382 Ribonucleases Human genes 0.000 description 3
- 206010039509 Scab Diseases 0.000 description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 3
- 235000021536 Sugar beet Nutrition 0.000 description 3
- 241000192707 Synechococcus Species 0.000 description 3
- 241000888721 Thiobacillaceae Species 0.000 description 3
- 108091023040 Transcription factor Proteins 0.000 description 3
- 102000040945 Transcription factor Human genes 0.000 description 3
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 3
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 230000004075 alteration Effects 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 229940097012 bacillus thuringiensis Drugs 0.000 description 3
- 230000004790 biotic stress Effects 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 235000014633 carbohydrates Nutrition 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000011088 chloroplast localization Effects 0.000 description 3
- 235000012000 cholesterol Nutrition 0.000 description 3
- 108010025764 chorismate pyruvate lyase Proteins 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 235000020971 citrus fruits Nutrition 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 238000001784 detoxification Methods 0.000 description 3
- 241001493065 dsRNA viruses Species 0.000 description 3
- 230000004720 fertilization Effects 0.000 description 3
- 230000007614 genetic variation Effects 0.000 description 3
- 108020002326 glutamine synthetase Proteins 0.000 description 3
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 3
- 239000004615 ingredient Substances 0.000 description 3
- 239000003112 inhibitor Substances 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 150000002484 inorganic compounds Chemical class 0.000 description 3
- 239000002523 lectin Substances 0.000 description 3
- 230000011987 methylation Effects 0.000 description 3
- 238000007069 methylation reaction Methods 0.000 description 3
- 125000000325 methylidene group Chemical group [H]C([H])=* 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 238000000520 microinjection Methods 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 238000002703 mutagenesis Methods 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 125000003835 nucleoside group Chemical group 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 235000016709 nutrition Nutrition 0.000 description 3
- 239000003921 oil Substances 0.000 description 3
- 150000002894 organic compounds Chemical class 0.000 description 3
- 150000004713 phosphodiesters Chemical class 0.000 description 3
- 125000004437 phosphorous atom Chemical group 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 108060006633 protein kinase Proteins 0.000 description 3
- 230000005783 single-strand break Effects 0.000 description 3
- 229910052717 sulfur Inorganic materials 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 231100000331 toxic Toxicity 0.000 description 3
- 230000002588 toxic effect Effects 0.000 description 3
- 238000010361 transduction Methods 0.000 description 3
- 230000026683 transduction Effects 0.000 description 3
- 230000010474 transient expression Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- 239000013603 viral vector Substances 0.000 description 3
- 230000003612 virological effect Effects 0.000 description 3
- GZADFIRBJNODAA-UHFFFAOYSA-N 1h-pyrimidine Chemical compound [CH]1NC=CC=N1 GZADFIRBJNODAA-UHFFFAOYSA-N 0.000 description 2
- PIINGYXNCHTJTF-UHFFFAOYSA-N 2-(2-azaniumylethylamino)acetate Chemical group NCCNCC(O)=O PIINGYXNCHTJTF-UHFFFAOYSA-N 0.000 description 2
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 2
- ICSNLGPSRYBMBD-UHFFFAOYSA-N 2-aminopyridine Chemical compound NC1=CC=CC=N1 ICSNLGPSRYBMBD-UHFFFAOYSA-N 0.000 description 2
- PDBUTMYDZLUVCP-UHFFFAOYSA-N 3,4-dihydro-1,4-benzoxazin-2-one Chemical compound C1=CC=C2OC(=O)CNC2=C1 PDBUTMYDZLUVCP-UHFFFAOYSA-N 0.000 description 2
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 2
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 2
- LOSIULRWFAEMFL-UHFFFAOYSA-N 7-deazaguanine Chemical compound O=C1NC(N)=NC2=C1CC=N2 LOSIULRWFAEMFL-UHFFFAOYSA-N 0.000 description 2
- HCGHYQLFMPXSDU-UHFFFAOYSA-N 7-methyladenine Chemical compound C1=NC(N)=C2N(C)C=NC2=N1 HCGHYQLFMPXSDU-UHFFFAOYSA-N 0.000 description 2
- UJOBWOGCFQCDNV-UHFFFAOYSA-N 9H-carbazole Chemical compound C1=CC=C2C3=CC=CC=C3NC2=C1 UJOBWOGCFQCDNV-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 241000218475 Agrotis segetum Species 0.000 description 2
- 235000010167 Allium cepa var aggregatum Nutrition 0.000 description 2
- 244000099147 Ananas comosus Species 0.000 description 2
- 235000007119 Ananas comosus Nutrition 0.000 description 2
- 235000017060 Arachis glabrata Nutrition 0.000 description 2
- 244000105624 Arachis hypogaea Species 0.000 description 2
- 235000010777 Arachis hypogaea Nutrition 0.000 description 2
- 235000018262 Arachis monticola Nutrition 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 201000002909 Aspergillosis Diseases 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 208000036641 Aspergillus infections Diseases 0.000 description 2
- 241000208837 Asterales Species 0.000 description 2
- 241001622882 Austrobaileyales Species 0.000 description 2
- 235000021537 Beetroot Nutrition 0.000 description 2
- 235000016068 Berberis vulgaris Nutrition 0.000 description 2
- 241000335053 Beta vulgaris Species 0.000 description 2
- 241001480061 Blumeria graminis Species 0.000 description 2
- 241000123650 Botrytis cinerea Species 0.000 description 2
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 2
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 2
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 2
- 241000233684 Bremia Species 0.000 description 2
- BQMUWNMDGNVFNI-UHFFFAOYSA-N C.C.C.C.C.C.C.C.C.C.C Chemical compound C.C.C.C.C.C.C.C.C.C.C BQMUWNMDGNVFNI-UHFFFAOYSA-N 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 2
- 235000002566 Capsicum Nutrition 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 241000632385 Celastrales Species 0.000 description 2
- 108020004998 Chloroplast DNA Proteins 0.000 description 2
- 240000005250 Chrysanthemum indicum Species 0.000 description 2
- 240000007154 Coffea arabica Species 0.000 description 2
- 241000233971 Commelinales Species 0.000 description 2
- 240000001980 Cucurbita pepo Species 0.000 description 2
- 235000009852 Cucurbita pepo Nutrition 0.000 description 2
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 2
- 241000450599 DNA viruses Species 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 241000289763 Dasygaster padockina Species 0.000 description 2
- 241001609607 Delia platura Species 0.000 description 2
- 241000879145 Diatraea grandiosella Species 0.000 description 2
- 241000353522 Earias insulana Species 0.000 description 2
- 235000001950 Elaeis guineensis Nutrition 0.000 description 2
- 241001568757 Elsinoe glycines Species 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 241000223221 Fusarium oxysporum Species 0.000 description 2
- 241000208326 Gentianales Species 0.000 description 2
- 241000134874 Geraniales Species 0.000 description 2
- 229930191978 Gibberellin Natural products 0.000 description 2
- 239000005562 Glyphosate Substances 0.000 description 2
- 241000578422 Graphosoma lineatum Species 0.000 description 2
- XKMLYUALXHKNFT-UUOKFMHZSA-N Guanosine-5'-triphosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XKMLYUALXHKNFT-UUOKFMHZSA-N 0.000 description 2
- 241001147381 Helicoverpa armigera Species 0.000 description 2
- 241000258937 Hemiptera Species 0.000 description 2
- 101001001272 Homo sapiens Prostatic acid phosphatase Proteins 0.000 description 2
- 241000004856 Hydraecia immanis Species 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 101100288095 Klebsiella pneumoniae neo gene Proteins 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- 241000208822 Lactuca Species 0.000 description 2
- 241000222418 Lentinus Species 0.000 description 2
- 241000801118 Lepidium Species 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 102000018697 Membrane Proteins Human genes 0.000 description 2
- 108010052285 Membrane Proteins Proteins 0.000 description 2
- 102000016397 Methyltransferase Human genes 0.000 description 2
- 108020005196 Mitochondrial DNA Proteins 0.000 description 2
- 241001518731 Monilinia fructicola Species 0.000 description 2
- 241001459558 Monographella nivalis Species 0.000 description 2
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 2
- 241001477931 Mythimna unipuncta Species 0.000 description 2
- BAWFJGJZGIEFAR-NNYOXOHSSA-N NAD zwitterion Chemical compound NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 BAWFJGJZGIEFAR-NNYOXOHSSA-N 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- DFPAKSUCGFBDDF-UHFFFAOYSA-N Nicotinamide Chemical compound NC(=O)C1=CC=CN=C1 DFPAKSUCGFBDDF-UHFFFAOYSA-N 0.000 description 2
- 108091005461 Nucleic proteins Proteins 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 241001520808 Panicum virgatum Species 0.000 description 2
- 241000488583 Panonychus ulmi Species 0.000 description 2
- 241000122123 Penicillium italicum Species 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 2
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 2
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 241000233645 Phytophthora nicotianae Species 0.000 description 2
- 241000233629 Phytophthora parasitica Species 0.000 description 2
- 241000948155 Phytophthora sojae Species 0.000 description 2
- 241000758713 Piperales Species 0.000 description 2
- 108010064851 Plant Proteins Proteins 0.000 description 2
- 241000013557 Plantaginaceae Species 0.000 description 2
- 241000317981 Podosphaera fuliginea Species 0.000 description 2
- 102000012338 Poly(ADP-ribose) Polymerases Human genes 0.000 description 2
- 108010061844 Poly(ADP-ribose) Polymerases Proteins 0.000 description 2
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 description 2
- 241000254101 Popillia japonica Species 0.000 description 2
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 2
- 102100035703 Prostatic acid phosphatase Human genes 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 241001246058 Puccinia allii Species 0.000 description 2
- 241000221301 Puccinia graminis Species 0.000 description 2
- 241000918585 Pythium aphanidermatum Species 0.000 description 2
- 241000599030 Pythium debaryanum Species 0.000 description 2
- 241000918584 Pythium ultimum Species 0.000 description 2
- SMWDFEZZVXVKRB-UHFFFAOYSA-N Quinoline Chemical compound N1=CC=CC2=CC=CC=C21 SMWDFEZZVXVKRB-UHFFFAOYSA-N 0.000 description 2
- 244000088415 Raphanus sativus Species 0.000 description 2
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 description 2
- 241001361634 Rhizoctonia Species 0.000 description 2
- 241000167882 Rhopalosiphum maidis Species 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- 241000134968 Sapindales Species 0.000 description 2
- 241000134890 Saxifragales Species 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 235000002597 Solanum melongena Nutrition 0.000 description 2
- 244000061458 Solanum melongena Species 0.000 description 2
- 241000322273 Stenolophus lecontei Species 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 241001122767 Theaceae Species 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 108091028113 Trans-activating crRNA Proteins 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 235000015919 Ustilago maydis Nutrition 0.000 description 2
- 244000301083 Ustilago maydis Species 0.000 description 2
- 108020005202 Viral DNA Proteins 0.000 description 2
- 108020000999 Viral RNA Proteins 0.000 description 2
- 208000036142 Viral infection Diseases 0.000 description 2
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 2
- 108020002494 acetyltransferase Proteins 0.000 description 2
- 102000005421 acetyltransferase Human genes 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- DZBUGLKDJFMEHC-UHFFFAOYSA-N acridine Chemical compound C1=CC=CC2=CC3=CC=CC=C3N=C21 DZBUGLKDJFMEHC-UHFFFAOYSA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000009418 agronomic effect Effects 0.000 description 2
- 125000003342 alkenyl group Chemical group 0.000 description 2
- ANVAOWXLWRTKGA-XHGAXZNDSA-N all-trans-alpha-carotene Chemical compound CC=1CCCC(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1C(C)=CCCC1(C)C ANVAOWXLWRTKGA-XHGAXZNDSA-N 0.000 description 2
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 230000000844 anti-bacterial effect Effects 0.000 description 2
- 230000000843 anti-fungal effect Effects 0.000 description 2
- 230000000845 anti-microbial effect Effects 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 229940121375 antifungal agent Drugs 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 230000010310 bacterial transformation Effects 0.000 description 2
- 235000021015 bananas Nutrition 0.000 description 2
- 101150103518 bar gene Proteins 0.000 description 2
- 108010005774 beta-Galactosidase Proteins 0.000 description 2
- 102000005936 beta-Galactosidase Human genes 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 229910000085 borane Inorganic materials 0.000 description 2
- 238000009395 breeding Methods 0.000 description 2
- 150000001721 carbon Chemical group 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000013043 chemical agent Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000002512 chemotherapy Methods 0.000 description 2
- 239000003541 chymotrypsin inhibitor Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 244000038559 crop plants Species 0.000 description 2
- 125000000753 cycloalkyl group Chemical group 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- 230000002559 cytogenic effect Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 235000014113 dietary fatty acids Nutrition 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 239000000975 dye Substances 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 235000013601 eggs Nutrition 0.000 description 2
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 2
- 239000002532 enzyme inhibitor Substances 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N ethylene glycol Natural products OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- 229930195729 fatty acid Natural products 0.000 description 2
- 239000000194 fatty acid Substances 0.000 description 2
- 150000004665 fatty acids Chemical class 0.000 description 2
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 2
- 235000013376 functional food Nutrition 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 238000012226 gene silencing method Methods 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Chemical compound O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 2
- IXORZMNAPKEEDV-UHFFFAOYSA-N gibberellic acid GA3 Natural products OC(=O)C1C2(C3)CC(=C)C3(O)CCC2C2(C=CC3O)C1C3(C)C(=O)O2 IXORZMNAPKEEDV-UHFFFAOYSA-N 0.000 description 2
- 239000003448 gibberellin Substances 0.000 description 2
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 235000004554 glutamine Nutrition 0.000 description 2
- 102000005396 glutamine synthetase Human genes 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 2
- 229940097068 glyphosate Drugs 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- 125000001475 halogen functional group Chemical group 0.000 description 2
- 230000007407 health benefit Effects 0.000 description 2
- 125000005842 heteroatom Chemical group 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 235000014304 histidine Nutrition 0.000 description 2
- 230000015784 hyperosmotic salinity response Effects 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000000442 meristematic effect Effects 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 210000003470 mitochondria Anatomy 0.000 description 2
- 108091005573 modified proteins Proteins 0.000 description 2
- 102000035118 modified proteins Human genes 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 229950006238 nadide Drugs 0.000 description 2
- 239000002105 nanoparticle Substances 0.000 description 2
- 238000007481 next generation sequencing Methods 0.000 description 2
- 235000020232 peanut Nutrition 0.000 description 2
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 2
- 230000003285 pharmacodynamic effect Effects 0.000 description 2
- RDOWQLZANAYVLL-UHFFFAOYSA-N phenanthridine Chemical compound C1=CC=C2C3=CC=CC=C3C=NC2=C1 RDOWQLZANAYVLL-UHFFFAOYSA-N 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 150000003904 phospholipids Chemical class 0.000 description 2
- 150000008300 phosphoramidites Chemical class 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 238000003976 plant breeding Methods 0.000 description 2
- 230000008635 plant growth Effects 0.000 description 2
- 235000021118 plant-derived protein Nutrition 0.000 description 2
- 230000010152 pollination Effects 0.000 description 2
- 229920000768 polyamine Polymers 0.000 description 2
- 229920000447 polyanionic polymer Polymers 0.000 description 2
- 108010011110 polyarginine Proteins 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 150000003212 purines Chemical class 0.000 description 2
- 150000003230 pyrimidines Chemical class 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000003757 reverse transcription PCR Methods 0.000 description 2
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 2
- YGSDEFSMJLZEOE-UHFFFAOYSA-N salicylic acid Chemical compound OC(=O)C1=CC=CC=C1O YGSDEFSMJLZEOE-UHFFFAOYSA-N 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000007226 seed germination Effects 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 2
- 229960000268 spectinomycin Drugs 0.000 description 2
- 108010068698 spleen exonuclease Proteins 0.000 description 2
- 150000003431 steroids Chemical class 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- SUVMJBTUFCVSAD-UHFFFAOYSA-N sulforaphane Chemical compound CS(=O)CCCCN=C=S SUVMJBTUFCVSAD-UHFFFAOYSA-N 0.000 description 2
- 239000011593 sulfur Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 231100000167 toxic agent Toxicity 0.000 description 2
- 239000003053 toxin Substances 0.000 description 2
- 231100000765 toxin Toxicity 0.000 description 2
- 108700012359 toxins Proteins 0.000 description 2
- QAIPRVGONGVQAS-DUXPYHPUSA-N trans-caffeic acid Chemical compound OC(=O)\C=C\C1=CC=C(O)C(O)=C1 QAIPRVGONGVQAS-DUXPYHPUSA-N 0.000 description 2
- KBPHJBAIARWVSC-XQIHNALSSA-N trans-lutein Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CC(O)CC1(C)C)C=CC=C(/C)C=CC2C(=CC(O)CC2(C)C)C KBPHJBAIARWVSC-XQIHNALSSA-N 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- UORVGPXVDQYIDP-UHFFFAOYSA-N trihydridoboron Substances B UORVGPXVDQYIDP-UHFFFAOYSA-N 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- 235000011178 triphosphate Nutrition 0.000 description 2
- 238000010798 ubiquitination Methods 0.000 description 2
- 230000034512 ubiquitination Effects 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 229910052725 zinc Inorganic materials 0.000 description 2
- 239000011701 zinc Substances 0.000 description 2
- PFTAWBLQPZVEMU-ZFWWWQNUSA-N (+)-epicatechin Natural products C1([C@@H]2OC3=CC(O)=CC(O)=C3C[C@@H]2O)=CC=C(O)C(O)=C1 PFTAWBLQPZVEMU-ZFWWWQNUSA-N 0.000 description 1
- WTFXTQVDAKGDEY-UHFFFAOYSA-N (-)-chorismic acid Natural products OC1C=CC(C(O)=O)=CC1OC(=C)C(O)=O WTFXTQVDAKGDEY-UHFFFAOYSA-N 0.000 description 1
- PFTAWBLQPZVEMU-UKRRQHHQSA-N (-)-epicatechin Chemical compound C1([C@H]2OC3=CC(O)=CC(O)=C3C[C@H]2O)=CC=C(O)C(O)=C1 PFTAWBLQPZVEMU-UKRRQHHQSA-N 0.000 description 1
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- FYGDTMLNYKFZSV-URKRLVJHSA-N (2s,3r,4s,5s,6r)-2-[(2r,4r,5r,6s)-4,5-dihydroxy-2-(hydroxymethyl)-6-[(2r,4r,5r,6s)-4,5,6-trihydroxy-2-(hydroxymethyl)oxan-3-yl]oxyoxan-3-yl]oxy-6-(hydroxymethyl)oxane-3,4,5-triol Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1[C@@H](CO)O[C@@H](OC2[C@H](O[C@H](O)[C@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O FYGDTMLNYKFZSV-URKRLVJHSA-N 0.000 description 1
- JKQXZKUSFCKOGQ-JLGXGRJMSA-N (3R,3'R)-beta,beta-carotene-3,3'-diol Chemical compound C([C@H](O)CC=1C)C(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1=C(C)C[C@@H](O)CC1(C)C JKQXZKUSFCKOGQ-JLGXGRJMSA-N 0.000 description 1
- BHQCQFFYRZLCQQ-UHFFFAOYSA-N (3alpha,5alpha,7alpha,12alpha)-3,7,12-trihydroxy-cholan-24-oic acid Natural products OC1CC2CC(O)CCC2(C)C2C1C1CCC(C(CCC(O)=O)C)C1(C)C(O)C2 BHQCQFFYRZLCQQ-UHFFFAOYSA-N 0.000 description 1
- QGVQZRDQPDLHHV-DPAQBDIFSA-N (3s,8s,9s,10r,13r,14s,17r)-10,13-dimethyl-17-[(2r)-6-methylheptan-2-yl]-2,3,4,7,8,9,11,12,14,15,16,17-dodecahydro-1h-cyclopenta[a]phenanthrene-3-thiol Chemical compound C1C=C2C[C@@H](S)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 QGVQZRDQPDLHHV-DPAQBDIFSA-N 0.000 description 1
- ACEAELOMUCBPJP-UHFFFAOYSA-N (E)-3,4,5-trihydroxycinnamic acid Natural products OC(=O)C=CC1=CC(O)=C(O)C(O)=C1 ACEAELOMUCBPJP-UHFFFAOYSA-N 0.000 description 1
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 1
- KSEBMYQBYZTDHS-HWKANZROSA-M (E)-Ferulic acid Natural products COC1=CC(\C=C\C([O-])=O)=CC=C1O KSEBMYQBYZTDHS-HWKANZROSA-M 0.000 description 1
- FYADHXFMURLYQI-UHFFFAOYSA-N 1,2,4-triazine Chemical class C1=CN=NC=N1 FYADHXFMURLYQI-UHFFFAOYSA-N 0.000 description 1
- JKMPXGJJRMOELF-UHFFFAOYSA-N 1,3-thiazole-2,4,5-tricarboxylic acid Chemical compound OC(=O)C1=NC(C(O)=O)=C(C(O)=O)S1 JKMPXGJJRMOELF-UHFFFAOYSA-N 0.000 description 1
- WJFKNYWRSNBZNX-UHFFFAOYSA-N 10H-phenothiazine Chemical compound C1=CC=C2NC3=CC=CC=C3SC2=C1 WJFKNYWRSNBZNX-UHFFFAOYSA-N 0.000 description 1
- TZMSYXZUNZXBOL-UHFFFAOYSA-N 10H-phenoxazine Chemical compound C1=CC=C2NC3=CC=CC=C3OC2=C1 TZMSYXZUNZXBOL-UHFFFAOYSA-N 0.000 description 1
- UHUHBFMZVCOEOV-UHFFFAOYSA-N 1h-imidazo[4,5-c]pyridin-4-amine Chemical compound NC1=NC=CC2=C1N=CN2 UHUHBFMZVCOEOV-UHFFFAOYSA-N 0.000 description 1
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-SHYZEUOFSA-N 2'‐deoxycytidine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-SHYZEUOFSA-N 0.000 description 1
- VEPOHXYIFQMVHW-XOZOLZJESA-N 2,3-dihydroxybutanedioic acid (2S,3S)-3,4-dimethyl-2-phenylmorpholine Chemical compound OC(C(O)C(O)=O)C(O)=O.C[C@H]1[C@@H](OCCN1C)c1ccccc1 VEPOHXYIFQMVHW-XOZOLZJESA-N 0.000 description 1
- OVSKIKFHRZPJSS-UHFFFAOYSA-N 2,4-D Chemical compound OC(=O)COC1=CC=C(Cl)C=C1Cl OVSKIKFHRZPJSS-UHFFFAOYSA-N 0.000 description 1
- 229940087195 2,4-dichlorophenoxyacetate Drugs 0.000 description 1
- QSHACTSJHMKXTE-UHFFFAOYSA-N 2-(2-aminopropyl)-7h-purin-6-amine Chemical compound CC(N)CC1=NC(N)=C2NC=NC2=N1 QSHACTSJHMKXTE-UHFFFAOYSA-N 0.000 description 1
- KRQUFUKTQHISJB-YYADALCUSA-N 2-[(E)-N-[2-(4-chlorophenoxy)propoxy]-C-propylcarbonimidoyl]-3-hydroxy-5-(thian-3-yl)cyclohex-2-en-1-one Chemical compound CCC\C(=N/OCC(C)OC1=CC=C(Cl)C=C1)C1=C(O)CC(CC1=O)C1CCCSC1 KRQUFUKTQHISJB-YYADALCUSA-N 0.000 description 1
- WKMPTBDYDNUJLF-UHFFFAOYSA-N 2-fluoroadenine Chemical compound NC1=NC(F)=NC2=C1N=CN2 WKMPTBDYDNUJLF-UHFFFAOYSA-N 0.000 description 1
- NEAQRZUHTPSBBM-UHFFFAOYSA-N 2-hydroxy-3,3-dimethyl-7-nitro-4h-isoquinolin-1-one Chemical compound C1=C([N+]([O-])=O)C=C2C(=O)N(O)C(C)(C)CC2=C1 NEAQRZUHTPSBBM-UHFFFAOYSA-N 0.000 description 1
- 125000004200 2-methoxyethyl group Chemical group [H]C([H])([H])OC([H])([H])C([H])([H])* 0.000 description 1
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 1
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 1
- 101710168820 2S seed storage albumin protein Proteins 0.000 description 1
- DMJREFOUOWCNIC-UHFFFAOYSA-N 2h-pyrimidine Chemical compound C1[N]C=CC=N1 DMJREFOUOWCNIC-UHFFFAOYSA-N 0.000 description 1
- 101150090724 3 gene Proteins 0.000 description 1
- FHSQHXGZAXPNBF-UHFFFAOYSA-N 3,4-dihydro-1,4-benzothiazin-2-one Chemical compound C1=CC=C2SC(=O)CNC2=C1 FHSQHXGZAXPNBF-UHFFFAOYSA-N 0.000 description 1
- UPMXNNIRAGDFEH-UHFFFAOYSA-N 3,5-dibromo-4-hydroxybenzonitrile Chemical compound OC1=C(Br)C=C(C#N)C=C1Br UPMXNNIRAGDFEH-UHFFFAOYSA-N 0.000 description 1
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical compound O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 1
- GOLORTLGFDVFDW-UHFFFAOYSA-N 3-(1h-benzimidazol-2-yl)-7-(diethylamino)chromen-2-one Chemical compound C1=CC=C2NC(C3=CC4=CC=C(C=C4OC3=O)N(CC)CC)=NC2=C1 GOLORTLGFDVFDW-UHFFFAOYSA-N 0.000 description 1
- 102100026105 3-ketoacyl-CoA thiolase, mitochondrial Human genes 0.000 description 1
- 108010020183 3-phosphoshikimate 1-carboxyvinyltransferase Proteins 0.000 description 1
- SUVMJBTUFCVSAD-JTQLQIEISA-N 4-Methylsulfinylbutyl isothiocyanate Natural products C[S@](=O)CCCCN=C=S SUVMJBTUFCVSAD-JTQLQIEISA-N 0.000 description 1
- HLPAJQITBMEOML-XVFCMESISA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-methyloxolan-2-yl]pyrimidin-2-one Chemical compound O[C@@H]1[C@H](O)[C@@H](C)O[C@H]1N1C(=O)N=C(N)C=C1 HLPAJQITBMEOML-XVFCMESISA-N 0.000 description 1
- OVONXEQGWXGFJD-UHFFFAOYSA-N 4-sulfanylidene-1h-pyrimidin-2-one Chemical compound SC=1C=CNC(=O)N=1 OVONXEQGWXGFJD-UHFFFAOYSA-N 0.000 description 1
- ZLOIGESWDJYCTF-XVFCMESISA-N 4-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=S)C=C1 ZLOIGESWDJYCTF-XVFCMESISA-N 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- ZLAQATDNGLKIEV-UHFFFAOYSA-N 5-methyl-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound CC1=CNC(=S)NC1=O ZLAQATDNGLKIEV-UHFFFAOYSA-N 0.000 description 1
- UJBCLAXPPIDQEE-UHFFFAOYSA-N 5-prop-1-ynyl-1h-pyrimidine-2,4-dione Chemical compound CC#CC1=CNC(=O)NC1=O UJBCLAXPPIDQEE-UHFFFAOYSA-N 0.000 description 1
- KXBCLNRMQPRVTP-UHFFFAOYSA-N 6-amino-1,5-dihydroimidazo[4,5-c]pyridin-4-one Chemical compound O=C1NC(N)=CC2=C1N=CN2 KXBCLNRMQPRVTP-UHFFFAOYSA-N 0.000 description 1
- DCPSTSVLRXOYGS-UHFFFAOYSA-N 6-amino-1h-pyrimidine-2-thione Chemical compound NC1=CC=NC(S)=N1 DCPSTSVLRXOYGS-UHFFFAOYSA-N 0.000 description 1
- QNNARSZPGNJZIX-UHFFFAOYSA-N 6-amino-5-prop-1-ynyl-1h-pyrimidin-2-one Chemical compound CC#CC1=CNC(=O)N=C1N QNNARSZPGNJZIX-UHFFFAOYSA-N 0.000 description 1
- NJBMMMJOXRZENQ-UHFFFAOYSA-N 6H-pyrrolo[2,3-f]quinoline Chemical compound c1cc2ccc3[nH]cccc3c2n1 NJBMMMJOXRZENQ-UHFFFAOYSA-N 0.000 description 1
- HRYKDUPGBWLLHO-UHFFFAOYSA-N 8-azaadenine Chemical compound NC1=NC=NC2=NNN=C12 HRYKDUPGBWLLHO-UHFFFAOYSA-N 0.000 description 1
- LPXQRXLUHJKZIE-UHFFFAOYSA-N 8-azaguanine Chemical compound NC1=NC(O)=C2NN=NC2=N1 LPXQRXLUHJKZIE-UHFFFAOYSA-N 0.000 description 1
- 229960005508 8-azaguanine Drugs 0.000 description 1
- FJNCXZZQNBKEJT-UHFFFAOYSA-N 8beta-hydroxymarrubiin Natural products O1C(=O)C2(C)CCCC3(C)C2C1CC(C)(O)C3(O)CCC=1C=COC=1 FJNCXZZQNBKEJT-UHFFFAOYSA-N 0.000 description 1
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 1
- JBYXPOFIGCOSSB-GOJKSUSPSA-N 9-cis,11-trans-octadecadienoic acid Chemical compound CCCCCC\C=C\C=C/CCCCCCCC(O)=O JBYXPOFIGCOSSB-GOJKSUSPSA-N 0.000 description 1
- 101150004974 ACP3 gene Proteins 0.000 description 1
- 101150001232 ALS gene Proteins 0.000 description 1
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 1
- 102000005416 ATP-Binding Cassette Transporters Human genes 0.000 description 1
- 108010006533 ATP-Binding Cassette Transporters Proteins 0.000 description 1
- 108010003902 Acetyl-CoA C-acyltransferase Proteins 0.000 description 1
- 108010013043 Acetylesterase Proteins 0.000 description 1
- 241000881711 Acipenser sturio Species 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 108010024223 Adenine phosphoribosyltransferase Proteins 0.000 description 1
- 102100029457 Adenine phosphoribosyltransferase Human genes 0.000 description 1
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 1
- 241001163841 Albugo ipomoeae-panduratae Species 0.000 description 1
- 235000016790 Allium chinense Nutrition 0.000 description 1
- 244000295724 Allium chinense Species 0.000 description 1
- 241001439211 Almeida Species 0.000 description 1
- 241000266416 Alternaria japonica Species 0.000 description 1
- 241000323752 Alternaria longipes Species 0.000 description 1
- 241000219318 Amaranthus Species 0.000 description 1
- 235000009328 Amaranthus caudatus Nutrition 0.000 description 1
- 240000001592 Amaranthus caudatus Species 0.000 description 1
- 108700023418 Amidases Proteins 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- 241000563984 Ampelopsis Species 0.000 description 1
- 244000144730 Amygdalus persica Species 0.000 description 1
- 229940122816 Amylase inhibitor Drugs 0.000 description 1
- 108010037870 Anthranilate Synthase Proteins 0.000 description 1
- 108020004491 Antisense DNA Proteins 0.000 description 1
- 241000172143 Aphanomyces cochlioides Species 0.000 description 1
- 101100208963 Arabidopsis thaliana UPL3 gene Proteins 0.000 description 1
- 241000490494 Arabis Species 0.000 description 1
- 244000080767 Areca catechu Species 0.000 description 1
- 235000006226 Areca catechu Nutrition 0.000 description 1
- 241001167018 Aroa Species 0.000 description 1
- 241001443610 Aschersonia Species 0.000 description 1
- 244000003416 Asparagus officinalis Species 0.000 description 1
- 235000005340 Asparagus officinalis Nutrition 0.000 description 1
- 241000258957 Asteroidea Species 0.000 description 1
- 241001530056 Athelia rolfsii Species 0.000 description 1
- 241001549140 Atractotomus mali Species 0.000 description 1
- 235000005781 Avena Nutrition 0.000 description 1
- 101150076489 B gene Proteins 0.000 description 1
- 101000950981 Bacillus subtilis (strain 168) Catabolic NAD-specific glutamate dehydrogenase RocG Proteins 0.000 description 1
- 108020000946 Bacterial DNA Proteins 0.000 description 1
- 108010062877 Bacteriocins Proteins 0.000 description 1
- 241000724306 Barley stripe mosaic virus Species 0.000 description 1
- 108010001572 Basic-Leucine Zipper Transcription Factors Proteins 0.000 description 1
- 102000000806 Basic-Leucine Zipper Transcription Factors Human genes 0.000 description 1
- 241001568341 Bdellovibrionaceae Species 0.000 description 1
- KHBQMWCZKVMBLN-UHFFFAOYSA-N Benzenesulfonamide Chemical compound NS(=O)(=O)C1=CC=CC=C1 KHBQMWCZKVMBLN-UHFFFAOYSA-N 0.000 description 1
- 229920002498 Beta-glucan Polymers 0.000 description 1
- 241000190150 Bipolaris sorokiniana Species 0.000 description 1
- 241001536324 Botryococcus Species 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- DPUOLQHDNGRHBS-UHFFFAOYSA-N Brassidinsaeure Natural products CCCCCCCCC=CCCCCCCCCCCCC(O)=O DPUOLQHDNGRHBS-UHFFFAOYSA-N 0.000 description 1
- 239000005489 Bromoxynil Substances 0.000 description 1
- 101100394003 Butyrivibrio fibrisolvens end1 gene Proteins 0.000 description 1
- DIQHTDHADJUONG-UHFFFAOYSA-N C.C.C.C.C.C.C.C.C.C.C.C.C.C.C.C.C.C.C.C Chemical compound C.C.C.C.C.C.C.C.C.C.C.C.C.C.C.C.C.C.C.C DIQHTDHADJUONG-UHFFFAOYSA-N 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 101150061009 C1 gene Proteins 0.000 description 1
- 125000006374 C2-C10 alkenyl group Chemical group 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 240000008574 Capsicum frutescens Species 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 108050004290 Cecropin Proteins 0.000 description 1
- 241000113401 Cercospora sojina Species 0.000 description 1
- 241000947067 Cercospora zeae-maydis Species 0.000 description 1
- 241001620052 Cercosporella Species 0.000 description 1
- 241001660259 Cereus <cactus> Species 0.000 description 1
- 108020005133 Chloroplast RNA Proteins 0.000 description 1
- 239000005496 Chlorsulfuron Substances 0.000 description 1
- 239000004380 Cholic acid Substances 0.000 description 1
- 235000008495 Chrysanthemum leucanthemum Nutrition 0.000 description 1
- 235000000604 Chrysanthemum parthenium Nutrition 0.000 description 1
- 244000189548 Chrysanthemum x morifolium Species 0.000 description 1
- 241001124134 Chrysomelidae Species 0.000 description 1
- 229940122644 Chymotrypsin inhibitor Drugs 0.000 description 1
- 101710137926 Chymotrypsin inhibitor Proteins 0.000 description 1
- 241000688200 Cingulata Species 0.000 description 1
- 244000241235 Citrullus lanatus Species 0.000 description 1
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 description 1
- 241000131066 Coccinella Species 0.000 description 1
- 241000228437 Cochliobolus Species 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 235000007460 Coffea arabica Nutrition 0.000 description 1
- 102000029816 Collagenase Human genes 0.000 description 1
- 108060005980 Collagenase Proteins 0.000 description 1
- 241000222235 Colletotrichum orbiculare Species 0.000 description 1
- 241000998302 Colletotrichum tabaci Species 0.000 description 1
- KQLDDLUWUFBQHP-UHFFFAOYSA-N Cordycepin Natural products C1=NC=2C(N)=NC=NC=2N1C1OCC(CO)C1O KQLDDLUWUFBQHP-UHFFFAOYSA-N 0.000 description 1
- 241000142975 Cornaceae Species 0.000 description 1
- 241000134970 Cornales Species 0.000 description 1
- 241000209020 Cornus Species 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 108091029523 CpG island Proteins 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 241000219104 Cucurbitaceae Species 0.000 description 1
- 101710095468 Cyclase Proteins 0.000 description 1
- 241001660870 Cyrtomium Species 0.000 description 1
- 108010052832 Cytochromes Proteins 0.000 description 1
- 102000018832 Cytochromes Human genes 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 102000010719 DNA-(Apurinic or Apyrimidinic Site) Lyase Human genes 0.000 description 1
- 108010063362 DNA-(Apurinic or Apyrimidinic Site) Lyase Proteins 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 101150092880 DREB1A gene Proteins 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 108010002069 Defensins Proteins 0.000 description 1
- 102000000541 Defensins Human genes 0.000 description 1
- CKTSBUTUHBMZGZ-UHFFFAOYSA-N Deoxycytidine Natural products O=C1N=C(N)C=CN1C1OC(CO)C(O)C1 CKTSBUTUHBMZGZ-UHFFFAOYSA-N 0.000 description 1
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 1
- 241001645342 Diaporthe citri Species 0.000 description 1
- 241000382787 Diaporthe sojae Species 0.000 description 1
- 235000008597 Diospyros kaki Nutrition 0.000 description 1
- 102000016680 Dioxygenases Human genes 0.000 description 1
- 108010028143 Dioxygenases Proteins 0.000 description 1
- 241000663351 Diplocarpon rosae Species 0.000 description 1
- 241000935926 Diplodia Species 0.000 description 1
- 101100136092 Drosophila melanogaster peng gene Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 240000003133 Elaeis guineensis Species 0.000 description 1
- 244000127993 Elaeis melanococca Species 0.000 description 1
- 241000160557 Elaenia Species 0.000 description 1
- 235000007351 Eleusine Nutrition 0.000 description 1
- 241000209215 Eleusine Species 0.000 description 1
- 241000125117 Elsinoe Species 0.000 description 1
- 241000901048 Elsinoe ampelina Species 0.000 description 1
- 101100491986 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) aromA gene Proteins 0.000 description 1
- 101710094010 Endonuclease II Proteins 0.000 description 1
- 102100030013 Endoribonuclease Human genes 0.000 description 1
- 108010093099 Endoribonucleases Proteins 0.000 description 1
- 101000889812 Enterobacteria phage T4 Endonuclease Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 241000134884 Ericales Species 0.000 description 1
- URXZXNYJPAJJOQ-UHFFFAOYSA-N Erucic acid Natural products CCCCCCC=CCCCCCCCCCCCC(O)=O URXZXNYJPAJJOQ-UHFFFAOYSA-N 0.000 description 1
- 241000221787 Erysiphe Species 0.000 description 1
- 241001489205 Erysiphe pisi Species 0.000 description 1
- 101000933461 Escherichia coli (strain K12) Beta-glucuronidase Proteins 0.000 description 1
- 101000999829 Escherichia coli (strain K12) NH(3)-dependent NAD(+) synthetase Proteins 0.000 description 1
- 108090000371 Esterases Proteins 0.000 description 1
- 241000221017 Euphorbiaceae Species 0.000 description 1
- 241001619920 Euschistus servus Species 0.000 description 1
- 102000009788 Exodeoxyribonucleases Human genes 0.000 description 1
- 108010009832 Exodeoxyribonucleases Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108010002700 Exoribonucleases Proteins 0.000 description 1
- 102000004678 Exoribonucleases Human genes 0.000 description 1
- PXGOKWXKJXAPGV-UHFFFAOYSA-N Fluorine Chemical compound FF PXGOKWXKJXAPGV-UHFFFAOYSA-N 0.000 description 1
- 235000016623 Fragaria vesca Nutrition 0.000 description 1
- 240000009088 Fragaria x ananassa Species 0.000 description 1
- 235000011363 Fragaria x ananassa Nutrition 0.000 description 1
- 229920002670 Fructan Polymers 0.000 description 1
- 101150062467 GAT gene Proteins 0.000 description 1
- 235000004434 Gaultheria shallon Nutrition 0.000 description 1
- 244000037922 Gaultheria shallon Species 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 235000008100 Ginkgo biloba Nutrition 0.000 description 1
- 244000194101 Ginkgo biloba Species 0.000 description 1
- 241000282819 Giraffa Species 0.000 description 1
- KKLOCFOZPFGVBB-UHFFFAOYSA-N Glabrene Natural products C1=C(O)C=C2OCC(C3=CC=C4OC(C=CC4=C3O)(C)C)=CC2=C1 KKLOCFOZPFGVBB-UHFFFAOYSA-N 0.000 description 1
- NGGYSPUAKQMTNP-UHFFFAOYSA-N Glabrene Chemical compound C1=C(O)C=C2OCC(C3=C4OC(C=CC4=C(O)C=C3)(C)C)=CC2=C1 NGGYSPUAKQMTNP-UHFFFAOYSA-N 0.000 description 1
- 101710186901 Globulin 1 Proteins 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 102000016901 Glutamate dehydrogenase Human genes 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 108700037728 Glycine max beta-conglycinin Proteins 0.000 description 1
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 1
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 1
- 241000218674 Gnetum Species 0.000 description 1
- 108010073032 Grain Proteins Proteins 0.000 description 1
- 241000221557 Gymnosporangium Species 0.000 description 1
- 101150012639 HPPD gene Proteins 0.000 description 1
- 241000498254 Heterodera glycines Species 0.000 description 1
- 102000006479 Heterogeneous-Nuclear Ribonucleoproteins Human genes 0.000 description 1
- 108010019372 Heterogeneous-Nuclear Ribonucleoproteins Proteins 0.000 description 1
- 235000003935 Hippophae Nutrition 0.000 description 1
- 241000229143 Hippophae Species 0.000 description 1
- 102000008157 Histone Demethylases Human genes 0.000 description 1
- 108010074870 Histone Demethylases Proteins 0.000 description 1
- 102000011787 Histone Methyltransferases Human genes 0.000 description 1
- 108010036115 Histone Methyltransferases Proteins 0.000 description 1
- 102000003893 Histone acetyltransferases Human genes 0.000 description 1
- 108090000246 Histone acetyltransferases Proteins 0.000 description 1
- 108090000353 Histone deacetylase Proteins 0.000 description 1
- 102000003964 Histone deacetylase Human genes 0.000 description 1
- 101000589450 Homo sapiens Poly(ADP-ribose) glycohydrolase Proteins 0.000 description 1
- 108700032155 Hordeum vulgare hordothionin Proteins 0.000 description 1
- 102000004157 Hydrolases Human genes 0.000 description 1
- 108090000604 Hydrolases Proteins 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 241000221775 Hypocreales Species 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 229920001202 Inulin Polymers 0.000 description 1
- 241000032989 Ipomoea lacunosa Species 0.000 description 1
- 241000758789 Juglans Species 0.000 description 1
- 235000013757 Juglans Nutrition 0.000 description 1
- 241000721662 Juniperus Species 0.000 description 1
- 102000011782 Keratins Human genes 0.000 description 1
- 108010076876 Keratins Proteins 0.000 description 1
- 208000001126 Keratosis Diseases 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 235000003228 Lactuca sativa Nutrition 0.000 description 1
- 235000019687 Lamb Nutrition 0.000 description 1
- 241000207923 Lamiaceae Species 0.000 description 1
- 241000218194 Laurales Species 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 241000234280 Liliaceae Species 0.000 description 1
- 239000000232 Lipid Bilayer Substances 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- UPYKUZBSLRQECL-UKMVMLAPSA-N Lycopene Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1C(=C)CCCC1(C)C)C=CC=C(/C)C=CC2C(=C)CCCC2(C)C UPYKUZBSLRQECL-UKMVMLAPSA-N 0.000 description 1
- 108700012133 Lycopersicon Pto Proteins 0.000 description 1
- JEVVKJMRZMXFBT-XWDZUXABSA-N Lycophyll Natural products OC/C(=C/CC/C(=C\C=C\C(=C/C=C/C(=C\C=C\C=C(/C=C/C=C(\C=C\C=C(/CC/C=C(/CO)\C)\C)/C)\C)/C)\C)/C)/C JEVVKJMRZMXFBT-XWDZUXABSA-N 0.000 description 1
- 241001344131 Magnaporthe grisea Species 0.000 description 1
- 241000724202 Maize stripe tenuivirus Species 0.000 description 1
- 241000219171 Malpighiales Species 0.000 description 1
- 244000081841 Malus domestica Species 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 101000763602 Manilkara zapota Thaumatin-like protein 1 Proteins 0.000 description 1
- 101000763586 Manilkara zapota Thaumatin-like protein 1a Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108010059724 Micrococcal Nuclease Proteins 0.000 description 1
- 108091092878 Microsatellite Proteins 0.000 description 1
- 241000228347 Monascus <ascomycete fungus> Species 0.000 description 1
- 241001518729 Monilinia Species 0.000 description 1
- 241001363493 Monilinia mali Species 0.000 description 1
- 206010027982 Morphoea Diseases 0.000 description 1
- 241000235395 Mucor Species 0.000 description 1
- 241000122904 Mucuna Species 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 1
- 101000966653 Musa acuminata Glucan endo-1,3-beta-glucosidase Proteins 0.000 description 1
- 241000226677 Myceliophthora Species 0.000 description 1
- 102000018463 Myo-Inositol-1-Phosphate Synthase Human genes 0.000 description 1
- 108091000020 Myo-Inositol-1-Phosphate Synthase Proteins 0.000 description 1
- 241000219433 Myrica Species 0.000 description 1
- 241000219926 Myrtaceae Species 0.000 description 1
- 241000134886 Myrtales Species 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- OVBPIULPVIDEAO-UHFFFAOYSA-N N-Pteroyl-L-glutaminsaeure Natural products C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)NC(CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-UHFFFAOYSA-N 0.000 description 1
- 241000498271 Necator Species 0.000 description 1
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 1
- 108090000189 Neuropeptides Proteins 0.000 description 1
- 102000000780 Nicotinate phosphoribosyltransferase Human genes 0.000 description 1
- 108700040046 Nicotinate phosphoribosyltransferases Proteins 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 241001329956 Nothopassalora personata Species 0.000 description 1
- 241000998584 Nuda Species 0.000 description 1
- OSRWYQUSDMUYBS-UHFFFAOYSA-N OBO.OP(O)(O)=O Chemical class OBO.OP(O)(O)=O OSRWYQUSDMUYBS-UHFFFAOYSA-N 0.000 description 1
- 229910004679 ONO2 Inorganic materials 0.000 description 1
- REYJJPSVUYRZGE-UHFFFAOYSA-N Octadecylamine Chemical compound CCCCCCCCCCCCCCCCCCN REYJJPSVUYRZGE-UHFFFAOYSA-N 0.000 description 1
- 239000005642 Oleic acid Substances 0.000 description 1
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 1
- 101710089395 Oleosin Proteins 0.000 description 1
- 241000581017 Oliva Species 0.000 description 1
- 241001219479 Olpidium Species 0.000 description 1
- 102000016387 Pancreatic elastase Human genes 0.000 description 1
- 108010067372 Pancreatic elastase Proteins 0.000 description 1
- 241000123637 Pandanales Species 0.000 description 1
- 241000209117 Panicum Species 0.000 description 1
- 235000006443 Panicum miliaceum subsp. miliaceum Nutrition 0.000 description 1
- 235000009037 Panicum miliaceum subsp. ruderale Nutrition 0.000 description 1
- 235000009388 Parthenocissus quinquefolia Nutrition 0.000 description 1
- 241001507673 Penicillium digitatum Species 0.000 description 1
- 244000115721 Pennisetum typhoides Species 0.000 description 1
- 235000007195 Pennisetum typhoides Nutrition 0.000 description 1
- 239000006002 Pepper Substances 0.000 description 1
- 241001223281 Peronospora Species 0.000 description 1
- 241001670201 Peronospora destructor Species 0.000 description 1
- 241001223280 Peronospora sparsa Species 0.000 description 1
- 244000025272 Persea americana Species 0.000 description 1
- 235000008673 Persea americana Nutrition 0.000 description 1
- 241000440444 Phakopsora Species 0.000 description 1
- 241000222385 Phanerochaete Species 0.000 description 1
- 101710163504 Phaseolin Proteins 0.000 description 1
- 101000870887 Phaseolus vulgaris Glycine-rich cell wall structural protein 1.8 Proteins 0.000 description 1
- PCNDJXKNXGMECE-UHFFFAOYSA-N Phenazine Natural products C1=CC=CC2=NC3=CC=CC=C3N=C21 PCNDJXKNXGMECE-UHFFFAOYSA-N 0.000 description 1
- 244000089933 Phoebe grandis Species 0.000 description 1
- 241001557902 Phomopsis sp. Species 0.000 description 1
- 241000257732 Phomopsis vexans Species 0.000 description 1
- 108010010677 Phosphodiesterase I Proteins 0.000 description 1
- ABLZXFCXXLZCGV-UHFFFAOYSA-N Phosphorous acid Chemical class OP(O)=O ABLZXFCXXLZCGV-UHFFFAOYSA-N 0.000 description 1
- 102000009097 Phosphorylases Human genes 0.000 description 1
- 108010073135 Phosphorylases Proteins 0.000 description 1
- 241000601424 Phycisphaera Species 0.000 description 1
- 241000210649 Phyllosticta ampelicida Species 0.000 description 1
- 241001270527 Phyllosticta citrullina Species 0.000 description 1
- 241000275067 Phyllotreta Species 0.000 description 1
- 241001149949 Phytophthora cactorum Species 0.000 description 1
- 241000263678 Phytophthora cactorum var. applanata Species 0.000 description 1
- 241000031556 Phytophthora sp. Species 0.000 description 1
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 1
- 235000011613 Pinus brutia Nutrition 0.000 description 1
- 241000018646 Pinus brutia Species 0.000 description 1
- 235000016761 Piper aduncum Nutrition 0.000 description 1
- 235000017804 Piper guineense Nutrition 0.000 description 1
- 240000003889 Piper guineense Species 0.000 description 1
- 235000008184 Piper nigrum Nutrition 0.000 description 1
- 241001503464 Plasmodiophora Species 0.000 description 1
- 241000233610 Plasmopara halstedii Species 0.000 description 1
- 241001281803 Plasmopara viticola Species 0.000 description 1
- 241000244271 Pleurospermum Species 0.000 description 1
- 241000222350 Pleurotus Species 0.000 description 1
- 241001337928 Podosphaera leucotricha Species 0.000 description 1
- 241001294742 Podosphaera macularis Species 0.000 description 1
- 102100032347 Poly(ADP-ribose) glycohydrolase Human genes 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- 229920000331 Polyhydroxybutyrate Polymers 0.000 description 1
- 108010039918 Polylysine Proteins 0.000 description 1
- 241000709992 Potato virus X Species 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 235000006040 Prunus persica var persica Nutrition 0.000 description 1
- 241000087479 Pseudocercospora fijiensis Species 0.000 description 1
- 241000301598 Pseudocercospora kaki Species 0.000 description 1
- 241000184297 Pseudocercospora musae Species 0.000 description 1
- 108091008109 Pseudogenes Proteins 0.000 description 1
- 241000589615 Pseudomonas syringae Species 0.000 description 1
- 241001281805 Pseudoperonospora cubensis Species 0.000 description 1
- 241000221300 Puccinia Species 0.000 description 1
- 241001123559 Puccinia hordei Species 0.000 description 1
- 241000312975 Puccinia horiana Species 0.000 description 1
- 241001304534 Puccinia polysora Species 0.000 description 1
- 241000228454 Pyrenophora graminea Species 0.000 description 1
- 241000520648 Pyrenophora teres Species 0.000 description 1
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 1
- 108091093078 Pyrimidine dimer Proteins 0.000 description 1
- 235000001630 Pyrus pyrifolia var culta Nutrition 0.000 description 1
- 244000079529 Pyrus serotina Species 0.000 description 1
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 1
- 241001622911 Pythium graminicola Species 0.000 description 1
- 241001505297 Pythium irregulare Species 0.000 description 1
- 241001385948 Pythium sp. Species 0.000 description 1
- 102000009572 RNA Polymerase II Human genes 0.000 description 1
- 108010009460 RNA Polymerase II Proteins 0.000 description 1
- 102000014450 RNA Polymerase III Human genes 0.000 description 1
- 108010078067 RNA Polymerase III Proteins 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 101150075111 ROLB gene Proteins 0.000 description 1
- 101150013395 ROLC gene Proteins 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 241001128129 Rafflesiaceae Species 0.000 description 1
- 241000218201 Ranunculaceae Species 0.000 description 1
- 241000218206 Ranunculus Species 0.000 description 1
- 235000019484 Rapeseed oil Nutrition 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 241000589180 Rhizobium Species 0.000 description 1
- 241001144606 Rhizobium oryzae Species 0.000 description 1
- 240000002044 Rhizophora apiculata Species 0.000 description 1
- 241000235527 Rhizopus Species 0.000 description 1
- 102000004389 Ribonucleoproteins Human genes 0.000 description 1
- 108010081734 Ribonucleoproteins Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 108020004422 Riboswitch Proteins 0.000 description 1
- 235000004789 Rosa xanthina Nutrition 0.000 description 1
- 241000109329 Rosa xanthina Species 0.000 description 1
- 101100174722 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) GAA1 gene Proteins 0.000 description 1
- 101100296979 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PEP5 gene Proteins 0.000 description 1
- 241000209051 Saccharum Species 0.000 description 1
- 241000195475 Sargassaceae Species 0.000 description 1
- 241000208437 Sarraceniaceae Species 0.000 description 1
- 241000951473 Schizonepeta Species 0.000 description 1
- 206010039710 Scleroderma Diseases 0.000 description 1
- 241000221662 Sclerotinia Species 0.000 description 1
- 241001558929 Sclerotium <basidiomycota> Species 0.000 description 1
- 241000122799 Scopulariopsis Species 0.000 description 1
- 244000082988 Secale cereale Species 0.000 description 1
- 108010016634 Seed Storage Proteins Proteins 0.000 description 1
- RJFAYQIBOAGBLC-BYPYZUCNSA-N Selenium-L-methionine Chemical compound C[Se]CC[C@H](N)C(O)=O RJFAYQIBOAGBLC-BYPYZUCNSA-N 0.000 description 1
- RJFAYQIBOAGBLC-UHFFFAOYSA-N Selenomethionine Natural products C[Se]CCC(N)C(O)=O RJFAYQIBOAGBLC-UHFFFAOYSA-N 0.000 description 1
- 241000270295 Serpentes Species 0.000 description 1
- 235000008515 Setaria glauca Nutrition 0.000 description 1
- 235000010086 Setaria viridis var. viridis Nutrition 0.000 description 1
- 241001643412 Sinomenium Species 0.000 description 1
- 101000611441 Solanum lycopersicum Pathogenesis-related leaf protein 6 Proteins 0.000 description 1
- 235000015503 Sorghum bicolor subsp. drummondii Nutrition 0.000 description 1
- 241000227724 Sphaceloma Species 0.000 description 1
- 241001219482 Spongospora Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 244000170625 Sudangrass Species 0.000 description 1
- UCKMPCXJQFINFW-UHFFFAOYSA-N Sulphide Chemical compound [S-2] UCKMPCXJQFINFW-UHFFFAOYSA-N 0.000 description 1
- 241000192584 Synechocystis Species 0.000 description 1
- 240000004460 Tanacetum coccineum Species 0.000 description 1
- 101710192266 Tegument protein VP22 Proteins 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 241000722133 Tilletia Species 0.000 description 1
- 241000723873 Tobacco mosaic virus Species 0.000 description 1
- 241000370924 Tomato yellow mosaic virus Species 0.000 description 1
- 108090000340 Transaminases Proteins 0.000 description 1
- 102000003929 Transaminases Human genes 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- 235000007264 Triticum durum Nutrition 0.000 description 1
- 241000209143 Triticum turgidum subsp. durum Species 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 102000006275 Ubiquitin-Protein Ligases Human genes 0.000 description 1
- 108010083111 Ubiquitin-Protein Ligases Proteins 0.000 description 1
- 241000233791 Ustilago tritici Species 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241001645362 Valsa Species 0.000 description 1
- 241000317942 Venturia <ichneumonid wasp> Species 0.000 description 1
- 241000228452 Venturia inaequalis Species 0.000 description 1
- 241001669638 Venturia nashicola Species 0.000 description 1
- 241001006642 Venturia pyrina Species 0.000 description 1
- 241000256856 Vespidae Species 0.000 description 1
- 235000010749 Vicia faba Nutrition 0.000 description 1
- 240000006677 Vicia faba Species 0.000 description 1
- 235000002098 Vicia faba var. major Nutrition 0.000 description 1
- 235000010726 Vigna sinensis Nutrition 0.000 description 1
- 244000042314 Vigna unguiculata Species 0.000 description 1
- 108700010756 Viral Polyproteins Proteins 0.000 description 1
- 241000219094 Vitaceae Species 0.000 description 1
- 241000702302 Wheat dwarf virus Species 0.000 description 1
- JKQXZKUSFCKOGQ-LQFQNGICSA-N Z-zeaxanthin Natural products C([C@H](O)CC=1C)C(C)(C)C=1C=CC(C)=CC=CC(C)=CC=CC=C(C)C=CC=C(C)C=CC1=C(C)C[C@@H](O)CC1(C)C JKQXZKUSFCKOGQ-LQFQNGICSA-N 0.000 description 1
- 101001036768 Zea mays Glucose-1-phosphate adenylyltransferase large subunit 1, chloroplastic/amyloplastic Proteins 0.000 description 1
- 101000662549 Zea mays Sucrose synthase 1 Proteins 0.000 description 1
- QOPRSMDTRDMBNK-RNUUUQFGSA-N Zeaxanthin Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CCC(O)C1(C)C)C=CC=C(/C)C=CC2=C(C)CC(O)CC2(C)C QOPRSMDTRDMBNK-RNUUUQFGSA-N 0.000 description 1
- 241000234675 Zingiberales Species 0.000 description 1
- 241000981595 Zoysia japonica Species 0.000 description 1
- SIIZPVYVXNXXQG-KGXOGWRBSA-N [(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-4-[[(3s,4r)-5-(6-aminopurin-9-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-3-hydroxyoxolan-2-yl]methyl [(2r,4r,5r)-2-(6-aminopurin-9-yl)-4-hydroxy-5-(phosphonooxymethyl)oxolan-3-yl] hydrogen phosphate Polymers C1=NC2=C(N)N=CN=C2N1[C@@H]1O[C@H](COP(O)(=O)OC2[C@@H](O[C@H](COP(O)(O)=O)[C@H]2O)N2C3=NC=NC(N)=C3N=C2)[C@@H](O)[C@H]1OP(O)(=O)OCC([C@@H](O)[C@H]1O)OC1N1C(N=CN=C2N)=C2N=C1 SIIZPVYVXNXXQG-KGXOGWRBSA-N 0.000 description 1
- RLXCFCYWFYXTON-JTTSDREOSA-N [(3S,8S,9S,10R,13S,14S,17R)-3-hydroxy-10,13-dimethyl-17-[(2R)-6-methylheptan-2-yl]-2,3,4,7,8,9,11,12,14,15,16,17-dodecahydro-1H-cyclopenta[a]phenanthren-16-yl] N-hexylcarbamate Chemical group C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC(OC(=O)NCCCCCC)[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 RLXCFCYWFYXTON-JTTSDREOSA-N 0.000 description 1
- NOXMCJDDSWCSIE-DAGMQNCNSA-N [[(2R,3S,4R,5R)-5-(2-amino-4-oxo-3H-pyrrolo[2,3-d]pyrimidin-7-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=2NC(N)=NC(=O)C=2C=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O NOXMCJDDSWCSIE-DAGMQNCNSA-N 0.000 description 1
- CUOLBWPZVZCPIJ-MCDZGGTQSA-N [[(2r,3s,4r,5r)-5-(6-aminopurin-9-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate;diphosphono hydrogen phosphate Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O.C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O CUOLBWPZVZCPIJ-MCDZGGTQSA-N 0.000 description 1
- PGAVKCOVUIYSFO-UHFFFAOYSA-N [[5-(2,4-dioxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound OC1C(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-UHFFFAOYSA-N 0.000 description 1
- 238000005299 abrasion Methods 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- XVIYCJDWYLJQBG-UHFFFAOYSA-N acetic acid;adamantane Chemical compound CC(O)=O.C1C(C2)CC3CC1CC2C3 XVIYCJDWYLJQBG-UHFFFAOYSA-N 0.000 description 1
- 108091000039 acetoacetyl-CoA reductase Proteins 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 230000006154 adenylylation Effects 0.000 description 1
- 239000000556 agonist Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 150000001336 alkenes Chemical class 0.000 description 1
- 125000005083 alkoxyalkoxy group Chemical group 0.000 description 1
- 125000002877 alkyl aryl group Chemical group 0.000 description 1
- 125000005600 alkyl phosphonate group Chemical group 0.000 description 1
- 230000029936 alkylation Effects 0.000 description 1
- 238000005804 alkylation reaction Methods 0.000 description 1
- OENHQHLEOONYIE-UKMVMLAPSA-N all-trans beta-carotene Natural products CC=1CCCC(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C OENHQHLEOONYIE-UKMVMLAPSA-N 0.000 description 1
- JKQXZKUSFCKOGQ-LOFNIBRQSA-N all-trans-Zeaxanthin Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CC(O)CC1(C)C)C=CC=C(/C)C=CC2=C(C)CC(O)CC2(C)C JKQXZKUSFCKOGQ-LOFNIBRQSA-N 0.000 description 1
- 239000011795 alpha-carotene Substances 0.000 description 1
- 235000003903 alpha-carotene Nutrition 0.000 description 1
- ANVAOWXLWRTKGA-HLLMEWEMSA-N alpha-carotene Natural products C(=C\C=C\C=C(/C=C/C=C(\C=C\C=1C(C)(C)CCCC=1C)/C)\C)(\C=C\C=C(/C=C/[C@H]1C(C)=CCCC1(C)C)\C)/C ANVAOWXLWRTKGA-HLLMEWEMSA-N 0.000 description 1
- 239000004178 amaranth Substances 0.000 description 1
- 235000012735 amaranth Nutrition 0.000 description 1
- 102000005922 amidase Human genes 0.000 description 1
- 125000004103 aminoalkyl group Chemical group 0.000 description 1
- 125000005122 aminoalkylamino group Chemical group 0.000 description 1
- 239000003392 amylase inhibitor Substances 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- PYKYMHQGRFAEBM-UHFFFAOYSA-N anthraquinone Natural products CCC(=O)c1c(O)c2C(=O)C3C(C=CC=C3O)C(=O)c2cc1CC(=O)OC PYKYMHQGRFAEBM-UHFFFAOYSA-N 0.000 description 1
- 150000004056 anthraquinones Chemical class 0.000 description 1
- 230000000840 anti-viral effect Effects 0.000 description 1
- 239000003816 antisense DNA Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 101150037081 aroA gene Proteins 0.000 description 1
- 125000003710 aryl alkyl group Chemical group 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 230000000680 avirulence Effects 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- 230000033590 base-excision repair Effects 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 235000013734 beta-carotene Nutrition 0.000 description 1
- 239000011648 beta-carotene Substances 0.000 description 1
- TUPZEYHYWIEDIH-WAIFQNFQSA-N beta-carotene Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CCCC1(C)C)C=CC=C(/C)C=CC2=CCCCC2(C)C TUPZEYHYWIEDIH-WAIFQNFQSA-N 0.000 description 1
- 229960002747 betacarotene Drugs 0.000 description 1
- 125000002619 bicyclic group Chemical group 0.000 description 1
- 229920000704 biodegradable plastic Polymers 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 235000004883 caffeic acid Nutrition 0.000 description 1
- 229940074360 caffeic acid Drugs 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 239000001390 capsicum minimum Substances 0.000 description 1
- 235000021256 carbohydrate metabolism Nutrition 0.000 description 1
- 235000021466 carotenoid Nutrition 0.000 description 1
- 150000001747 carotenoids Chemical class 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 150000001765 catechin Chemical class 0.000 description 1
- ADRVNXBAWSRFAJ-UHFFFAOYSA-N catechin Natural products OC1Cc2cc(O)cc(O)c2OC1c3ccc(O)c(O)c3 ADRVNXBAWSRFAJ-UHFFFAOYSA-N 0.000 description 1
- 235000005487 catechin Nutrition 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000036978 cell physiology Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 230000030570 cellular localization Effects 0.000 description 1
- 230000004700 cellular uptake Effects 0.000 description 1
- 235000019993 champagne Nutrition 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- RIUXZHMCCFLRBI-UHFFFAOYSA-N chlorimuron Chemical compound COC1=CC(Cl)=NC(NC(=O)NS(=O)(=O)C=2C(=CC=CC=2)C(O)=O)=N1 RIUXZHMCCFLRBI-UHFFFAOYSA-N 0.000 description 1
- 108010031100 chloroplast transit peptides Proteins 0.000 description 1
- VJYIFXVZLXQVHO-UHFFFAOYSA-N chlorsulfuron Chemical compound COC1=NC(C)=NC(NC(=O)NS(=O)(=O)C=2C(=CC=CC=2)Cl)=N1 VJYIFXVZLXQVHO-UHFFFAOYSA-N 0.000 description 1
- 235000019416 cholic acid Nutrition 0.000 description 1
- 229960002471 cholic acid Drugs 0.000 description 1
- WTFXTQVDAKGDEY-HTQZYQBOSA-L chorismate(2-) Chemical compound O[C@@H]1C=CC(C([O-])=O)=C[C@H]1OC(=C)C([O-])=O WTFXTQVDAKGDEY-HTQZYQBOSA-L 0.000 description 1
- 230000019113 chromatin silencing Effects 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 230000008711 chromosomal rearrangement Effects 0.000 description 1
- QAIPRVGONGVQAS-UHFFFAOYSA-N cis-caffeic acid Natural products OC(=O)C=CC1=CC=C(O)C(O)=C1 QAIPRVGONGVQAS-UHFFFAOYSA-N 0.000 description 1
- 229940108924 conjugated linoleic acid Drugs 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- OFEZSBMBBKLLBJ-BAJZRUMYSA-N cordycepin Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)C[C@H]1O OFEZSBMBBKLLBJ-BAJZRUMYSA-N 0.000 description 1
- OFEZSBMBBKLLBJ-UHFFFAOYSA-N cordycepine Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(CO)CC1O OFEZSBMBBKLLBJ-UHFFFAOYSA-N 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 150000001923 cyclic compounds Chemical class 0.000 description 1
- 125000001995 cyclobutyl group Chemical group [H]C1([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 1
- 125000000596 cyclohexenyl group Chemical group C1(=CCCCC1)* 0.000 description 1
- 239000004062 cytokinin Substances 0.000 description 1
- UQHKFADEQIVWID-UHFFFAOYSA-N cytokinin Natural products C1=NC=2C(NCC=C(CO)C)=NC=NC=2N1C1CC(O)C(CO)O1 UQHKFADEQIVWID-UHFFFAOYSA-N 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- UFJPAQSLHAGEBL-RRKCRQDMSA-N dITP Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(N=CNC2=O)=C2N=C1 UFJPAQSLHAGEBL-RRKCRQDMSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 230000006196 deacetylation Effects 0.000 description 1
- 238000003381 deacetylation reaction Methods 0.000 description 1
- 230000009615 deamination Effects 0.000 description 1
- 238000006481 deamination reaction Methods 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- KXGVEGMKQFWNSR-UHFFFAOYSA-N deoxycholic acid Natural products C1CC2CC(O)CCC2(C)C2C1C1CCC(C(CCC(O)=O)C)C1(C)C(O)C2 KXGVEGMKQFWNSR-UHFFFAOYSA-N 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000030609 dephosphorylation Effects 0.000 description 1
- 238000006209 dephosphorylation reaction Methods 0.000 description 1
- 230000027832 depurination Effects 0.000 description 1
- 230000009504 deubiquitination Effects 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- ANCLJVISBRWUTR-UHFFFAOYSA-N diaminophosphinic acid Chemical compound NP(N)(O)=O ANCLJVISBRWUTR-UHFFFAOYSA-N 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 235000013325 dietary fiber Nutrition 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- GTZOYNFRVVHLDZ-UHFFFAOYSA-N dodecane-1,1-diol Chemical group CCCCCCCCCCCC(O)O GTZOYNFRVVHLDZ-UHFFFAOYSA-N 0.000 description 1
- 230000008641 drought stress Effects 0.000 description 1
- 150000002061 ecdysteroids Chemical class 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000007159 enucleation Effects 0.000 description 1
- 229940125532 enzyme inhibitor Drugs 0.000 description 1
- LPTRNLNOHUVQMS-UHFFFAOYSA-N epicatechin Natural products Cc1cc(O)cc2OC(C(O)Cc12)c1ccc(O)c(O)c1 LPTRNLNOHUVQMS-UHFFFAOYSA-N 0.000 description 1
- 235000012734 epicatechin Nutrition 0.000 description 1
- DPUOLQHDNGRHBS-KTKRTIGZSA-N erucic acid Chemical compound CCCCCCCC\C=C/CCCCCCCCCCCC(O)=O DPUOLQHDNGRHBS-KTKRTIGZSA-N 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000001723 extracellular space Anatomy 0.000 description 1
- 239000010685 fatty oil Substances 0.000 description 1
- 235000001785 ferulic acid Nutrition 0.000 description 1
- KSEBMYQBYZTDHS-HWKANZROSA-N ferulic acid Chemical compound COC1=CC(\C=C\C(O)=O)=CC=C1O KSEBMYQBYZTDHS-HWKANZROSA-N 0.000 description 1
- KSEBMYQBYZTDHS-UHFFFAOYSA-N ferulic acid Natural products COC1=CC(C=CC(O)=O)=CC=C1O KSEBMYQBYZTDHS-UHFFFAOYSA-N 0.000 description 1
- 229940114124 ferulic acid Drugs 0.000 description 1
- 235000008384 feverfew Nutrition 0.000 description 1
- 229930003935 flavonoid Natural products 0.000 description 1
- 235000017173 flavonoids Nutrition 0.000 description 1
- 150000002215 flavonoids Chemical class 0.000 description 1
- HVQAJTFOCKOKIN-UHFFFAOYSA-N flavonol Natural products O1C2=CC=CC=C2C(=O)C(O)=C1C1=CC=CC=C1 HVQAJTFOCKOKIN-UHFFFAOYSA-N 0.000 description 1
- 150000002216 flavonol derivatives Chemical class 0.000 description 1
- 235000011957 flavonols Nutrition 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 239000011737 fluorine Substances 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- 229960000304 folic acid Drugs 0.000 description 1
- 235000019152 folic acid Nutrition 0.000 description 1
- 239000011724 folic acid Substances 0.000 description 1
- 235000012041 food component Nutrition 0.000 description 1
- 239000005417 food ingredient Substances 0.000 description 1
- WSFSSNUMVMOOMR-UHFFFAOYSA-N formaldehyde Substances O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 235000012055 fruits and vegetables Nutrition 0.000 description 1
- 239000003008 fumonisin Substances 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 230000005021 gait Effects 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 125000004383 glucosinolate group Chemical group 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 125000003827 glycol group Chemical group 0.000 description 1
- 230000002414 glycolytic effect Effects 0.000 description 1
- 235000021021 grapes Nutrition 0.000 description 1
- 244000304962 green bristle grass Species 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- 210000001320 hippocampus Anatomy 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 239000010903 husk Substances 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 210000001822 immobilized cell Anatomy 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 238000012744 immunostaining Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- QNLOWBMKUIXCOW-UHFFFAOYSA-N indol-2-one Chemical compound C1=CC=CC2=NC(=O)C=C21 QNLOWBMKUIXCOW-UHFFFAOYSA-N 0.000 description 1
- 150000002475 indoles Chemical class 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 230000000749 insecticidal effect Effects 0.000 description 1
- 210000003093 intracellular space Anatomy 0.000 description 1
- JYJIGFIDKWBXDU-MNNPPOADSA-N inulin Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)OC[C@]1(OC[C@]2(OC[C@]3(OC[C@]4(OC[C@]5(OC[C@]6(OC[C@]7(OC[C@]8(OC[C@]9(OC[C@]%10(OC[C@]%11(OC[C@]%12(OC[C@]%13(OC[C@]%14(OC[C@]%15(OC[C@]%16(OC[C@]%17(OC[C@]%18(OC[C@]%19(OC[C@]%20(OC[C@]%21(OC[C@]%22(OC[C@]%23(OC[C@]%24(OC[C@]%25(OC[C@]%26(OC[C@]%27(OC[C@]%28(OC[C@]%29(OC[C@]%30(OC[C@]%31(OC[C@]%32(OC[C@]%33(OC[C@]%34(OC[C@]%35(OC[C@]%36(O[C@@H]%37[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O%37)O)[C@H]([C@H](O)[C@@H](CO)O%36)O)[C@H]([C@H](O)[C@@H](CO)O%35)O)[C@H]([C@H](O)[C@@H](CO)O%34)O)[C@H]([C@H](O)[C@@H](CO)O%33)O)[C@H]([C@H](O)[C@@H](CO)O%32)O)[C@H]([C@H](O)[C@@H](CO)O%31)O)[C@H]([C@H](O)[C@@H](CO)O%30)O)[C@H]([C@H](O)[C@@H](CO)O%29)O)[C@H]([C@H](O)[C@@H](CO)O%28)O)[C@H]([C@H](O)[C@@H](CO)O%27)O)[C@H]([C@H](O)[C@@H](CO)O%26)O)[C@H]([C@H](O)[C@@H](CO)O%25)O)[C@H]([C@H](O)[C@@H](CO)O%24)O)[C@H]([C@H](O)[C@@H](CO)O%23)O)[C@H]([C@H](O)[C@@H](CO)O%22)O)[C@H]([C@H](O)[C@@H](CO)O%21)O)[C@H]([C@H](O)[C@@H](CO)O%20)O)[C@H]([C@H](O)[C@@H](CO)O%19)O)[C@H]([C@H](O)[C@@H](CO)O%18)O)[C@H]([C@H](O)[C@@H](CO)O%17)O)[C@H]([C@H](O)[C@@H](CO)O%16)O)[C@H]([C@H](O)[C@@H](CO)O%15)O)[C@H]([C@H](O)[C@@H](CO)O%14)O)[C@H]([C@H](O)[C@@H](CO)O%13)O)[C@H]([C@H](O)[C@@H](CO)O%12)O)[C@H]([C@H](O)[C@@H](CO)O%11)O)[C@H]([C@H](O)[C@@H](CO)O%10)O)[C@H]([C@H](O)[C@@H](CO)O9)O)[C@H]([C@H](O)[C@@H](CO)O8)O)[C@H]([C@H](O)[C@@H](CO)O7)O)[C@H]([C@H](O)[C@@H](CO)O6)O)[C@H]([C@H](O)[C@@H](CO)O5)O)[C@H]([C@H](O)[C@@H](CO)O4)O)[C@H]([C@H](O)[C@@H](CO)O3)O)[C@H]([C@H](O)[C@@H](CO)O2)O)[C@@H](O)[C@H](O)[C@@H](CO)O1 JYJIGFIDKWBXDU-MNNPPOADSA-N 0.000 description 1
- 229940029339 inulin Drugs 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 238000006317 isomerization reaction Methods 0.000 description 1
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 150000002540 isothiocyanates Chemical class 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 229930014550 juvenile hormone Natural products 0.000 description 1
- 239000002949 juvenile hormone Substances 0.000 description 1
- 150000003633 juvenile hormone derivatives Chemical class 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 229920000126 latex Polymers 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- OYHQOLUKZRVURQ-IXWMQOLASA-N linoleic acid Natural products CCCCC\C=C/C\C=C\CCCCCCCC(O)=O OYHQOLUKZRVURQ-IXWMQOLASA-N 0.000 description 1
- 230000002366 lipolytic effect Effects 0.000 description 1
- 235000012680 lutein Nutrition 0.000 description 1
- 239000001656 lutein Substances 0.000 description 1
- 229960005375 lutein Drugs 0.000 description 1
- KBPHJBAIARWVSC-RGZFRNHPSA-N lutein Chemical compound C([C@H](O)CC=1C)C(C)(C)C=1\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\[C@H]1C(C)=C[C@H](O)CC1(C)C KBPHJBAIARWVSC-RGZFRNHPSA-N 0.000 description 1
- ORAKUVXRZWMARG-WZLJTJAWSA-N lutein Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CCCC1(C)C)C=CC=C(/C)C=CC2C(=CC(O)CC2(C)C)C ORAKUVXRZWMARG-WZLJTJAWSA-N 0.000 description 1
- 235000012661 lycopene Nutrition 0.000 description 1
- 239000001751 lycopene Substances 0.000 description 1
- 229960004999 lycopene Drugs 0.000 description 1
- OAIJSZIZWZSQBC-GYZMGTAESA-N lycopene Chemical compound CC(C)=CCC\C(C)=C\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\C=C(/C)CCC=C(C)C OAIJSZIZWZSQBC-GYZMGTAESA-N 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- CYEBJEDOHLIWNP-UHFFFAOYSA-N methanethioamide Chemical compound NC=S CYEBJEDOHLIWNP-UHFFFAOYSA-N 0.000 description 1
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 230000033607 mismatch repair Effects 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 230000025608 mitochondrion localization Effects 0.000 description 1
- 229930003658 monoterpene Natural products 0.000 description 1
- 150000002773 monoterpene derivatives Chemical class 0.000 description 1
- 235000002577 monoterpenes Nutrition 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 230000001338 necrotic effect Effects 0.000 description 1
- 230000001069 nematicidal effect Effects 0.000 description 1
- 229960003966 nicotinamide Drugs 0.000 description 1
- 235000005152 nicotinamide Nutrition 0.000 description 1
- 239000011570 nicotinamide Substances 0.000 description 1
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 1
- 125000001893 nitrooxy group Chemical group [O-][N+](=O)O* 0.000 description 1
- ORKZAIATDSINLW-UHFFFAOYSA-N nonacosane-1,2,3-triol Chemical compound C(CCCCCCCCCCCCCCCCCCCCCCCCC)C(O)C(O)CO ORKZAIATDSINLW-UHFFFAOYSA-N 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 230000020520 nucleotide-excision repair Effects 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 239000002417 nutraceutical Substances 0.000 description 1
- 235000021436 nutraceutical agent Nutrition 0.000 description 1
- 235000021049 nutrient content Nutrition 0.000 description 1
- 235000021062 nutrient metabolism Nutrition 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- JRZJOMJEPLMPRA-UHFFFAOYSA-N olefin Natural products CCCCCCCC=C JRZJOMJEPLMPRA-UHFFFAOYSA-N 0.000 description 1
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 235000020660 omega-3 fatty acid Nutrition 0.000 description 1
- 125000001181 organosilyl group Chemical group [SiH3]* 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 125000000913 palmityl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- FJKROLUGYXJWQN-UHFFFAOYSA-N papa-hydroxy-benzoic acid Natural products OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 230000000361 pesticidal effect Effects 0.000 description 1
- 239000000575 pesticide Substances 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 150000002989 phenols Chemical class 0.000 description 1
- 229950000688 phenothiazine Drugs 0.000 description 1
- 150000002991 phenoxazines Chemical class 0.000 description 1
- 150000002995 phenylpropanoid derivatives Chemical class 0.000 description 1
- 239000003016 pheromone Substances 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 150000008299 phosphorodiamidates Chemical class 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 230000008659 phytopathology Effects 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- 244000000003 plant pathogen Species 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920000724 poly(L-arginine) polymer Polymers 0.000 description 1
- 239000005015 poly(hydroxybutyrate) Substances 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 229920000570 polyether Polymers 0.000 description 1
- 229920000157 polyfructose Polymers 0.000 description 1
- 229920000656 polylysine Polymers 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 239000001103 potassium chloride Substances 0.000 description 1
- 235000011164 potassium chloride Nutrition 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000019525 primary metabolic process Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 229940024999 proteolytic enzymes for treatment of wounds and ulcers Drugs 0.000 description 1
- IGFXRKMLLMBKSA-UHFFFAOYSA-N purine Chemical group N1=C[N]C2=NC=NC2=C1 IGFXRKMLLMBKSA-UHFFFAOYSA-N 0.000 description 1
- UBQKCCHYAOITMY-UHFFFAOYSA-N pyridin-2-ol Chemical compound OC1=CC=CC=N1 UBQKCCHYAOITMY-UHFFFAOYSA-N 0.000 description 1
- 239000013635 pyrimidine dimer Substances 0.000 description 1
- SRBUGYKMBLUTIS-UHFFFAOYSA-N pyrrolo[2,3-d]pyrimidin-2-one Chemical compound O=C1N=CC2=CC=NC2=N1 SRBUGYKMBLUTIS-UHFFFAOYSA-N 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 125000006853 reporter group Chemical group 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 229960004889 salicylic acid Drugs 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 235000021003 saturated fats Nutrition 0.000 description 1
- 230000008117 seed development Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 229960002718 selenomethionine Drugs 0.000 description 1
- 230000010153 self-pollination Effects 0.000 description 1
- 229930004725 sesquiterpene Natural products 0.000 description 1
- 150000004354 sesquiterpene derivatives Chemical class 0.000 description 1
- 230000014639 sexual reproduction Effects 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 238000005549 size reduction Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 108010048090 soybean lectin Proteins 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 235000020354 squash Nutrition 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 235000021286 stilbenes Nutrition 0.000 description 1
- 150000001629 stilbenes Chemical class 0.000 description 1
- 230000035882 stress Effects 0.000 description 1
- 230000004960 subcellular localization Effects 0.000 description 1
- 235000021092 sugar substitutes Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- IIACRCGMVDHOTQ-UHFFFAOYSA-N sulfamic acid Chemical group NS(O)(=O)=O IIACRCGMVDHOTQ-UHFFFAOYSA-N 0.000 description 1
- 150000003456 sulfonamides Chemical group 0.000 description 1
- BDHFUVZGWQCTTF-UHFFFAOYSA-M sulfonate Chemical compound [O-]S(=O)=O BDHFUVZGWQCTTF-UHFFFAOYSA-M 0.000 description 1
- 150000003457 sulfones Chemical group 0.000 description 1
- 229960005559 sulforaphane Drugs 0.000 description 1
- 235000015487 sulforaphane Nutrition 0.000 description 1
- 150000003462 sulfoxides Chemical class 0.000 description 1
- 230000010741 sumoylation Effects 0.000 description 1
- 235000020238 sunflower seed Nutrition 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 239000001648 tannin Substances 0.000 description 1
- 235000018553 tannin Nutrition 0.000 description 1
- 229920001864 tannin Polymers 0.000 description 1
- 125000004001 thioalkyl group Chemical group 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- ZEMGGZBWXRYJHK-UHFFFAOYSA-N thiouracil Chemical compound O=C1C=CNC(=S)N1 ZEMGGZBWXRYJHK-UHFFFAOYSA-N 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- NGSWKAQJJWESNS-ZZXKWVIFSA-N trans-4-coumaric acid Chemical compound OC(=O)\C=C\C1=CC=C(O)C=C1 NGSWKAQJJWESNS-ZZXKWVIFSA-N 0.000 description 1
- QURCVMIEKCOAJU-UHFFFAOYSA-N trans-isoferulic acid Natural products COC1=CC=C(C=CC(O)=O)C=C1O QURCVMIEKCOAJU-UHFFFAOYSA-N 0.000 description 1
- ZCIHMQAPACOQHT-ZGMPDRQDSA-N trans-isorenieratene Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/c1c(C)ccc(C)c1C)C=CC=C(/C)C=Cc2c(C)ccc(C)c2C ZCIHMQAPACOQHT-ZGMPDRQDSA-N 0.000 description 1
- 238000012033 transcriptional gene silencing Methods 0.000 description 1
- 230000037426 transcriptional repression Effects 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- ZMANZCXQSJIPKH-UHFFFAOYSA-O triethylammonium ion Chemical compound CC[NH+](CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-O 0.000 description 1
- 125000000876 trifluoromethoxy group Chemical group FC(F)(F)O* 0.000 description 1
- 125000002023 trifluoromethyl group Chemical group FC(F)(F)* 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 125000002948 undecyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 239000002435 venom Substances 0.000 description 1
- 231100000611 venom Toxicity 0.000 description 1
- 210000001048 venom Anatomy 0.000 description 1
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 1
- 230000001018 virulence Effects 0.000 description 1
- 108091009357 vitamin binding proteins Proteins 0.000 description 1
- 102000028728 vitamin binding proteins Human genes 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
- FJHBOVDFOQMZRV-XQIHNALSSA-N xanthophyll Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CC(O)CC1(C)C)C=CC=C(/C)C=CC2C=C(C)C(O)CC2(C)C FJHBOVDFOQMZRV-XQIHNALSSA-N 0.000 description 1
- 235000010930 zeaxanthin Nutrition 0.000 description 1
- 239000001775 zeaxanthin Substances 0.000 description 1
- 229940043269 zeaxanthin Drugs 0.000 description 1
- OENHQHLEOONYIE-JLTXGRSLSA-N β-Carotene Chemical compound CC=1CCCC(C)(C)C=1\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C OENHQHLEOONYIE-JLTXGRSLSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8213—Targeted insertion of genes into the plant genome by homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Cell Biology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明涉及CRISPR/CasX系统在植物中用于基因组工程的应用,以及涉及用于此类方法的组合物。
Description
背景技术
1、技术领域
本发明涉及用于在植物细胞中进行基因编辑的材料和方法,尤其涉及用于基因编辑的方法,该方法包括例如但不限于使用核酸向导的CRISPR/CasX系统。
2、背景及相关技术
精确修饰真核细胞中遗传物质的能力使得能够在医学、制药、农业、基础研究和其他领域具有广泛的高价值应用。从根本上说,基因组工程通过在真核生物基因组的特定位置处引入预定义的遗传变异(诸如删除、插入、突变或取代特定的核酸序列)来提供该能力。这些改变可以是基因或位置特异性的。然而,在真核细胞中常规引入靶向遗传变异的一个重要障碍是没有突变、插入或重排,而基因组中没有先兆断裂来刺激变化。例如,由植物中位点特异性核酸酶(SSN)的表达引起的靶向双链断裂(DSB)可以将同源重组(HR)的频率增加至少二至三个数量级(Puchta等人,美国国家科学院院刊93:5055-5060,1996)。因此,在靶向诱变、编辑或插入的有效基因编辑方面的最新技术成就取决于在真核基因组中特定位置处引入基因组单链或双链断裂的能力。因此,有效的可编程核酸内切酶系统或SSN是稳健的基因编辑的基础。已用于基因编辑的SSN的示例包括归巢核酸内切酶(也称为大范围核酸酶)、锌指核酸酶(ZFN)、转录激活因子样效应子核酸酶(TALEN)以及成簇的规律间隔的短回文重复(CRISPR)/CRISPR相关(CAS)核酸酶。在这些系统中,CRISPR/Cas的独特之处在于其向导RNA组分,该组分能够实现比使用其他系统所需的蛋白质改造更快的靶标重编程。
为了有效地产生遗传变异而定向导入染色体DSB的需求使得SSN在基因编辑中必不可少。像CRISPR/Cas9核酸酶一样,CRISPR/CasX核酸内切酶(“CRISPR/CasX”)通过使用核酸向导指定靶序列,然后由CRISPR/CasX蛋白组分裂解该靶序列,来参与针对外来核酸的防御。具体来讲,CRISPR/CasX可通过与设计或合成的核酸-靶向核酸形成复合物来结合并裂解靶核酸,其中靶核酸的裂解可在靶核酸中引入双链断裂。就像Cas9系统一样,CRISPR/CasX核酸向导为编程核酸内切酶序列特异性提供了一种便捷的方法。
最近一种这样的CRISPR/CAX系统被证明适用于人类细胞中的基因编辑。参见Burstein等人,来自未培养微生物的新型CRISPR-Cas系统。Nature(2017)542(7640):237-241。以前尚未证明在植物中CRISPR/CasX系统的应用。因此,本发明部分基于令人惊奇的发现,即CRISPR/CasX在适于植物和植物细胞的生长和培养的温度下作为核酸内切酶具有活性,并且进一步令人惊奇的发现,即该核酸内切酶可用于植物细胞中的基因编辑。
发明内容
如背景技术部分中所指定的,在本领域中有很大的需求来识别基因组工程的技术,特别是用于植物中的基因组工程技术,并利用这种理解来开发用于这种工程的新颖方法和组合物。本发明满足了这一需求和其他需求。本发明的实施方案总体上涉及用于基因组工程的方法和组合物,并且更具体地涉及CRISPR/CasX系统的应用,包括例如但不限于来自δ变形菌(Deltaproteobacteria)和浮霉菌(Planctomycetes)的CRISPR/CasX蛋白系统在植物中进行基因组工程。
本发明部分基于以下发现:CRISPR/CasX家族的核酸向导的核酸内切酶可以用于植物基因组工程。CRISPR/CasX核酸内切酶系统具有CRISPR/Cas9系统的优势,因为可以使用简单的单链核酸对其进行编程以实现靶标特异性。因此,可以使用CRISPR/CasX核酸内切酶系统而不受限制地对真核细胞的遗传物质进行靶向修饰,该靶向修饰包括靶向插入和缺失、靶向序列置换、靶向小规模和大规模基因组重排(包括倒位或染色体重排)、内源序列的靶向编辑和外源序列的靶向整合。这些修饰可以独立进行,也可以作为细胞内的同时或顺序多重修饰来进行。因此,可以利用CRISPR/CasX核酸内切酶系统将许多有价值的性状引入到植物中。
本发明还提供了一种修饰存在于植物细胞中的遗传物质的方法。该方法可以包括向细胞内递送靶向细胞遗传物质序列的靶向核酸的核酸,以及向植物细胞内递送CRISPR/CasX核酸内切酶。然后,靶向核酸的核酸可以指导CRISPR/CasX核酸内切酶在由该靶向核酸的核酸指定的靶向位点处或附近的细胞遗传物质中产生断裂。通过非同源末端连接(NHEJ)或同源重组(HR)介导的途径修复断裂可导致植物细胞遗传物质中的靶向修饰。
可以通过任何合适的方法将靶向核酸的核酸和/或CRISPR/CasX核酸内切酶一起或分别递送到植物细胞中,这包括例如但不限于通过细菌DNA转移,诸如农杆菌转化、通过微粒轰击、通过聚乙二醇(PEG)转化、通过例如病毒载体的转染、通过电穿孔或通过另一种合适的方法(包括机械引入方法)。可选地,靶向核酸的核酸和/或CRISPR/CasX核酸内切酶可以通过Ensifer或在T-DNA中递送。可选地,可将CRISPR/CasX核酸内切酶的表达盒稳定整合到植物基因组中,用于在植物细胞及其衍生物中的可遗传表达。
除了向导RNA分子的优点外,CRISPR/CasX核酸内切酶由于其小尺寸也有助于其递送。来自δ变形菌(Deltaproteobacteria)(NCBI登录号MGPG01000094,座标4319..9866)的野生型(WT)蛋白为980个氨基酸,约为化脓性链球菌Cas9大小的2/3。来自浮霉菌(Planctomycetes)的野生型(WT)蛋白(NCBI登录号MHYZ01000150,坐标1..5586)为1035个氨基酸,也约为化脓链球菌Cas9大小的2/3。这些CRISPR/CasX核酸内切酶的大小减小至少提供以下优势:简化克隆和载体装配;增加核酸酶在细胞中的表达水平;并减少在高度大小敏感的平台(诸如病毒(包括DNA或RNA病毒))表达蛋白质的挑战。
本文描述了CRISPR/CasX在植物基因组工程中的应用。如所证明的,并且作为一般方法,瞬时测试系统(诸如原生质体)可用于分析、验证和优化在游离和内源或转基因染色体靶标上的核酸酶活性。也可以在再生组织或生殖组织中进行修饰,从而能够生产经基因编辑的植物和植物系,用于基础研究和农业应用。
像其他核酸向导的核酸内切酶一样,CRISPR/CasX SSN通常至少需要两个组分才能在植物细胞中进行靶向诱变:5’磷酸化的单链向导RNA和CRISPR/CasX核酸内切酶蛋白。在一些实施方案中,还存在Cas1、Cas2和Cas4组分,如Burstein,D等人,“来自未培养微生物的CRISPR-Cas系统”自然(2017)542:237-241中所述的。对于靶向的编辑、插入或序列替换,还可以将编码所需序列变化的DNA模板提供给植物细胞,以通过NHEJ或HR修复途径来引入变化。成功的编辑事件最常见的检测是通过表型变化(诸如通过导致可见表型的基因敲除或基因导入)、基于PCR的方法(诸如通过富集PCR、PCR消化或T7EI或Surveyor核酸内切酶测定法)、或所靶向的下一代测序(NGS;也称为深度测序)进行检测。例如,转基因植物可以编码有缺陷的GUS:NPTII报道分子。同样,基于PCR的方法可用于确定基因组靶位点是否包含靶向突变或供体序列,和/或在供体的5'和3'端是否已发生精确重组。
CRISPR/CasX系统的一个优势是它在适合于植物和植物细胞生长和培养的温度下具有功能,所述温度诸如(例如)但不限于约20℃至约35℃,优选约23℃至约32℃,并且最优选约25℃至约28℃。
在一个方面,提供了一种用于修饰植物细胞中至少一个染色体基因或染色体外基因的表达的方法,该方法包括向细胞中引入:
(a)(i)成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)和反式激活的crRNA(tracrRNA),或(ii)嵌合的cr/tracrRNA杂合体(sgRNA),其中,crRNA或sgRNA靶向基因内或该基因编码的RNA分子内的序列;以及
(b)CRISPR/CasX核酸内切酶分子,其中所述CRISPR/CasX核酸内切酶能够在crRNA或sgRNA所靶向的序列处或附近引入双链断裂或单链断裂。
在一些实施方案中,CRISPR/CasX核酸内切酶分子能够在crRNA或sgRNA靶向的序列处或序列附近引入单链断裂。
在一些实施方案中,crRNA包含约23个核苷酸的重复序列和约20个核苷酸的间隔区序列,其中间隔区序列与靶核酸相互作用。在一些实施方案中,crRNA或tracrRNA或sgRNA包含非常规和/或修饰的核苷酸和/或包含非常规和/或修饰的主链化学成份。在一些实施方案中,crRNA或tracrRNA或sgRNA包含一种或多种修饰,该修饰选自由以下项构成的组:锁核酸(LNA)碱基、主链中的核苷酸间硫代磷酸酯键、2’-O-甲基RNA碱基、解锁核酸(UNA)碱基、5-甲基dC碱基、5-羟基丁炔-2’-脱氧尿苷碱基、5-硝基吲哚碱基、脱氧肌苷碱基、8-氮杂-7-脱氮鸟苷碱基、5’末端处的双脱氧-T、3’末端处的反向dT以及和3’末端处的双脱氧胞苷。
在一些实施方案中,将crRNA、tracrRNA或sgRNA作为编码所述RNA并与指导细胞中所述RNA产生的启动子可操作地连接的DNA分子引入细胞中。
在一些实施方案中,CRISPR/CasX核酸内切酶分子是δ变形菌(Deltaproteobacteria)核酸内切酶或其突变体或衍生物。CRISPR/CasX核酸内切酶分子包含SEQ ID No:1的氨基酸序列,与SEQ ID No:1具有至少85%的序列同一性的序列,与SEQID No:1具有至少90%的序列同一性的序列或与SEQ ID NO:1具有至少95%序列同一性的序列。
在一些实施方案中,CRISPR/CasX核酸内切酶分子是浮霉菌(Planctomycetes)核酸内切酶或其突变体或衍生物。CRISPR/CasX核酸内切酶分子包含SEQ ID No:2的氨基酸序列,与SEQ ID No:2具有至少85%的序列同一性的序列,与SEQ ID No:2具有至少90%的序列同一性的序列或与SEQ ID NO:2具有至少95%序列同一性的序列。
在一些实施方案中,CRISPR/CasX核酸内切酶分子被修饰以便在与其修饰前的最佳温度不同的温度下具有活性。修饰的CRISPR/CasX核酸内切酶分子可以在适合于植物或植物细胞的生长和培养的温度下具有活性。修饰的CRISPR/CasX核酸内切酶分子可以在约20℃至约35℃的温度下具有活性。修饰的CRISPR/CasX核酸内切酶分子可以在约23℃至约32℃的温度下具有活性。修饰的CRISPR/CasX核酸内切酶分子可以在约25℃至约28℃的温度下具有活性。
在一些实施方案中,CRISPR/CasX核酸内切酶分子作为DNA分子被递送至细胞,该DNA分子包含CRISPR/CasX核酸内切酶编码序列,该编码序列可操作地连接至指导所述CRISPR/CasX核酸内切酶在细胞中产生的启动子。DNA分子可以瞬时存在于细胞中。可以将DNA分子稳定地掺入到细胞或祖细胞的核或质体基因组序列中,从而提供CRISPR/CasX核酸内切酶分子的可遗传表达。可以将DNA分子稳定地掺入到细胞或祖细胞的叶绿体基因组中,从而提供CRISPR/CasX核酸内切酶分子的可遗传表达。在一些实施方案中,启动子选自由组成型启动子、诱导型启动子和细胞型特异性启动子或组织型特异性启动子构成的组。该启动子可以通过自杀外显子的选择性剪接来激活。
在一些实施方案中,CRISPR/CasX核酸内切酶分子作为编码所述CRISPR/CasX核酸内切酶的mRNA分子被递送至细胞。在一些实施方案中,CRISPR/CasX核酸内切酶分子作为蛋白质被递送至细胞。
在一些实施方案中,CRISPR/CasX核酸内切酶分子具有一个或多个定位信号、检测标签、检测报道分子和纯化标签。在一些实施方案中,CRISPR/CasX核酸内切酶分子包含一个或多个定位信号。CRISPR/CasX核酸内切酶分子可以包含至少一个具有酶活性的另外的蛋白质结构域。该额外的蛋白质结构域可以具有选自以下的酶活性:核酸外切酶、解旋酶,DNA双链断裂的修复、转录(共)活化物、转录(共)阻遏物、甲基化酶、脱甲基酶及其任意组合。
在一些实施方案中,该方法包括递送包含在引入细胞之前装载有crRNA/tracrRNA或sgRNA的CRISPR/CasX核酸内切酶分子的预组装复合物。
在一些实施方案中,通过选自由以下构成的组的方法将DNA或RNA递送至细胞:微粒轰击、聚乙二醇(PEG)介导的转化、电穿孔、花粉管介导的接合子的导入,以及由一种或多种细胞穿透肽(CPPs)介导的递送。DNA可以在T-DNA中递送至细胞。DNA的递送可以通过细菌介导的转化来进行。DNA的递送可以通过农杆菌或Ensifer进行。
在一些实施方案中,DNA或RNA通过病毒递送至细胞。该病毒可以是双生病毒或烟草脆裂病毒。
在一些实施方案中,植物是单子叶植物。在一些实施方案中,植物是双子叶植物。
在各种实施方案中,植物细胞来源于选自由以下的物种构成的组:大麦(Hordeumvulgare)、球茎大麦(Hordeum bulbusom)、双色高粱(Sorghum bicolor)、甘蔗(Saccharumofficinarium)、玉米(Zea mays)、谷子(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oriza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、黑麦(Secale cereale)、黑小麦(Triticale)、苹果(Malus domestica)、二穗短柄草(Brachypodium distachyon)、海滨大麦(Hordeum marinum)、节节麦(Aegilops tauschii)、Daucus glochidiatus、甜菜(Betavulgaris)、Daucus pusillus、Daucus muricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotiana sylvestris)、茸毛烟草(Nicotianatomentosiformis)、普通烟草(Nicotiana tabacum)、本氏烟草(Nicotiana benthamiana)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffeacanephora)、葡萄(Vitis vinifera)、Erythrante guttata、Genlisea aurea、黄瓜(Cucumis sativus)、桑树(Morus notabilis)、Arabidopsis arenosa、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、须弥芥(Crucihimalayahimalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamineflexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa pastoris)、小拟南芥(Olmarabidopsis pumila)、硬毛南芥(Arabis hirsute)、欧洲油菜(Brassicanapus)、甘蓝(Brassica oleracea)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncacea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicariasubsp.sativa)、柑桔(Citrus sinensis)、麻风树(Jatropha curcas)、毛果杨(Populustrichocarpa)、蒺藜苜蓿(Medicago truncatula)、Cicer yamashitae、野生鹰嘴豆(Cicerbijugum)、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、Cicer judaicum、木豆(Cajanus cajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolusvulgaris)、大豆(Glycine max)、棉属(Gossypium sp.)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏槿(Torenia fournieri)、洋葱(Allium cepa)、葱(Alliumfistulosum)、大蒜(Allium sativum)、向日葵(Helianthus annuus)、菊芋(Helianthustuberosus)和韭菜(Allium tuberosum),以及属于上述植物之一的任何品种或亚种。
在一些实施方案中,靶序列选自由以下项构成的组:乙酰乳酸合酶(ALS)基因、烯醇丙酮酸磷酸合酶基因(EPSPS)基因、雄性育性基因、雄性不育基因、雌性育性基因、雌性不育基因、雄性恢复基因、雌性恢复基因、与不育性状有关的基因、与生育性状有关的基因、与除草剂抗性有关的基因、与除草剂耐受性有关的基因、与真菌抗性有关的基因、与病毒抗性有关的基因、与昆虫抗性有关的基因抗性、与耐旱性有关的基因、与耐冷性有关的基因、与耐寒性相关的基因、与氮利用效率相关的基因、与磷利用效率相关的基因、与水分利用效率相关的基因和与作物或生物质产量相关的基因、以及这些基因的任何突变体。雄性不育基因可以选自由MS45、MS26和MSCA1构成的组。
在另一方面,提供了一种通过以上各方面或实施方案中的任一项的方法产生的植物细胞,以及源自该植物细胞的完整植物或其后代。
在另一方面,提供了一种组合物,该组合物包含:
(a)(i)成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)和反式激活的crRNA(tracrRNA),或
(ii)嵌合cr/tracrRNA杂合体(sgRNA),其中crRNA或sgRNA靶向染色体植物基因序列或染色体外植物基因序列或由所述基因编码的RNA分子内;和/或
(b)CRISPR/CasX核酸内切酶分子,其中CRISPR/CasX核酸内切酶能够在适合于植物或植物细胞生长和培养的温度下,在crRNA或sgRNA靶向的序列处或附近引入双链断裂或单链断裂。
在一些实施方案中,crRNA包含约23个核苷酸的重复序列和约20个核苷酸的间隔区序列;该间隔区序列与靶核酸相互作用。
在一些实施方案中,crRNA或tracrRNA或sgRNA包含非常规和/或修饰的核苷酸和/或包含非常规和/或修饰的主链化学成份。crRNA、tracrRNA或sgRNA可以包含一个或多个修饰,该修饰选自由以下项构成的组:锁核酸(LNA)碱基、主链中的核苷酸间硫代磷酸酯键、2’-O-甲基RNA碱基、解锁核酸(UNA)碱基、5-甲基dC碱基、5-羟基丁炔-2’-脱氧尿苷碱基、5-硝基吲哚碱基、脱氧肌苷碱基、8-氮杂-7-脱氮鸟嘌呤碱基、5’末端处的双脱氧-T、3’末端处的反向dT、3’末端处的双脱氧胞苷。
在一些实施方案中,CRISPR/CasX核酸内切酶分子是δ变形菌(Deltaproteobacteria)核酸内切酶或其突变体或衍生物。CRISPR/CasX核酸内切酶分子包含SEQ ID No:1的氨基酸序列,与SEQ ID No:1具有至少85%的序列同一性的序列,与SEQID No:1具有至少90%的序列同一性的序列或与SEQ ID NO:1具有至少95%序列同一性的序列。
在一些实施方案中,CRISPR/CasX核酸内切酶分子是Planctomycetes核酸内切酶或其突变体或衍生物。CRISPR/CasX核酸内切酶分子包含SEQ ID No:2的氨基酸序列,与SEQID No:2具有至少85%的序列同一性的序列,与SEQ ID No:2具有至少90%的序列同一性的序列或与SEQ ID NO:2具有至少95%序列同一性的序列。
在一些实施方案中,CRISPR/CasX核酸内切酶分子被修饰以便在与其修饰前的最佳温度不同的温度下具有活性。修饰的CRISPR/CasX核酸内切酶分子可以在适合于植物或植物细胞的生长和培养的温度下具有活性。修饰的CRISPR/CasX核酸内切酶分子可以在约20℃至约35℃的温度下具有活性。修饰的CRISPR/CasX核酸内切酶分子可以在约23℃至约32℃的温度下具有活性。修饰的CRISPR/CasX核酸内切酶分子可以在约25℃至约28℃的温度下具有活性。
在一些实施方案中,CRISPR/CasX核酸内切酶分子包含一种或多种选自由定位信号、检测标签、检测报道分子和纯化标签构成的组的元件。在一些实施方案中,CRISPR/CasX核酸内切酶分子被修饰为表达切口酶活性或具有核酸靶向活性而没有任何切口酶或核酸内切酶活性。
在一些实施方案中,CRISPR/CasX核酸内切酶分子包含至少一个具有酶活性的另外的蛋白质结构域。该至少一个另外的蛋白质结构域可具有选自由以下项构成的组的酶活性:核酸外切酶、解旋酶、DNA双链断裂的修复、转录(共)活化物、转录(共)阻遏物、甲基化酶、脱甲基酶和任意其组合。
在一些实施方案中,靶序列选自由以下项构成的组的植物序列:乙酰乳酸合酶(ALS)基因、烯醇丙酮酸磷酸合酶基因(EPSPS)基因、雄性育性基因、雄性不育基因、雌性育性基因、雌性不育基因、雄性恢复基因、雌性恢复基因、与不育性状有关的基因、与生育性状有关的基因、与除草剂抗性有关的基因、与除草剂耐受性有关的基因、与真菌抗性有关的基因、与病毒抗性有关的基因、与昆虫抗性有关的基因抗性、与耐旱性有关的基因、与耐冷性有关的基因、与耐寒性相关的基因、与氮利用效率相关的基因、与磷利用效率相关的基因、与水利用效率相关的基因和与作物或生物质产量相关的基因、以及这些基因的任何突变体。雄性不育基因可以选自由MS45、MS26和MSCA1构成的组。
在一些实施方案中,植物是单子叶的。在一些实施方案中,植物是双子叶的。植物细胞可来源于选自由以下项构成的组的物种:大麦(Hordeum vulgare)、球茎大麦(Hordeumbulbusom)、双色高粱(Sorghum bicolor)、甘蔗(Saccharum officinarium)、玉米(Zeamays)、谷子(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oriza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、普通小麦(Triticumaestivum)、硬粒小麦(Triticum durum)、黑麦(Secale cereale)、黑小麦(Triticale)、苹果(Malus domestica)、二穗短柄草(Brachypodium distachyon)、海滨大麦(Hordeummarinum)、节节麦(Aegilops tauschii)、Daucus glochidiatus、甜菜(Beta vulgaris)、Daucus pusillus、Daucus muricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptusgrandis)、美花烟草(Nicotiana sylvestris)、茸毛烟草(Nicotiana tomentosiformis)、普通烟草(Nicotiana tabacum)、本氏烟草(Nicotiana benthamiana)、番茄(Solanumlycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffea canephora)、葡萄(Vitisvinifera)、Erythrante guttata、Genlisea aurea、黄瓜(Cucumis sativus)、桑树(Morusnotabilis)、Arabidopsis arenosa、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、须弥芥(Crucihimalaya himalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamine flexuosa)、北美独行菜(Lepidiumvirginicum)、荠菜(Capsella bursa pastoris)、小拟南芥(Olmarabidopsis pumila)、硬毛南芥(Arabis hirsute)、欧洲油菜(Brassica napus)、甘蓝(Brassica oleracea)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncacea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicaria subsp.sativa)、柑桔(Citrus sinensis)、麻风树(Jatropha curcas)、毛果杨(Populus trichocarpa)、蒺藜苜蓿(Medicagotruncatula)、Cicer yamashitae、野生鹰嘴豆(Cicer bijugum)、鹰嘴豆(Cicerarietinum)、Cicer reticulatum、Cicer judaicum、木豆(Cajanus cajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、棉属(Gossypium sp.)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏槿(Torenia fournieri)、洋葱(Allium cepa)、葱(Allium fistulosum)、大蒜(Alliumsativum)、向日葵(Helianthus annuus)、菊芋(Helianthus tuberosus)和韭菜(Alliumtuberosum),以及属于上述植物之一的任何品种或亚种。
在另一方面,提供了一种试剂盒,该试剂盒包括:(a)(i)成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)和反式激活的crRNA(tracrRNA),或(ii)嵌合的cr/tracrRNA杂合体(sgRNA),其中,crRNA或sgRNA靶向植物基因内或该基因编码的RNA分子内的序列;(b)CRISPR/CasX核酸内切酶分子,其中所述CRISPR/CasX核酸内切酶能够在适合于植物或植物细胞生长和培养的温度下,在crRNA或sgRNA靶向的序列处或其附近引入双链断裂或单链断裂,以及任选的(c)使用说明。
在另一方面,提供了一种试剂盒,该试剂盒包括:(a)(i)编码成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)和反式激活crRNA(tracrRNA)的核酸分子,或(ii)编码嵌合cr/tracrRNA杂合体的核酸分子(sgRNA),其中crRNA或sgRNA靶向植物基因内或由该基因编码的RNA分子内的序列;(b)编码CRISPR/CasX核酸内切酶分子的核酸分子,其中所述CRISPR/CasX核酸内切酶能够在适合于植物或植物细胞生长和培养的温度下,在crRNA或sgRNA靶向的序列处或其附近引入双链断裂或单链断裂,以及任选的(c)使用说明。
在另一方面,提供了一种试剂盒,该试剂盒包括:(a)(i)编码成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)的核酸分子和编码反式激活crRNA(tracrRNA)的核酸分子,或(ii)编码嵌合cr/tracrRNA杂合体的核酸分子(sgRNA),其中crRNA或sgRNA靶向植物基因内或由该基因编码的RNA分子内的序列;(b)编码CRISPR/CasX核酸内切酶分子的核酸分子,其中所述CRISPR/CasX核酸内切酶能够在适合于植物或植物细胞生长和培养的温度下,在crRNA或sgRNA靶向的序列处或其附近引入双链断裂或单链断裂,以及任选的(c)使用说明。
在另一方面,本发明提供了一种宿主细胞,该宿主细胞包含如任一前述方法中所述的CRISPR/CasX核酸内切酶,以及如任一前述方法中所述的至少一种靶向核酸的核酸。
在另一方面,本发明提供了一种载体,该载体包含核酸,其编码如任一前述方法中所述的CRISPR/CasX核酸内切酶和如任一前述方法中所述的至少一种靶向核酸的核酸。
在另一方面,本发明提供了一种用于在植物中治疗病害和/或病症和/或预防昆虫感染/侵染的方法,该方法包括通过使用任一前述方法来修饰所述植物的染色体或染色体外遗传物质。
可治疗的病害和/或病症的非限制性示例包括炭疽病茎腐病、曲霉穗腐病、普通玉米穗腐病、玉米穗病(不常见)、普通玉米锈病、二倍体穗腐病、二倍体茎腐病、霜霉病、眼斑病、镰刀菌穗腐病、镰刀菌茎腐病、赤霉素耳腐病、赤霉菌茎腐病、戈斯枯萎病和叶枯病、灰色叶斑病、丝黑穗病、北方玉米叶枯病、褐斑病、腐霉病、南方叶斑病、南方锈病和斯图尔特的细菌性枯萎病和枯萎病及其组合。
可直接或间接引起病害和/或病症的昆虫的非限制性示例包括粘虫、亚洲园林甲虫、小地老虎、棕纹蝽、褐臭蝽、普通茎螟、玉米臭虫、玉米穗虫、玉米叶蚜虫、玉米根虫、玉米根虫蚕丝、欧洲玉米螟、秋天粘虫、葡萄肖叶甲、啤酒花蛀虫、日本甲虫、秋季行军粘虫(Scouting for Fall Armyworm)、种子玉米甲虫、种子玉米蛆、南方玉米叶甲虫、西南玉米螟、红蜘蛛、甘蔗甲虫、西豆角虫、蛴螬和线虫及其组合。本发明的方法还适用于防止植物被任何此类昆虫感染和/或侵染。
在另一方面,本发明提供了一种影响植物中至少一个性状的方法,所述性状选自由以下项构成的组:不育性、育性、除草剂抗性、除草剂耐受性、真菌抗性、病毒抗性、昆虫抗性、干旱耐受性、耐冷性或耐寒性、氮利用效率、磷利用效率、水利用效率和作物或生物质产量,所述方法包括通过使用任何前述方法来修饰所述植物的染色体或染色体外遗传物质。
通过结合所附具体实施方式和权利要求阅读以下说明书,本发明的这些和其他目的、特征和优点将变得更加显而易见。
具体实施方式
为了便于对本发明各种实施方案的原理和特征的理解,下面解释各个例示性实施方案。尽管详细解释了本发明的示例性实施方案,但是应当理解,也可以设想出其他实施方案。因此,无意于将本发明的范围局限于以下具体实施方式或示例中阐述的部件的构造和布置的细节。本发明能够实施其他实施方案,并能够以各种方式实施或执行。另外,在描述示例性实施方案时,为了清楚起见,将采用特定术语。
还必须注意,如本说明书和所附权利要求书中所使用的,单数形式“一个”、“一种”和“该”包括复数引用,除非上下文另外明确指出。例如,对部件的引用也旨在包括多个部件的组合。对包含“一种”成分的组合物的引用旨在包括除所提及的成分之外的其他成分。换句话讲,术语“一个”、“一种”和“该”不表示数量的限制,而是表示所引用的项目存在“至少一个”。
同样,在描述示例性实施方案时,为了清楚起见将采用术语。旨在使每个术语都考虑到本领域技术人员所理解的最广泛的含义,并且包括以相似方式操作以实现相似目的的所有技术等同物。
范围在本文中可表示为从“约”或“大约”或“基本上”一个特定值和/或至“约”或“大约”或“基本上”另一特定值。当表达此类范围时,其他示例性实施方案包括从一个特定值和/或到另一特定值。此外,术语“约”是指在特定值的可接受误差范围内,如本领域普通技术人员所确定的那样,这将部分取决于如何测量或确定该值,即测量系统的局限性。例如,根据本领域的惯例,“约”可以表示在可接受的标准偏差内。可选地,“约”可以是指给定值的至多±20%、优选地至多±10%、更优选地至多±5%、并且更优选地至多±1%的范围。可选地,特别是关于生物系统或过程,该术语可以指在数值的一定数量级内,优选在数值的2倍内。在本申请和权利要求书中描述了特定值的情况下,除非另有说明,否则术语“约”是隐含的,并且在本上下文中表示该特定值在可接受的误差范围内。
类似地,如本文所用,“基本上不含”某物或“基本上纯的”以及类似特征可包括“至少基本上不含”某物或“至少基本上纯的”以及“完全不含”或“完全纯的”。
“包含”或“含有”或“包括”是指在组合物或制品或方法中至少存在指定的化合物、元素、颗粒或方法步骤,但不排除其他化合物、材料、颗粒、方法步骤,即使其他此类化合物、材料、颗粒、方法步骤具有与指定功能相同的功能。
在整个说明书中,可以识别出具有特定值或参数的各种组件,但是,这些项目被作为示例性实施方案提供。实际上,示例性实施方案不限制本发明的各个方面和概念,因为可以实现许多可比较的参数、大小、范围和/或数值。术语“第一”、“第二”等,“主要”、“次级”等不表示任何顺序、数量或重要性,而是用于将一个要素与另一个要素区分开来。
注意,如“具体地”、“优选地”、“典型地”、“大体地”和“通常地”的术语在本文中没有被用来限制所要求保护的发明的范围,或暗示某些特征对于所要求保护的发明的结构或功能是关键的、必要的或者甚至重要的。相反,这些术语仅旨在强调在本发明的特定实施方案中可以使用或可以不使用的替代或附加特征。还应注意,在本文中使用如“基本上”和“约”之类的术语来表示不确定性的固有程度,该不确定性可归因于任何定量比较结果、值、测量结果或其他表示法。
本文所公开的量纲和值不应理解为严格限于所述的精确数值。相反,除非另外指明,否则每个这样的量纲旨在表示所列举的值和围绕该值的功能上等效的范围。例如,公开为“50mm”的量纲旨在表示“约50mm”。
还应理解,提及一个或多个方法步骤并不排除在明确标识的那些步骤之间存在其他方法步骤或中间方法步骤。类似地,还应理解的是,在组合物中提及一种或多种组分并不排除存在与明确鉴定的组分之外的其它的组分。
在下文中描述的构成本发明的各种元件的材料旨在是例示性的而非限制性的。与本文所述的材料将执行相同或相似功能的许多合适的材料旨在包含在本发明的范围内。例如,本文中未描述的此类其他材料可以包括但不限于例如在本发明开发之后开发的材料。
根据本发明,可以采用本领域技术范围内的常规分子生物学、微生物学和重组DNA技术。文献中对这种技术进行了充分的解释。参见例如,Sambrook、Fritsch&Maniatis,分子克隆:实验手册,第二版(1989),冷泉港实验室出版社,纽约冷泉港(本文简称“Sambrook等人,1989”);DNA克隆:实用方法,第一卷和第二卷(D.N.Glover编辑1985);寡核苷酸合成(M.J.Gait编辑1984);核酸杂交(B.D.Hames&S.J.Higgins编辑(1985);转录和翻译(B.D.Hames&S.J.Higgins,编辑(1984);动物细胞培养(R.I.Freshney,编辑(1986);固定化细胞和酶(IRL Press,(1986);B.Perbal,分子克隆的实用指南(1984);F.M.Ausubel等人(编辑),分子生物学的当前协议,约翰威利父子公司(1994);等等。
定义
如本文所用,“核酸”是指多核苷酸,并且包括脱氧核糖核苷酸或核糖核苷酸碱基的单链聚合物或双链聚合物。核酸还可包括片段和修饰的核苷酸。因此,术语“多核苷酸”、“核酸序列”、“核苷酸序列”和“核酸片段”可互换使用,以表示单链或双链的RNA和/或DNA的聚合物,任选含有合成的,非天然或改变的核苷酸碱基。核苷酸(通常以其5’-单磷酸形式存在)用其单字母名称表示如下:“A”代表腺苷或脱氧腺苷(分别代表RNA或DNA);“C”代表胞嘧啶或脱氧胞嘧啶;“G”代表鸟苷或脱氧鸟苷;“U”代表尿苷;“T”代表脱氧胸苷;“R”代表嘌呤(A或G);“Y”代表嘧啶(C或T);“K”代表G或T;“H”代表A或C或T;“I”代表肌苷;以及“N”代表任何核苷酸。核酸可包含核苷酸。核酸对于细胞可以是外源的或内源的。核酸可以存在于无细胞的环境中。核酸可以是基因或其片段。核酸可以是DNA。核酸可以是RNA。核酸可包含一种或多种类似物(例如,改变的主链、糖或核碱基)。类似物的一些非限制性示例包括:5-溴尿嘧啶、肽核酸、异种核酸、吗啉代、锁核酸、乙二醇核酸、苏糖核酸、双脱氧核苷酸、虫草素、7-脱氮-GTP、荧光团(例如与糖链接的若丹明或氟丁香)、含有硫醇的核苷酸、生物素联接的核苷酸、荧光碱基类似物、CpG岛、甲基7-鸟苷、甲基化的核苷酸、肌苷、硫代尿苷、假尿嘧啶、二氢尿苷、喹啉和怀俄苷。
如本文所用,术语“CRISPR/CasX”、“CasX”、“CasX核酸内切酶”和CRISPR/CasX核酸内切酶可以互换使用。CRISPR/CasX或CasX可以指CRISPR/CasX的任何修饰的(例如,缩短、突变、延长)多肽序列或同源物,包括变体、修饰、融合(如本文所定义)和/或酶失活形式的CRISPR/CasX。CRISPR/CasX可以进行密码子优化。CRISPR/CasX可以是CRISPR/CasX的密码子优化同源物。CRISPR/CasX可以是酶失活的、部分活性的、组成性活性的、完全活性的、诱导活性的、在不同温度下有活性的和/或更具活性的(例如,比蛋白质或多肽的野生型同源物更多)。在一些情况下,CRISPR/CasX(例如,变体、突变和/或酶失活性的CRISPR/CasX)可以靶向靶核酸。CRISPR/CasX可以与短的靶向核酸或向导核酸结合,从而为通过蛋白质的核酸内切酶活性裂解的靶核酸提供特异性。CRISPR/CasX可以单独提供,或可以以其与靶向核酸或向导核酸预先关联的复合物形式提供。在一些情况下,CRISPR/CasX可以是如本文所述的融合蛋白,例如与mNeonGreen融合的CRISPR/CasX。
如本文所用,术语“δ变形菌(Deltaproteobacteria)CRISPR/CasX”用于指从δ变形菌(Deltaproteobacteria)分离的适于基因组编辑的RNA向导的核酸内切酶。δ变形菌(Deltaproteobacteria)是革兰氏阴性细菌的一类,包括以下目和科:Syntrophorhabdaceae、蛭弧菌目(Bdellovibrionales)、噬菌弧菌科(Bacteriovoracaceae)、蛭弧菌科(Bdellovibrionaceae)、脱硫盒菌目(Desulfarculales)、脱硫盒菌科(Desulfarculaceae)、脱硫杆菌目(Desulfobacterales)、脱硫杆菌科(Desulfobacteraceae)、Desulfobulbaceae、Nitrospinaceae、脱硫弧菌目(Desulfovibrionales)、Desulfohalobiaceae、Desulfomicrobiaceae、Desulfonatronaceae、硫弧菌科(Desulfovibrionaceae)、硫还原菌目(Desulfurellales)、硫还原菌科(Desulfurellaceae)、除硫单胞菌目(Desulfuromonadales)、除硫单胞菌科(Desulfuromonadaceae)、地杆菌科(Geobacteraceae)、粘球菌目(Myxococcales)[粘细菌]、孢囊杆菌科(Cystobacteraceae)、粘液球菌科(Myxococcaceae)、Haliangiaceae、Kofleriaceae、侏囊菌科(Nannocystaceae)、Phaselicystidaceae、多囊粘菌科(Polyangiaceae)、互营杆菌目(Syntrophobacterales)、互营菌科(Syntrophaceae)、互营杆菌科(Syntrophobacteraceae)。
如本文所用,术语“浮霉菌(Planctomycetes)CRISPR/CasX”用于指从浮霉菌(Planctomycetes)目中分离的适合基因组编辑的RNA向导的核酸内切酶。浮霉菌(Planctomycetes)是水生细菌的门,该门包括Phycisphaerae和Planctomycetes纲。CRISPR/CasX可以由tracrRNA和crRNA向导。CRISPR/CasX可以由sgRNA(单向导RNA)向导,其中tracrRNA使用四环(tetraloop)连接到crRNA。crRNA的转录加工导致包含约23个重复序列核苷酸和20个相邻间隔区序列核苷酸,其中间隔区序列可与靶标DNA的特定序列杂交,并能有效地将CRISPR/CasX向导至靶标DNA的特定序列。参见Burstein等人,来自未培养微生物的新型CRISPR-Cas系统。Nature(2017)542(7640):237-241作进一步描述,特别是图3e和第239页右栏。
在一些实施方案中,序列TTCN位于质粒靶标中的前间区序列的5’。在一些实施方案中,序列TTCA位于质粒靶标中的前间区序列的5’。
CRISPR/CasX在装载有向导RNA时,有效地产生位点特异性的DNA双链断裂。CRISPR/CasX在适合植物基因组工程的温度下具有活性。CRISPR/CasX的示例性氨基酸序列在本文中以SEQ ID NO:1-3提供。CRISPR/CasX在还适合于植物和植物细胞的生长和培养的温度范围内起作用,诸如但不限于,约20℃至约35℃,优选约23℃至约32℃,最优选约25℃至约28℃。CRISPR/CasX可用于本文所述的任何实施方案中。
如本文所用,“间隔区”、“靶向核酸的核酸”或“靶向核酸的向导核酸”或“向导-RNA”可互换使用,并且可以指可结合本公开的CRISPR/CasX蛋白并与靶核酸杂交的核酸。靶向核酸的核酸可以是RNA,包括但不限于一种或多种单链RNA。CRISPR/CasX可以由tracrRNA和crRNA向导。CRISPR/CasX可以由sgRNA(单向导RNA)向导,其中tracrRNA使用四环连接到crRNA。crRNA的转录加工可导致包含约23个核苷酸的重复序列,以及20个核苷酸的相邻间隔区序列。
靶向核酸的核酸可以位点特异性结合靶核酸。靶向核酸的核酸的一部分可以与靶核酸的一部分互补。靶向核酸的核酸可包含可称为“核酸靶向片段”的片段。靶向核酸的核酸可包含可称为“蛋白质结合片段”的片段。核酸靶向片段和蛋白质结合片段可以是靶向核酸的核酸的相同片段。靶向核酸的核酸可以包含修饰的核苷酸,修饰的主链或两者。靶向核酸的核酸可以包含肽核酸(PNA)。
如本文所用,“供体多核苷酸”可以指在基因组工程、靶核酸工程或本公开的任何其他方法期间可以整合到位点的核酸。
如本文所用,“融合物”可以指包含一个或多个非天然序列(例如,部分)的蛋白质和/或核酸。融合物可以在修饰蛋白质的N-末端或C-末端处,或两者处。融合物可以是转录和/或翻译融合。融合物可以包含一个或多个相同的非天然序列。融合物可以包含一个或多个不同的非天然序列。融合物可以是嵌合体。融合物可包含核酸亲和标签。融合物可包含条形码。融合物可包含肽亲和标签。融合物可提供CRISPR/CasX的亚细胞定位(例如,用于靶向核的核定位信号(NLS)、用于靶向线粒体的线粒体定位信号、用于靶向叶绿体的叶绿体定位信号、内质网状(ER)保留信号等)。融合物可提供可用于追踪或纯化的非天然序列(例如亲和标签)。融合物可以是小分子,诸如生物素,也可以是染料、诸如染料、Cyanine3染料、Cyanine5染料。融合物可以提供增加或降低的稳定性。在一些实施方案中,融合物可包含可检测标记(包括可提供可检测信号的部分)。可以提供可检测信号的合适的可检测标记和/或部分可以包括但不限于酶、放射性同位素、特异性结合对的成员;荧光团;荧光报道分子或荧光蛋白;量子点;等等。融合物可包含FRET对的成员,或荧光团/量子点供体/受体对。融合物可包含酶。合适的酶可包括但不限于辣根过氧化物酶、萤光素酶、β-半乳糖苷酶等。融合物可包含荧光蛋白。合适的荧光蛋白可包括但不限于绿色荧光蛋白(GFP)(例如,来自维多利亚水母的GFP、来自日本鳗鲡的荧光蛋白或其突变体或衍生物)、红色荧光蛋白、黄色荧光蛋白、黄绿色荧光蛋白(例如,来源于四聚体荧光蛋白中的mNeonGreen,该四聚体荧光蛋白来自头索动物文昌鱼(Branchiostoma lanceolatum))多种荧光和有色蛋白中的任何一种。融合物可包含纳米颗粒。合适的纳米颗粒可包括荧光或发光纳米颗粒、以及磁性纳米颗粒。纳米颗粒的任何光学或磁性或特性可被检测。
融合物可包含解旋酶、核酸酶(例如FokI)、核酸内切酶、核酸外切酶(例如5’核酸外切酶和/或3’核酸外切酶)、连接酶、切口酶、核酸酶解旋酶(例如Cas3)、DNA甲基转移酶(例如Dam)、或DNA脱甲基酶、组蛋白甲基转移酶、组蛋白脱甲基酶、乙酰酶(包括例如但不限于组蛋白乙酰化酶)、脱乙酰基酶(包括例如但不限于组蛋白脱乙酰基酶)、磷酸酶、激酶、转录(共)激活物、转录(共)因子、RNA聚合酶亚基、转录阻遏物、DNA结合蛋白、DNA结构蛋白、长非编码RNA、DNA修复蛋白(例如,涉及修复单链和/或双链断裂的蛋白,例如参与碱基切除修复的蛋白质,核苷酸切除修复、错配修复、NHEJ、HR、微同源介导的末端连接(MMEJ)和/或其他非同源末端连接(ANHEJ),诸如但不限于,HR调节器和HR复杂装配信号)、标记蛋白、报道蛋白、荧光蛋白、配体结合蛋白(例如mCherry或重金属结合蛋白)、信号肽(例如Tat信号序列)、靶向蛋白或肽、亚细胞定位序列(例如核定位序列、叶绿体定位序列)和/或抗体表位、或其任何组合。
如本文所用,“基因组工程”可以指修饰靶核酸的过程。基因组工程可以指将非天然核酸整合到天然核酸中。基因组工程可以指将CRISPR/CasX和靶向核酸的核酸靶向靶核酸。基因组工程可以指靶核酸的裂解和靶核酸的重新连接而在靶核酸中没有外源序列的整合或靶核酸中的缺失。天然核酸可以包含基因。非天然核酸可包含供体多核苷酸。核酸内切酶可以在所需的基因座(或基因位点)处产生靶向的DNA双链断裂,并且植物细胞可以使用供体多核苷酸修复双链断裂,从而将修饰稳定地并入到植物基因组中。
在本公开的这些方法中,CRISPR/CasX蛋白或其复合物可在核酸(例如基因组DNA)中引入双链断裂。双链断裂可刺激细胞的内源性DNA修复途径(例如同源重组(HR)和/或非同源末端连接(NHEJ)或A-NHEJ(替代性非同源末端连接)。可以将外来、外源和/或替代核酸的突变、缺失、改变和整合引入双链DNA断裂的位点。
如本文所用,术语“分离的”可以指通过人工存在于其天然环境之外并且因此不是自然产物的核酸或多肽。分离的可以指基本纯的。分离的核酸或多肽可以纯化形式存在和/或可在非天然环境中存在,例如在转基因细胞中。
如本文所用,“非天然”可以指在天然核酸或蛋白质中未发现的核酸或多肽序列。非天然可以指亲和标签。非天然可以指融合物。非天然可以指包含突变、插入和/或缺失的天然存在的核酸或多肽序列。非天然序列可以表现出和/或编码如下的活性(例如酶活性、甲基转移酶活性、乙酰基转移酶活性、激酶活性、泛素化活性等),该活性也可以通过与非天然序列融合的核酸和/或多肽序列表现出来。非天然核酸或多肽序列可以通过基因工程与天然存在的核酸或多肽序列(或其变体)联接,以产生编码嵌合核酸和/或多肽的嵌合核酸和/或多肽序列。非天然序列可以指3'杂交延伸序列。
如本文所用,“核苷酸”通常可以指碱基糖磷酸酯的组合。核苷酸可包含合成核苷酸。核苷酸可包含合成核苷酸类似物。核苷酸可以是核酸序列的单体单元(例如脱氧核糖核酸(DNA)和核糖核酸(RNA))。术语核苷酸可包括核糖核苷三磷酸腺苷三磷酸(ATP)、尿苷三磷酸(UTP)、胞嘧啶三磷酸(CTP)、鸟苷三磷酸(GTP)和脱氧核糖核苷三磷酸,诸如dATP、dCTP、dITP、dUTP、dGTP、dTTP或其衍生物。此类衍生物可包括,例如但不限于,[αS]dATP、7-脱氮-dGTP和7-脱氮-dATP、以及在包含它们的核酸分子上赋予核酸酶抗性的核苷酸衍生物。本文所用的术语核苷酸可以指双脱氧核糖核苷三磷酸(ddNTP)及其衍生物。双脱氧核糖核苷三磷酸的说明性示例可包括但不限于ddATP、ddCTP、ddGTP、ddITP和ddTTP。核苷酸可以是未标记的,也可以通过众所周知的技术可检测地标记。标记也可以用量子点进行。可检测的标记可包括例如放射性同位素、荧光标记、化学发光标记、生物发光标记和酶标记。核苷酸的荧光标记可包括但不限于荧光素、5-羧基荧光素(FAM)、2’7’-二甲氧基-4’5-二氯-6-羧基荧光素(JOE)、若丹明、6-羧基若丹明(R6G)、N,N,N',N’-四甲基6-羧基若丹明(TAMRA)、6-羧基-X-若丹明(ROX)、4-(4’二甲基氨基苯基偶氮)苯甲酸(DABCYL)、Cascade蓝、俄勒冈绿、德克萨斯红、花菁和5-(2’-氨基乙基)氨基萘-1-磺酸(EDANS)。
如本文所用,“重组”可指源自特定宿主(例如细胞)外源的序列,或如果源自相同来源,则从其原始形式修饰的序列。细胞中的重组核酸可包括特定细胞内源的核酸,但是已经通过例如使用定点诱变进行了修饰。术语“重组”可包括天然存在的DNA序列的非天然存在的多个拷贝。因此,术语“重组”可指与细胞是异源或异源的核酸,或与细胞同源但在细胞内通常找不到该核酸的位置或形式的核酸。类似地,当在多肽或氨基酸序列的上下文中使用时,外源多肽或氨基酸序列可以是源自特定细胞外源的多肽或氨基酸序列,或者如果源自相同来源,则从其原始形式修饰的多肽或氨基酸序列。
如本文所用,术语“特异性”可指两个分子的相互作用,其中该分子之一通过例如化学或物理手段特异性地与第二分子结合。示例性的特异性结合相互作用可指抗原-抗体结合、抗生物素蛋白-生物素结合、碳水化合物和凝集素、互补核酸序列(例如杂交)、互补肽序列(包括通过重组方法形成的肽序列)、效应子和受体分子、酶辅因子和酶、酶抑制剂和酶等。“非特异性”可指两个分子之间的非特异性相互作用。
如本文所用,“靶核酸”或“靶位点”通常可指本公开的方法中要靶向的靶核酸。靶核酸可指核染色体/基因组序列或染色体外序列(例如附加型序列、小环序列、线粒体序列、叶绿体序列、原生质体序列、质体序列等),靶核酸可以是DNA。靶核酸可以是单链DNA。靶核酸可以是双链DNA。靶核酸可以是单链或双链RNA。靶核酸在本文中可以与“靶核苷酸序列”和/或“靶多核苷酸”互换使用。
如本文所用,在核酸或多肽序列的上下文中,“序列同一性”或“同一性”是指当在指定的比较窗口上进行最大对应性比对时,两个序列中的相同的核酸碱基或氨基酸残基。
如本文所用,术语“序列同一性百分比”是指通过在比较窗口上比较两个最佳比对的序列而确定的值,其中比较窗口中的多核苷酸或多肽序列的一部分与参考序列(不包含添加或缺失)相比可包括添加或缺失(即缺口),以用于两个序列的最佳比对。通过确定两个序列中出现同一核酸碱基或氨基酸残基的位置数以得出匹配位置数,将匹配位置数除以比较窗口中的位置总数来计算百分比,并将结果乘以100以得出序列同一性的百分比。百分比序列同一性的有用示例包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%或95%或50%至100%的任何整数百分比。
如本文所用,术语“植物”是指整株植物、植物器官、植物组织、种子、植物细胞、种子及其后代。植物细胞包括但不限于来自以下的细胞:种子、悬浮培养物、胚胎、受精卵、分生组织区域、愈伤组织、叶、根、芽、配子体、原生质体、质体、孢子体、花粉和小孢子。植物部位包括分化和未分化的组织,该组织包括但不限于根、茎、枝、叶、花粉、种子、花、人类和/或其他哺乳动物可食用的部分(例如稻米、玉米棒,块茎)、肿瘤组织以及各种形式的细胞和培养物(例如单细胞、原生质体、质体、胚胎、受精卵和愈伤组织)。
“植物组织”涵盖植物细胞,并且可以在植物中或在植物器官,组织或细胞培养物中。植物组织还指此类植物、种子、后代、繁殖体的任何克隆,无论是有性或无性繁殖的,以及其中任何一种的后代,诸如插条或种子。术语“植物器官”是指构成植物的形态和功能上不同的部分的植物组织或一组组织。术语“基因组”是指存在于生物体、病毒或细胞器的每个细胞中的遗传物质(基因和非编码序列)的完整补充;和/或从一个亲本作为(单倍体)单元继承的完整染色体组。“后代”包括植物的任何后续世代。
如本文所用,术语“转基因植物”包括:例如在其基因组中包含通过转化步骤引入的异源多核苷酸的植物。异源多核苷酸可以稳定地整合在基因组内,从而使多核苷酸传递给相继的世代。异源多核苷酸可单独或作为重组DNA构建体的一部分整合到基因组中。转基因植物还可以在其基因组内包含一个以上的异源多核苷酸。每个异源多核苷酸可赋予转基因植物不同的性状。异源多核苷酸可包括源自外来物种的序列,或者如果源自相同物种,则可从其天然形式进行实质上修饰。转基因可包括任何细胞、细胞系、愈伤组织、组织、植物部位或植物,其基因型已因异源核酸的存在而改变,包括最初如此改变的转基因以及由最初转基因的有性杂交或无性繁殖产生的转基因。通过常规植物育种方法,通过本文所述的不导致外源多核苷酸插入的基因组编辑程序,或通过自然发生的事件(诸如随机交叉受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变)来改变基因组(染色体或染色体外)不被认为是转基因的。
在本公开的某些实施方案中,可育植物是产生存活的雄配子和雌配子并且是自育(self-fertile)的植物。此类自育植物可产生后代植物,而没有任何其他配子和配子中含有的遗传物质的贡献。本公开的其他实施方案可涉及使用不自育的植物,因为该植物不产生存活或以其他方式能够受精的雄配子或雌配子或两者。如本文所用,“雄性不育植物”是不产生存活或以其他方式能够受精的雄配子的植物。如本文所用,“雌性不育植物”是不产生有存活或以其他方式能够受精的雌配子的植物。人们认识到,雄性不育植物和雌性不育植物可以分别是雌性可育的和雄性可育的。进一步认识到,雄性可育(但雌性不育)植物与雌性可育植物杂交时可产生存活的子代,而雌性可育(但雄性不育)植物与雄性可育植物杂交时可产生存活的子代。
如本文所用,术语“质粒”、“载体”和“盒”是指染色体外元件,该元件通常携带不属于细胞中心代谢部分的基因,并且通常是以双链DNA的形式。此类元件可以是以源自任何来源的单链或双链DNA或RNA的线性或环状形式的自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其中多个核苷酸序列已经连接或重组成能够将目的多核苷酸引入细胞的独特结构。“转化盒”是指包含基因并且除该基因外还具有促进特定宿主细胞转化的元件的指定载体。“表达盒”是指包含基因并且除该基因之外还具有允许该基因在宿主中表达的元件的指定载体。
用于稳定整合到植物细胞的基因组中的表达盒可包含一种或多种以下元件:可用于在植物细胞中表达RNA和/或CasX酶的启动子元件;增强表达的5’非翻译区;内含子元件,以进一步增强某些细胞(诸如单子叶植物细胞)中的表达;多克隆位点,为插入向导RNA和/或CasX基因序列和其他所需元件提供方便的限制性位点;3’非翻译区,以提供有效终止表达的转录物。
术语“重组DNA分子”、“重组构建体”、“表达构建体”、“构建体”、“构建体”和“重组DNA构建体”在本文可互换使用。重组构建体包含核酸片段的人工组合,例如在自然界中并非全部一起发现的调节和编码序列。例如,构建体可包含源自不同来源的调节序列和编码序列,或源自相同来源但以与自然界发现的不同方式排列的调节序列和编码序列。此类构建体可以单独使用或与载体结合使用。如果使用载体,则载体的选择取决于本领域技术人员众所周知的将用于转化宿主细胞的方法。例如,可以使用质粒载体。T7载体(pSF-T7)可用于允许产生带帽RNA,以用于转染到细胞中。技术人员充分了解为了成功转化、选择和繁殖宿主细胞,载体上必须存在遗传元件。技术人员还将认识到,不同的独立转化事件可能导致不同的表达水平和模式(Jones等人,(1985)EMBO J 4:241 1-2418;De Almeida等人,(1989)分子遗传学218:78-86),因此通常筛选多个事件,以获得显示所需表达水平和模式的品系。此类筛选可通过标准的分子生物学、生化和其他测定来完成,这些测定包括DNA的Southern分析、mRNA表达的Northern分析、PCR、实时定量PCR(qPCR)、逆转录PCR(RT-PCR)、蛋白质表达的免疫印迹分析、酶或活性测定和/或表型分析。其他技术(诸如S1 RNase保护、引物延伸、原位杂交、酶染色和免疫染色)也可用于检测多肽和/或多核苷酸的存在或表达。
如本文所用,术语“表达”是指前体或成熟形式的功能性终产物(例如,mRNA、向导RNA或蛋白质)的产生。
如本文所用,术语“引入”是指向细胞内提供核酸(例如表达构建体)或蛋白质。“引入”包括提及将核酸掺入到真核或原核细胞中,其中核酸可掺入到细胞的基因组中,并且“引入”包括提及向细胞瞬时提供核酸或蛋白质。“引入”包括提及稳定或瞬时转化方法以及有性杂交。因此,在将核酸片段(例如重组DNA构建体/表达构建体)插入细胞中的上下文中的“引入”是指“转染”或“转化”或“转导”,并包括将核酸片段掺入真核或原核细胞,其中核酸片段可掺入细胞基因组(例如,核染色体、质粒、质体、叶绿体或线粒体DNA),转化为自主复制子、或瞬时表达(例如,转染的mRNA)。
如本文所用,术语“成熟”蛋白是指翻译后经加工的多肽(即,已去除存在于初级翻译产物中的任何前肽原或前肽的多肽)。“前体”蛋白是指mRNA翻译的主要产物(即,前肽原和前肽仍然存在)。前肽原和前肽可以是但不限于细胞内定位信号。
如本文所用,术语“稳定转化”是指核酸片段转移到宿主生物的基因组中,“稳定转化”包括核基因组和细胞器基因组,导致遗传学上稳定的遗传。相反,“瞬时转化”是指核酸片段转移到宿主生物的核或其他含DNA的细胞器中,导致基因表达而没有整合或稳定的遗传。包含转化的核酸片段的宿主生物被称为“转基因”生物。基因改良种质的商业开发也已进入将多种性状引入农作物的阶段,通常被称为基因叠加法。用这种方法,可以将赋予不同目的特性的多个基因导入植物中。基因叠加可以通过许多手段完成,其包括但不限于共转化、重转化以及与目的不同基因杂交的品系。
如本文所用,术语“经杂交”或“杂交”或“杂交中”是指配子通过授粉融合以产生后代(即细胞、种子或植物)。该术语包括有性杂交(一种植物对另一种植物的授粉)和自交(自花授粉,即当花粉和胚珠(或小孢子和大孢子)来自同一植物或遗传上相同的植物)。
如本文所用,术语“基因渗入”是指遗传基因座的所需等位基因从一个遗传背景向另一遗传背景的传递。例如,所需等位基因在指定基因座处的基因渗入可以通过两个亲本植物之间的有性杂交传递给至少一种后代植物,其中至少一种亲本植物在其基因组内具有所需的等位基因。或者,例如,等位基因的传递可通过两个供体基因组之间的重组发生,例如在融合的原生质体中,其中至少一个供体原生质体在其基因组中具有所需的等位基因。所需的等位基因可以是例如转基因、修饰的(突变或编辑的)天然等位基因,或标记物或QTL的选定等位基因。
如本文所用,术语“杂交”是指在常规条件下杂交,如Sambrook等人,(1989)所述,优选是在严格的条件下进行。严格的杂交条件是例如但不限于:在65℃下的4×SSC中杂交。然后在65℃下的0.1×SSC中多次洗涤,持续共约一个小时。较不严格的杂交条件是例如但不限于:在37℃下的4×SSC中杂交,然后在室温下的1×SSC中多次洗涤。“严格杂交条件”也可以是例如但不限于:在68℃下杂交。在0.25M磷酸钠、pH 7.2、7%SDS、1mM EDTA和1%BSA中溶解16小时,然后在68℃下用2×SSC和0.1%SDS洗涤两次。
本发明的CRISPR/CasX核酸内切酶
CRISPR/CasX可能会在靶核酸(例如基因组DNA)中引入双链断裂。双链断裂可以刺激细胞的内源性DNA修复途径(例如HR、NHEJ、A-NHEJ或MMEJ)。NHEJ可以修复裂解的靶核酸,而无需同源模板。这可导致靶核酸的缺失。同源重组(HR)可以用同源模板发生。同源模板可包含与靶核酸裂解位点侧翼的序列同源的序列。在靶核酸被CRISPR/CasX裂解后,裂解位点可以被破坏(例如,该位点可能无法用原始的靶向核酸的核酸和CRISPR/CasX进行另一轮裂解)。
CRISPR/CasX可包含核酸结合结构域。核酸结合结构域可包含接触核酸的区域。核酸结合结构域可包含核酸。核酸结合结构域可包含蛋白质物质。核酸结合结构域可包含核酸和蛋白质物质。核酸结合结构域可包含DNA。核酸结合结构域可包含单链DNA。核酸结合结构域的示例可包括但不限于:螺旋-转-螺旋结构域、锌指结构域、亮氨酸拉链(bZIP)结构域、有翼的螺旋结构域、有翼的螺旋转螺旋结构域、螺旋-环-螺旋结构域、HMG-box结构域、Wor3结构域、免疫球蛋白结构域、B3结构域和TALE结构域。核酸结合结构域可以是CRISPR/CasX蛋白的结构域。CRISPR/CasX蛋白可以是真核CRISPR/CasX或原核CRISPR/CasX。CRISPR/CasX蛋白可结合RNA或DNA,也可结合RNA和DNA。CRISPR/CasX蛋白可裂解RNA或DNA,或裂解RNA和DNA两者。在一些情况下,CRISPR/CasX蛋白结合DNA并裂解DNA。在一些情况下,CRISPR/CasX蛋白结合双链DNA并裂解双链DNA。在一些情况下,两个或更多个核酸结合结构域可以联接在一起。将多个核酸结合结构域联接在一起可以提供增加的多核苷酸靶向特异性。可以通过一个或多个接头联接两个或多个核酸结合结构域。该接头可以是柔性接头。接头长度可包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40或更多个氨基酸。接头结构域可包含甘氨酸和/或丝氨酸,并且在一些实施方案中可由甘氨酸和/或丝氨酸组成或可基本上由甘氨酸和/或丝氨酸组成。接头可以是可包含核苷酸的核酸接头。核酸接头可以将两个DNA结合结构域联接在一起。核酸接头的长度最多为5、10、15、20、25、30、35、40、45或50个或更多个核苷酸。核酸接头的长度可以是至少5、10、15、30、35、40、45或50或更多个核苷酸。
核酸结合结构域可以结合核酸序列。核酸结合结构域可以通过杂交与核酸结合。核酸结合结构域可以被工程化(例如,工程化以与基因组中的序列杂交)。可以通过分子克隆技术(例如,定向进化、位点特异性突变和合理诱变)来工程化核酸结合结构域。
CRISPR/CasX可包含核酸裂解结构域。核酸裂解结构域可以是来自任何核酸裂解蛋白的核酸裂解结构域。核酸裂解结构域可以源自核酸酶。合适的核酸裂解结构域包括核酸内切酶的核酸裂解结构域(例如AP核酸内切酶、RecBCD核酸内切酶、T7核酸内切酶、T4核酸内切酶IV、Bal 31核酸内切酶、核酸内切酶I(内切I)、微球菌核酸酶、核酸内切酶II(内切VI、外切核酸酶)、外切核酸酶、限制性核酸酶、内切核糖核酸酶、外切核糖核酸酶、RNA酶(例如,RNA酶I、RNA酶II或RNA酶III)。核酸结合结构域可以是CRISPR/CasX蛋白的结构域。CRISPR/CasX蛋白可以是真核CRISPR/CasX或原核CRISPR/CasX。CRISPR/CasX蛋白可结合RNA或DNA,或结合RNA和DNA两者。CRISPR/CasX蛋白可裂解RNA或DNA,或裂解RNA和DNA两者。在一些情况下,CRISPR/CasX蛋白结合DNA并裂解DNA。在一些情况下,CRISPR/CasX蛋白结合双链DNA并裂解双链DNA。在一些情况下,核酸裂解结构域可以源自FokI核酸内切酶。CRISPR/CasX可包含多个核酸裂解结构域。核酸裂解结构域可以联接在一起。可以通过接头将两个或更多个核酸裂解域联接。在一些实施方案中,该接头可以是如本文所述的柔性接头。接头长度可包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40或更多个氨基酸。在一些实施方案中,CRISPR/CasX可包含多个核酸裂解结构域。
CRISPR/CasX可以在核酸(例如基因组DNA)中引入双链断裂。双链断裂可刺激细胞的内源性DNA修复途径(例如同源重组和非同源末端连接(NHEJ)或另选的非同源末端连接(A-NHEJ))。NHEJ可以修复裂解的靶核酸,而无需同源模板。这可导致靶核酸的缺失。同源重组(HR)可以用同源模板发生。同源模板可包含与靶核酸裂解位点侧翼的序列同源的序列。在靶核酸被CRISPR/CasX裂解后,裂解位点可以被破坏(例如,该位点可能无法用原始的靶向核酸的核酸和CRISPR/CasX进行另一轮裂解)。
在一些情况下,同源重组可将外源多核苷酸序列插入靶核酸裂解位点。外源多核苷酸序列可称为供体多核苷酸。在本公开的方法的一些情况下,可以将供体多核苷酸、供体多核苷酸的一部分、供体多核苷酸的拷贝或供体多核苷酸的拷贝的一部分插入靶核酸裂解位点。供体多核苷酸可以是外源多核苷酸序列。供体多核苷酸可以是在靶核酸裂解位点天然不存在的序列。载体可包含供体多核苷酸。由于NHEJ和/或HR对靶DNA的修饰可导致例如突变、缺失、改变、整合、基因校正、基因替换、基因标记、转基因插入、核苷酸缺失、基因破坏和/或基因突变。将非天然核酸整合到基因组DNA中的过程可以称为基因组工程。
在一些情况下,CRISPR/CasX可包含与野生型示例性CRISPR/CasX(例如SEQ IDNO:1-2)具有至多10%、至多15%、至多20%、至多30%、至多40%、至多50%、至多60%、至多70%、至多75%、至多80%、至多85%、至多90%、至多95%、至多99%或100%的氨基酸序列同一性的氨基酸序列。
在一些情况下,CRISPR/CasX可包含与野生型示例性CRISPR/CasX(例如SEQ IDNO:1-2)具有至少10%、至少15%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或100%的氨基酸序列同一性的氨基酸序列。
在一些情况下,CRISPR/CasX可包含与野生型示例性CRISPR/CasX(例如SEQ IDNOS:1-2)的核酸酶结构域具有至多10%、至多15%、至多20%、至多30%、至多40%、至多50%、至多60%、至多70%、至多75%、至多80%、至多85%、至多90%、至多95%、至多99%或100%的氨基酸序列同一性的氨基酸序列。
本文公开的CRISPR/CasX蛋白可包含一种或多种修饰。该修饰可包括翻译后修饰。靶核酸的修饰可发生在离CRISPR/CasX蛋白羧基末端或氨基末端的至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或更多个氨基酸处。CRISPR/CasX蛋白的修饰可发生在离CRISPR/CasX蛋白羧基末端或氨基末端至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或更多个氨基酸处。该修饰可能由于编码CRISPR/CasX蛋白的核酸的修饰而发生。示例性的修饰可包括甲基化、脱甲基、乙酰化、脱乙酰基、泛素化、脱泛素化、脱氨基化、烷基化、脱嘌呤化、氧化、嘧啶二聚体形成、转座、重组、链伸长、连接、糖基化。磷酸化、去磷酸化、腺苷酸化、去腺苷酸化、SUMOylation、deSUMOylation、核糖基化、去核糖基化、肉豆蔻酰基化、重塑、裂解、氧化还原、水解和异构化。
CRISPR/CasX可包含野生型示例性CRISPR/CasX的修饰形式。野生型示例性CRISPR/CasX的修饰形式可包含降低CRISPR/CasX的核酸裂解活性的氨基酸变化(例如,缺失、插入或取代)。可选地,氨基酸变化可导致CRISPR/CasX的核酸裂解活性增加。可选地,氨基酸变化可导致CRISPR/CasX具有活性的温度的变化。
CRISPR/CasX蛋白可包含一个或多个突变。CRISPR/CasX蛋白可包含氨基酸修饰(例如,取代、缺失、添加等,及其组合)。CRISPR/CasX蛋白可包含一个或多个非天然序列(例如,如本文所定义的融合物)。氨基酸修饰可包含一个或多个非天然序列(例如,如本文定义的融合物、亲和标签)。氨基酸修饰可能基本上不改变核酸内切酶的活性。包含氨基酸修饰和/或融合的CRISPR/CasX可保留野生型CRISPR/CasX的至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约97%或100%的活性。本公开的修饰(例如,突变)可通过定点突变产生。突变可包括取代、添加和缺失或其任何组合。在一些情况下,该突变将突变的氨基酸转化为丙氨酸。在一些情况下,该突变将突变的氨基酸转化为另一个氨基酸(例如,甘氨酸、丝氨酸、苏氨酸、半胱氨酸、缬氨酸、亮氨酸、异亮氨酸、甲硫氨酸、脯氨酸、苯丙氨酸、酪氨酸、色氨酸、天冬氨酸、谷氨酸、天冬酰胺、谷氨酰胺、组氨酸、赖氨酸或精氨酸)。该突变可将突变的氨基酸转化为非天然氨基酸(例如硒代甲硫氨酸)。该突变可将突变的氨基酸转化为氨基酸模拟物(例如,磷酸化模拟物)。该突变可以是保守突变。例如,该突变可将突变的氨基酸转化为类似于突变氨基酸的大小、形状、电荷、极性、构象和/或旋转异构体的氨基酸(例如半胱氨酸/丝氨酸突变、赖氨酸/天冬酰胺突变、组氨酸/苯丙氨酸突变)。
在一些情况下,CRISPR/CasX可以靶向核酸。CRISPR/CasX可以靶向DNA。在一些情况下,CRISPR/CasX被修饰以表达切口酶活性。在一些情况下,将CRISPR/CasX修饰为靶向核酸,但是不具有酶活性(例如,不具有核酸内切酶或切口酶活性)。在一些情况下,对CRISPR/CasX进行修饰以表达以下一种或多种具有或不具有核酸内切酶活性的活性:切口酶、核酸外切酶、DNA修复(例如DNA DSB修复)、解旋酶、转录(共)激活、转录(共)抑制、甲基化酶和/或脱甲基酶。
在一些情况下,CRISPR/CasX在适合植物和植物细胞生长和培养的温度下具有活性,诸如但不限于约20℃至约35℃,优选约23℃至约32℃,最优选约25℃至约28℃。通过将DSB靶向整合的报道基因和内源基因座,可以在植物叶片组织中进行概念验证实验。然后,该技术可适用于原生质体和整个植物以及基于病毒的递送系统。最后,可以通过将DSB靶向同一基因组内的多个位点来证明多重基因组工程。
CRISPR/CasX可包含一个或多个非天然序列(例如,如本文所讨论的融合物)。在一些情况下,CRISPR/CasX的非天然序列包含可改变转录的部分。转录可增加或减少。转录可改变至少约1倍、2倍、3倍、4倍、5倍、10倍、15倍或20倍或更多。转录最多可改变约1倍、2倍、3倍、4倍、5倍、10倍、15倍或20倍或更多。该部分可以是转录因子。当CRISPR/CasX是包含可改变转录的非天然序列的融合CRISPR/CasX时,该融合CRISPR/CasX与野生型CRISPR/CasX相比,CRISPR/CasX可包含降低的酶活性。
作为非限制性示例,CRISPR/CasX可结合靶向核酸的核酸(例如,单链DNA、单链RNA),该靶向核酸的核酸将其向导至与靶向核酸的核酸互补的靶核酸,其中该靶核酸包含dsDNA(例如,质粒、基因组DNA等),从而在靶核酸中进行位点特异性裂解。
在本发明的一些实施方案中,这些方法和组合物包含来自δ变形菌(Deltaproteobacteria)细菌的CRISPR/CasX,并且所述方法和组合物在适合于植物和植物细胞的生长和培养的温度下使用,诸如但不限于约20℃至约35℃,优选约23℃至约32℃,最优选约25℃至约28℃。
在本发明的一些实施方案中,这些方法和组合物包含来自浮霉菌(Planctomycetes)细菌的CRISPR/CasX,并且所述方法和组合物在适合于植物和植物细胞生长和培养的温度下使用,诸如但不限于约20℃至约35℃,优选约23℃至约32℃,最优选约25℃至约28℃。
在本发明的一些实施方案中,CRISPR/CasX与靶向核酸的核酸分开提供。在其他实施方案中,以复合物的形式提供CRISPR/CasX,其中靶向核酸的核酸与CRISPR/CasX预先关联。
在本发明的一些实施方案中,将CRISPR/CasX作为表达盒的一部分提供在合适的载体上,该载体被配置用于在所需的宿主细胞(例如植物细胞或植物原生质体)中表达CRISPR/CasX。该载体可允许CRISPR/CasX的瞬时表达。可选地,该载体可允许表达盒和/或CRISPR/CasX稳定地保持在宿主细胞中,诸如但不限于,通过整合到宿主细胞基因组中,包括稳定整合到基因组中。在一些实施方案中,宿主细胞是祖细胞,从而提供了CRISPR/CasX的可遗传表达。包含在表达盒中的CRISPR/CasX可以是如下所述的异源多肽。
在其他实施方案中,CRISPR/CasX作为异源多肽单独提供,或作为转录或翻译融合物(与CRISPR/CasX的N末端和C末端结构域中的任一者或两者)提供,如本文所讨论的,具有一个或多个功能结构域,诸如但不限于定位信号(例如核定位信号、叶绿体定位信号)、表位标签、抗体和/或功能蛋白,诸如但不限于报道蛋白(例如,荧光报道蛋白,诸如mNeonGreen和GFP)、参与DNA断裂修复的蛋白(例如DNA DSB)、切口酶、解旋酶、核酸外切酶、转录(共)激活物、转录(共)阻遏物、甲基化酶和/或脱甲基酶。
示例性的定位信号可包括但不限于SV40核定位信号(Hicks等人,1993)。其他非经典类型的核定位信号也可适于与本文提供的方法一起使用,诸如hnRNP A1的酸性M9结构域或PY-NLS基序信号(Dormann等人,2012)。还可以掺入定位信号以允许核酸酶运输到其他亚细胞区室,诸如线粒体或叶绿体。将CasX组分靶向叶绿体可通过在表达构建体中掺入编码叶绿体转运肽(CTP)或质体转运肽的序列来实现,该序列可操作地连接到编码CasX蛋白的序列的5’区。
在其他实施方案中,CRISPR/CasX作为蛋白质提供。还在其他实施方案中,CRISPR/CasX作为核酸提供,诸如但不限于mRNA。
在任何上述实施方案中,可针对在植物中的表达优化CRISPR/CasX,包括但不限于植物优选的启动子、植物组织特异性启动子和/或植物优选的密码子优化,如本文更详细讨论的。
在任何上述实施方案中,CRISPR/CasX可作为与某些植物基因和/或性状相关的目的多核苷酸或多肽的融合物(例如,转录和/或翻译融合物)存在。此类植物基因和/或性状包括例如但不限于:乙酰乳酸合酶(ALS)基因、烯醇丙酮基莽草酸酯(enolpyruvylshikimate)磷酸合酶基因(EPSPS)基因、雄性育性基因(例如MS45、MS26或MSCA1)、除草剂抗性基因、雄性不育基因、雌性育性基因、雌性不育基因、雄性或雌性恢复基因、以及与不育、生育力、除草剂抗性、除草剂耐受性、非生物胁迫(诸如真菌抗性、病毒抗性)的性状相关的基因、或昆虫抗性、非生物胁迫(诸如干旱耐受性、耐冷性或耐寒性)、氮利用效率、磷利用效率、水分利用效率和作物或生物质产量(例如,作物或生物质产量的提高或降低)及此类基因突变体。此类突变体包括例如但不限于:氨基酸取代、缺失、插入、密码子优化和调节序列变化以改变基因表达谱。
本发明的靶向核酸的核酸(靶向核酸的向导核酸)
本文公开了靶向核酸的核酸(靶向核酸的向导核酸),该核酸可指导相关多肽(例如CRISPR/CasX蛋白,包括SEQ ID NO:1-2之一)的活性向导靶核酸内的指定靶序列。靶向核酸的核酸可包含核苷酸。靶向核酸的核酸可以是单链RNA(ssRNA)。
靶向核酸的核酸可包含一种或多种修饰(例如,碱基修饰、主链修饰),以提供具有新的或增强的特征(例如,改善的稳定性)的核酸。除了改善稳定性之外或独立于改善稳定性,一种或多种修饰可以以用户偏爱的方式改变靶向核酸的核酸的结合特异性(例如,对特定错配具有更大或更小的特异性或耐受性或缺乏耐受性)。无论是提高稳定性还是改变结合特异性或两者,一种或多种修饰都保留了靶向核酸的核酸与CRISPR/CasX和靶核酸两者相互作用的能力。靶向核酸的核酸可包含核酸亲和标签。核苷可以是碱基糖的组合。核苷的碱基部分可以是杂环碱基。此类杂环碱基的两种最常见的类别是嘌呤和嘧啶。核苷酸可以是核苷,核苷酸还包括与核苷的糖部分共价联接的磷酸基团。对于那些包括戊呋喃糖基糖的核苷,磷酸基团可以联接到糖的2’、3’或5’羟基部分。在形成靶向核酸的核酸时,磷酸基团可将相邻的核苷彼此共价联接以形成线性聚合化合物。进而,该线性聚合化合物的各自末端可以进一步连接以形成环状化合物;然而,线性化合物通常是合适的。另外,线性化合物可具有内部核苷酸碱基互补性,并且因此可以根据产生完全或部分双链化合物的方式折叠。在靶向核酸的核酸内,磷酸基团通常可被称为形成靶向核酸的核酸的核苷间主链。靶向核酸的核酸的键或主链可以是3’至5’磷酸二酯键。
靶向核酸的核酸可以是ssRNA。在一个优选的实施方案中,靶向核酸的核酸是短ssRNA。在一些实施方案中,ssRNA的长度为50个核苷酸或更少,长度优选为40个核苷酸或更少,长度最优选为30个核苷酸或更少。在一个特定优选的实施方案中,靶向核酸的核酸是长度为20、21、22、23、24、25、26、27、28、29或30个核苷酸的5’-磷酸化的ssRNA。
修饰的主链可包括在主链中保留磷原子的那些主链和在主链中不具有磷原子的那些主链。其中含有磷原子的合适修饰的靶向核酸的核酸主链可包括:例如硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基膦酸酯,诸如3’-亚烷基膦酸酯、5’-亚烷基膦酸酯、手性膦酸酯、次膦酸酯、包括3’-氨基氨基膦酸酯和氨基烷基膦酰胺酸酯的氨基磷酸酯、二氨基磷酸酯、硫代膦酸氨基酸酯、硫代烷基膦酸酯、硫代烷基磷酸三酯、硒代磷酸酯和硼酸酯磷酸酯、和具有正常的3’-5’连接、2’-5’连接类似物的硼烷磷酸酯、以及具有相反极性的硼烷磷酸酯,其中一个或多个核苷酸间键是3’至3’、5’至5’或2’至2’键。具有相反极性的合适靶向核酸的核酸可在3'最核苷酸间键处包含单个3’至3’键(即,其中核碱基缺失或具有羟基取代的单个反核苷残基)。也可以包括各种盐(例如氯化钾或氯化钠)、混合盐和游离酸形式。靶向核酸的核酸可包含一个或多个硫代磷酸酯和/或杂原子核苷间键。靶向核酸的核酸可包含吗啉代主链结构。例如,核酸可包含6-元吗啉代环取代核糖环。在这些实施方案的一些中,二氨基磷酸酯或其他非磷酸二酯核苷间键可取代磷酸二酯键。靶向核酸的核酸可包含多核苷酸主链,该主链由短链烷基或环烷基核苷间键、混合的杂原子和烷基或环烷基核苷间键或一个或多个短链杂原子或杂环核苷间键形成。这些主链可包括具有吗啉代键(部分由核苷的糖部分形成)的主链;硅氧烷主链;硫化物,亚砜和砜主链;形成乙酰基和硫代甲酰胺基主链;亚甲基甲酰基和硫代甲酰基主链;核糖乙酰基主链;含有烯烃的主链;氨基磺酸盐主链;亚甲基亚氨基和亚甲基肼基主链;磺酸盐和磺酰胺主链;酰胺主链;其他具有混合的N、O、S和CH2组成部分。
靶向核酸的核酸可包含核酸模拟物。术语“模拟物”可旨在包括多核苷酸中仅呋喃糖环或呋喃糖环和核苷酸间键都被非呋喃糖基团取代的多核苷酸,仅呋喃糖环的取代也可以称为糖替代物。可以保留杂环碱基部分或修饰的杂环碱基部分,以与适当的靶核酸杂交。一种此类核酸可以是肽核酸(PNA)。在PNA中,多核苷酸的糖-主链可以被含有酰胺的主链,特别是氨基乙基甘氨酸主链取代。核苷酸可保留并且直接或间接结合至主链酰胺部分的氮杂氮原子。PNA化合物中的主链可包含两个或多个连接的氨基乙基甘氨酸单元,该单元使PNA具有含酰胺的主链。杂环碱基部分可直接或间接结合到主链酰胺部分的氮杂氮原子上。
靶向核酸的核酸可包含连接的吗啉代单元(即吗啉代核酸),该单元具有附接到吗啉代环上的杂环碱基。联接基团可联接吗啉代核酸中的吗啉代单体单元。基于非离子吗啉代的寡聚化合物与细胞蛋白的相互作用可能较少。基于吗啉代的多核苷酸可以是靶向核酸的核酸的非离子模拟物。可以使用不同的联接基团连接吗啉代类中的各种化合物。另一类多核苷酸模拟物可称为环己烯基核酸(CeNA)。通常存在于核酸分子中的呋喃糖环可以被环己烯基环取代。可以制备CeNA DMT(二甲氧基三苯甲基)保护的亚磷酰胺单体,并使用亚磷酰胺化学方法用于低聚化合物的合成。将CeNA单体掺入核酸链可提高DNA/RNA杂合体的稳定性。CeNA寡腺苷酸可以与核酸补体形成复合物,该复合物稳定性与天然复合物相似。进一步的修饰可包括LNA,其中2’-羟基与糖环的4’碳原子键,从而形成2’-C、4’-C-甲醛键,从而形成双环糖部分。该键可以是亚甲基(-CH 2-),该亚甲基是桥接2’氧原子和4’碳原子的基团,其中n为1或2。LNA和LNA类似物可与互补核酸显示非常高的双链热稳定性(Tm=+3℃至+10℃),具有对3’-核酸外切酶降解的稳定性和良好的溶解性。
靶向核酸的核酸可包含一个或多个取代的糖部分。合适的多核苷酸可包含选自以下的糖取代基:OH;F;O-、S-或N-烷基;O-、S-或N-烯基;O-、S-或N-炔基;或O-烷基-O-烷基,其中所述烷基、烯基和炔基可以是取代或未取代的C1-C10烷基或C2-C10烯基和炔基。特别合适的是O((CH2)nO)mCH3、O(CH2)nOCH3、O(CH2)nNH2、O(CH2)nCH3、O(CH2)nONH2、和O(CH2)nON((CH2)nCH3)2,其中n和m为1至约10。糖取代基可选自:C1至C10低级烷基、取代的低级烷基、烯基、炔基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2、杂环烷基、杂环烷基芳基、氨基烷基氨基、聚烷基氨基、取代的甲硅烷基、RNA裂解基团、报道基团、嵌入剂、用于改善靶向核酸的核酸的药代动力学性质的基团、或用于改善药效学的基团靶向核酸的核酸的性质以及具有相似性质的其他取代基。合适的修饰可以包括2’-甲氧基乙氧基(2’-O-CH2CH2OCH3,也称为2’-O-(2-甲氧基乙基)或2’-MOE,即烷氧基烷氧基)。进一步合适的修饰可以包括2’-二甲基氨基乙氧基乙氧基(即,O(CH2)2ON(CH3)2基团,也称为2'-DMAOE)和2’-二甲基氨基乙氧基乙氧基(也称为2’-O-二甲基-氨基-乙氧基-乙基或2’-DMAEOE),即2’-O-CH2-O-CH2-N(CH3)2。其他合适的糖取代基可包括甲氧基(-O-CH3)、氨基丙氧基(-O CH2CH2CH2NH2)、烯丙基(-CH2-CH=C-)、-O-烯丙基(-O-CH2-CH=CH2)和氟(F)。2’-糖取代基可以在阿拉伯糖(上)位置或核糖(下)位置。合适的2’-阿拉伯糖基修饰是2’-F。还可以在寡聚化合物的其他位置,特别是在3’末端核苷上或在2’至5’联接的核苷酸中糖的3’位置和5’末端核苷酸的5’位置进行类似的修饰。寡聚化合物还可具有糖模拟物(诸如环丁基部分)取代戊呋喃糖基糖。
靶向核酸的核酸还可包括核碱基(通常简称为“碱基”)修饰或取代。如本文所用,“未修饰的”或“天然的”核碱基可包括嘌呤碱基(例如腺嘌呤(A)和鸟嘌呤(G))以及嘧啶碱基(例如胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U))。修饰的核碱基可包括其他合成和天然核碱基,诸如5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、6-甲基和腺嘌呤和鸟嘌呤的其他烷基衍生物、2-丙基以及腺嘌呤和鸟嘌呤的其他烷基衍生物、2-硫尿嘧啶、2-硫胸腺嘧啶和2-硫胞嘧啶、5-卤尿嘧啶和胞嘧啶、5-丙炔基(--C=C--CH3)尿嘧啶和胞嘧啶以及嘧啶碱基的其他炔基衍生物、6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶、8-卤代、8-氨基、8-硫醇、8-硫烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤、5-卤代(特别是5-溴代)、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶、7-甲基鸟嘌呤和7-甲基腺嘌呤、2-F-腺嘌呤、2-氨基腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-去氮杂鸟嘌呤和7-去氮杂腺嘌呤以及3-去氮杂鸟嘌呤和3-去氮杂腺嘌呤。修饰的核碱基可包括三环嘧啶,诸如吩恶嗪胞苷(1H-嘧啶(5,4-b)(1,4)苯并嗪-2(3H)-one)、吩噻嗪胞苷(1H-嘧啶(5,4-b)(1,4)苯并硫氮-2(3H)-one)、G-clamps(诸如取代的吩恶嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶(5,4-(b)(1,4)苯并恶嗪-2(3H)-one))、咔唑胞苷(2H-嘧啶(4,5-b)吲哚-2-one)、吡啶并吲哚胞苷(氢吡啶(3',2':4,5)吡咯并(2,3-d)嘧啶-2-one)。
杂环碱基部分可包括其中嘌呤或嘧啶碱基被其他杂环取代的那些部分,例如7-脱氮-腺嘌呤、7-脱氮鸟嘌呤、2-氨基吡啶和2-吡啶酮。核糖核酸酶可用于增加多核苷酸化合物的结合亲和力。这些核糖核酸酶可包括5-取代的嘧啶、6-氮杂嘧啶和N-2、N-6和O-6取代的嘌呤,包括2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶和5-丙炔基胞嘧啶。5-甲基胞嘧啶取代可以使核酸双链体稳定性提高0.6oC至1.2oC,并且可以是合适的碱基取代(例如,在与2’-O-甲氧基乙基糖修饰结合时)。
靶向核酸的核酸的修饰可包括将可增强靶向核酸的活性、细胞分布或细胞摄取的一个或多个部分或共轭物化学联接至靶向核酸的核酸。这些部分或共轭物可包括与官能团诸如伯羟基或仲羟基共价结合的共轭基团。共轭基团可包括但不限于嵌入剂、报道分子、多胺、聚酰胺、聚乙二醇、聚醚、增强低聚物的药代动力学性质的基团和可以增强低聚物的药代动力学性质的基团。共轭基团可包括但不限于胆固醇、脂质、磷脂、生物素、吩嗪、叶酸、菲啶、蒽醌、吖啶、荧光素、若丹明、香豆素和染料。增强药效学性质的基团包括改善摄取,增强对降解的抗性和/或加强与靶核酸的序列特异性杂交的基团。可以增强药代动力学性质的基团包括改善核酸吸收、分布、代谢或排泄的基团。共轭部分可包括但不限于脂质部分,诸如胆固醇部分、胆酸硫醚(例如,己基-S-三苯甲基硫醇)、硫代胆固醇、脂族链(例如十二烷二醇或十一烷基残基)、磷脂例如二十六烷基-rac-甘油或三乙基铵1,2-二-O-十六烷基-rac-甘油-3-H-膦酸盐)、多胺或聚乙二醇链或金刚烷乙酸、棕榈基部分或十八胺或己氨基-羰基-氧胆固醇部分。修饰还可以包括“蛋白质转导域”或PTD(即,细胞穿透肽(CPP))。PTD可以指有助于穿越脂质双层、胶束、细胞膜、细胞器膜或囊泡膜的多肽、多核苷酸、碳水化合物或有机或无机化合物。PTD可以附接到另一个分子上,该分子的范围可从小极性分子到大分子和/或纳米颗粒,并且可以促进分子穿过膜,例如从细胞外空间到细胞内空间,或者从细胞质到细胞器内。如WO2008/043156、US 20130185823和WO2015089419中所述,可以使用各种类型的纳米颗粒。PTD可与多肽的氨基末端共价联接。PTD可与多肽的羧基末端共价联接。PTD可与核酸共价联接。示例性的PTD可包括但不限于最小肽蛋白转导结构域;聚精氨酸序列,其包含足以指导进入细胞的多个精氨酸(例如,3、4、5、6、7、8、9、10或10-50个精氨酸)、VP22结构域、聚赖氨酸和转运蛋白、3个精氨酸残基至50个精氨酸残基的精氨酸均聚物。PTD可以是可激活的CPP(ACPP)。ACPP可包含通过可裂解的联接基连接至匹配的聚阴离子(例如G1u9或“E9”)的聚阳离子CPP(例如Arg9或“R9”),这可以将净电荷降低至几乎为零,从而抑制粘附和摄取细胞。裂解联接基后,聚阴离子可以释放出来,从而局部暴露聚精氨酸及其固有的粘附性,从而“激活”ACPP穿过膜。
靶向核酸的核酸的其他修饰可包括5’帽、3’聚腺苷酸尾、核糖开关序列、稳定性控制序列、形成dsRNA双链体的序列、将靶向核酸的核酸靶向亚细胞位置的修饰或序列、提供追踪的修饰或序列、提供蛋白质结合位点的修饰或序列、5-甲基dC核苷酸、2,6-二氨基嘌呤核苷酸、2’-氟核苷酸、2’-氟U核苷酸;2’-O-甲基RNA核苷酸、硫代磷酸酯键、到胆固醇分子的键、到聚乙二醇分子的键、到间隔区分子的键、5’至3’共价键或它们的任意组合。
靶向核酸的核酸的长度可以是至少约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个或更多个核苷酸。靶向核酸的核酸的长度可以是至多约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个或更多个核苷酸。在一些情况下,靶向核酸的核酸的长度为20、21、22、23、24、25、26、27、28、29或30个核苷酸。在一些情况下,靶向核酸的核酸在5’末端或3’末端或两末端处被磷酸化。
靶向核酸的核酸可包含5’脱氧胞嘧啶。靶向核酸的核酸可以在靶向核酸的核酸的5’末端处包含脱氧胞嘧啶-脱氧腺苷。在一些实施方案中,任何核苷酸可存在于5’末端处,和/或可包含修饰的主链或本文讨论的其他修饰。靶向核酸的核酸可包含5’磷酸化的末端。
靶向核酸的核酸可与该靶核酸完全互补(例如,可杂交)。靶向核酸的核酸可与该靶核酸部分互补。例如,靶向核酸的核酸可以在该靶向核酸的核酸的区域上与该靶核酸具有至少30、40、50、60、70、80、90、95或100%互补。靶向核酸的核酸在该靶向核酸的核酸的区域上可以与该靶核酸至多30、40、50、60、70、80、90、95或100%互补。
靶向核酸的核酸的一段核苷酸可与靶核酸互补(例如,可杂交)。至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个连续核苷酸的片段可与靶核酸互补。至多2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个连续核苷酸的片段可以与靶核酸互补。
与靶核酸完全互补的靶向核酸的核酸的一部分可以从至少核苷酸2延伸至核苷酸17(从靶向核酸的核酸的5’末端算起)。与靶核酸完全互补的靶向核酸的核酸的一部分可以从至少核苷酸3延伸至核苷酸20,核苷酸4延伸至核苷酸18,核苷酸5延伸至核苷酸16,核苷酸6延伸至核苷酸14,核苷酸7延伸至核苷酸12,核苷酸6延伸至核苷酸16,核苷酸6延伸至核苷酸18或核苷酸6延伸至核苷酸20。
靶向核酸的核酸可与靶核酸杂交。靶向核酸的核酸可与该靶向核酸的核酸和靶核酸之间的错配杂交(例如,靶向核酸的核酸中的核苷酸可不与靶核酸杂交)。当与靶核酸杂交时,靶向核酸的核酸可包含至少1、2、3、4、5、6、7、8、9或10个或更多个错配。当与靶核酸杂交时,靶向核酸的核酸可包含至多1、2、3、4、5、6、7、8、9或10个或更多个错配。
靶向核酸的核酸可以在相对于设计的靶向核酸的核酸的5’末端的第1和第2、第2和第3、第3和第4、第4和第5、第5和第6、第6和第7、第7和第8、第8和第9、第9和第10、第10和第11、第11和第12、第12和第13、第13和第14、第14和第15、第15和第16、第16和第17、第17和第18、第18和第19、第19和第20、第20和第21、第21和第22、第22和23、第23和第24或第24和第25个核苷酸之间的键处指导靶核酸的裂解。设计的靶向核酸的核酸可以指导靶核酸在相对于设计的靶向核酸的核酸的5’末端的第10和第11个核苷酸(t10和t11)之间的键处的裂解。靶核酸裂解位点最佳裂解的精确设计可以通过质粒靶掺入裂解位点的初步测试来确定。
如本文所讨论的,靶向核酸的核酸可以是ssRNA。在一个优选的实施方案中,靶向核酸的核酸是短ssRNA。在一些实施方案中,ssRNA的长度为50个核苷酸或更少,长度优选为40个核苷酸或更少,长度最优选为30个核苷酸或更少。在一个特定优选的实施方案中,靶向核酸的核酸的长度为20、21、22、23、24、25、26、27、28、29或30个核苷酸。
本发明的靶核酸
靶核酸可以包含与一种或多种设计的靶向核酸的核酸至少部分互补的一种或多种序列。靶核酸可以是基因、基因的5’末端、基因的3’末端、调节元件(例如启动子、增强子)、假基因、非编码DNA、微卫星、内含子、外显子、染色体DNA、线粒体DNA、有义DNA、反义DNA、核苷酸DNA、叶绿体DNA或RNA等其他核酸实体的一部分或全部。靶核酸可以是质粒DNA的一部分或全部。质粒DNA或其部分可以是负超螺旋的。靶核酸可以是体外或体内的。
靶核酸可包含低GC含量区域内的序列。靶核酸可以是负超螺旋的。因此,作为非限制性示例,靶核酸可包含至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%或65%或更高的GC含量。靶核酸可包含至多约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%或65%或更高的GC含量。
包含特定GC含量的区域可以是与设计的靶向核酸的核酸杂交的靶核酸的长度。包含GC含量的区域可以比与设计的靶向核酸的核酸杂交的区域的长度更长或更短。包含GC含量的区域可比与设计的靶向核酸的核酸杂交的区域的长度长或短为至少30、40、50、60、70、80、90或100个或更多个核苷酸。包含GC含量的区域可比与设计的靶向核酸的核酸杂交的区域的长度长或短为至多30、40、50、60、70、80、90或100个或更多个核苷酸。
在一些实施方案中,在植物基因组内发现靶核酸。植物可以是单子叶植物或双子叶植物。单子叶植物的非限制性示例包括玉米、水稻、高粱、黑麦、大麦、小麦、小米、燕麦、甘蔗、草皮草或柳枝稷。双子叶植物的非限制性示例包括大豆、低芥酸菜子、苜蓿、向日葵、棉花、烟草、花生、马铃薯、冬季油菜籽、春季油菜籽、甜菜、饲料甜菜、红甜菜、向日葵、烟草、拟南芥或红花。在一些实施方案中,靶核酸包含乙酰乳酸合酶(ALS)基因(包括其突变体)、烯醇丙酮基莽草酸酯磷酸合酶基因(EPSPS)基因(包括EPSPS基因的突变体,诸如但不限于T102I/P106A、T102I/P106S、T102I/P106C、G101A/A192T和G101A/A144D)、雄性育性(MS45、MS26或MSCA1)基因(包括其突变体)、雄性不育基因、不育恢复基因、除草剂抗性基因、除草剂耐受基因、真菌抗性基因、病毒抗性基因、昆虫抗性基因、与植物产量增加或减少(例如,生物质或种子)相关的基因、与干旱、寒冷或寒冷抗性/耐受性相关的基因、氮、磷或水的利用效率、或WO2015/026883中描述的另一个靶位点。靶核酸可包括与以下性状中的一个或多个相关的基因:除草剂抗性、除草剂耐受性、生物胁迫抗性、真菌抗性、病毒抗性、昆虫抗性、植物产量增加或减少(例如生物质或种子)、非生物抗逆性、氮利用效率、磷利用效率、水分利用效率和抗旱性。靶核酸可包括突变,诸如但不限于,氨基酸取代、缺失、插入、密码子优化和调节序列变化以改变基因表达谱。靶核酸可进一步包括如下文所述与本发明一起使用的任何核酸。
与本发明一起使用的核酸/多肽
可以提供任何目的核酸,在靶核酸处将其整合到宿主细胞基因组(例如植物细胞或原生质体)中,或瞬时保持在宿主细胞内,并通过使用本发明的方法和组合物在宿主细胞中表达。此类核酸可以是非天然的。目的核酸可以包括突变,诸如但不限于,氨基酸取代、缺失、插入、调节序列变化以改变基因表达谱,如本文讨论的转录和/或翻译融合和/或密码子优化。一种或多种目的核酸可用于本文所述的方法和组合物中。一种或多种核酸可作为与CRISPR/CasX的融合物(例如,转录和/或翻译融合物)存在。
目的核酸/多肽包括但不限于,抗除草剂编码序列、耐除草剂编码序列、杀虫/抗昆虫编码序列、杀线虫编码序列,抗微生物编码序列、抗真菌/真菌抗性编码序列、抗病毒/病毒抗性编码序列(包括RNA和DNA病毒)、非生物和生物胁迫耐受性编码序列、或修饰植物性状(诸如产量,谷物品质,营养成分、淀粉品质和数量、固氮和/或利用率、脂肪酸、以及油含量和/或组合物的序列)。
其他目的多核苷酸包括不育和/或育性基因,诸如但不限于,雄性不育和雄性育性基因。目的更具体的多核苷酸包括但不限于:提高作物产量的基因、降低作物产量的基因、提高作物需求的多核苷酸、编码赋予对非生物胁迫(诸如干旱、氮、温度、盐度、有毒金属或微量元素)抗性的蛋白质的基因、或赋予对毒素(诸如杀虫剂和除草剂抗性的基因、或赋予对生物胁迫(诸如真菌、病毒、细菌、昆虫和线虫攻击)抗性的基因,以及与这些生物体相关的病害的发展,以及赋予除草剂耐受性的基因。目的基因的一般类别包括,例如涉及信息的那些基因(诸如锌指),涉及通信的那些基因(诸如激酶),以及涉及管家的那些基因(诸如热激蛋白)。
与非生物胁迫耐受性有关的基因的示例包括:如WO 00/04173或WO/2006/045633中所述的能够降低植物细胞或植物中聚(ADP-核糖)聚合酶(PARP)基因的表达和/或活性的转基因;能够减少植物或植物细胞的PARG编码基因的表达和/或活性的转基因,如WO 2004/090140中所述;以及编码烟碱酰胺腺嘌呤二核苷酸挽救合成途径的植物功能性酶的转基因,包括烟碱酰胺酶,烟酸磷酸核糖基转移酶,烟酸单核苷酸腺苷酸转移酶,烟酰胺腺嘌呤二核苷酸合成酶或烟碱酰胺磷酸核糖基转移酶,涉及碳水化合物生物合成的酶,涉及多果糖生产的酶,尤其是菊粉和果聚糖型的酶。
例如,在WO 2013122472中描述了改善抗旱性的基因的示例。功能泛素蛋白连接酶蛋白(UPL)蛋白,更具体的讲是UPL3的缺乏或含量降低,可以减少对水的需求或以其他方式提高所述植物的抗旱性。例如,美国2009/0144850、美国2007/0266453和WO 2002/083911中公开了具有增加耐旱性的转基因植物的其他示例。US2009/0144850描述了由于DR02核酸的表达改变而显示出耐旱表型的植物。US2007/0266453描述了由于DR03核酸的表达改变而显示出耐旱表型的植物,并且WO2002/083911描述了由于在保卫细胞中表达的ABC转运蛋白的活性降低而对干旱胁迫具有增强的耐受性的植物。在正常的生长条件下,DREB1A在转基因植物中的过度表达可激活许多胁迫耐受基因的表达,从而提高了对干旱、盐分负荷和冻结的耐受性。
例如,更具体的转基因类别包括编码重要性状的基因,这些特状包括农艺学、昆虫抗性、抗病性、除草剂抗性、生育力或不育性、谷物特性和商业产品。目的基因通常包括涉及油、淀粉、碳水化合物或营养物质代谢的那些基因;以及影响籽粒大小、蔗糖负载等的那些基因,这些基因可以堆叠或与其他性状结合使用,诸如但不限于本文所述的除草剂抗性。由任何前述多核苷酸编码的多肽也可用于本文的方法和组合物中,诸如但不限于掺入宿主细胞(例如植物细胞或原生质体)中、与CRISPR/CasX的融合物中和/或掺入具有CRISPR/CasX的表达盒中。一种或多种多肽可存在于所述方法或组合物中。
除了使用传统的育种方法外,还可从遗传学上改变农艺学上重要的性状,诸如油、蔗糖、淀粉和蛋白质含量。这些修饰包括增加油酸、饱和和不饱和油的含量、增加赖氨酸和硫的含量、提供必需氨基酸以及淀粉的修饰。在美国专利号5,703,049、5,885,801、5,885,802、和5,990,389中描述了角硫(Hordothionin)蛋白的修饰,通过引用并入本文。另一个例子是美国专利号5,850,016中所述的大豆2S白蛋白编码的赖氨酸和/或富含硫的种子蛋白,以及大麦中的胰凝乳蛋白酶抑制剂,如Williamson等人所述,欧洲杂志生物化学(1987)165:99-106,其公开内容通过引用并入本文。
商业性状也可以编码在目的多核苷酸上,该多核苷酸可增加例如,用于乙醇生产的淀粉或蔗糖,或提供蛋白质的表达。转化植物的另一个重要的商业应用是生产聚合物和生物塑料,诸如美国专利号5,602,321中所述的。诸如β-酮硫醇酶、PHBase(聚羟基丁酸合酶)和乙酰乙酰辅酶A还原酶等基因(参见Schubert等人,J.细菌素(1988)170:5837-5847)促进了聚羟基链烷酸酯(PHA)的表达。
本文所述的CasX系统和方法可用于在内源DNA序列中引入靶向的双链断裂(DSB)。DSB激活细胞DNA修复途径,可利用该途径在断裂位点附近实现所需的DNA序列修饰。当内源基因的失活可以赋予或有助于所需性状时,这是令人感兴趣的。在特定的实施方案中,在DSB的位点促进与模板序列的同源重组,以便引入目的基因。
在特定的实施方案中,获得非转基因的遗传上修饰的植物、植物部分或细胞,因为没有外源DNA序列被掺入到植物的任何植物细胞的基因组中。仅确保内源基因的修饰以及植物基因组中没有引入或保留外源基因;所得的转基因作物不包含外源基因,因此基本上可以认为是非转基因的。
编码序列的衍生物可以通过定点诱变来制备,以增加编码的多肽中预选氨基酸的水平。例如,编码大麦高赖氨酸多肽(BHL)的基因源自大麦胰凝乳蛋白酶抑制剂,1996年11月1日提交的美国专利申请序列号08/740,682和WO 98/20133,其公开内容通过引用并入本文。其他蛋白质包括富含蛋氨酸的植物蛋白质,诸如来自葵花籽的蛋白质(Lilley等人,(1989)人类食品和动物饲料中植物蛋白利用的世界大会记录,编辑Applewhite(美国石油化学家协会,伊利诺伊州香槟),自费出版497-502;通过引用并入本文);玉米(Pedersen等人,J.生物化学(1986)261:6279;Kirihara等人,基因(1988)71:359;两者均通过引用并入本文);和稻(Musumura等人,植物分子生物学(1989)12:123,通过引用并入本文)。其他在农业上重要的基因编码乳胶、Floury2、生长因子、种子贮藏因子和转录因子。
提高作物产量的多核苷酸包括矮化基因,诸如Rht1和Rht2(Peng等人,自然(1999)400:256-261),以及增加植物生长的那些基因,诸如铵诱导的谷氨酸脱氢酶。改善作物需求的多核苷酸包括,例如,使植物具有降低的饱和脂肪含量的多核苷酸,提高植物的营养价值的多核苷酸以及增加谷物蛋白的多核苷酸。改善耐盐性的多核苷酸是那些在比引入了耐盐基因的植物的天然环境更高的盐度环境中增加或允许植物生长的多核苷酸。
影响氨基酸生物合成的多核苷酸/多肽包括,例如邻氨基苯甲酸合酶(AS;EC4.1.3.27)其催化从芳香族氨基酸途径到植物、真菌和细菌中色氨酸生物合成的第一反应分支。在植物中,色氨酸生物合成的化学过程在叶绿体中区分开。参见例如,USPub.2008/0050506,通过引用并入本文。其他目的序列包括分支酸盐(Chorismate)丙酮酸裂解酶(CPL),其是指编码催化分支酸盐转化为丙酮酸和pHBA的酶的基因。最具表征的CPL基因已从大肠杆菌中分离出来,其GenBank登录号为M96268。参见美国专利号7,361,811,其通过引用并入本文。
目的多核苷酸序列可编码涉及提供病害抗性或害虫抗性的蛋白质。“病害抗性”或“害虫抗性”意指植物避免作为植物-病原体相互作用产生的有害症状。害虫抗性基因可编码对具有高产量阻力的害虫的抗性,诸如根虫、地老虎、欧洲玉米螟等。病害抗性和害虫抗性基因(诸如溶菌酶或天蚕素)用于抗菌保护;或蛋白质(诸如防御素、葡聚糖酶或几丁质酶)用于抗真菌保护;或用于控制线虫或昆虫的苏云金芽孢杆菌内毒素、蛋白酶抑制剂、胶原酶、凝集素或糖苷酶都是有用的基因产物的示例。编码病害抗性性状的基因包括解毒基因,诸如针对伏马菌素的解毒基因(美国专利号5,792,931);无毒(avr)和病害抗性(R)基因(Jones等人,科学(1994)266:789;Martin等人,科学(1993)262:1432;和Mindrinos等人,细胞(1994)78:1089);等等。昆虫抗性基因可编码对具有高产量阻力的害虫的抗性,诸如根虫、地老虎、欧洲玉米螟等。此类基因包括例如苏云金芽孢杆菌有毒蛋白质基因(美国专利号5,366,892、5,747,450、5,736,514、5,723,756、5,593,881;以及Geiser等人,基因(1986)48:109);等等。
可以用克隆的抗性基因转化植物以工程化对特定病原体菌株具有抗性的植物。参见例如,Jones等人,科学266:789(1994)(番茄抗黄枝菌Cf-9基因的克隆);Martin等人,科学262:1432(1993)(番茄Pto基因对丁香假单胞菌的抗性,番茄编码蛋白激酶);Mindrinos等人,细胞78:1089(1994)。可以用赋予对害虫(诸如大豆孢囊线虫)的抗性的克隆抗性基因转化植物。参见例如,PCT专利申请WO 96/30517和PCT专利申请WO 93/19181。可用编码苏云金芽孢杆菌蛋白的基因转化植物。参见例如,Geiser等人,基因48:109(1986)。可以用涉及凝集素产生的基因转化植物。参见例如,Van Damme等人,植物分子生物学24:25(1994)。
可以用编码维生素结合蛋白的基因(诸如抗生物素蛋白)转化植物。参见PCT专利申请US93/06487,该申请描述了抗生物素蛋白和抗生物素蛋白同系物作为针对害虫的杀幼虫剂的应用。可以用编码酶抑制剂(诸如蛋白酶或蛋白酶抑制剂或淀粉酶抑制剂)的基因转化植物。参见例如,Abe等人,J.生物化学262:16793(1987),Huub等人,植物分子生物学21:985(1993);Sumitani等人,Sumitani等人,生物科学,生物技术,生物化学57:1243(1993)和美国专利5,494,813。可以用编码昆虫特异性激素或信息素(诸如蜕皮类固醇或幼年激素)、该激素变体、基于该激素的模拟物或该激素拮抗剂或激动剂的基因转化植物。参见例如Hammock等人,自然344:458(1990)。
可以用编码昆虫特异性肽或神经肽的基因转化植物,该基因一经表达就会破坏受影响害虫的生理。参见例如,Regan,J.生物化学269:9(1994)和Pratt等人,Biochem.Biophys.Res.Comm.163:1243(1989)。另见美国专利号5,266,317。可以用编码蛋白质和多肽的基因转化植物,这些蛋白质和多肽是蛇、黄蜂或任何其他生物自然产生的昆虫特异性毒液的一部分。例如,参见Pang等人,基因116:165(1992)。可以用编码负责引起单萜、倍半萜、类固醇、异羟肟酸、苯丙烷类衍生物或另一种具有杀虫活性的非蛋白质分子超积累的酶的基因转化植物。可以用编码参与生物活性分子的修饰(包括翻译后修饰)的酶的基因转化植物;例如,糖酵解酶;蛋白水解酶、脂解酶、核酸酶、环化酶、转氨酶、酯酶、水解酶、磷酸酶、激酶、磷酸化酶、聚合酶、弹性蛋白酶、几丁质酶和葡聚糖酶,无论是天然的还是合成的。参见PCT专利申请WO93/02197,Kramer等人,昆虫生物化学分子生物23:691(1993)和Kawalleck等人,植物分子生物学21:673(1993)。
可以用编码刺激信号转导的分子的基因转化植物。例如参见Botella等人,植物分子生物学24:757(1994),和Griess等人,植物生理学104:1467(1994)。可以用编码病毒侵入性蛋白质或由其衍生的复合毒素的基因转化植物。参见Beachy等人,Ann.rev.植物病理学28:451(1990)。可以用编码由病原体或寄生虫自然产生的发育抑制蛋白的基因转化植物。参见Lamb等人,生物/技术10:1436(1992)和Toubart等人,植物杂志2:367(1992)。可以用编码由植物自然产生的发育抑制蛋白的基因转化植物。例如,Logemann等人,生物/技术10:305(1992)。
“除草剂抗性蛋白”或由“编码除草剂抗性的核酸分子”的表达产生的蛋白质包括赋予细胞与不表达该蛋白质的细胞相比,耐受更高浓度的除草剂能力的蛋白质,或与不表达该蛋白质的细胞相比,可耐受一定浓度的除草剂更长的时间段。除草剂抗性性状可通过以下基因引入植物中:编码对乙酰乳酸合酶(ALS)作用抑制的除草剂抗性的基因,特别是磺酰脲型除草剂;编码对谷氨酰胺合酶作用抑制的除草剂抗性的基因,诸如膦丝菌素或basta(例如bar基因)、草甘膦(例如EPSP合酶基因和GAT基因)、HPPD抑制剂(例如HPPD基因)或本领域已知的其它此类基因。参见例如,美国专利号7,626,077、5,310,667、5,866,775、6,225,114、6,248,876、7,169,970;6,867,293和美国临时申请号61/401,456,其各自通过引用并入本文。bar基因编码对除草剂basta的抗性,nptII基因编码对卡那霉素和遗传霉素的抗性,以及ALS基因突变体编码对除草剂氯磺隆的抗性。
不育基因也可在表达盒中编码,并提供物理去雄的替代方法,特别是玉米。以此类方式使用的基因的示例包括雄性育性基因,诸如MS26(参见例如,美国专利7,098,388、7,517,975和7,612,251)、MS45(参见例如美国专利5,478,369和6,265,640)或MSCA1(参见例如美国专利7,919,676)。其他基因包括激酶和那些编码对雄性或雌性配子体发育有毒的化合物的基因。
此外,已经认识到目的多核苷酸还可包含与目的靶向基因序列的信使RNA(mRNA)的至少一部分互补的反义序列。构建反义核苷酸以与相应的mRNA杂交。
只要序列与相应的mRNA杂交并干扰该mRNA表达,就可以进行反义序列的修饰。以这种方式,可以使用与相应的反义序列具有70%、80%或85%的序列同一性的反义构建体。此外,部分反义核苷酸可用于破坏靶基因的表达。通常,可以使用至少50个核苷酸,100个核苷酸,200个核苷酸或更大的序列。
另外,目的多核苷酸也可以以有义方向用于抑制植物中内源基因的表达。使用有义方向的多核苷酸抑制植物中基因表达的方法是本领域已知的。这些方法通常涉及用DNA构建体转化植物,该DNA构建体包含启动子,该启动子驱动在植物中的表达,该启动子可操作地连接至对应于内源基因转录本的核苷酸序列的至少一部分。通常,此类核苷酸序列与内源基因的转录物的序列具有基本的序列同一性,通常大于约65%的序列同一性,约85%的序列同一性或大于约95%的序列同一性。参见美国专利号5,283,184和5,034,323;其全文以引用方式并入本文。
目的多核苷酸也可以是表型标记物。表型标记物是可筛选的或包括视觉标记物和可选标记物的可选标记物,无论该标记物是阳性还是阴性可选标记物。可以使用任何表型标记物。具体地讲,可选择的或可筛选的标记物包含DNA片段,该DNA片段通常在特定条件下允许人们识别、或选择或针对包含它的分子或细胞。这些标记物可编码活性,诸如但不限于RNA、肽或蛋白质的产生,或者可以提供RNA、肽、蛋白质、无机和有机化合物或组合物等的结合位点。
选择标记物的示例包括但不限于包含限制性酶位点的DNA片段;编码对其它有毒化合物(包括抗生素,诸如壮观霉素、氨苄青霉素、卡那霉素、四环素、Basta、新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT))产生抗性的产物的DNA片段;编码在受体细胞中其他方面缺乏的产物的DNA片段(例如tRNA基因、营养缺陷型标记物);编码易于识别的产物的DNA片段(例如表型标记物,诸如β-半乳糖苷酶,GUS;荧光蛋白,诸如绿色荧光蛋白(GFP)、青色(CFP)、黄色(YFP)、红色(RFP)、黄绿色荧光蛋白(mNeonGreen)和细胞表面蛋白);产生用于PCR的新引物位点(例如,两个先前未并置的DNA序列并置),包含未被限制性内切酶或其他DNA修饰酶、化学物质作用或已被作用的DNA序列;以及包含特定修饰(例如甲基化)所需的允许其识别的DNA序列。另外的选择标记物包括赋予除草剂化合物抗性的基因,诸如草铵膦铵盐、溴苯腈、咪唑啉酮和2,4-二氯苯氧基乙酸盐(2,4-D)。参见例如,Yarranton,生物技术进展(1992)3:506-11;Christopherson等人,美国国家科学院院刊,美国(1992)89:6314-8;Yao等人,细胞(1992)71:63-72;Reznikoff,分子微生物学(1992)6:2419-22;Hu等人,细胞(1987)48:555-66;Brown等人,细胞(1987)49:603-12;Figge等人,细胞(1988)52:713-22;Deuschle等人,美国国家科学院院刊,美国(1989)86:5400-4;Fuerst等人,美国国家科学院院刊,美国(1989)86:2549-53;Deuschle等人,科学(1990)248:480-3;Gossen,博士论文,海德堡大学(1993);Reines等人,美国国家科学院院刊,美国(1993)90:1917-21;Labow等人,分子细胞生物学(1990)10:3343-56;Zambretti等人,美国国家科学院院刊,美国(1992)89:3952-6;Bairn等人,美国国家科学院院刊,美国(1991)88:5072-6;Wyborski等人,核酸研究(1991)19:4647-53;Hillen and Wissman,分子结构生物学(1989)10:143-62;Degenkolb等人,抗菌物化学疗法(1991)35:1591-5;Kleinschnidt等人,生物化学(1988)27:1094-104;Bonin博士论文,海德堡大学(1993);Gossen等人,美国国家科学院院刊,美国(1992)89:5547-51;Oliva等人,抗菌药化学疗法(1992)36:913-9;Hlavka等人,实验药理学手册(1985),第78卷(柏林斯普林格出版社);Gill等人,自然(1988)334:721-4。
外源性产物包括植物酶和产物以及来自其他来源的那些产物,包括原核生物和其他真核生物。此类产物包括酶、辅因子、激素等。可以增加蛋白质的水平,特别是具有改善的氨基酸分布以改善植物的营养价值的修饰的蛋白质的水平。这是通过表达具有增强的氨基酸含量的此类蛋白质来实现的。转基因、重组DNA分子、目的DNA序列和目的多核苷酸可包含一种或多种用于基因沉默的DNA序列。涉及植物中DNA序列表达的基因沉默方法是本领域已知的,这些方法包括但不限于共抑制、反义抑制、双链RNA(dsRNA)干扰、发夹RNA(hpRNA)干扰、含内含子的发夹RNA(ihpRNA)干扰、转录基因沉默和micro RNA(miRNA)干扰。
在一些实施方案中,必须优化核酸以在植物中表达。如本文所用,“植物优化的核苷酸序列”是针对植物中的表达增加,特别是针对植物或一种或多种目的植物中的表达增加而优化的核苷酸序列。例如,植物优化的核苷酸序列可通过修饰编码蛋白质的核苷酸序列来合成,该蛋白质诸如(例如)本文公开的双链断裂诱导剂(例如核酸内切酶),使用一种或多种植物优选的密码子来提高表达。参见例如,Campbell和Gowri,植物生理学(1990)92:1-11讨论了宿主偏好的密码子用法。
合成植物优选基因的方法在本领域是可用的。参见例如,美国专利号5,380,831和5,436,391,以及Murray等人,核酸研究(1989)17:477-498,以引用方式并入本文。已知其他序列修饰可增强植物宿主中的基因表达。这些修饰包括(例如)消除:一个或多个编码杂多聚腺苷酸化信号的序列,一个或多个外显子-内含子剪接位点信号,一个或多个转座子样重复序列,以及其他可能对基因表达有害的充分表征的序列。序列的G-C含量可调节至给定植物宿主的平均水平,如参照宿主植物细胞中表达的已知基因所计算的。可能的话,对序列进行修饰以避免一个或多个预测的发夹次级mRNA结构。因此,本公开的“植物优化的核苷酸序列”包含一个或多个此类序列修饰。
与本发明一起使用的转化方法
用于将核苷酸序列和多肽引入生物中的多种方法是已知的,这些方法包括(例如)转化、有性杂交以及将多肽、DNA或mRNA引入细胞中。
在一些实施方案中,本发明包含植物育种,这些植物包含一种或多种转基因性状。最常见地,由于细菌转化系统,诸如(例如)但不限于,基于农杆菌、基因枪、嫁接、昆虫载体,DNA磨蚀或其他常用程序的那些转化系统,转基因性状随机插入整个植物基因组。最近,已经开发了能够定向转基因插入的基因靶向方案。一种重要的技术是位点特异性整合(SSI),可将转基因靶向到与先前插入的转基因相同的染色体位置。定制设计的大范围核酸酶和定制设计的锌指大范围核酸酶可以使研究人员设计出靶向特定染色体位置的核酸酶,并且这些试剂可以将转基因靶向由这些核酸酶裂解的染色体位点。
当前使用的用于真核基因组(例如植物基因组)的精确基因工程的系统依赖于归巢核酸内切酶,大范围核酸酶,锌指核酸酶和转录激活因子样效应子核酸酶(TALEN),这需要对每个新的靶基因进行全新的蛋白质工程。本文所述的高度特异性的CRISPR/CasX核酸内切酶系统更易于定制,因此,当目标是修饰许多不同靶序列时,该系统将更加有用。
植物中的转化方法可包括直接和间接转化方法。通过任何上述方法递送到植物细胞中可进一步包括使用一种或多种细胞穿透肽(CPP)。适用于转化的细胞包括但不限于质体和原生质体。
合适的直接转化方法包括,例如但不限于,PEG诱导的DNA摄取、花粉管介导的直接引入受精胚胎/受精卵、脂质体介导的转化、生物弹射法、借助于粒子轰击、电穿孔或显微注射。间接方法包括,例如但不限于,细菌介导的转化(例如农杆菌介导的转化技术)或使用病毒载体的病毒感染。在生物射弹转化的情况下,可以使用生物射弹装置将核酸酶引入植物组织,该装置可将微粒加速至300m/s至600m/s的速度,以穿透植物细胞壁和细胞膜。将蛋白质或RNA引入植物的另一种方法是通过靶细胞的超声处理。脂质体或原生质球融合物也可用于将外源材料引入植物。电穿孔可用于将外源物质引入原生质体、全细胞和组织中。
示例性病毒载体包括但不限于来自DNA病毒的载体,该DNA病毒诸如但不限于双生病毒、卷心菜卷曲病毒、豆黄矮病毒、小麦矮病毒、番茄卷曲病毒、玉米条纹病毒、烟草叶卷曲病毒、番茄金黄色花叶病毒或蚕豆坏死性黄色病毒、或RNA病毒的载体(例如但不限于烟草脆裂病毒(例如烟草拨浪鼓病毒、烟草花叶病毒))、马铃薯X病毒或大麦条纹花叶病毒。
而且,穿梭载体或二元载体可以(例如)通过农杆菌介导的转化稳定地整合到植物基因组中。然后可通过遗传杂交和分离去除CRISPR/CasX转基因,以生产非转基因但经基因修饰的植物或农作物。在农杆菌介导的转化的情况下,标记盒可以邻近侧翼T-DNA边界或位于侧翼T-DNA边界之间,并包含在二元载体中。在另一个实施方案中,标记盒可位于T-DNA的外部。可选择的标记盒也可位于与表达盒相同的T-DNA边界之内或附近,或者可以在二元载体(例如2T-DNA系统)上的第二T-DNA之内的其他地方。
本文公开的方法和组合物可用于将外源序列插入植物细胞基因组中的预定位置。因此,可以通过靶向重组将编码(例如)病原体抗性蛋白、代谢途径的酶、受体或转录因子的基因插入植物基因组中有利于其表达的区域。
用于将组合物接触,提供和/或引入到各种生物中的方法是已知的,这些方法包括但不限于稳定的转化方法、瞬时转化方法、病毒介导的方法和有性繁殖。稳定转化表明引入的多核苷酸整合到生物的基因组中,并能够被其子代遗传。瞬时转化表明引入的组合物仅在生物体中临时表达或存在。将多核苷酸和多肽引入植物中的方案可根据转化靶向的植物或植物细胞的类型而改变,诸如单子叶植物或双子叶植物。将多核苷酸和多肽引入植物细胞并随后插入植物基因组的合适方法包括(除本文列出的方法外)聚乙二醇介导的转化、微粒轰击、花粉管介导的受精胚胎/受精卵的引入、显微注射(Crossway等人,生物技术(1986)4:320-34和美国专利号6,300,543),分生组织转变(美国专利号5,736,369),电穿孔(Riggs等人,美国国家科学院院刊,美国(1986)83:5602-6),农杆菌介导的转化(美国专利号5,563,055和5,981,840),直接基因转移(Paszkowski等人,EMBO J.(1984)3:2717-22),和弹道粒子加速(美国专利号4,945,050、5,879,918、5,886,244、5,932,782;Tomes等人,(1995)在植物细胞、组织和器官培养物中,通过微粒轰击直接将DNA转移到完整的植物细胞中:基本方法,编辑Gamborg&Phillips(柏林斯普林格出版社);McCabe等人,生物技术(1988)6:923-6;Weissinger等人,Ann Rev Genet(1988)22:421-77;Sanford等人,微粒科学与技术(1987)5:27-37(onion);Christou等人,植物生理学(1988)87:67-74(大豆);Finer和McMullen,体外培养细胞(1991)27P:175-82(大豆);Singh等人,理论与应用遗传学(1998)96:319-24(大豆);Datta等人,生物技术(1990)8:736-40(稻);Klein等人,美国国家科学院院刊,美国(1988)85:4305-9(玉米);Klein等人,生物技术(1988)6:559-63(玉米);美国专利号5,240,855、5,322,783和5,324,646;Klein等人,植物生理学(1988)91:440-4(玉米);Fromm等人,生物技术(1990)8:833-9(玉米);Hooykaas-Van Slogteren等人,自然(1984)311:763-4;美国专利号5,736,369(谷物);Bytebier等人,美国国家科学院院刊,美国(1987)84:5345-9(百合科);De Wet等人(1985)在”胚珠组织的实验操作”中,编辑Chapman等人,(朗文,纽约),第197-209页(花粉);Kaeppler等人,植物细胞报告(1990)9:415-8)和Kaeppler等人,理论与应用遗传学(1992)84:560-6(晶须介导的转化);D'Halluin等人,植物细胞(1992)4:1495-505(电穿孔);Li等人,植物细胞报告(1993)12:250-5;Christou和Ford Annals Botany(1995)75:407-13(稻)和Osjoda等人,自然生物技术(1996)14:745-50(农杆菌感染玉米)。
或者,可以将DNA构建体与合适的T-DNA侧翼区组合,并引入常规的根癌土壤杆菌宿主载体中。农杆菌介导的转化技术,包括解毒和使用二元载体,在科学文献中已有很好的描述。参见例如,Horsch等人(1984)科学233:496-498,和Fraley等人(1983)美国国家科学院院刊,美国80:4803。当使用二元T DNA载体的细菌感染细胞时,根癌土壤杆菌宿主的毒力功能将指导将构建体和邻近标记物插入植物细胞DNA中(Bevan(1984)核酸研究12:8711-8721)或共同培养程序(Horsch等人(1985)科学227:1229-1231)。农杆菌转化系统还可用于将DNA转化以及转移到单子叶植物和植物细胞中。参见Hernalsteen等人(1984)EMBO J 3:3039-3041;Hooykass-Van Slogteren等人(1984)自然311:763-764;Grimsley等人(1987)自然325:1677-179;Boulton等人(1989)植物分子生物学12:31-40;和Gould等人(1991)植物生理学95:426(-434)。
或者,可通过使植物与病毒或病毒核酸接触而将多核苷酸引入植物中。通常,此类方法涉及将多核苷酸掺入病毒DNA或RNA分子内。在一些实施方案中,可以首先合成目的多肽作为病毒多蛋白的一部分,该病毒多蛋白随后在体内或体外通过蛋白水解加工以产生所需的重组蛋白。将多核苷酸引入植物并表达其中编码的涉及病毒DNA或RNA分子的蛋白质的方法是已知的,参见例如美国专利号5,889,191、5,889,190、5,866,785、5,589,367和5,316,931。
在其他实施方案中,将编码CasX蛋白的RNA多核苷酸引入植物细胞中,然后由宿主细胞翻译和加工,以产生足以修饰细胞的量的蛋白(在至少一个向导RNA的存在下),但是在经过一段预期的时间或一个或多个细胞分裂后,这种情况不会持续。将mRNA引入植物原生质体以进行瞬时表达的方法是本领域技术人员已知的(参见比如Gallie,植物细胞报告(1993),13;119-122)。瞬时转化方法包括但不限于将多肽(诸如双链断裂诱导剂)直接引入生物体,将多核苷酸(诸如DNA和/或RNA多核苷酸)以及RNA转录本(诸如编码双链断裂诱导剂的mRNA)引入生物体。此类方法包括(例如)显微注射或粒子轰击。参见例如,Crossway等人,Mol.Gen.Genet.(1986)202:179-85;Nomura等人,植物科学(1986)44:53-8;Hepler等人,美国国家科学院院刊,美国(1994)91:2176-80;以及Hush等人,J.细胞科学(1994)107:775-84。
对于粒子轰击或原生质体转化,表达系统可包含一个或多个分离的线性片段,或者可以是较大构建体的一部分,该较大构建体可能包含细菌复制元件、细菌选择标记物或其他可检测元件。包含编码向导和/或CasX的多核苷酸的表达盒可与标记盒物理联接或可与编码标记盒的第二核酸分子混合。标记盒由表达可检测或可选择标记物的必要元件组成,该标记物允许有效选择转化细胞。
在某些实施方案中,令人感兴趣的是将CasX CRISPR系统的一种或多种组分直接递送至植物细胞,例如以产生非转基因植物。一种或多种CasX组分可以在植物或植物细胞外部制备,并递送到细胞中。比如,可以在引入植物细胞之前在体外制备CasX蛋白。CasX蛋白可通过本领域技术人员已知的多种方法来制备,这些方法包括重组生产。表达后,将CasX蛋白分离,根据需要重新折叠、纯化并可选地进行处理,以去除任何纯化标签,诸如His标签。一旦获得粗制、部分纯化或更完全纯化的CasX蛋白,就可以将该蛋白引入植物细胞中。在特定实施方案中,将CasX蛋白与靶向目的基因的向导RNA混合以形成预组装的核糖核蛋白,其可以通过电穿孔,轰击,化学转染和本文所述其他递送方式中的任何一种或多种方式递送至植物细胞。
本发明的基因构建体
本公开进一步提供了表达构建体,诸如但不限于表达盒,用于在宿主(例如植物、植物细胞或植物部位)中表达CRISPR/CasX系统,该系统能够结合并在靶位点产生双链断裂。在一个实施方案中,本发明的表达构建体包含与编码CRISPR/CasX基因的核苷酸序列可操作地连接的启动子和与本发明的向导核酸可操作地连接的启动子。该启动子能够驱动宿主(例如植物)细胞中可操作联接的核苷酸序列的表达。在另一个实施方案中,CRISPR/CasX基因包含一种或多种本文所述的转录和/或翻译融合物。在一些实施方案中,表达盒允许CRISPR/CasX系统的瞬时表达,而在其他实施方案中,表达盒允许CRISPR/CasX系统诸如(例如)但不限于,通过整合到宿主细胞基因组中而稳定地保持在宿主细胞内。
启动子是DNA的一个区域,该区域参与RNA聚合酶和其他蛋白质的识别和结合以启动转录。启动子在本领域中众所周知是高度特异性的,并且适合在同一生物体内的特定界、属、物种、甚至特定组织中使用。启动子可以是组成型活性或诱导型;每种的示例是本领域众所周知的。例如,植物启动子是能够在植物细胞中启动转录的启动子,有关植物启动子的综述,参见Potenza等人,In Vitro Cell Dev Biol(2004)40:1-22。组成型植物启动子是能够在植物的全部或几乎所有发育阶段表达其在所有或几乎所有植物组织中控制的开放阅读框(ORF)的启动子(称为“组成型表达”)。组成型启动子包括,例如Rsyn7启动子的核心启动子和WO99/43838以及美国专利号6,072,050中公开的其他组成型启动子;核心CaMV 35S启动子(Odell等人,自然(1985)313:810-2);大米肌动蛋白(McElroy等人,植物细胞(1990)2:163-71);ubiquitin(Christensen等人,植物分子生物学(1989)12:619-32;Christensen等人,植物分子生物学(1992)18:675-89);pEMU(Last等人,理论与应用遗传学(1991)81:581-8);MAS(Velten等人,EMBO杂志(1984)3:2723-30);ALS启动子(美国专利号5,659,026)等。其他组成型启动子在例如美国专利号5,608,149、5,608,144、5,604,121、5,569,597、5,466,785、5,399,680、5,268,463、5,608,142和6,177,611中描述。
在一些实施方案中,可使用诱导型启动子。病原体感染后诱导的病原体诱导型启动子包括但不限于,调节PR蛋白、SAR蛋白、β-1,3-葡聚糖酶、几丁质酶等表达的启动子。或者,可将编码CasX核酸内切酶的序列可操作地连接至组成型、细胞特异性或通过自杀外显子的可变剪接而激活的启动子。
化学调节的启动子可用于通过应用外源化学调节剂来调节植物中基因的表达。该启动子可以是化学诱导型启动子,其中该化学试剂的应用诱导基因表达,或者是化学抑制型启动子,其中该化学试剂的应用抑制基因表达。化学诱导型启动子包括但不限于,由苯磺酰胺除草剂安全剂激活的玉米ln2-2启动子(De Veylder等人,Plant Cell Physiol(1997)38:568-77),玉米GST启动子(被用作芽前除草剂的疏水亲电化合物激活的GST-II-27,WO93/01294)和被水杨酸激活的烟草PR-1a启动子(Ono等人,生物技术,生物化学(2004)68:803-7)。其他化学调节的启动子包括类固醇响应性启动子(参见例如,糖皮质激素诱导型启动子(Schena等人,美国国家科学院院刊,美国(1991)88:10421-5;McNellis等人,植物杂志(1998)14:247-257);四环素诱导型和四环素抑制型启动子(Gatz等人,Mol Gen Genet(1991)227:229-37;美国专利号5,814,618和5,789,156)。
可使用诱导型启动子,该启动子允许时空控制基因编辑或基因表达可使用能量的形式。能量的形式可包括但不限于声能、电磁辐射、化学能和/或热能。光诱导系统(光色素,LOV域或隐色色素)的示例,诸如以序列特异性方式指导转录活性变化的光诱导转录效应子(LITE)。光诱导系统的组件可包括Cpf1 CRISPR酶、光响应性细胞色素异二聚体(例如来自拟南芥)和转录激活/抑制域。
组织优选的启动子可用于靶向特定植物组织内的增强表达。组织优选的启动子包括:例如Kawamata等人,植物细胞生理学(1997)38:792-803;Hansen等人,Mol Gen Genet(1997)254:337-43;Russell等人,转基因研究(1997)6:157-68;Rinehart等人,植物生理学1(1996)12:1331-41;Van Camp等人,植物生理学(1996)112:525-35;Canevascini等人,植物生理学(1996)112:513-524;Lam,Results Probl Cell Differ(1994)20:181-96;和Guevara-Garcia等人,植物学杂志(1993)4:495-505。叶优选的启动子包括:例如Yamamoto等人,植物学杂志(1997)12:255-65;Kwon等人,植物生理学(1994)105:357-67;Yamamoto等人,植物生理学(1994)35:773-8;Gotor等人,植物学杂志(1993)3:509-18;Orozco等人,植物分子生物学(1993)23:1 129-38;Matsuoka等人,美国国家科学院院刊,美国(1993)90:9586-90;Simpson等人,EMBO杂志(1958)4:2723-9;Timko等人,自然(1988)318:57-8。根优选的启动子包括:例如Hire等人,植物分子生物学(1992)20:207-18(大豆根特异性谷氨酰胺合成酶基因);Miao等人,植物细胞(1991)3:11-22(胞质谷氨酰胺合成酶(GS));Keller和Baumgartner,植物细胞(1991)3:1051-61(豆芽GRP 1.8基因的根特异性控制元件);Sanger等人,植物分子生物学(1990)14:433-43(根癌农杆菌甘露糖合成酶的根特异性启动子(MAS));Bogusz等人,植物细胞(1990)2:633-41(分离自山梨属和苔藓的根特异性启动子);Leach和Aoyagi,植物科学(1991)79:69-76(发根基因rolC和rolD根诱导基因);Teeri等人,EMBO J(1989)8:343-50(农杆菌诱导的致伤TR1’和TR2’基因);VfENOD-GRP3基因启动子(Kuster等人,植物分子生物学(1995)29:759-72);和rolB promoter(Capana等人,植物分子生物学(1994)25:681-91;菜豆素基因(Murai等人,科学(1983)23:476-82;Sengopta-Gopalen等人,美国国家科学院院刊,美国(1988)82:3320-4)。另见美国专利号5,837,876、5,750,386、5,633,363、5,459,252、5,401,836、5,110,732和5,023,179。
在一些实施方案中,使用DNA依赖性RNA聚合酶II启动子或DNA依赖性RNA聚合酶III启动子。在一些实施方案中,单子叶植物启动子用于驱动单子叶植物中的表达。在各种其他实施方案中,双子叶植物启动子用于驱动双子叶植物中的表达。
种子优选的启动子包括在种子发育过程中有活性的种子特异性启动子,以及在种子发芽过程中有活性的种子发芽启动子。参见Thompson等人,BioEssays(1989)10:108。种子优选的启动子包括但不限于Cim1(细胞分裂素诱导的信息);cZ19B1(maize19kDa zein);和milps(肌醇-1-磷酸合酶);(WO00/11177;以及美国专利6,225,529)。对于双子叶植物,种子优选的启动子包括但不限于:豆β-菜豆蛋白、油菜籽蛋白、β-伴大豆球蛋白、大豆凝集素、十字花科素等。对于单子叶植物,种子优选的启动子包括但不限于:玉米15kDa玉米醇溶蛋白、22kDa玉米醇溶蛋白、27kDaγ玉米醇溶蛋白、蜡质、皱缩1、皱缩2、球蛋白1、油质蛋白和裸核。另见WO00/12733,其中公开了来自END1和END2基因的种子优选的启动子。
表型标记物是可筛选的或可选择的标记物,该标记物包括视觉标记物和可选择的标记物,无论其是阳性还是阴性的可选择标记物。可以使用任何表型标记物。具体地讲,可选择的或可筛选的标记物包含DNA片段,该DNA片段通常在特定条件下允许人们识别、或选择或针对包含它的分子或细胞。这些标记物可编码活性,诸如但不限于RNA、肽或蛋白质的产生,或者可以提供RNA、肽、蛋白质、无机和有机化合物或组合物等的结合位点。
选择标记物的示例包括但不限于包含限制性酶位点的DNA片段;编码对其它有毒化合物(包括抗生素,诸如壮观霉素、氨苄青霉素、卡那霉素、四环素、Basta、新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT))产生抗性的产物的DNA片段;编码在受体细胞中其他方面缺乏的产物的DNA片段(例如tRNA基因、营养缺陷型标记物);编码易于识别的产物的DNA片段(例如表型标记物,诸如β-半乳糖苷酶,GUS;荧光蛋白,诸如绿色荧光蛋白(GFP)、青色(CFP)、黄色(YFP)、黄绿色(mNeonGreen)、红色(RFP)以及细胞表面蛋白);产生用于PCR的新引物位点(例如,两个先前未并置的DNA序列并置),包含未被限制性内切酶或其他DNA修饰酶、化学物质作用或已被作用的DNA序列;以及包含特定修饰(例如甲基化)所需的允许其识别的DNA序列。
另外的选择标记物包括赋予除草剂化合物抗性的基因,诸如草铵膦铵盐、溴苯腈、咪唑啉酮和2,4-二氯苯氧基乙酸盐(2,4-D)。参见例如Yarranton,生物技术进展(1992)3:506-1 1;Christopherson等人,美国国家科学院院刊,美国(1992)89:6314-8;Yao等人,细胞(1992)71:63-72;Reznikoff,分子微生物学(1992)6:2419-22;Hu等人,细胞(1987)48:555-66;Brown等人,细胞(1987)49:603-12;Figge等人,细胞(1988)52:713-22;Deuschle等人,美国国家科学院院刊,美国(1989)86:5400-4;Fuerst等人,美国国家科学院院刊,美国(1989)86:2549-53;Deuschle等人,科学(1990)248:480-3;Gossen,(1993)博士论文,海德堡大学;Reines等人,美国国家科学院院刊,美国(1993)90:1917-21;Labow等人,分子细胞生物学(1990)10:3343-56;Zambretti等人,美国国家科学院院刊,美国(1992)89:3952-6;Bairn等人,美国国家科学院院刊,美国(1991)88:5072-6;Wyborski等人,核酸研究(1991)19:4647-53;Hillen and Wissman,分子结构生物学(1989)10:143-62;Degenkolb等人,抗菌药化学疗法(1991)35:1591-5;Kleinschnidt等人,生物化学(1988)27:1094-104;Bonin,(1993)博士论文,海德堡大学;Gossen等人,美国国家科学院院刊,美国(1992)89:5547-51;Oliva等人,抗菌药化学疗法(1992)36:913-9;Hlavka等人,实验药理学手册,(1985)第78卷(德国斯普林格出版社);Gill等人,自然(1988)334:721-4。
根据标记物基因的性质,可以使用基于可选择标记物的细胞的各种选择程序。在特定的实施方案中,使用可选择的标记物,即允许基于标记物的表达直接选择细胞的标记物。可选择标记物可赋予阳性或阴性选择,并且在存在外部底物的条件下是有条件的或无条件的(Miki等人2004,107(3):193-232)。最常见的是,将抗生素或除草剂抗性基因用作标记物,由此通过在含有抑制量的标记物基因赋予抗性的抗生素或除草剂的培养基上生长工程化植物材料来进行选择。此类基因的示例是赋予抗生素抗性的基因(诸如潮霉素(hpt)和卡那霉素(nptII))、以及赋予除草剂抗性的基因(诸如膦丝菌素(bar)、氯嘧磺隆(als)、aroA、草甘膦乙酰转移酶(GAT)基因)、来自链霉菌属物种的膦丝菌素乙酰转移酶(PAT)基因和ACCase抑制剂编码基因。排毒基因也可用作标记物,其示例包括编码膦丝菌素乙酰转移酶、膦丝菌素乙酰转移酶和羟苯基丙酮酸双加氧酶(HPPD)抑制剂的酶。
还可通过筛选可见标记物的活性来鉴定转化的植物和植物细胞,该可见标记物通常是能够处理有色底物的酶(例如β-葡糖醛酸糖苷酶、萤光素酶、B或C1基因)。此类选择和筛选方法是本领域技术人员众所周知的。
本发明的转基因植物、植物部分、细胞和种子
在本发明的一个优选的实施方案中,提供了包括转基因植物的转基因部分的转基因植物,特别是转基因种子和转基因细胞。转基因植物的转基因部分可进一步包括可以收获的那些部分,诸如但不限于甜菜的甜菜根、水稻的米粒和玉米的玉米棒。
为了生产携带整合的核酸构建体的转基因种子,可以使转基因植物自交。或者,可以将转基因植物与相似的转基因植物或携带一种或多种不同于本发明的基因构建体核酸的转基因植物杂交,或与已知植物育种方法的非转基因植物杂交以生产转基因种子。这些种子可用于提供本发明的转基因植物的后代,包含来自本发明的基因构建体整合的核酸。
转化植物细胞的合适方法在植物生物技术中是已知的,并且在本文中进行了描述。可以培养转化的植物细胞以再生整个植物,该植物具有转化的基因型并因此具有所需的表型。这些方法中的每一种都可用于将选择的核酸优选地引入载体到植物细胞中以获得本发明的转基因植物。转化方法可包括直接和间接转化方法,并且适用于双子叶植物和主要用于单子叶植物。该植物可以是单子叶植物(例如小麦、玉米或狗尾草),或者该植物可以是双子叶植物(例如番茄、大豆、烟草、马铃薯或拟南芥)。
本文所述的方法也可以与单子叶植物一起使用,诸如属于以下目的单子叶植物:泽泻目(Alismatales)、水瞥目(Hydrocharitales)、茨藻目(Najadales)、霉草目(Triuridales)、鸭跖草目(Commelinales)、谷精草目(Eriocaulales)、帚灯草目(Restionales)、禾本目(Poales)、灯心草目(Juncales)、莎草目(Cyperales)、香蒲目(Typhales)、凤梨目(Bromeliales)、姜目(Zingiberales)、槟榔目(Arecales)、环花草目(Cyclanthales)、露兜树目(Pandanales)、天南星目(Arales)、百合目(Lilliales)和兰目(Orchid ales)的植物,或者属于裸子植物门的植物,例如,松果菊、银杏、苏铁和片麻岩。
本文所述的方法可与双子叶植物一起使用,该双子叶植物属于例如以下目:Magniolales、八角目(Illiciales)、月桂目(Laurales)、胡椒目(Piperales)、亚里士多德目(Aristochiales)、睡莲目(Nymphaeales)、毛茛目(Ranunculales)、蒲公英目(Papeverales)、沙棘目(Sarraceniaceae)、荆芥目(Trochodendrales)、金缕梅目(Hamamelidales)、优生目(Eucomiales)、莱特纳目(Leitneriales)、杨梅目(Myricales)、山毛榉目(Fagales)、木麻黄目(Casuarinales)、石竹目(Caryophyllales)、肉穗果目(Batales)、蓼目(Polygonales)、蓝雪目(Plumbaginales)、五桠果目(Dilleniales)、山茶目(Theales)、锦葵目(Malvales)、荨麻目(Urticales)、玉蕊目(Lecythidales)、紫堇目(Violales)、杨柳目(Salicales)、白花菜目(Capparales)、欧石楠目(Ericales)、岩梅目(Diapensales)、柿树目(Ebenales)、报春花目(Primulales)、蔷薇目(Rosales)、豆目(Fabales)、川草目(Podostemales)、小二仙草目(Haloragales)、桃金娘目(Myrtales)、山茱萸目(Cornales)、山龙眼目(Proteales)、San tales、大花草目(Rafflesiales)、卫矛目(Celastrales)、大戟目(Euphorbiales)、鼠李目(Rhamnales)、无患子目(Sapindales)、胡桃目(Juglandales)、牻牛儿苗目(Geraniales)、远志目(Polygalales)、伞形目(Umbellales)、龙胆目(Gentianales)、花葱目(Polemoniales)、唇形目(Lamiales)、车前草目(Plantaginales)、玄参目(Scrophulariales)、桔梗目(Campanulales)、茜草目(Rubiales)、川绿断目(Dipsacales)、以及菊目(Asterales)。
本文所述的方法可用于广泛范围的植物,这些植物包括但不限于来自以下属的物种:芦笋属、燕麦属、芸苔属、柑橘属、西瓜属、辣椒属、南瓜属、胡萝卜属、甘氨酸属、大麦属、莴苣属、番茄属、苹果属、木薯属、烟草属、稻属、鳄梨属、豌豆属、梨属、李属、萝卜属、黑麦属、茄属、高粱属、小麦属、葡萄属、豇豆属和玉米属。
为一种或多种标记物选择转化的植物细胞,这些细胞包括原生质体和质体,这些标记物已经用本发明的核酸转化到植物中,并且包括优选介导抗生素抗性的基因,诸如新霉素磷酸转移酶II介导的基因NPTII,该基因NPTII编码卡那霉素抗性。或者,可以使用除草剂抗性基因。随后,转化的细胞再生为完整的植物。DNA转移和再生后,可以对植物进行检查,例如定量PCR以确定本发明核酸的存在。
在一些实施方案中,可将抗生素抗性和/或除草剂抗性选择标记物与CRISPR/CasX系统共引入植物细胞中,以通过同源重组进行靶向的基因修复/校正和敲入(基因插入和置换)。结合不同的供体DNA片段,CRISPR/CasX系统可用于修饰各种农艺性状以进行遗传改良。
具有引入序列的细胞可使用常规条件生长或再生为植物,参见(例如)McCormick等人,植物行细胞报告(1986)5:81-4。然后这些植物可以生长,并用相同的转化菌株或不同的转化或未转化的菌株授粉,从而鉴定出具有所需特性和/或包含引入的多核苷酸或多肽的后代。可以生长两个或更多个世代以确保稳定地维持和遗传多核苷酸,并收获种子。
可以使用任何植物,包括单子叶植物和双子叶植物。可以使用的单子叶植物的示例包括但不限于:玉米(Zea mays)、稻米(Oryza sativa)、黑麦(Secale graine)、高粱(Sorghum bicolor、Sorghum vulgare)、小米(例如珍珠粟(青草(Penensetum glaucum)、粟(Panicum miliaceum)、谷子(Setaria italica)、小米(Eleusine coracana)、小麦(Triticum aestivum)、甘蔗(Saccharum spp.)、燕麦(Avena)、大麦(Hordeum)、柳枝switch(Panicum virgatum)、菠萝(Ananas comosus)、香蕉(Musa spp.)、棕榈、观赏植物、草皮草和其他草。可以使用的双子叶植物的示例包括但不限于:大豆(Glycine max)、油菜(Brassica napus和B.campestris)、苜蓿(Medicago sativa)、烟草(Nicotiana tabacum)、拟南芥(Arabidopsis thaliana)、向日葵(Helianthus annuus)、甜菜(Beta vulgaris)、棉花(Gossypium arboreum)和花生(Arachis hypogaea)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)等,可以使用的其他单子叶植物包括油棕(Elaeisguineensis)、苏丹草(Sorghum×drummondii)和黑麦(Secale cereale)。可以使用的其他双子叶植物包括红花(Carthamus tinctorius)、咖啡(Coffea arabica和Coffeacanephora)、苋菜(Amaranthus spp.)和油菜籽(Brassica napus和Brassicanapobrassica;高芥酸和菜籽油)。
与本发明的方法和组合物一起使用的另外的非限制性示例性植物包括:大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、双色高粱(Sorghum bicolor)、甘蔗(Saccharum officinarium)、玉米(Zea mays)、谷子(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oriza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、黑麦(Secalecereale)、黑小麦(Triticale)、苹果(Malus domestica)、二穗短柄草(Brachypodiumdistachyon)、海滨大麦(Hordeum marinum)、节节麦(Aegilops tauschii)、Daucusglochidiatus、甜菜(Beta vulgaris)、Daucus pusillus、Daucus muricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotiana sylvestris)、茸毛烟草(Nicotiana tomentosiformis)、普通烟草(Nicotiana tabacum)、本氏烟草(Nicotiana benthamiana)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffea canephora)、葡萄(Vitis vinifera)、Erythrante guttata、Genliseaaurea、黄瓜(Cucumis sativus)、桑树(Morus notabilis)、Arabidopsis arenosa、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、须弥芥(Crucihimalayahimalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamineflexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa pastoris)、小拟南芥(Olmarabidopsis pumila)、硬毛南芥(Arabis hirsute)、欧洲油菜(Brassicanapus)、甘蓝(Brassica oleracea)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncacea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicariasubsp.sativa)、柑桔(Citrus sinensis)、麻风树(Jatropha curcas)、毛果杨(Populustrichocarpa)、蒺藜苜蓿(Medicago truncatula)、Cicer yamashitae、野生鹰嘴豆(Cicerbijugum)、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、Cicer judaicum、木豆(Cajanus cajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolusvulgaris)、大豆(Glycine max)、棉属(Gossypium sp.)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏槿(Torenia fournieri)、洋葱(Allium cepa)、葱(Alliumfistulosum)、大蒜(Allium sativum)、向日葵(Helianthus annuus)、菊芋(Helianthustuberosus)和韭菜(Allium tuberosum),以及属于上述植物之一的任何品种或亚种。
与本发明一起使用的治疗方法
本发明的方法提供了一种用于治疗病害和/或病症(诸如但不限于由昆虫引起的病害)的方法。本发明的方法还提供了一种用于预防植物中的昆虫感染和/或侵染(例如,昆虫抗性)的方法。
通过本发明方法可治疗的病害和/或病症的非限制性示例包括炭疽病茎腐病、曲霉穗腐病、普通玉米穗腐病、玉米穗病(不常见)、普通玉米锈病、二倍体穗腐病、二倍体茎腐病、霜霉病、眼斑病、镰刀菌穗腐病、镰刀菌茎腐病、赤霉素耳腐病、赤霉菌茎腐病、戈斯枯萎病和叶枯病、灰色叶斑病、丝黑穗病、北方玉米叶枯病、褐斑病、腐霉病、南方叶斑病、南方锈病和斯图尔特细菌性枯萎病和枯萎病及其组合。
通过本发明的可直接或间接引起病害和/或病症的昆虫的非限制性示例包括粘虫、亚洲园林甲虫、小地老虎、棕纹蝽、褐臭蝽、普通茎螟、玉米臭虫、玉米穗虫、玉米叶蚜虫、玉米根虫、玉米根虫蚕丝、欧洲玉米螟、秋天粘虫、葡萄肖叶甲、啤酒花蛀虫、日本甲虫、秋季行军粘虫(Scouting for Fall Armyworm)、种子玉米甲虫、种子玉米蛆、南方玉米叶甲虫、西南玉米螟、红蜘蛛、甘蔗甲虫、西豆角虫、蛴螬和线虫及其组合。本发明的方法还适用于防止植物被任何此类昆虫感染和/或侵染。
植物病害的其他非限制性示例列于WO 2013/046247,并在以下重现:
水稻病害:稻瘟病菌、米氏科氏菌、茄属根瘤菌、富士赤霉菌;
小麦病害:小麦白粉病(Erysiphe graminis)、禾谷镰刀菌(Fusariumgraminearum)、燕麦镰刀菌(F.avenaceum)、大刀镰刀菌(F.culmorum)、微座孢属斑病(Microdochium nivale)、条形柄锈菌(Puccinia striiformis)、小麦秆锈菌(P.graminis)、小麦叶锈病菌(P.recondita)、雪腐镰刀菌(Micronectriella nivale)、斑疹伤寒菌(Typhula sp.)、黑粉菌(Ustilago tritici)、网腥黑粉菌(Tilletia caries)、小麦基腐病菌(Pseudocercosporella herpotrichoides)、叶枯病(Mycosphaerellagraminicola)、颖枯壳针孢(Stagonospora nodorum)、偃麦草核腔菌(Pyrenophoratritici-repentis);
大麦病害:小麦白粉病(Erysiphe graminis)、禾谷镰刀菌(Fusariumgraminearum)、燕麦镰刀菌(F.avenaceum)、大刀镰刀菌(F.culmorum)、微座孢属斑病(Microdochium nivale)、条形柄锈菌(Puccinia striiformis)、小麦秆锈菌(P.graminis)、大麦褐锈病(P.hordei)、大麦散黑穗病(Ustilago nuda)、大麦云纹病菌(Rhynchosporium secalis)、大麦网斑病(Pyrenophora teres)、禾旋孢腔菌(Cochliobolus sativus)、大麦条纹病(Pyrenophora graminea)、立枯丝核菌(Rhizoctonia solani);
玉米病害:玉蜀黍黑粉菌(Ustilago maydis)、异旋孢腔菌(Cochliobolusheterostrophus)、高粱胶尾孢(Geoeocercospora sorghi)、玉米锈病(Pucciniapolysora)、玉米灰斑病菌(Cercospora zeae-maydis)、立枯丝核菌(Rhizoctoniasolani);
柑橘类病害:间座壳菌(Diaporthe citri)、疮痂病(Elsinoe fawcetti)、指状青霉(Penicillium digitatum)、意大利青霉(P.italicum)、寄生疫霉(Phytophthoraparasitica)、柑桔褐腐疫霉(Phytophthora citrophthora);
苹果病害:苹果链核盘菌(Monilinia mali)、苹果腐烂病(Valsa ceratosperma)、白叉丝单囊壳(Podosphaera leucotricha)、斑点落叶病菌(Alternaria alternata applepathotype)、黑星病(Venturia inaequalis)、炭疽菌(Colletotrichum acutatum)、恶疫霉菌(Phytophtora cactorum);
梨病害:星病菌(Venturia nashicola)、梨黑星病(V.pirina)、斑病菌(Alternaria alternata Japanese pear pathotype)、梨胶锈菌(Gymnosporangiumharaeanum)、恶疫霉菌(Phytophtora cactorum);
桃子病害:桃褐腐病菌(Monilinia fructicola)、疮痂病(Caradosporiumcarpophilum)、拟茎点霉(Phomopsis sp.);
葡萄病害:痂囊腔菌(Elsinoe ampelina)、围小丛壳菌(Glomerella cingulata)、Uninula necator、葡萄锈病菌(Phakopsora ampelopsidis)、葡萄球座菌(Guignardiabidwellii)、霜霉病(Plasmopara viticola);
柿子病害:柿炭疽病(Gloesporium kaki)、柿角斑病(Cercospora kaki)、Mycosphaerela nawae;
葫芦病害:葫芦科刺盘孢(Colletotrichum lagenarium)、白粉病菌(Sphaerotheca fuliginea)、蔓枯病(Mycosphaerella melonis)、尖孢镰刀菌(Fusariumoxysporum)、霜霉病菌(Pseudoperonospora cubensis)、疫霉菌(Phytophthora sp.)、腐霉菌(Pythium sp.);
番茄病害:茄链格孢(Alternaria solani)、黄枝孢霉(Cladosporium fulvum)、致病疫霉(Phytophthora infestans);
茄子病害:茄子褐纹病(Phomopsis vexans)、白粉病菌(Erysiphecichoracearum);
十字花科类蔬菜病害:链格孢菌(Alternaria japonica)、白菜白斑病菌(Cercosporella brasicae)、根肿病(Plasmodiophora brasicae)、寄生孢霉(Peronosporaparasitica);
大葱病害:葱柄锈菌(Puccinia allii)、霜霉病(Peronospora destructor);
大豆病害:大豆紫斑病菌(Cercospora kikuchii)、痂囊腔菌属甘氨酸(Elsinoeglycines)、海洋红树林内生真菌(Diaporthe phaseolorum var.sojae)、大豆壳针孢(Septoria glycines)、细毛角斑病菌(Cercospora sojina)、大豆锈菌(Phakopsorapachyrhizi)、大豆疫霉菌(Phytophthora sojae)、立枯丝核菌(Rhizoctonia solani)、褐斑病菌(Corynespora casiicola)、核盘菌(Sclerotinia sclerotiorum);
芸豆病害:林地炭疽病(Colletrichum lindemthianum);
花生病害:花生黑斑病菌(Cercospora personata)、褐斑病菌(Cercosporaarachidicola)、齐整小核菌(Sclerotium rolfsii);
豌豆病害:豌豆白粉菌(Erysiphe pisi);
马铃薯病害:茄链格孢(Alternaria solani)、疫霉菌(Phytophthorainfestans)、马铃薯绯腐病菌(Phytophthora erythroseptica)、马铃薯粉痂菌(Spongospora subterranean)、f.sp.Subterranean;
草莓病害:白粉病(Sphaerotheca humuli),炭疽病(Glomerella cingulata);
茶病害:茶网饼病菌(Exobasidium reticulatum)、白星病(Elsinoeleucospila)、拟盘菌(Pestalotiopsis sp.)、炭疽病(Colletotrichum theae-sinensis);
烟草病害:烟草赤星病菌(Alternaria longipes)、烟草白粉病(Erysiphecichoracearum)、刺盘孢(Colletotrichum tabacum)、烟草霜霉病(Peronosporatabacina)、烟草疫霉菌(Phytophthora nicotianae);
油菜病害:核盘菌(Sclerotinia sclerotiorum)、立枯丝核菌(Rhizoctoniasolani);
棉花病害:立枯丝核菌(Rhizoctonia solani);
甜菜病害:白尾孢(Cercospora beticola)、水稻纹枯病(Thanatephoruscucumeris)、水稻纹枯病(Thanatephorus cucumeris)、丝囊霉(Aphanomycescochlioides);
玫瑰病害:蔷薇双壳菌(Diplocarpon rosae)、单丝壳菌(Sphaerothecapannosa)、霜霉病(Peronospora sparsa);
菊花和菊科病害:莴苣盘梗霉(Bremia lactuca)、菊壳针孢(Septoriachrysanthemi-indici)、菊花白锈病(Puccinia horiana);
各种植物的病害:瓜果腐霉(Pythium aphanidermatum)、德巴利腐霉(Pythiumdebarianum)、禾生腐霉菌(Pythium graminicola)、畸雌腐霉(Pythium irregulare)、极腐霉(Pythium ultimum)、葡萄孢菌(Botrytis cinerea)、核盘菌(Sclerotiniasclerotiorum);
萝卜病害:黑斑病菌(Alternaria brassicicola);
结缕草病害:内果硬核菌(Sclerotinia homeocarpa)、立枯丝核菌(Rhizoctoniasolani);
香蕉病害:香蕉黑条叶斑病菌(Mycosphaerella fijiensis)、香蕉褐条斑小球壳菌(Mycosphaerella musicola);
向日葵病害:单轴霉(Plasmopara halstedii);
由曲霉属(Aspergillus spp.)、青霉属(Penicillium spp.)、镰刀菌属(Fusariumspp.)、赤霉菌属(Gibberella spp.)、木霉属(Tricoderma spp.)、Thielaviopsis spp.、根霉属、毛霉菌、伏革菌属、Rhoma spp.、丝核菌属、Diplodia spp.等引起的种子病害或各种植物生长初期的病害。
Polymixa spp.、奥氏菌属(Olpidium spp.)介导的各种植物的病毒病等。
创造营养改良作物和功能性食品的方法
本文所述的CasX系统和方法可用于生产营养改良的农作物。在一些实施方案中,本文提供的方法适于生产“功能性食品”,即可以提供超出其包含的传统营养素的健康益处的改良食品或食品成分,和/或“营养食品”,即可以被认为是食品或食品的一部分并提供健康益处的物质,包括病害的预防和治疗。该营养食品可用于预防和/或治疗癌症、糖尿病、心血管病害和高血压中的一种或多种病害。
例如,营养改善的农作物可诱导或增加了以下一种或多种化合物的合成:类胡萝卜素,诸如各种水果和蔬菜中的α-胡萝卜素或β-胡萝卜素;叶黄素;番茄和番茄制品中存在的番茄红素;玉米黄质,存在于柑橘和玉米中;膳食纤维、β-葡聚糖、脂肪酸(例如omega-3、共轭亚油酸、GLA和CVD);黄酮类化合物(例如小麦中存在的羟基肉桂酸酯);黄酮醇;儿茶素;单宁;芥子油苷;吲哚;异硫氰酸盐,诸如萝卜硫烷;酚类,诸如葡萄中的斯蒂芬类、咖啡酸、阿魏酸和表儿茶素;玉米、大豆、小麦和木油中存在的植物甾烷醇/甾醇;果聚糖;菊糖;菊芋中的低聚果糖;大豆中存在的皂苷;植物雌激素;亚麻、黑麦和蔬菜中存在的木脂素;二烯丙基硫;烯丙基甲基三硫化物;二硫代硫酮;和单宁,诸如原花青素。
诱导或增加的合成可通过直接引入一种或多种编码上述化合物合成中涉及的蛋白质的基因而发生。或者,可以修饰植物的代谢,以便增加一种或多种上述化合物的产量。例如,可以工程化植物以表达硬脂基-ACP去饱和酶的反义基因以增加植物的硬脂酸含量。可将植物工程化成表达突变形式的DNA,以阻止上述化合物之一的降解。拟南芥可被工程化以在强启动子的控制下表达Tfs C1和R,从而带来高的花色素苷积聚率。参见Bruce等人,2000,Plant Cell 12:65-80。Tf RAP2.2及其相互作用伴侣SINAT2的表达增加可以增加拟南芥叶片中的类胡萝卜素形成作用。在拟南芥中表达Tf Dof1可诱导编码碳骨架酶的基因的上调、氨基酸含量的显著增加和Glc水平的降低。
本文提供的方法可用于产生变应原水平降低的植物。在特定的实施方案中,这些方法包含修饰负责植物变应原产生的一种或多种基因的表达。在一些实施方案中,CasX可用于破坏或下调植物细胞(诸如黑麦草植物细胞)中的Lol p5基因的表达,并从中再生植物,以便降低所述植物的花粉的变应原性。本文所述的CasX系统和方法可用于鉴定然后编辑或沉默编码此类豆类的致敏蛋白的基因。在花生,大豆,小扁豆,豌豆,羽扇豆,四季豆和绿豆中可能已经鉴定了一些此类的基因。参见Nicolaou等人,2011年《过敏与临床免疫学》的最新观点;11:3(222)。
增强生物燃料生产的方法
本文所述的CasX系统和方法可用于增强植物中生物燃料的生产。可以从有机物质中提取可再生的生物燃料,这些有机物质的能量是通过固碳过程获得的,或者是通过使用用或转化生物质制得的。此类生物质可以直接用于生物燃料,或者可以通过热转化、化学转化和生化转化而转化为方便的含能量物质。至少可以生产两种类型的生物燃料:生物乙醇和生物柴油。生物乙醇主要是通过纤维素(淀粉)的糖发酵过程生产的,该纤维素大部分来自玉米和甘蔗。另一方面,生物柴油主要来自油料作物,诸如油菜籽、棕榈和大豆。
如本文所述的使用CasX CRISPR系统的方法可用于改变细胞壁的性质,以便促进关键的水解剂的进入,从而更有效地释放糖以进行发酵。在特定的实施方案中,纤维素和/或木质素的生物合成被修饰。纤维素是细胞壁的主要成分。纤维素和木质素的生物合成是共同调节的。通过减少植物中木质素的比例,可增加纤维素的比例。在特定的实施方案中,本文所述的方法用于下调植物中木质素的生物合成,以便增加可发酵的碳水化合物。更具体而言,本文所述的方法用于下调至少第一木质素生物合成基因,该基因选自由以下项构成的组:4-香豆酸3-羟化酶(C3H)、苯丙氨酸氨裂合酶(PAL)、肉桂酸4-羟化酶(C4H)、羟肉桂酸转移酶(HCT)、咖啡酸O-甲基转移酶(COMT)、咖啡酰辅酶A 3-O-甲基转移酶(CCoAOMT)、阿魏酸5-羟化酶(F5H)、肉桂醇脱氢酶(CAD)、肉桂酰辅酶A还原酶(CCR)、4-香豆酸酯-CoA连接酶(4CL)、单木酚-木脂蛋白特异性糖基转移酶和醛脱氢酶(ALDH)、如WO2008/064289中所公开的。本文公开的方法可用于产生与Cas1L同源的突变,以减少多糖乙酰化。
在US2015/0152398、US2016/0145631、US2015/089681、WO2016/205749和WO2016/196655中找到了用于本发明的其他方法和组合物。
实施例
还通过以下示例描述和证明本发明。但是,在说明书中任何地方使用这些和其他示例仅是说明性的,绝不限制本发明或任何示例性术语的范围和含义。同样,本发明不限于本文描述的任何特定的优选实施例。实际上,在阅读本说明书后,本发明的许多修改和变化对本领域技术人员而言是显而易见的,并且在不脱离本发明的精神或范围的情况下,可以进行各种变化。因此,本发明仅由所附权利要求的条款以及那些权利要求所赋予的等同物的全部范围来限制。
实施例1:用于植物优化表达的CasX和测量核酸内切酶活性的盒。
为了测试CasX核酸内切酶在植物细胞中的活性,将δ变形菌CasX蛋白序列(NCBI登录号MGPG01000094,SEQ ID NO:1)修改为在植物中最佳翻译起始的N末端MASS序列,紧接着是SV40 NLS序列和C-末端核糖核酸NLS序列,紧接着是用于抗体检测的HA标签,以形成2NLS-CRISPR/CasX(SEQ ID NO:5)。为了证明2NLS-CRISPR/CasX核酸内切酶在植物细胞中的活性,将这种优化的蛋白与密码子一起进行反翻译,以在植物中高效表达,然后置于强组成型表达盒中。设计了类似的盒,用于表达2NLS-CRISPR/CasX核酸内切酶,并具有与绿色荧光报道分子(SEQ ID NO:3)的C末端翻译融合。这些表达盒(SEQ ID NO:7&SEQ ID No:8)被克隆到最小的质粒载体主链,诸如pBlueScript主链。
产生第三质粒作为载体,以共递送用于测试核酸内切酶活性的游离型靶标。该载体包含针对tdTomato荧光报道分子的强组成型表达盒,随后是核酸内切酶靶标的克隆位点,之后是相对于tdTomato报道分子而言超出框架的mNeonGreen编码序列。靶位点的核酸内切酶裂解导致NHEJ修复,并且这些修复事件的一些频率将产生导致mNeonGreen蛋白表达的移码。通过比较表达tdTomato和mNeonGreen的细胞群体相对于仅表达tdTomato的细胞群体,可以测量在不同条件下,或不同核酸酶或不同向导RNA下的相对裂解效率。这种类型的测试构建体通常称为“交通灯报道分子”(TLR)。
实施例2:表达的2NLS-CRISPR/CasX的正确亚细胞定位和游离靶标的切割。
为了证明2NLS-CRISPR/CasX植物优化基因的稳健表达和正确的亚细胞定位,将含有2NLS-CRISPR/CasX-mNeonGreen表达盒(SEQ ID NO:8)的质粒用PEG转化为从幼叶中分离的原生质体转化为从玉米和烟草植物幼叶分离的原生质体,并监测亚细胞积累。mNeonGreen报道分子的强核信号表明核酸内切酶蛋白表达稳健且亚细胞定位正确。
为了证明CRISPR/CasX在单子叶植物和双子叶植物细胞中以及在植物优化温度下的活性,从玉米和本氏烟草植物的幼叶中分离了原生质体,并用含有2NLS-CRISPR/CasX表达盒和带有核酸内切酶靶标的TLR的载体进行了转化。另外,各种长度的5’-磷酸化的单链RNA被共转化为适当靶序列的向导RNA。转化后,将细胞在18℃和37℃之间的各种温度下孵育至少24小时(25℃至28℃是植物生长的最佳温度)。通过流式细胞术评估相对核酸酶活性,以比较表达tdTomato和mNeonGreen的细胞群相对于仅表达tdTomato的细胞群。
实施方案3:CRISPR/CasX在原生质体中的染色体位点靶向突变。
为了证明CRISPR/CasX在染色体靶标处诱导靶向突变的效用,从玉米植物的幼叶中分离原生质体并用含有2NLS-CRISPR/CasX或2NLS-CRISPR/CasX-mNeonGreen表达盒的载体转化。此外,将5’-磷酸化的单链RNA共转化为玉米基因组中适当靶序列的向导RNA。可通过基于PCR的检测,通过PCR扩增的靶标的靶向下一代测序(NGS;也称为深度测序)或通过整合的tdTomato荧光报道分子的信号缺失来鉴定靶标突变。
为了证明CRISPR/CasX在染色体靶标上诱导多重编辑事件的效用,通过两个5’-磷酸化的单链向导RNA分子的共转化重复了相同的实验。通过基于PCR的检测,通过PCR扩增的靶标的靶向NGS或通过整合tdTomato荧光报道分子的信号缺失来鉴定靶向突变。
实施方案4:CRISPR/CasX在再生组织中定向诱变染色体位点,随后进行植物再生
和突变遗传。
为了证明使用CRISPR/CasX产生可遗传的基因编辑事件,将含有除草剂选择标记物的载体和含有2NLS-CRISPR/CasX表达盒的载体与5’-磷酸化的单链RNA一起轰击玉米愈伤组织,作为针对染色体靶标的向导RNA。从被轰击的组织中再生出小植物,并通过表型、基于PCR的测序方法和针对染色体靶标突变的测序方法进行筛选。带有目标突变的植物进行自交,后代进行突变遗传筛选。
实施方案5:CRISPR/CasX在原生质体中基因编辑的应用。
为了证明CRISPR/CasX在植物细胞中染色体靶标处进行基因编辑的效用,从玉米植物的幼叶中分离出原生质体,并用含有2NLS-CRISPR/CasX表达盒、5’-磷酸化的单链RNA的载体转化为适合染色体靶序列的向导RNA和用于染色体靶标正确修复的DNA修复模板。通过流式细胞术评估基因编辑,以鉴定表达源自模板的靶向修复的荧光报道分子信号的细胞数量。通过PCR扩增和测序确认正确的修复。
实施方案6:含有修饰碱基的向导RNA在用CRISPR/CasX进行原生质体中定向诱变
的应用。
为了证明CRISPR/CasX与包含修饰碱基的向导RNA的组合使用,从玉米植物的幼叶中分离了原生质体,并用含有2NLS-CRISPR/CasX表达盒且带有或不带有具有核酸内切酶靶标的TLR的载体转化。此外,含有修饰碱基的5'-磷酸化单链RNA被共转化为适当靶序列的向导RNA。通过流式细胞术评估使用有和没有各种修饰的向导RNA的相对核酸酶活性,以将表达tdTomato和mNeonGreen的细胞群与仅表达tdTomato的细胞群进行比较。通过基于PCR的检测,通过PCR扩增的靶标的靶向NGS或通过整合的tdTomato荧光报道分子的信号缺失,评估染色体靶标处的核酸酶活性。
序列表
SEQ ID NO:1:来自δ变形菌(Deltaproteobacteria)的CRISPR/CasX,NCBI登录号MGPG01000094
SEQ ID NO:2:来自浮霉菌(Planctomycetes)的CasX,NCBI登录号MHYZ01000150
SEQ ID NO:3:来自δ变形菌(Deltaproteobacteria)的CRISPR/CasX与mNeonGreen融合
SEQ ID NO:4:与mNeonGreen融合的来自浮霉菌(Planctomycetes)的CasX
SEQ ID NO:5:来自δ变形菌(Deltaproteobacteria)的2NLS-CRISPR/CasX,具有N末端和C末端序列修饰,用于最佳翻译、核定位和抗体检测
SEQ ID NO:6:来自浮霉菌(Planctomycetes)的2NLS-CRISPR/CasX,具有N末端和C末端序列修饰,用于最佳翻译、核定位和抗体检测
SEQ ID NO:7:来自δ变形菌(Deltaproteobacteria)的CRISPR/CasX的强组成型表达盒;专有的强组成型启动子构型,可驱动此编码DNA序列的表达。
SEQ ID NO:8:与mNeonGreen融合的来自δ变形菌(Deltaproteobacteria)的CRISPR/CasX的强组成型表达盒;专有的强组成型启动子构型,可驱动此编码DNA序列的表达。
***本发明的范围不受本文所述的具体实施方案的限制。实际上,除了本文所描述那些之外,根据前述描述,本发明的各种修改对于本领域技术人员将变得显而易见。此类修改旨在落入所附权利要求书的范围内。
本文引用的所有专利、申请、出版物、测试方法、文献和其他材料通过引用整体并入本文,就如同物理上存在于本说明书中一样。
序列表
<110> KWS SAAT SE
<120> CRISPR-Cas核酸内切酶在植物基因组工程中的应用
<130> KWS0262PCT
<150> US 62/500,639
<151> 2017-05-03
<160> 8
<170> PatentIn version 3.5
<210> 1
<211> 977
<212> PRT
<213> delta proteobacterium
<400> 1
Val Ala Leu His Pro Arg Leu Glu Arg Lys Ile Lys Glu Phe Leu Pro
1 5 10 15
Thr Tyr Arg Leu Gly Val Asp Leu Gly Glu Ala Ala Gly Gly Leu Ala
20 25 30
Leu Ile His Asn Asn Asn Ile Leu His Ala Glu Thr Phe Thr Asp Phe
35 40 45
His Glu Ala Thr Leu Glu Thr Lys Arg Ala Leu Arg Arg Gly Arg Arg
50 55 60
Thr Arg His Ala Lys Lys Met Arg Leu Ala Arg Leu Arg Ser Trp Ile
65 70 75 80
Leu Arg Gln Cys Ile Pro Ala His Val Thr Gly Ala Glu Ile Lys Asp
85 90 95
Ser Tyr Ser Arg Leu Pro Asp Pro Tyr Arg Leu Met Lys Asp Lys Lys
100 105 110
Tyr Gln Thr Leu Pro Gly Phe Tyr Glu Val Lys Gly Gln Asn Pro Glu
115 120 125
Lys Ser Pro Thr Trp Ile Asp Lys Ala Lys Ala Gly Glu Val Asp Ala
130 135 140
Glu Gly Phe Val Ile Ala Leu Thr His Ile Leu Gln Lys Arg Gly Tyr
145 150 155 160
Lys Tyr Asp Gly Lys Glu Phe Ser Asp Tyr Asp Asp Ser Arg Leu Ile
165 170 175
Asp Phe Ile Asp Ser Cys Ala Met Leu Ala Glu Ala Pro Glu Met Arg
180 185 190
Lys Ala Leu Glu Asp Glu Ile Met Arg Arg Glu Val Gly Glu Lys Glu
195 200 205
Lys Pro Lys Leu His Glu Ala Phe Asp Asn Ala Leu Asn Arg Gln Arg
210 215 220
Glu Arg Lys Lys Ala Leu Pro Arg Gln Val Arg Glu Lys Asp Met Glu
225 230 235 240
Asp Met Val Asp Val Phe Gly Arg Arg Trp Gln Leu Ser Gln Glu Ile
245 250 255
Ile Ala Asn Trp Lys Ser Gln Leu Thr Gly Leu Leu Asn Lys Val Val
260 265 270
Arg Glu Ala Arg Tyr Asp Asn Arg Leu Lys Ser Gly Cys Ser Trp Cys
275 280 285
Gly Lys Lys Thr Pro Arg Leu Ala Lys Pro Glu Ile Arg Glu Leu Ala
290 295 300
Phe Glu Ala Ala Val Gly Asn Leu Arg Ile Arg Glu Arg Asp Gly Arg
305 310 315 320
Asp Arg Pro Ile Ser Asp Glu Glu Arg Asn Pro Leu Arg Gly Trp Phe
325 330 335
Gln Arg Arg Arg Glu Asn His Asp Tyr Ser Arg Ala Thr Lys Asn Thr
340 345 350
Pro Ile Glu Glu Arg Ala Pro Ser Glu Asp Asn Ile Arg Thr Tyr Leu
355 360 365
Glu Gln Ile Gly Val Lys Lys Ala Trp Ile Arg Lys Lys Lys Gly Lys
370 375 380
Glu Lys Trp Lys Phe Asp Phe Ala Met Leu Pro Gln Leu Asp Asn Leu
385 390 395 400
Ile Asn Lys Glu Ala Arg Lys Gly Arg Ala Arg Leu Cys Val Glu His
405 410 415
Met Arg Met Gln Ala Glu Gly Lys Thr Met Lys Asp Ala Asp Val Asp
420 425 430
Trp Gln Ser Met Arg Lys Arg Asn Ala Pro Asn Pro Arg Arg Glu Gln
435 440 445
His Asp Ala Arg Val Leu Lys Arg Ile Glu Arg Leu Ile Phe Asn Arg
450 455 460
Gly Lys Lys Gly Thr Asp Ala Trp Arg His Gly Pro Ile Ala Val Ile
465 470 475 480
Thr Leu Glu Val Pro Met Pro Val Asp Leu Glu Arg Ala Arg Glu Lys
485 490 495
Glu Gln Val Glu Arg Lys Pro Leu Asn Leu Arg Gln Arg Leu His Ala
500 505 510
Glu Thr Glu Gly Val Cys Ile Tyr Cys Gly Glu Asn Val His Asp Arg
515 520 525
Thr Met His Leu Glu His Ile Val Pro Gln Ala Lys Gly Gly Pro Asp
530 535 540
Val Gln Met Asn Arg Ile Ala Ser Cys Pro Lys Cys Asn Ala Asp Arg
545 550 555 560
Asp Thr Gly Lys Lys Asp Met Leu Pro Ser Glu Trp Leu Thr Gly Asp
565 570 575
Lys Trp Asn Val Phe Lys Ser Arg Val Met Ser Leu Asn Leu Pro Pro
580 585 590
Leu Lys Lys Gln Leu Leu Leu Leu Glu Pro Gly Ser Lys Tyr Pro Asn
595 600 605
Asp Pro Thr Pro Leu Ala Arg Val Ser Ala Arg Trp Arg Ala Phe Ala
610 615 620
Ala Asp Ile Met Trp Leu Phe Asp Glu Tyr Ser Val Pro Val Pro Thr
625 630 635 640
Leu Asn Tyr Glu Lys Asp Lys Pro His Ile Gln Val Val Arg Gly Asn
645 650 655
Leu Thr Ser Arg Leu Arg Arg Asp Trp Arg Trp Lys Asp His Glu Ala
660 665 670
Thr Val Glu Asn Phe Pro Asp Lys Arg Arg Thr Asp Leu Tyr Asn His
675 680 685
Ala Gln Asp Ala Ala Ile Leu Ala Ala Ile Pro Pro His Thr Trp Gln
690 695 700
Glu Gln Ile Phe Ser Asp Met Ala Val Arg Pro Cys Ala Lys Lys Asp
705 710 715 720
Glu Gln Gly Asn Ile Leu Lys Asn Glu Lys Glu Met Arg Pro Arg Pro
725 730 735
Gly Ile Ala Ala Leu Ala Leu Ala Pro Glu Trp Ala Asp Tyr Glu Arg
740 745 750
Thr Gln Lys Glu Leu Lys Arg Pro Met Val His Thr Leu Gly Lys Leu
755 760 765
Lys Ala Thr Trp Arg Arg Gln Ile Met Asp Leu Ser Phe Tyr Gln Asn
770 775 780
Pro Thr Asp Asn Asp Gly Pro Leu Phe Ile Arg Lys Val Asp Ala Lys
785 790 795 800
Thr Gly Lys Arg Glu Thr Lys Glu Val Gln Lys Gly Gly Leu Val Val
805 810 815
Gln Val Pro His Tyr Asp Gly Thr Ser Gly Lys Arg Lys Val Gln Ile
820 825 830
Lys Pro Ile Gln Ser Asn Ala Ile Ile Leu Trp His Asp Pro Ser Gly
835 840 845
Arg Lys Asp Asn Leu Asn Ile Ser Ile Glu Arg Pro Ala Ala Ile Lys
850 855 860
Lys Phe Val Lys His Pro Val Asp Pro Pro Ile Ala Ser Asp Ala Ile
865 870 875 880
Ile Leu Gly Arg Ile Glu Arg Ala Ser Thr Leu Trp Leu Arg Glu Gly
885 890 895
Lys Gly Thr Val Glu Leu Lys Ala Asp Lys Lys Ser Val Arg Ser Ser
900 905 910
Val Val Met Pro Glu Gly Ile Tyr Arg Val Lys Glu Leu Gly Ser Asn
915 920 925
Gly Val Ile Val Val Gln Glu Asn Ala Val Ser Lys Glu Leu Ala Asn
930 935 940
Lys Leu Gly Ile Ser Asp Asp Gln Phe Ser Lys Val Pro Glu Arg Ala
945 950 955 960
Leu Gly Lys Lys Glu Leu Ala Glu Tyr Phe Lys Gly Asn Gln Arg Ser
965 970 975
Gly
<210> 2
<211> 978
<212> PRT
<213> Planctomyces sp.
<400> 2
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 3
<211> 1213
<212> PRT
<213> 人工序列
<220>
<223> 与mNeonGreen融合的来自Deltaproteobacteria的CRISPR/CasX
<400> 3
Val Ala Leu His Pro Arg Leu Glu Arg Lys Ile Lys Glu Phe Leu Pro
1 5 10 15
Thr Tyr Arg Leu Gly Val Asp Leu Gly Glu Ala Ala Gly Gly Leu Ala
20 25 30
Leu Ile His Asn Asn Asn Ile Leu His Ala Glu Thr Phe Thr Asp Phe
35 40 45
His Glu Ala Thr Leu Glu Thr Lys Arg Ala Leu Arg Arg Gly Arg Arg
50 55 60
Thr Arg His Ala Lys Lys Met Arg Leu Ala Arg Leu Arg Ser Trp Ile
65 70 75 80
Leu Arg Gln Cys Ile Pro Ala His Val Thr Gly Ala Glu Ile Lys Asp
85 90 95
Ser Tyr Ser Arg Leu Pro Asp Pro Tyr Arg Leu Met Lys Asp Lys Lys
100 105 110
Tyr Gln Thr Leu Pro Gly Phe Tyr Glu Val Lys Gly Gln Asn Pro Glu
115 120 125
Lys Ser Pro Thr Trp Ile Asp Lys Ala Lys Ala Gly Glu Val Asp Ala
130 135 140
Glu Gly Phe Val Ile Ala Leu Thr His Ile Leu Gln Lys Arg Gly Tyr
145 150 155 160
Lys Tyr Asp Gly Lys Glu Phe Ser Asp Tyr Asp Asp Ser Arg Leu Ile
165 170 175
Asp Phe Ile Asp Ser Cys Ala Met Leu Ala Glu Ala Pro Glu Met Arg
180 185 190
Lys Ala Leu Glu Asp Glu Ile Met Arg Arg Glu Val Gly Glu Lys Glu
195 200 205
Lys Pro Lys Leu His Glu Ala Phe Asp Asn Ala Leu Asn Arg Gln Arg
210 215 220
Glu Arg Lys Lys Ala Leu Pro Arg Gln Val Arg Glu Lys Asp Met Glu
225 230 235 240
Asp Met Val Asp Val Phe Gly Arg Arg Trp Gln Leu Ser Gln Glu Ile
245 250 255
Ile Ala Asn Trp Lys Ser Gln Leu Thr Gly Leu Leu Asn Lys Val Val
260 265 270
Arg Glu Ala Arg Tyr Asp Asn Arg Leu Lys Ser Gly Cys Ser Trp Cys
275 280 285
Gly Lys Lys Thr Pro Arg Leu Ala Lys Pro Glu Ile Arg Glu Leu Ala
290 295 300
Phe Glu Ala Ala Val Gly Asn Leu Arg Ile Arg Glu Arg Asp Gly Arg
305 310 315 320
Asp Arg Pro Ile Ser Asp Glu Glu Arg Asn Pro Leu Arg Gly Trp Phe
325 330 335
Gln Arg Arg Arg Glu Asn His Asp Tyr Ser Arg Ala Thr Lys Asn Thr
340 345 350
Pro Ile Glu Glu Arg Ala Pro Ser Glu Asp Asn Ile Arg Thr Tyr Leu
355 360 365
Glu Gln Ile Gly Val Lys Lys Ala Trp Ile Arg Lys Lys Lys Gly Lys
370 375 380
Glu Lys Trp Lys Phe Asp Phe Ala Met Leu Pro Gln Leu Asp Asn Leu
385 390 395 400
Ile Asn Lys Glu Ala Arg Lys Gly Arg Ala Arg Leu Cys Val Glu His
405 410 415
Met Arg Met Gln Ala Glu Gly Lys Thr Met Lys Asp Ala Asp Val Asp
420 425 430
Trp Gln Ser Met Arg Lys Arg Asn Ala Pro Asn Pro Arg Arg Glu Gln
435 440 445
His Asp Ala Arg Val Leu Lys Arg Ile Glu Arg Leu Ile Phe Asn Arg
450 455 460
Gly Lys Lys Gly Thr Asp Ala Trp Arg His Gly Pro Ile Ala Val Ile
465 470 475 480
Thr Leu Glu Val Pro Met Pro Val Asp Leu Glu Arg Ala Arg Glu Lys
485 490 495
Glu Gln Val Glu Arg Lys Pro Leu Asn Leu Arg Gln Arg Leu His Ala
500 505 510
Glu Thr Glu Gly Val Cys Ile Tyr Cys Gly Glu Asn Val His Asp Arg
515 520 525
Thr Met His Leu Glu His Ile Val Pro Gln Ala Lys Gly Gly Pro Asp
530 535 540
Val Gln Met Asn Arg Ile Ala Ser Cys Pro Lys Cys Asn Ala Asp Arg
545 550 555 560
Asp Thr Gly Lys Lys Asp Met Leu Pro Ser Glu Trp Leu Thr Gly Asp
565 570 575
Lys Trp Asn Val Phe Lys Ser Arg Val Met Ser Leu Asn Leu Pro Pro
580 585 590
Leu Lys Lys Gln Leu Leu Leu Leu Glu Pro Gly Ser Lys Tyr Pro Asn
595 600 605
Asp Pro Thr Pro Leu Ala Arg Val Ser Ala Arg Trp Arg Ala Phe Ala
610 615 620
Ala Asp Ile Met Trp Leu Phe Asp Glu Tyr Ser Val Pro Val Pro Thr
625 630 635 640
Leu Asn Tyr Glu Lys Asp Lys Pro His Ile Gln Val Val Arg Gly Asn
645 650 655
Leu Thr Ser Arg Leu Arg Arg Asp Trp Arg Trp Lys Asp His Glu Ala
660 665 670
Thr Val Glu Asn Phe Pro Asp Lys Arg Arg Thr Asp Leu Tyr Asn His
675 680 685
Ala Gln Asp Ala Ala Ile Leu Ala Ala Ile Pro Pro His Thr Trp Gln
690 695 700
Glu Gln Ile Phe Ser Asp Met Ala Val Arg Pro Cys Ala Lys Lys Asp
705 710 715 720
Glu Gln Gly Asn Ile Leu Lys Asn Glu Lys Glu Met Arg Pro Arg Pro
725 730 735
Gly Ile Ala Ala Leu Ala Leu Ala Pro Glu Trp Ala Asp Tyr Glu Arg
740 745 750
Thr Gln Lys Glu Leu Lys Arg Pro Met Val His Thr Leu Gly Lys Leu
755 760 765
Lys Ala Thr Trp Arg Arg Gln Ile Met Asp Leu Ser Phe Tyr Gln Asn
770 775 780
Pro Thr Asp Asn Asp Gly Pro Leu Phe Ile Arg Lys Val Asp Ala Lys
785 790 795 800
Thr Gly Lys Arg Glu Thr Lys Glu Val Gln Lys Gly Gly Leu Val Val
805 810 815
Gln Val Pro His Tyr Asp Gly Thr Ser Gly Lys Arg Lys Val Gln Ile
820 825 830
Lys Pro Ile Gln Ser Asn Ala Ile Ile Leu Trp His Asp Pro Ser Gly
835 840 845
Arg Lys Asp Asn Leu Asn Ile Ser Ile Glu Arg Pro Ala Ala Ile Lys
850 855 860
Lys Phe Val Lys His Pro Val Asp Pro Pro Ile Ala Ser Asp Ala Ile
865 870 875 880
Ile Leu Gly Arg Ile Glu Arg Ala Ser Thr Leu Trp Leu Arg Glu Gly
885 890 895
Lys Gly Thr Val Glu Leu Lys Ala Asp Lys Lys Ser Val Arg Ser Ser
900 905 910
Val Val Met Pro Glu Gly Ile Tyr Arg Val Lys Glu Leu Gly Ser Asn
915 920 925
Gly Val Ile Val Val Gln Glu Asn Ala Val Ser Lys Glu Leu Ala Asn
930 935 940
Lys Leu Gly Ile Ser Asp Asp Gln Phe Ser Lys Val Pro Glu Arg Ala
945 950 955 960
Leu Gly Lys Lys Glu Leu Ala Glu Tyr Phe Lys Gly Asn Gln Arg Ser
965 970 975
Gly Met Val Ser Lys Gly Glu Glu Asp Asn Met Ala Ser Leu Pro Ala
980 985 990
Thr His Glu Leu His Ile Phe Gly Ser Ile Asn Gly Val Asp Phe Asp
995 1000 1005
Met Val Gly Gln Gly Thr Gly Asn Pro Asn Asp Gly Tyr Glu Glu
1010 1015 1020
Leu Asn Leu Lys Ser Thr Lys Gly Asp Leu Gln Phe Ser Pro Trp
1025 1030 1035
Ile Leu Val Pro His Ile Gly Tyr Gly Phe His Gln Tyr Leu Pro
1040 1045 1050
Tyr Pro Asp Gly Met Ser Pro Phe Gln Ala Ala Met Val Asp Gly
1055 1060 1065
Ser Gly Tyr Gln Val His Arg Thr Met Gln Phe Glu Asp Gly Ala
1070 1075 1080
Ser Leu Thr Val Asn Tyr Arg Tyr Thr Tyr Glu Gly Ser His Ile
1085 1090 1095
Lys Gly Glu Ala Gln Val Lys Gly Thr Gly Phe Pro Ala Asp Gly
1100 1105 1110
Pro Val Met Thr Asn Ser Leu Thr Ala Ala Asp Trp Cys Arg Ser
1115 1120 1125
Lys Lys Thr Tyr Pro Asn Asp Lys Thr Ile Ile Ser Thr Phe Lys
1130 1135 1140
Trp Ser Tyr Thr Thr Gly Asn Gly Lys Arg Tyr Arg Ser Thr Ala
1145 1150 1155
Arg Thr Thr Tyr Thr Phe Ala Lys Pro Met Ala Ala Asn Tyr Leu
1160 1165 1170
Lys Asn Gln Pro Met Tyr Val Phe Arg Lys Thr Glu Leu Lys His
1175 1180 1185
Ser Lys Thr Glu Leu Asn Phe Lys Glu Trp Gln Lys Ala Phe Thr
1190 1195 1200
Asp Val Met Gly Met Asp Glu Leu Tyr Lys
1205 1210
<210> 4
<211> 1214
<212> PRT
<213> 人工序列
<220>
<223> 与mNeonGreen融合的来自Planctomycetes的CasX
<400> 4
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val Met Val Ser Lys Gly Glu Glu Asp Asn Met Ala Ser Leu Pro
980 985 990
Ala Thr His Glu Leu His Ile Phe Gly Ser Ile Asn Gly Val Asp Phe
995 1000 1005
Asp Met Val Gly Gln Gly Thr Gly Asn Pro Asn Asp Gly Tyr Glu
1010 1015 1020
Glu Leu Asn Leu Lys Ser Thr Lys Gly Asp Leu Gln Phe Ser Pro
1025 1030 1035
Trp Ile Leu Val Pro His Ile Gly Tyr Gly Phe His Gln Tyr Leu
1040 1045 1050
Pro Tyr Pro Asp Gly Met Ser Pro Phe Gln Ala Ala Met Val Asp
1055 1060 1065
Gly Ser Gly Tyr Gln Val His Arg Thr Met Gln Phe Glu Asp Gly
1070 1075 1080
Ala Ser Leu Thr Val Asn Tyr Arg Tyr Thr Tyr Glu Gly Ser His
1085 1090 1095
Ile Lys Gly Glu Ala Gln Val Lys Gly Thr Gly Phe Pro Ala Asp
1100 1105 1110
Gly Pro Val Met Thr Asn Ser Leu Thr Ala Ala Asp Trp Cys Arg
1115 1120 1125
Ser Lys Lys Thr Tyr Pro Asn Asp Lys Thr Ile Ile Ser Thr Phe
1130 1135 1140
Lys Trp Ser Tyr Thr Thr Gly Asn Gly Lys Arg Tyr Arg Ser Thr
1145 1150 1155
Ala Arg Thr Thr Tyr Thr Phe Ala Lys Pro Met Ala Ala Asn Tyr
1160 1165 1170
Leu Lys Asn Gln Pro Met Tyr Val Phe Arg Lys Thr Glu Leu Lys
1175 1180 1185
His Ser Lys Thr Glu Leu Asn Phe Lys Glu Trp Gln Lys Ala Phe
1190 1195 1200
Thr Asp Val Met Gly Met Asp Glu Leu Tyr Lys
1205 1210
<210> 5
<211> 1006
<212> PRT
<213> 人工序列
<220>
<223> N-和C-末端序列修改以优化翻译、核定位以及抗体检测的来自Deltaproteobacteria的2NLS-CRISPR/CasX
<400> 5
Met Ala Ser Ser Val Ala Leu His Pro Arg Leu Glu Arg Lys Ile Lys
1 5 10 15
Glu Phe Leu Pro Thr Tyr Arg Leu Gly Val Asp Leu Gly Glu Ala Ala
20 25 30
Gly Gly Leu Ala Leu Ile His Asn Asn Asn Ile Leu His Ala Glu Thr
35 40 45
Phe Thr Asp Phe His Glu Ala Thr Leu Glu Thr Lys Arg Ala Leu Arg
50 55 60
Arg Gly Arg Arg Thr Arg His Ala Lys Lys Met Arg Leu Ala Arg Leu
65 70 75 80
Arg Ser Trp Ile Leu Arg Gln Cys Ile Pro Ala His Val Thr Gly Ala
85 90 95
Glu Ile Lys Asp Ser Tyr Ser Arg Leu Pro Asp Pro Tyr Arg Leu Met
100 105 110
Lys Asp Lys Lys Tyr Gln Thr Leu Pro Gly Phe Tyr Glu Val Lys Gly
115 120 125
Gln Asn Pro Glu Lys Ser Pro Thr Trp Ile Asp Lys Ala Lys Ala Gly
130 135 140
Glu Val Asp Ala Glu Gly Phe Val Ile Ala Leu Thr His Ile Leu Gln
145 150 155 160
Lys Arg Gly Tyr Lys Tyr Asp Gly Lys Glu Phe Ser Asp Tyr Asp Asp
165 170 175
Ser Arg Leu Ile Asp Phe Ile Asp Ser Cys Ala Met Leu Ala Glu Ala
180 185 190
Pro Glu Met Arg Lys Ala Leu Glu Asp Glu Ile Met Arg Arg Glu Val
195 200 205
Gly Glu Lys Glu Lys Pro Lys Leu His Glu Ala Phe Asp Asn Ala Leu
210 215 220
Asn Arg Gln Arg Glu Arg Lys Lys Ala Leu Pro Arg Gln Val Arg Glu
225 230 235 240
Lys Asp Met Glu Asp Met Val Asp Val Phe Gly Arg Arg Trp Gln Leu
245 250 255
Ser Gln Glu Ile Ile Ala Asn Trp Lys Ser Gln Leu Thr Gly Leu Leu
260 265 270
Asn Lys Val Val Arg Glu Ala Arg Tyr Asp Asn Arg Leu Lys Ser Gly
275 280 285
Cys Ser Trp Cys Gly Lys Lys Thr Pro Arg Leu Ala Lys Pro Glu Ile
290 295 300
Arg Glu Leu Ala Phe Glu Ala Ala Val Gly Asn Leu Arg Ile Arg Glu
305 310 315 320
Arg Asp Gly Arg Asp Arg Pro Ile Ser Asp Glu Glu Arg Asn Pro Leu
325 330 335
Arg Gly Trp Phe Gln Arg Arg Arg Glu Asn His Asp Tyr Ser Arg Ala
340 345 350
Thr Lys Asn Thr Pro Ile Glu Glu Arg Ala Pro Ser Glu Asp Asn Ile
355 360 365
Arg Thr Tyr Leu Glu Gln Ile Gly Val Lys Lys Ala Trp Ile Arg Lys
370 375 380
Lys Lys Gly Lys Glu Lys Trp Lys Phe Asp Phe Ala Met Leu Pro Gln
385 390 395 400
Leu Asp Asn Leu Ile Asn Lys Glu Ala Arg Lys Gly Arg Ala Arg Leu
405 410 415
Cys Val Glu His Met Arg Met Gln Ala Glu Gly Lys Thr Met Lys Asp
420 425 430
Ala Asp Val Asp Trp Gln Ser Met Arg Lys Arg Asn Ala Pro Asn Pro
435 440 445
Arg Arg Glu Gln His Asp Ala Arg Val Leu Lys Arg Ile Glu Arg Leu
450 455 460
Ile Phe Asn Arg Gly Lys Lys Gly Thr Asp Ala Trp Arg His Gly Pro
465 470 475 480
Ile Ala Val Ile Thr Leu Glu Val Pro Met Pro Val Asp Leu Glu Arg
485 490 495
Ala Arg Glu Lys Glu Gln Val Glu Arg Lys Pro Leu Asn Leu Arg Gln
500 505 510
Arg Leu His Ala Glu Thr Glu Gly Val Cys Ile Tyr Cys Gly Glu Asn
515 520 525
Val His Asp Arg Thr Met His Leu Glu His Ile Val Pro Gln Ala Lys
530 535 540
Gly Gly Pro Asp Val Gln Met Asn Arg Ile Ala Ser Cys Pro Lys Cys
545 550 555 560
Asn Ala Asp Arg Asp Thr Gly Lys Lys Asp Met Leu Pro Ser Glu Trp
565 570 575
Leu Thr Gly Asp Lys Trp Asn Val Phe Lys Ser Arg Val Met Ser Leu
580 585 590
Asn Leu Pro Pro Leu Lys Lys Gln Leu Leu Leu Leu Glu Pro Gly Ser
595 600 605
Lys Tyr Pro Asn Asp Pro Thr Pro Leu Ala Arg Val Ser Ala Arg Trp
610 615 620
Arg Ala Phe Ala Ala Asp Ile Met Trp Leu Phe Asp Glu Tyr Ser Val
625 630 635 640
Pro Val Pro Thr Leu Asn Tyr Glu Lys Asp Lys Pro His Ile Gln Val
645 650 655
Val Arg Gly Asn Leu Thr Ser Arg Leu Arg Arg Asp Trp Arg Trp Lys
660 665 670
Asp His Glu Ala Thr Val Glu Asn Phe Pro Asp Lys Arg Arg Thr Asp
675 680 685
Leu Tyr Asn His Ala Gln Asp Ala Ala Ile Leu Ala Ala Ile Pro Pro
690 695 700
His Thr Trp Gln Glu Gln Ile Phe Ser Asp Met Ala Val Arg Pro Cys
705 710 715 720
Ala Lys Lys Asp Glu Gln Gly Asn Ile Leu Lys Asn Glu Lys Glu Met
725 730 735
Arg Pro Arg Pro Gly Ile Ala Ala Leu Ala Leu Ala Pro Glu Trp Ala
740 745 750
Asp Tyr Glu Arg Thr Gln Lys Glu Leu Lys Arg Pro Met Val His Thr
755 760 765
Leu Gly Lys Leu Lys Ala Thr Trp Arg Arg Gln Ile Met Asp Leu Ser
770 775 780
Phe Tyr Gln Asn Pro Thr Asp Asn Asp Gly Pro Leu Phe Ile Arg Lys
785 790 795 800
Val Asp Ala Lys Thr Gly Lys Arg Glu Thr Lys Glu Val Gln Lys Gly
805 810 815
Gly Leu Val Val Gln Val Pro His Tyr Asp Gly Thr Ser Gly Lys Arg
820 825 830
Lys Val Gln Ile Lys Pro Ile Gln Ser Asn Ala Ile Ile Leu Trp His
835 840 845
Asp Pro Ser Gly Arg Lys Asp Asn Leu Asn Ile Ser Ile Glu Arg Pro
850 855 860
Ala Ala Ile Lys Lys Phe Val Lys His Pro Val Asp Pro Pro Ile Ala
865 870 875 880
Ser Asp Ala Ile Ile Leu Gly Arg Ile Glu Arg Ala Ser Thr Leu Trp
885 890 895
Leu Arg Glu Gly Lys Gly Thr Val Glu Leu Lys Ala Asp Lys Lys Ser
900 905 910
Val Arg Ser Ser Val Val Met Pro Glu Gly Ile Tyr Arg Val Lys Glu
915 920 925
Leu Gly Ser Asn Gly Val Ile Val Val Gln Glu Asn Ala Val Ser Lys
930 935 940
Glu Leu Ala Asn Lys Leu Gly Ile Ser Asp Asp Gln Phe Ser Lys Val
945 950 955 960
Pro Glu Arg Ala Leu Gly Lys Lys Glu Leu Ala Glu Tyr Phe Lys Gly
965 970 975
Asn Gln Arg Ser Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
980 985 990
Ala Lys Lys Lys Lys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
995 1000 1005
<210> 6
<211> 1007
<212> PRT
<213> 人工序列
<220>
<223> N-和C-末端序列修改以优化翻译、核定位以及抗体检测的来自Planctomycetes的2NLS-CRISPR/CasX
<400> 6
Met Ala Ser Ser Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg
1 5 10 15
Arg Leu Val Lys Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro
20 25 30
Met Lys Thr Leu Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg
35 40 45
Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser
50 55 60
Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu
65 70 75 80
Met Lys Lys Ala Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp
85 90 95
Pro Val Gly Leu Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile
100 105 110
Asp Gln Arg Lys Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr
115 120 125
Ser Ser Gly Phe Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr
130 135 140
Lys Leu Glu Gln Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe
145 150 155 160
Gly Arg Cys Asn Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro
165 170 175
His Lys Pro Glu Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys
180 185 190
Phe Gly Gln Arg Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu
195 200 205
Ser Asn His Pro Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys
210 215 220
Ala Ser Gly Pro Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala
225 230 235 240
Val Ala Ser Phe Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln
245 250 255
Lys Val Ile Lys Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile
260 265 270
Ala Ser Ala Asn Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln
275 280 285
Pro His Thr Lys Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln
290 295 300
Ile Val Ile Trp Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly
305 310 315 320
Arg Asp Glu Ala Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe
325 330 335
Pro Leu Val Glu Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val
340 345 350
Cys Asn Val Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val
355 360 365
Phe Trp Gln Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro
370 375 380
Tyr Leu Ser Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg
385 390 395 400
Tyr Gln Phe Gly Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu
405 410 415
Asp Trp Gly Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys
420 425 430
Val Glu Gly Leu Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser
435 440 445
Glu Asp Ala Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys
450 455 460
Ala Ser Phe Val Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe
465 470 475 480
Cys Arg Cys Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly
485 490 495
Lys Pro Phe Ala Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly
500 505 510
Phe Ser Lys Gln Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val
515 520 525
Lys Lys Leu Asn Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys
530 535 540
Leu Arg Phe Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe
545 550 555 560
Tyr Thr Val Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val
565 570 575
Asn Phe Asn Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe
580 585 590
Gly Lys Arg Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu
595 600 605
Glu Thr Gly Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr
610 615 620
Leu Tyr Asn Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala
625 630 635 640
Leu Thr Phe Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro
645 650 655
Met Asn Leu Ile Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile
660 665 670
Ala Leu Thr Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser
675 680 685
Leu Gly Asn Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu
690 695 700
Lys Gln Arg Thr Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala
705 710 715 720
Gly Gly Tyr Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp
725 730 735
Asp Met Val Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr
740 745 750
Gln Asp Ala Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg
755 760 765
Gln Gly Lys Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu
770 775 780
Asp Trp Leu Thr Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr
785 790 795 800
Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn
805 810 815
Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys
820 825 830
Leu Lys Lys Thr Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu
835 840 845
Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln
850 855 860
Asn Val Val Lys Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu
865 870 875 880
Ser Val Asn Asn Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu
885 890 895
Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu
900 905 910
Lys Phe Val Cys Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln
915 920 925
Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu
930 935 940
Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg
945 950 955 960
Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu
965 970 975
Val Trp Lys Pro Ala Val Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly
980 985 990
Gln Ala Lys Lys Lys Lys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
995 1000 1005
<210> 7
<211> 3560
<212> DNA
<213> Artificial Sequence
<220>
<223> 来自Deltaproteobacteria的CRISPR/CasX的强组成型表达盒
<400> 7
atggcgagca gcgtggcgct gcatccgcgc ctggaacgca aaattaaaga atttctgccg 60
acctatcgcc tgggcgtgga tctgggcgaa gcggcgggcg gcctggcgct gattcataac 120
aacaacattc tgcatgcgga aacctttacc gattttcatg aagcgaccct ggaaaccaaa 180
cgcgcgctgc gccgcggccg ccgcacccgc catgcgaaaa aaatgcgcct ggcgcgcctg 240
cgcagctgga ttctgcgcca gtgcattccg gcgcatgtga ccggcgcgga aattaaagat 300
agctatagcc gcctgccgga tccgtatcgc ctgatgaaag ataaaaaata tcagaccctg 360
ccgggctttt atgaagtgaa aggccagaac ccggaaaaaa gcccgacctg gattgataaa 420
gcgaaagcgg gcgaagtgga tgcggaaggc tttgtgattg cgctgaccca tattctgcag 480
aaacgcggct ataaatatga tggcaaagaa tttagcgatt atgatgatag ccgcctgatt 540
gattttattg atagctgcgc gatgctggcg gaagcgccgg aaatgcgcaa agcgctggaa 600
gatgaaatta tgcgccgcga agtgggcgaa aaagaaaaac cgaaactgca tgaagcgttt 660
gataacgcgc tgaaccgcca gcgcgaacgc aaaaaagcgc tgccgcgcca ggtgcgcgaa 720
aaagatatgg aagatatggt ggatgtgttt ggccgccgct ggcagctgag ccaggaaatt 780
attgcgaact ggaaaagcca gctgaccggc ctgctgaaca aagtggtgcg cgaagcgcgc 840
tatgataacc gcctgaaaag cggctgcagc tggtgcggca aaaaaacccc gcgcctggcg 900
aaaccggaaa ttcgcgaact ggcgtttgaa gcggcggtgg gcaacctgcg cattcgcgaa 960
cgcgatggcc gcgatcgccc gattagcgat gaagaacgca acccgctgcg cggctggttt 1020
cagcgccgcc gcgaaaacca tgattatagc cgcgcgacca aaaacacccc gattgaagaa 1080
cgcgcgccga gcgaagataa cattcgcacc tatctggaac agattggcgt gaaaaaagcg 1140
tggattcgca aaaaaaaagg caaagaaaaa tggaaatttg attttgcgat gctgccgcag 1200
ctggataacc tgattaacaa agaagcgcgc aaaggccgcg cgcgcctgtg cgtggaacat 1260
atgcgcatgc aggcggaagg caaaaccatg aaagatgcgg atgtggattg gcagagcatg 1320
cgcaaacgca acgcgccgaa cccgcgccgc gaacagcatg atgcgcgcgt gctgaaacgc 1380
attgaacgcc tgatttttaa ccgcggcaaa aaaggcaccg atgcgtggcg ccatggcccg 1440
attgcggtga ttaccctgga agtgccgatg ccggtggatc tggaacgcgc gcgcgaaaaa 1500
gaacaggtgg aacgcaaacc gctgaacctg cgccagcgcc tgcatgcgga aaccgaaggc 1560
gtgtgcattt attgcggcga aaacgtgcat gatcgcacca tgcatctgga acatattgtg 1620
ccgcaggcga aaggcggccc ggatgtgcag atgaaccgca ttgcgagctg cccgaaatgc 1680
aacgcggatc gcgataccgg caaaaaagat atgctgccga gcgaatggct gaccggcgat 1740
aaatggaacg tgtttaaaag ccgcgtgatg agcctgaacc tgccgccgct gaaaaaacag 1800
ctgctgctgc tggaaccggg cagcaaatat ccgaacgatc cgaccccgct ggcgcgcgtg 1860
agcgcgcgct ggcgcgcgtt tgcggcggat attatgtggc tgtttgatga atatagcgtg 1920
ccggtgccga ccctgaacta tgaaaaagat aaaccgcata ttcaggtggt gcgcggcaac 1980
ctgaccagcc gcctgcgccg cgattggcgc tggaaagatc atgaagcgac cgtggaaaac 2040
tttccggata aacgccgcac cgatctgtat aaccatgcgc aggatgcggc gattctggcg 2100
gcgattccgc cgcatacctg gcaggaacag atttttagcg atatggcggt gcgcccgtgc 2160
gcgaaaaaag atgaacaggg caacattctg aaaaacgaaa aagaaatgcg cccgcgcccg 2220
ggcattgcgg cgctggcgct ggcgccggaa tgggcggatt atgaacgcac ccagaaagaa 2280
ctgaaacgcc cgatggtgca taccctgggc aaactgaaag cgacctggcg ccgccagatt 2340
atggatctga gcttttatca gaacccgacc gataacgatg gcccgctgtt tattcgcaaa 2400
gtggatgcga aaaccggcaa acgcgaaacc aaagaagtgc agaaaggcgg cctggtggtg 2460
caggtgccgc attatgatgg caccagcggc aaacgcaaag tgcagattaa accgattcag 2520
agcaacgcga ttattctgtg gcatgatccg agcggccgca aagataacct gaacattagc 2580
attgaacgcc cggcggcgat taaaaaattt gtgaaacatc cggtggatcc gccgattgcg 2640
agcgatgcga ttattctggg ccgcattgaa cgcgcgagca ccctgtggct gcgcgaaggc 2700
aaaggcaccg tggaactgaa agcggataaa aaaagcgtgc gcagcagcgt ggtgatgccg 2760
gaaggcattt atcgcgtgaa agaactgggc agcaacggcg tgattgtggt gcaggaaaac 2820
gcggtgagca aagaactggc gaacaaactg ggcattagcg atgatcagtt tagcaaagtg 2880
ccggaacgcg cgctgggcaa aaaagaactg gcggaatatt ttaaaggcaa ccagcgcagc 2940
ggcaaacgcc cggcggcgac caaaaaagcg ggccaggcga aaaaaaaaaa atatccgtat 3000
gatgtgccgg attatgcgta atctagaggt acctgatcat gagtaattag ctcgaatttc 3060
cccgatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt 3120
gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa 3180
tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa 3240
tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca 3300
tctatgttac tagatcgctc gacgcggccg ccatggcctc tagtggatca cctagggtcg 3360
atcgacaagc tcgagtttct ccataataat gtgtgagtag ttcccagata agggaattag 3420
ggttcctata gggtttcgct catgtgttga gcatataaga aacccttagt atgtatttgt 3480
atttgtaaaa tacttctatc aataaaattt ctaattccta aaaccaaaat ccagtactaa 3540
aatccagatc ccccgaatta 3560
<210> 8
<211> 4889
<212> DNA
<213> Artificial Sequence
<220>
<223> 与mNeonGreen融合的来自Deltaproteobacteria的CRISPR/CasX,强组成型表达盒
<400> 8
gtggcgctgc atccgcgcct ggaacgcaaa attaaagaat ttctgccgac ctatcgcctg 60
ggcgtggatc tgggcgaagc ggcgggcggc ctggcgctga ttcataacaa caacattctg 120
catgcggaaa cctttaccga ttttcatgaa gcgaccctgg aaaccaaacg cgcgctgcgc 180
cgcggccgcc gcacccgcca tgcgaaaaaa atgcgcctgg cgcgcctgcg cagctggatt 240
ctgcgccagt gcattccggc gcatgtgacc ggcgcggaaa ttaaagatag ctatagccgc 300
ctgccggatc cgtatcgcct gatgaaagat aaaaaatatc agaccctgcc gggcttttat 360
gaagtgaaag gccagaaccc ggaaaaaagc ccgacctgga ttgataaagc gaaagcgggc 420
gaagtggatg cggaaggctt tgtgattgcg ctgacccata ttctgcagaa acgcggctat 480
aaatatgatg gcaaagaatt tagcgattat gatgatagcc gcctgattga ttttattgat 540
agctgcgcga tgctggcgga agcgccggaa atgcgcaaag cgctggaaga tgaaattatg 600
cgccgcgaag tgggcgaaaa agaaaaaccg aaactgcatg aagcgtttga taacgcgctg 660
aaccgccagc gcgaacgcaa aaaagcgctg ccgcgccagg tgcgcgaaaa agatatggaa 720
gatatggtgg atgtgtttgg ccgccgctgg cagctgagcc aggaaattat tgcgaactgg 780
aaaagccagc tgaccggcct gctgaacaaa gtggtgcgcg aagcgcgcta tgataaccgc 840
ctgaaaagcg gctgcagctg gtgcggcaaa aaaaccccgc gcctggcgaa accggaaatt 900
cgcgaactgg cgtttgaagc ggcggtgggc aacctgcgca ttcgcgaacg cgatggccgc 960
gatcgcccga ttagcgatga agaacgcaac ccgctgcgcg gctggtttca gcgccgccgc 1020
gaaaaccatg attatagccg cgcgaccaaa aacaccccga ttgaagaacg cgcgccgagc 1080
gaagataaca ttcgcaccta tctggaacag attggcgtga aaaaagcgtg gattcgcaaa 1140
aaaaaaggca aagaaaaatg gaaatttgat tttgcgatgc tgccgcagct ggataacctg 1200
attaacaaag aagcgcgcaa aggccgcgcg cgcctgtgcg tggaacatat gcgcatgcag 1260
gcggaaggca aaaccatgaa agatgcggat gtggattggc agagcatgcg caaacgcaac 1320
gcgccgaacc cgcgccgcga acagcatgat gcgcgcgtgc tgaaacgcat tgaacgcctg 1380
atttttaacc gcggcaaaaa aggcaccgat gcgtggcgcc atggcccgat tgcggtgatt 1440
accctggaag tgccgatgcc ggtggatctg gaacgcgcgc gcgaaaaaga acaggtggaa 1500
cgcaaaccgc tgaacctgcg ccagcgcctg catgcggaaa ccgaaggcgt gtgcatttat 1560
tgcggcgaaa acgtgcatga tcgcaccatg catctggaac atattgtgcc gcaggcgaaa 1620
ggcggcccgg atgtgcagat gaaccgcatt gcgagctgcc cgaaatgcaa cgcggatcgc 1680
gataccggca aaaaagatat gctgccgagc gaatggctga ccggcgataa atggaacgtg 1740
tttaaaagcc gcgtgatgag cctgaacctg ccgccgctga aaaaacagct gctgctgctg 1800
gaaccgggca gcaaatatcc gaacgatccg accccgctgg cgcgcgtgag cgcgcgctgg 1860
cgcgcgtttg cggcggatat tatgtggctg tttgatgaat atagcgtgcc ggtgccgacc 1920
ctgaactatg aaaaagataa accgcatatt caggtggtgc gcggcaacct gaccagccgc 1980
ctgcgccgcg attggcgctg gaaagatcat gaagcgaccg tggaaaactt tccggataaa 2040
cgccgcaccg atctgtataa ccatgcgcag gatgcggcga ttctggcggc gattccgccg 2100
catacctggc aggaacagat ttttagcgat atggcggtgc gcccgtgcgc gaaaaaagat 2160
gaacagggca acattctgaa aaacgaaaaa gaaatgcgcc cgcgcccggg cattgcggcg 2220
ctggcgctgg cgccggaatg ggcggattat gaacgcaccc agaaagaact gaaacgcccg 2280
atggtgcata ccctgggcaa actgaaagcg acctggcgcc gccagattat ggatctgagc 2340
ttttatcaga acccgaccga taacgatggc ccgctgttta ttcgcaaagt ggatgcgaaa 2400
accggcaaac gcgaaaccaa agaagtgcag aaaggcggcc tggtggtgca ggtgccgcat 2460
tatgatggca ccagcggcaa acgcaaagtg cagattaaac cgattcagag caacgcgatt 2520
attctgtggc atgatccgag cggccgcaaa gataacctga acattagcat tgaacgcccg 2580
gcggcgatta aaaaatttgt gaaacatccg gtggatccgc cgattgcgag cgatgcgatt 2640
attctgggcc gcattgaacg cgcgagcacc ctgtggctgc gcgaaggcaa aggcaccgtg 2700
gaactgaaag cggataaaaa aagcgtgcgc agcagcgtgg tgatgccgga aggcatttat 2760
cgcgtgaaag aactgggcag caacggcgtg attgtggtgc aggaaaacgc ggtgagcaaa 2820
gaactggcga acaaactggg cattagcgat gatcagttta gcaaagtgcc ggaacgcgcg 2880
ctgggcaaaa aagaactggc ggaatatttt aaaggcaacc agcgcagcgg catggtgagc 2940
aaaggcgaag aagataacat ggcgagcctg ccggcgaccc atgaactgca tatttttggc 3000
agcattaacg gcgtggattt tgatatggtg ggccagggca ccggcaaccc gaacgatggc 3060
tatgaagaac tgaacctgaa aagcaccaaa ggcgatctgc agtttagccc gtggattctg 3120
gtgccgcata ttggctatgg ctttcatcag tatctgccgt atccggatgg catgagcccg 3180
tttcaggcgg cgatggtgga tggcagcggc tatcaggtgc atcgcaccat gcagtttgaa 3240
gatggcgcga gcctgaccgt gaactatcgc tatacctatg aaggcagcca tattaaaggc 3300
gaagcgcagg tgaaaggcac cggctttccg gcggatggcc cggtgatgac caacagcctg 3360
accgcggcgg attggtgccg cagcaaaaaa acctatccga acgataaaac cattattagc 3420
acctttaaat ggagctatac caccggcaac ggcaaacgct atcgcagcac cgcgcgcacc 3480
acctatacct ttgcgaaacc gatggcggcg aactatctga aaaaccagcc gatgtatgtg 3540
tttcgcaaaa ccgaactgaa acatagcaaa accgaactga actttaaaga atggcagaaa 3600
gcgtttaccg atgtgatggg catggatgaa ctgtataaaa tggtgagtaa aggagaagaa 3660
gataacatgg cttcgcttcc agccacacat gagcttcaca tcttcggttc catcaacggc 3720
gttgacttcg atatggtcgg acaaggcact gggaacccta atgacggata cgaagagctg 3780
aacctcaaga gcaccaaagg tgatcttcag ttttctccat ggattctggt gccacacatt 3840
ggctacggat tccatcaata ccttccatac cctgacggaa tgagtccatt ccaagcagcc 3900
atggttgatg gctccggata ccaagtccac aggacaatgc agtttgagga cggtgcttcg 3960
ctcaccgtca actaccgtta cacttacgaa gggagccaca tcaaaggaga agcccaagtg 4020
aaggggacag gctttcctgc tgatggacct gtcatgacca actccttaac tgccgctgat 4080
tggtgccggt ccaagaaaac ctaccctaac gacaagacca tcattagtac cttcaaatgg 4140
tcttacacca caggcaatgg caagagatat cgctctacag ccaggactac ctacacattc 4200
gctaaaccaa tggccgctaa ctaccttaag aaccaaccca tgtacgtgtt ccgtaagact 4260
gagttgaaac attccaagac cgaacttaac ttcaaggagt ggcagaaggc atttaccgac 4320
gtaatgggca tggatgaact atacaaataa tctagaggta cctgatcatg agtaattagc 4380
tcgaatttcc ccgatcgttc aaacatttgg caataaagtt tcttaagatt gaatcctgtt 4440
gccggtcttg cgatgattat catataattt ctgttgaatt acgttaagca tgtaataatt 4500
aacatgtaat gcatgacgtt atttatgaga tgggttttta tgattagagt cccgcaatta 4560
tacatttaat acgcgataga aaacaaaata tagcgcgcaa actaggataa attatcgcgc 4620
gcggtgtcat ctatgttact agatcgctcg acgcggccgc catggcctct agtggatcac 4680
ctagggtcga tcgacaagct cgagtttctc cataataatg tgtgagtagt tcccagataa 4740
gggaattagg gttcctatag ggtttcgctc atgtgttgag catataagaa acccttagta 4800
tgtatttgta tttgtaaaat acttctatca ataaaatttc taattcctaa aaccaaaatc 4860
cagtactaaa atccagatcc cccgaatta 4889
Claims (63)
1.一种用于修饰植物细胞中至少一个染色体基因或染色体外基因表达的方法,所述方法包含将以下项引入所述细胞中:
(a)(i)成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)和反式激活的crRNA(tracrRNA),或(ii)嵌合的cr/tracrRNA杂合体(sgRNA),其中所述crRNA或sgRNA包含与该基因内的或由该基因编码的RNA分子内的靶序列互补的序列;以及
(b)CRISPR/CasX核酸内切酶分子,其中所述CRISPR/CasX核酸内切酶能够在所述crRNA或sgRNA所靶向的序列处、所靶向的序列之内或所靶向的序列附近引入双链断裂或单链断裂。
2.根据权利要求1所述的方法,其中所述crRNA包含约23个核苷酸的重复序列和约20个核苷酸的间隔区序列,其中所述间隔区序列与所述靶核酸相互作用。
3.根据权利要求1或权利要求2所述的方法,其中所述crRNA或tracrRNA或sgRNA包含非常规和/或修饰的核苷酸和/或包含非常规和/或修饰的主链化学成份。
4.根据权利要求3所述的方法,其中crRNA或tracrRNA或sgRNA包含一种或多种修饰,所述修饰选自:锁核酸(LNA)碱基、主链中的核苷酸间硫代磷酸酯键、2’-O-甲基RNA碱基、解锁核酸(UNA)碱基、5-甲基dC碱基、5-羟基丁炔-2’-脱氧尿苷碱基、5-硝基吲哚碱基、脱氧肌苷碱基、8-氮杂-7-脱氮鸟苷碱基、5’末端处的双脱氧-T、3’末端处的反向dT以及和3’末端处的双脱氧胞苷。
5.根据权利要求1或权利要求2所述的方法,其中将所述crRNA、tracrRNA或sgRNA作为编码所述RNA并与指导所述RNA在细胞中产生的启动子可操作地连接的DNA分子引入所述细胞中。
6.根据权利要求1至5中任一项所述的方法,其中所述CRISPR/CasX核酸内切酶分子是δ变形菌(Deltaproteobacteria)核酸内切酶或其突变体或衍生物。
7.根据权利要求1至5中任一项所述的方法,其中所述CRISPR/CasX核酸内切酶分子包含SEQ ID NO:1的氨基酸序列或与SEQ ID NO:1具有至少85%序列同一性的序列。
8.根据权利要求1至5中任一项所述的方法,其中,所述CRISPR/CasX核酸内切酶分子是浮霉菌(Planctomycetes)核酸内切酶或其突变体或衍生物。
9.根据权利要求1至5中任一项所述的方法,其中所述CRISPR/CasX核酸内切酶分子包含SEQ ID NO:2的氨基酸序列或与SEQ ID NO:2具有至少85%序列同一性的序列。
10.根据权利要求1至9中任一项所述的方法,其中所述CRISPR/CasX核酸内切酶分子被修饰以使其在不同于修饰前的最佳温度的温度具有活性。
11.根据权利要求10所述的方法,其中所述修饰的CRISPR/CasX核酸内切酶分子在适合于植物或植物细胞的生长和培养的温度具有活性。
12.根据权利要求10所述的方法,其中所述修饰的CRISPR/CasX核酸内切酶分子在约20℃至约35℃的温度具有活性。
13.根据权利要求12所述的方法,其中所述修饰的CRISPR/CasX核酸内切酶分子在约23℃至约32℃的温度具有活性。
14.根据权利要求13所述的方法,其中所述修饰的CRISPR/CasX核酸内切酶分子在约25℃至约28℃的温度具有活性。
15.根据权利要求1至14中任一项所述的方法,其中所述CRISPR/CasX核酸内切酶分子作为DNA分子被递送至所述细胞,所述DNA分子包含可操作地连接至指导所述CRISPR/CasX核酸内切酶在细胞中产生的启动子的CRISPR/CasX核酸内切酶编码序列。
16.根据权利要求15所述的方法,其中所述DNA分子瞬时存在于所述细胞中。
17.根据权利要求15所述的方法,其中所述DNA分子被稳定地掺入到所述细胞或祖先细胞的核基因组或质体基因组序列中,从而提供所述CRISPR/CasX核酸内切酶分子的可遗传的表达。
18.根据权利要求1至14中任一项所述的方法,其中所述CRISPR/CasX核酸内切酶分子作为编码所述CRISPR/CasX核酸内切酶的mRNA分子被递送至所述细胞。
19.根据权利要求1至14中任一项所述的方法,其中所述CRISPR/CasX核酸内切酶分子作为蛋白质被递送至所述细胞。
20.根据权利要求1-19中任一项所述的方法,其中所述CRISPR/CasX核酸内切酶分子包含一种或多种选自以下的元件:定位信号、检测标签、检测报道分子和纯化标签。
21.根据权利要求20所述的方法,其中所述CRISPR/CasX核酸内切酶分子包含一个或多个定位信号。
22.根据权利要求1至21中任一项所述的方法,其中所述CRISPR/CasX核酸内切酶分子包含至少一个具有酶促活性的另外的蛋白质结构域。
23.根据权利要求22所述的方法,其中所述至少一个另外的蛋白质结构域具有选自以下的酶活性:核酸外切酶、解旋酶、DNA双链断裂的修复、转录(共)激活物、转录(共)阻遏物、甲基化酶、脱甲基化酶及其任何组合。
24.根据权利要求1至4、6至14和19至23中任一项所述的方法,其中所述方法包含递送包含在引入所述细胞之前装载有所述crRNA/tracrRNA或sgRNA的所述CRISPR/CasX核酸内切酶分子的预组装复合物。
25.根据权利要求5和15至17中任一项所述的方法,其中所述启动子选自组成型启动子、诱导型启动子以及细胞型特异性启动子或组织型特异性启动子。
26.根据权利要求5和15至17中任一项所述的方法,其中所述启动子通过自杀外显子的选择性剪接而被激活。
27.根据权利要求1-26中任一项所述的方法,其中所述DNA或RNA通过选自以下的方法递送至所述细胞:微粒轰击、聚乙二醇(PEG)介导的转化、电穿孔、花粉管介导的合子引入和由一种或多种细胞穿透肽(CPP)介导的递送。
28.根据权利要求1至26中任一项所述的方法,其中所述DNA通过细菌介导的转化被递送至所述细胞。
29.根据权利要求28所述的方法,其中所述DNA在T-DNA中被递送至所述细胞,并且其中所述递送经由农杆菌(Agrobacterium)或剑菌(Ensifer)。
30.根据权利要求1至26中任一项所述的方法,其中所述DNA或RNA通过病毒递送至所述细胞。
31.根据权利要求30所述的方法,其中所述病毒是双生病毒或烟草脆裂病毒。
32.根据权利要求1至31中任一项所述的方法,其中所述植物是单子叶植物。
33.权利要求1至31中任一项所述的方法,其中所述植物是双子叶植物。
34.根据权利要求1至31中任一项所述的方法,其中所述植物细胞来源于选自以下的物种:大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、双色高粱(Sorghumbicolor)、甘蔗(Saccharum officinarium)、玉米(Zea mays)、谷子(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oriza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、黑麦(Secale cereale)、黑小麦(Triticale)、苹果(Malus domestica)、二穗短柄草(Brachypodium distachyon)、海滨大麦(Hordeum marinum)、节节麦(Aegilopstauschii)、Daucus glochidiatus、甜菜(Beta vulgaris)、Daucus pusillus、Daucusmuricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotianasylvestris)、茸毛烟草(Nicotiana tomentosiformis)、普通烟草(Nicotiana tabacum)、本氏烟草(Nicotiana benthamiana)、番茄(Solanum lycopersicum)、马铃薯(Solanumtuberosum)、中果咖啡(Coffea canephora)、葡萄(Vitis vinifera)、Erythranteguttata、Genlisea aurea、黄瓜(Cucumis sativus)、桑树(Morus notabilis)、Arabidopsis arenosa、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsisthaliana)、须弥芥(Crucihimalaya himalaica)、卵叶须弥芥(Crucihimalayawallichii)、弯曲碎米荠(Cardamine flexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa pastoris)、小拟南芥(Olmarabidopsis pumila)、硬毛南芥(Arabishirsute)、欧洲油菜(Brassica napus)、甘蓝(Brassica oleracea)、芜菁(Brassicarapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncacea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicaria subsp.sativa)、柑桔(Citrus sinensis)、麻风树(Jatrophacurcas)、毛果杨(Populus trichocarpa)、蒺藜苜蓿(Medicago truncatula)、Ciceryamashitae、野生鹰嘴豆(Cicer bijugum)、鹰嘴豆(Cicer arietinum)、Cicerreticulatum、Cicer judaicum、木豆(Cajanus cajanifolius)、蔓草虫豆(Cajanusscarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、棉属(Gossypiumsp.)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏槿(Toreniafournieri)、洋葱(Allium cepa)、葱(Allium fistulosum)、大蒜(Allium sativum)、向日葵(Helianthus annuus)、菊芋(Helianthus tuberosus)和韭菜(Allium tuberosum),以及属于上述植物之一的任何品种或亚种。
35.根据权利要求1至34中任一项所述的方法,其中所述靶序列选自由以下项组成的组:乙酰乳酸合酶(ALS)基因、烯醇丙酮酸磷酸合酶基因(EPSPS)基因、雄性育性基因、雄性不育基因、雌性育性基因、雌性不育基因、雄性恢复基因、雌性恢复基因、与不育性状有关的基因、与生育性状有关的基因、与除草剂抗性有关的基因、与除草剂耐受性有关的基因、与真菌抗性有关的基因、与病毒抗性有关的基因、与昆虫抗药性有关的基因抗性、与耐旱性有关的基因、与耐冷性有关的基因、与耐寒性相关的基因、与氮利用效率相关的基因、与磷利用效率相关的基因、与水利用效率相关的基因和与作物或生物质产量相关的基因、以及这些基因的任何突变体。
36.根据权利要求35所述的方法,其中雄性不育基因选自MS45、MS26和MSCA1。
37.根据权利要求1至36中任一项所述的方法修饰的植物细胞。
38.衍生自根据权利要求37所述的植物细胞的细胞、整株植物或其后代。
39.一种组合物,所述组合物包括:(a)(i)成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)和反式激活的crRNA(tracrRNA),或(ii)嵌合的cr/tracrRNA杂合体(sgRNA),其中,所述crRNA或sgRNA靶向染色体植物基因序列或染色体外植物基因序列或靶向由所述基因编码的RNA分子内;和/或(b)CRISPR/CasX核酸内切酶分子,其中所述CRISPR/CasX核酸内切酶能够在适合于植物或植物细胞生长和培养的温度,在crRNA或sgRNA靶向的序列处或其附近引入双链断裂或单链断裂。
40.根据权利要求39所述的组合物,其中所述crRNA包含约23个核苷酸的重复序列和约20个核苷酸的间隔区序列,其中所述间隔区序列与所述靶核酸相互作用。
41.根据权利要求39或权利要求40所述的组合物,其中所述crRNA或tracrRNA或sgRNA包含非常规和/或修饰的核苷酸和/或包含非常规和/或修饰的主链化学成份。
42.根据权利要求41所述的组合物,其中crRNA或tracrRNA或sgRNA包含一种或多种修饰,所述修饰选自:锁核酸(LNA)碱基、主链中的核苷酸间硫代磷酸酯键、2’-O-甲基RNA碱基、解锁核酸(UNA)碱基、5-甲基dC碱基、5-羟基丁炔-2’-脱氧尿苷碱基、5-硝基吲哚碱基、脱氧肌苷碱基、8-氮杂-7-脱氮鸟苷碱基、5’末端处的双脱氧-T、3’末端处的反向dT和3’末端处的双脱氧胞苷。
43.根据权利要求39至42中任一项所述的组合物,其中所述CRISPR/CasX核酸内切酶分子是δ变形菌(Deltaproteobacteria)核酸内切酶或其突变体或衍生物。
44.根据权利要求39至42中任一项所述的组合物,其中所述CRISPR/CasX核酸内切酶分子包含SEQ ID NO:1的氨基酸序列或与SEQ ID NO:1具有至少85%序列同一性的序列。
45.根据权利要求39至42中任一项所述的组合物,其中所述CRISPR/CasX核酸内切酶分子是浮霉菌(Planctomycetes)核酸内切酶或其突变体或衍生物。
46.根据权利要求39至42中任一项所述的组合物,其中所述CRISPR/CasX核酸内切酶分子包含SEQ ID NO:2的氨基酸序列或与SEQ ID NO:2具有至少85%序列同一性的序列。
47.根据权利要求39至46中任一项所述的组合物,其中所述CRISPR/CasX核酸内切酶分子被修饰以使其在不同于修饰前的最佳温度的温度具有活性。
48.根据权利要求47所述的组合物,其中所述修饰的CRISPR/CasX核酸内切酶分子在适合于植物或植物细胞的生长和培养的温度具有活性。
49.根据权利要求47所述的组合物,其中所述修饰的CRISPR/CasX核酸内切酶分子在约20℃至约35℃的温度具有活性。
50.根据权利要求49所述的组合物,其中所述修饰的CRISPR/CasX核酸内切酶分子在约23℃至约32℃的温度具有活性。
51.根据权利要求50所述的组合物,其中所述修饰的CRISPR/CasX核酸内切酶分子在约25℃至约28℃的温度具有活性。
52.根据权利要求39至51中任一项所述的组合物,其中所述CRISPR/CasX核酸内切酶分子包含一种或多种选自以下的元件:定位信号、检测标签、检测报道分子和纯化标签。
53.根据权利要求39至52中任一项所述的组合物,其中所述CRISPR/CasX核酸内切酶分子被修饰为表达切口酶活性或具有核酸靶向活性而没有任何切口酶或核酸内切酶活性。
54.根据权利要求39至53中任一项所述的组合物,其中所述CRISPR/CasX核酸内切酶分子包含至少一个具有酶促活性的另外的蛋白质结构域。
55.根据权利要求54所述的组合物,其中所述至少一个另外的蛋白质结构域具有选自以下的酶活性:核酸外切酶、解旋酶、DNA双链断裂的修复、转录(共)激活物、转录(共)阻遏物、甲基化酶、脱甲基化酶及其任何组合。
56.根据权利要求39至55中任一项所述的组合物,其中所述靶序列选自以下的植物序列:乙酰乳酸合酶(ALS)基因、烯醇丙酮酸磷酸合酶基因(EPSPS)基因、雄性育性基因、雄性不育基因、雌性育性基因、雌性不育基因、雄性恢复基因、雌性恢复基因、与不育性状有关的基因、与生育性状有关的基因、与除草剂抗性有关的基因、与除草剂耐受性有关的基因、与真菌抗性有关的基因、与病毒抗性有关的基因、与昆虫抗药性有关的基因抗性、与耐旱性有关的基因、与耐冷性有关的基因、与耐寒性相关的基因、与氮利用效率相关的基因、与磷利用效率相关的基因、与水分利用效率相关的基因和与作物或生物质产量相关的基因、以及这些基因的任何突变体。
57.根据权利要求56所述的组合物,其中雄性不育基因选自MS45、MS26和MSCA1。
58.根据权利要求39至57中任一项所述的组合物,其中所述植物是单子叶植物。
59.权利要求39至57中任一项所述的组合物,其中所述植物是双子叶植物。
60.根据权利要求39至57中任一项所述的组合物,其中所述植物细胞来源于选自以下的物种:大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、双色高粱(Sorghumbicolor)、甘蔗(Saccharum officinarium)、玉米(Zea mays)、谷子(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oriza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、黑麦(Secale cereale)、黑小麦(Triticale)、苹果(Malus domestica)、二穗短柄草(Brachypodium distachyon)、海滨大麦(Hordeum marinum)、节节麦(Aegilopstauschii)、Daucus glochidiatus、甜菜(Beta vulgaris)、Daucus pusillus、Daucusmuricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotianasylvestris)、茸毛烟草(Nicotiana tomentosiformis)、普通烟草(Nicotiana tabacum)、本氏烟草(Nicotiana benthamiana)、番茄(Solanum lycopersicum)、马铃薯(Solanumtuberosum)、中果咖啡(Coffea canephora)、葡萄(Vitis vinifera)、Erythranteguttata、Genlisea aurea、黄瓜(Cucumis sativus)、桑树(Morus notabilis)、Arabidopsis arenosa、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsisthaliana)、须弥芥(Crucihimalaya himalaica)、卵叶须弥芥(Crucihimalayawallichii)、弯曲碎米荠(Cardamine flexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa pastoris)、小拟南芥(Olmarabidopsis pumila)、硬毛南芥(Arabishirsute)、欧洲油菜(Brassica napus)、甘蓝(Brassica oleracea)、芜菁(Brassicarapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncacea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicaria subsp.sativa)、柑桔(Citrus sinensis)、麻风树(Jatrophacurcas)、毛果杨(Populus trichocarpa)、蒺藜苜蓿(Medicago truncatula)、Ciceryamashitae、野生鹰嘴豆(Cicer bijugum)、鹰嘴豆(Cicer arietinum)、Cicerreticulatum、Cicer judaicum、木豆(Cajanus cajanifolius)、蔓草虫豆(Cajanusscarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、棉属(Gossypiumsp.)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏槿(Toreniafournieri)、洋葱(Allium cepa)、葱(Allium fistulosum)、大蒜(Allium sativum)、向日葵(Helianthus annuus)、菊芋(Helianthus tuberosus)和韭菜(Allium tuberosum),以及属于上述植物之一的任何品种或亚种。
61.一种试剂盒,所述试剂盒包括:(a)(i)成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)和反式激活的crRNA(tracrRNA),或(ii)嵌合的cr/tracrRNA杂合体(sgRNA),其中所述crRNA或sgRNA靶向植物基因内或所述基因编码的RNA分子内的序列;(b)CRISPR/CasX核酸内切酶分子,其中所述CRISPR/CasX核酸内切酶能够在适合于植物或植物细胞生长和培养的温度,在crRNA或sgRNA靶向的序列处或其附近引入双链断裂或单链断裂,以及任选的(c)使用说明。
62.一种试剂盒,所述试剂盒包括:(a)(i)编码成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)和反式激活的crRNA(tracrRNA)的核酸分子,或(ii)编码嵌合cr/tracrRNA杂合体的核酸分子(sgRNA),其中所述crRNA或sgRNA靶向植物基因内或由所述基因编码的RNA分子内的序列;(b)编码CRISPR/CasX核酸内切酶分子的核酸分子,其中所述CRISPR/CasX核酸内切酶能够在适合于植物或植物细胞生长和培养的温度,在所述crRNA或sgRNA靶向的所述序列处或其附近引入双链断裂或单链断裂,以及任选的(c)的使用说明。
63.一种试剂盒,所述试剂盒包括:(a)(i)编码成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)的核酸分子和编码反式激活的crRNA(tracrRNA)的核酸分子,或(ii)编码嵌合cr/tracrRNA杂合体的核酸分子(sgRNA),其中所述crRNA或sgRNA靶向植物基因内或由所述基因编码的RNA分子内的序列;(b)编码CRISPR/CasX核酸内切酶分子的核酸分子,其中所述CRISPR/CasX核酸内切酶能够在适合于植物或植物细胞生长和培养的温度,在所述crRNA或sgRNA靶向的序列处或其附近引入双链断裂或单链断裂,以及任选的(c)的使用说明。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762500639P | 2017-05-03 | 2017-05-03 | |
US62/500,639 | 2017-05-03 | ||
PCT/EP2018/061394 WO2018202800A1 (en) | 2017-05-03 | 2018-05-03 | Use of crispr-cas endonucleases for plant genome engineering |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110832074A true CN110832074A (zh) | 2020-02-21 |
Family
ID=62116444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880044965.7A Pending CN110832074A (zh) | 2017-05-03 | 2018-05-03 | CRISPR-Cas核酸内切酶在植物基因组工程中的应用 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20200407737A1 (zh) |
EP (1) | EP3619305A1 (zh) |
CN (1) | CN110832074A (zh) |
WO (1) | WO2018202800A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111793625A (zh) * | 2020-07-29 | 2020-10-20 | 江西农业大学 | 一种定点敲除水稻OsAUR2基因的sgRNA的oligo DNA组 |
CN111793624A (zh) * | 2020-07-29 | 2020-10-20 | 江西农业大学 | 一种定点敲除水稻OsAurora1基因的sgRNA的oligo DNA组 |
CN114438122A (zh) * | 2022-01-24 | 2022-05-06 | 华中农业大学 | 油菜类肉桂酰-CoA还原酶基因BnaCCR-LIKE在调控作物含油量中的应用 |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2853829C (en) | 2011-07-22 | 2023-09-26 | President And Fellows Of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
US9737604B2 (en) | 2013-09-06 | 2017-08-22 | President And Fellows Of Harvard College | Use of cationic lipids to deliver CAS9 |
US9228207B2 (en) | 2013-09-06 | 2016-01-05 | President And Fellows Of Harvard College | Switchable gRNAs comprising aptamers |
US11053481B2 (en) | 2013-12-12 | 2021-07-06 | President And Fellows Of Harvard College | Fusions of Cas9 domains and nucleic acid-editing domains |
US10077453B2 (en) | 2014-07-30 | 2018-09-18 | President And Fellows Of Harvard College | CAS9 proteins including ligand-dependent inteins |
IL294014B2 (en) | 2015-10-23 | 2024-07-01 | Harvard College | Nucleobase editors and their uses |
IL308426A (en) | 2016-08-03 | 2024-01-01 | Harvard College | Adenosine nuclear base editors and their uses |
US11661590B2 (en) | 2016-08-09 | 2023-05-30 | President And Fellows Of Harvard College | Programmable CAS9-recombinase fusion proteins and uses thereof |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
SG11201903089RA (en) | 2016-10-14 | 2019-05-30 | Harvard College | Aav delivery of nucleobase editors |
WO2018119359A1 (en) | 2016-12-23 | 2018-06-28 | President And Fellows Of Harvard College | Editing of ccr5 receptor gene to protect against hiv infection |
US11898179B2 (en) | 2017-03-09 | 2024-02-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
EP3592777A1 (en) | 2017-03-10 | 2020-01-15 | President and Fellows of Harvard College | Cytosine to guanine base editor |
JP7191388B2 (ja) | 2017-03-23 | 2022-12-19 | プレジデント アンド フェローズ オブ ハーバード カレッジ | 核酸によってプログラム可能なdna結合蛋白質を含む核酸塩基編集因子 |
US11560566B2 (en) | 2017-05-12 | 2023-01-24 | President And Fellows Of Harvard College | Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation |
CN111801345A (zh) | 2017-07-28 | 2020-10-20 | 哈佛大学的校长及成员们 | 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物 |
US11319532B2 (en) | 2017-08-30 | 2022-05-03 | President And Fellows Of Harvard College | High efficiency base editors comprising Gam |
CN111757937A (zh) | 2017-10-16 | 2020-10-09 | 布罗德研究所股份有限公司 | 腺苷碱基编辑器的用途 |
WO2020023529A1 (en) * | 2018-07-24 | 2020-01-30 | The Regents Of The University Of California | Rna-guided nucleic acid modifying enzymes and methods of use thereof |
CN109486838B (zh) * | 2018-12-21 | 2021-09-17 | 中国农业科学院北京畜牧兽医研究所 | 一种调控植物类黄酮合成的转录因子基因及其用途 |
JP7375028B2 (ja) * | 2019-02-18 | 2023-11-07 | カー・ヴェー・エス ザート エス・エー ウント コー. カー・ゲー・アー・アー | 植物病害に対する抵抗性の遺伝子 |
WO2020191243A1 (en) | 2019-03-19 | 2020-09-24 | The Broad Institute, Inc. | Methods and compositions for editing nucleotide sequences |
CN111139262A (zh) * | 2019-12-27 | 2020-05-12 | 新疆农业科学院园艺作物研究所 | 一种crispr介导的快速检测植物基因功能的系统 |
DE112021002672T5 (de) | 2020-05-08 | 2023-04-13 | President And Fellows Of Harvard College | Vefahren und zusammensetzungen zum gleichzeitigen editieren beider stränge einer doppelsträngigen nukleotid-zielsequenz |
CN117535290B (zh) * | 2023-10-25 | 2024-10-15 | 河北农业大学 | 一种CRISPR-Cas12a基因编辑系统及应用 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2796558A1 (en) * | 2013-04-23 | 2014-10-29 | Rheinische Friedrich-Wilhelms-Universität Bonn | Improved gene targeting and nucleic acid carrier molecule, in particular for use in plants |
US20160090603A1 (en) * | 2014-09-30 | 2016-03-31 | Sandia Corporation | Delivery platforms for the domestication of algae and plants |
WO2016100309A1 (en) * | 2014-12-16 | 2016-06-23 | Pioneer Hi-Bred International, Inc. | Restoration of male fertility in wheat |
CN105899657A (zh) * | 2013-12-12 | 2016-08-24 | 布罗德研究所有限公司 | 用于改变基因产物表达的crispr-cas系统和方法、结构信息以及诱导型模块化cas酶 |
US20170114351A1 (en) * | 2014-06-12 | 2017-04-27 | King Abdullah University Of Science And Technology | TARGETED VIRAL-MEDIATED PLANT GENOME EDITING USING CRISPR /Cas9 |
Family Cites Families (91)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5380831A (en) | 1986-04-04 | 1995-01-10 | Mycogen Plant Science, Inc. | Synthetic insecticidal crystal protein gene |
US4945050A (en) | 1984-11-13 | 1990-07-31 | Cornell Research Foundation, Inc. | Method for transporting substances into living cells and tissues and apparatus therefor |
US5569597A (en) | 1985-05-13 | 1996-10-29 | Ciba Geigy Corp. | Methods of inserting viral DNA into plant material |
US5268463A (en) | 1986-11-11 | 1993-12-07 | Jefferson Richard A | Plant promoter α-glucuronidase gene construct |
US5608142A (en) | 1986-12-03 | 1997-03-04 | Agracetus, Inc. | Insecticidal cotton plants |
US5316931A (en) | 1988-02-26 | 1994-05-31 | Biosource Genetics Corp. | Plant viral vectors having heterologous subgenomic promoters for systemic expression of foreign genes |
US5990387A (en) | 1988-06-10 | 1999-11-23 | Pioneer Hi-Bred International, Inc. | Stable transformation of plant cells |
US5023179A (en) | 1988-11-14 | 1991-06-11 | Eric Lam | Promoter enhancer element for gene expression in plant roots |
US5110732A (en) | 1989-03-14 | 1992-05-05 | The Rockefeller University | Selective gene expression in plants |
US5034323A (en) | 1989-03-30 | 1991-07-23 | Dna Plant Technology Corporation | Genetic engineering of novel plant phenotypes |
US5231020A (en) | 1989-03-30 | 1993-07-27 | Dna Plant Technology Corporation | Genetic engineering of novel plant phenotypes |
US5879918A (en) | 1989-05-12 | 1999-03-09 | Pioneer Hi-Bred International, Inc. | Pretreatment of microprojectiles prior to using in a particle gun |
US5240855A (en) | 1989-05-12 | 1993-08-31 | Pioneer Hi-Bred International, Inc. | Particle gun |
US5310667A (en) | 1989-07-17 | 1994-05-10 | Monsanto Company | Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthases |
US5322783A (en) | 1989-10-17 | 1994-06-21 | Pioneer Hi-Bred International, Inc. | Soybean transformation by microparticle bombardment |
ES2187497T3 (es) | 1990-04-12 | 2003-06-16 | Syngenta Participations Ag | Promotores preferentemente en tejidos. |
ES2171391T3 (es) | 1990-04-26 | 2002-09-16 | Aventis Cropscience Nv | Nueva cepa de bacillus thuringiensis y su gen de codificado de toxina insecticida. |
US5478369A (en) | 1990-06-12 | 1995-12-26 | Pioneer Hi-Bred International, Inc. | Nucleotide sequences mediating male fertility and method of using same |
US5498830A (en) | 1990-06-18 | 1996-03-12 | Monsanto Company | Decreased oil content in plant seeds |
US5633435A (en) | 1990-08-31 | 1997-05-27 | Monsanto Company | Glyphosate-tolerant 5-enolpyruvylshikimate-3-phosphate synthases |
US5866775A (en) | 1990-09-28 | 1999-02-02 | Monsanto Company | Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthases |
US5266317A (en) | 1990-10-04 | 1993-11-30 | University Of Georgia Research Foundation, Inc. | Insect-specific paralytic neurotoxin genes for use in biological insect control: methods and compositions |
US5932782A (en) | 1990-11-14 | 1999-08-03 | Pioneer Hi-Bred International, Inc. | Plant transformation method using agrobacterium species adhered to microprojectiles |
US5277905A (en) | 1991-01-16 | 1994-01-11 | Mycogen Corporation | Coleopteran-active bacillus thuringiensis isolate |
US5459252A (en) | 1991-01-31 | 1995-10-17 | North Carolina State University | Root specific gene promoter |
GB9104617D0 (en) | 1991-03-05 | 1991-04-17 | Nickerson Int Seed | Pest control |
US5399680A (en) | 1991-05-22 | 1995-03-21 | The Salk Institute For Biological Studies | Rice chitinase promoter |
GB9114259D0 (en) | 1991-07-02 | 1991-08-21 | Ici Plc | Plant derived enzyme and dna sequences |
GB9115909D0 (en) | 1991-07-23 | 1991-09-04 | Nickerson Int Seed | Recombinant dna |
DE69227911T2 (de) | 1991-08-02 | 1999-05-12 | Kubota Corp., Tokio/Tokyo | Neuer mikroorganismus und insektizid |
DE69230290T2 (de) | 1991-08-27 | 2000-07-20 | Novartis Ag, Basel | Proteine mit insektiziden eigenschaften gegen homopteran insekten und ihre verwendung im pflanzenschutz |
EP0612208B1 (en) | 1991-10-04 | 2004-09-15 | North Carolina State University | Pathogen-resistant transgenic plants |
TW261517B (zh) | 1991-11-29 | 1995-11-01 | Mitsubishi Shozi Kk | |
US5324646A (en) | 1992-01-06 | 1994-06-28 | Pioneer Hi-Bred International, Inc. | Methods of regeneration of Medicago sativa and expressing foreign DNA in same |
DK39692D0 (da) | 1992-03-25 | 1992-03-25 | Danisco | Biologisk materiale |
US5401836A (en) | 1992-07-16 | 1995-03-28 | Pioneer Hi-Bre International, Inc. | Brassica regulatory sequence for root-specific or root-abundant gene expression |
AU670316B2 (en) | 1992-07-27 | 1996-07-11 | Pioneer Hi-Bred International, Inc. | An improved method of (agrobacterium)-mediated transformation of cultured soybean cells |
AU5676394A (en) | 1992-11-20 | 1994-06-22 | Agracetus, Inc. | Transgenic cotton plants producing heterologous bioplastic |
IL108241A (en) | 1992-12-30 | 2000-08-13 | Biosource Genetics Corp | Plant expression system comprising a defective tobamovirus replicon integrated into the plant chromosome and a helper virus |
CA2161881C (en) | 1993-01-13 | 2001-03-27 | A. Gururaj Rao | High lysine derivatives of alpha-hordothionin |
US5789156A (en) | 1993-06-14 | 1998-08-04 | Basf Ag | Tetracycline-regulated transcriptional inhibitors |
US5814618A (en) | 1993-06-14 | 1998-09-29 | Basf Aktiengesellschaft | Methods for regulating gene expression |
US5593881A (en) | 1994-05-06 | 1997-01-14 | Mycogen Corporation | Bacillus thuringiensis delta-endotoxin |
US5633363A (en) | 1994-06-03 | 1997-05-27 | Iowa State University, Research Foundation In | Root preferential promoter |
US5736369A (en) | 1994-07-29 | 1998-04-07 | Pioneer Hi-Bred International, Inc. | Method for producing transgenic cereal plants |
US5608144A (en) | 1994-08-12 | 1997-03-04 | Dna Plant Technology Corp. | Plant group 2 promoters and uses thereof |
US5792931A (en) | 1994-08-12 | 1998-08-11 | Pioneer Hi-Bred International, Inc. | Fumonisin detoxification compositions and methods |
US5736514A (en) | 1994-10-14 | 1998-04-07 | Nissan Chemical Industries, Ltd. | Bacillus strain and harmful organism controlling agents |
US5659026A (en) | 1995-03-24 | 1997-08-19 | Pioneer Hi-Bred International | ALS3 promoter |
US5994627A (en) | 1995-03-31 | 1999-11-30 | Common Wealth Scientific And Industrial Research Organisation | Genetic sequences conferring nematode resistance in plants and uses therefor |
EP0828835A1 (en) | 1995-06-02 | 1998-03-18 | Pioneer Hi-Bred International, Inc. | HIGH THREONINE DERIVATIVES OF $g(a)-HORDOTHIONIN |
EP0832235A1 (en) | 1995-06-02 | 1998-04-01 | Pioneer Hi-Bred International, Inc. | HIGH METHIONINE DERIVATIVES OF alfa-HORDOTHIONIN |
US5837876A (en) | 1995-07-28 | 1998-11-17 | North Carolina State University | Root cortex specific gene promoter |
US5703049A (en) | 1996-02-29 | 1997-12-30 | Pioneer Hi-Bred Int'l, Inc. | High methionine derivatives of α-hordothionin for pathogen-control |
US5850016A (en) | 1996-03-20 | 1998-12-15 | Pioneer Hi-Bred International, Inc. | Alteration of amino acid compositions in seeds |
US6072050A (en) | 1996-06-11 | 2000-06-06 | Pioneer Hi-Bred International, Inc. | Synthetic promoters |
WO1998001575A1 (en) | 1996-07-08 | 1998-01-15 | Pioneer Hi-Bred International, Inc. | Transformation of zygote, egg or sperm cells and recovery of transformed plants from isolated embryo sacs |
EP0946729A2 (en) | 1996-11-01 | 1999-10-06 | Pioneer Hi-Bred International, Inc. | Proteins with enhanced levels of essential amino acids |
US5981840A (en) | 1997-01-24 | 1999-11-09 | Pioneer Hi-Bred International, Inc. | Methods for agrobacterium-mediated transformation |
ES2273127T3 (es) | 1998-02-26 | 2007-05-01 | Pioneer Hi-Bred International, Inc. | Promotor alfa-tubulin 3-18 del maiz. |
US6693185B2 (en) | 1998-07-17 | 2004-02-17 | Bayer Bioscience N.V. | Methods and means to modulate programmed cell death in eukaryotic cells |
ATE309362T1 (de) | 1998-08-20 | 2005-11-15 | Pioneer Hi Bred Int | Samen-bevorzugende promotoren |
AU5788299A (en) | 1998-08-28 | 2000-03-21 | Pioneer Hi-Bred International, Inc. | Seed-preferred promoters from (end) genes |
WO2000066748A1 (en) | 1999-04-29 | 2000-11-09 | Syngenta Limited | Herbicide resistant plants |
US6683231B2 (en) | 2000-06-02 | 2004-01-27 | E. I. Du Pont De Nemours And Company | High level production of p-hydroxybenzoic acid in green plants |
US7612251B2 (en) | 2000-09-26 | 2009-11-03 | Pioneer Hi-Bred International, Inc. | Nucleotide sequences mediating male fertility and method of using same |
EP1320618B1 (en) | 2000-09-26 | 2012-03-07 | Pioneer Hi-Bred International, Inc. | Nucleotide sequences mediating male fertility and method of using same |
US7517975B2 (en) | 2000-09-26 | 2009-04-14 | Pioneer Hi-Bred International, Inc. | Nucleotide sequences mediating male fertility and method of using same |
AU2001287862B2 (en) | 2000-09-29 | 2006-12-14 | Syngenta Limited | Herbicide resistant plants |
WO2002083911A1 (en) | 2001-04-12 | 2002-10-24 | MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. | Production of plants with increased tolerance to drought stress or with increased transpiration |
AU2003224789B2 (en) | 2002-03-27 | 2007-03-15 | Agrinomics, Llc | Generation of plants with improved drought tolerance |
US7045684B1 (en) | 2002-08-19 | 2006-05-16 | Mertec, Llc | Glyphosate-resistant plants |
KR101104830B1 (ko) | 2003-04-09 | 2012-01-17 | 바이엘 바이오사이언스 엔.브이. | 스트레스 조건에 대한 식물의 내성을 증가시키기 위한 방법및 수단 |
US7754945B2 (en) | 2003-06-24 | 2010-07-13 | Agrigenetics Inc. | Generation of plants with improved drought tolerance |
CN101090971B (zh) | 2004-10-29 | 2013-01-02 | 拜尔作物科学公司 | 耐受胁迫的棉花植物 |
KR101447300B1 (ko) | 2006-08-11 | 2014-10-07 | 몬산토 테크놀로지 엘엘씨 | 안트라닐레이트 신타제의 엽록체를 표적으로 하는 발현에 의한 고-트립토판 옥수수의 생산 |
WO2008043156A1 (en) | 2006-10-13 | 2008-04-17 | Noble House Group Pty. Ltd. | Means for sampling animal blood |
WO2008064289A2 (en) | 2006-11-21 | 2008-05-29 | The Samuel Roberts Noble Foundation, Inc. | Biofuel production methods and compositions |
US7919676B2 (en) | 2007-08-03 | 2011-04-05 | Pioneer Hi-Bred International, Inc. | Msca1 nucleotide sequences impacting plant male fertility and method of using same |
KR101840513B1 (ko) | 2011-09-26 | 2018-03-20 | 스미또모 가가꾸 가부시키가이샤 | 식물 질병 방제 조성물 및 그의 용도 |
US20130185823A1 (en) | 2012-01-16 | 2013-07-18 | Academia Sinica | Mesoporous silica nanoparticle-mediated delivery of dna into arabidopsis root |
EA201491537A1 (ru) | 2012-02-17 | 2015-01-30 | Киджин Н.В. | Повышение засухоустойчивости у растений: upl3 |
WO2013188638A2 (en) | 2012-06-15 | 2013-12-19 | The Regents Of The University Of California | Endoribonucleases and methods of use thereof |
US9902973B2 (en) | 2013-04-11 | 2018-02-27 | Caribou Biosciences, Inc. | Methods of modifying a target nucleic acid with an argonaute |
US20160145631A1 (en) | 2013-06-14 | 2016-05-26 | Cellectis | Methods for non-transgenic genome editing in plants |
MX2016002306A (es) | 2013-08-22 | 2016-07-08 | Du Pont | Promotor u6 de polimerasa iii de soja y metodos de uso. |
CN106536729A (zh) | 2013-12-12 | 2017-03-22 | 布罗德研究所有限公司 | 使用粒子递送组分靶向障碍和疾病的crispr‑cas系统和组合物的递送、用途和治疗应用 |
JP5937635B2 (ja) | 2014-03-28 | 2016-06-22 | ファナック株式会社 | 電磁接触器の溶着検出機能を有するモータ駆動装置 |
WO2016196655A1 (en) | 2015-06-03 | 2016-12-08 | The Regents Of The University Of California | Cas9 variants and methods of use thereof |
WO2016205749A1 (en) | 2015-06-18 | 2016-12-22 | The Broad Institute Inc. | Novel crispr enzymes and systems |
JP2019532644A (ja) * | 2016-09-30 | 2019-11-14 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | Rna誘導型核酸修飾酵素及びその使用方法 |
-
2018
- 2018-05-03 US US16/610,372 patent/US20200407737A1/en not_active Abandoned
- 2018-05-03 EP EP18722498.5A patent/EP3619305A1/en not_active Withdrawn
- 2018-05-03 CN CN201880044965.7A patent/CN110832074A/zh active Pending
- 2018-05-03 WO PCT/EP2018/061394 patent/WO2018202800A1/en unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2796558A1 (en) * | 2013-04-23 | 2014-10-29 | Rheinische Friedrich-Wilhelms-Universität Bonn | Improved gene targeting and nucleic acid carrier molecule, in particular for use in plants |
CN105899657A (zh) * | 2013-12-12 | 2016-08-24 | 布罗德研究所有限公司 | 用于改变基因产物表达的crispr-cas系统和方法、结构信息以及诱导型模块化cas酶 |
US20170114351A1 (en) * | 2014-06-12 | 2017-04-27 | King Abdullah University Of Science And Technology | TARGETED VIRAL-MEDIATED PLANT GENOME EDITING USING CRISPR /Cas9 |
US20160090603A1 (en) * | 2014-09-30 | 2016-03-31 | Sandia Corporation | Delivery platforms for the domestication of algae and plants |
WO2016100309A1 (en) * | 2014-12-16 | 2016-06-23 | Pioneer Hi-Bred International, Inc. | Restoration of male fertility in wheat |
Non-Patent Citations (5)
Title |
---|
ANANTHARAMAN,K.等: ""MHYZ01000150.1,MAG: Planctomycetes bacterium RIFCSPLOWO2_12_FULL_39_13 rifcsplowo2_12_scaffold_52511, whole genome shotgun sequence"", 《GENBANK》 * |
DAVID BURSTEIN等: ""New CRISPR–Cas systems from uncultivated microbes"", 《NATURE》 * |
HUI YANG等: ""New CRISPR-Cas systems discovered"", 《CELL RESEARCH》 * |
XUAN LIU等: ""Application of CRISPR/Cas9 in plant biology"", 《ACTA PHARMACEUTICA SINICA B》 * |
胡颂平等: ""CRISPR/Cas9介导基因组编辑技术在植物基因中的研究进展"", 《江西农业大学学报》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111793625A (zh) * | 2020-07-29 | 2020-10-20 | 江西农业大学 | 一种定点敲除水稻OsAUR2基因的sgRNA的oligo DNA组 |
CN111793624A (zh) * | 2020-07-29 | 2020-10-20 | 江西农业大学 | 一种定点敲除水稻OsAurora1基因的sgRNA的oligo DNA组 |
CN114438122A (zh) * | 2022-01-24 | 2022-05-06 | 华中农业大学 | 油菜类肉桂酰-CoA还原酶基因BnaCCR-LIKE在调控作物含油量中的应用 |
CN114438122B (zh) * | 2022-01-24 | 2023-11-24 | 华中农业大学 | 油菜类肉桂酰-CoA还原酶基因BnaCCR-LIKE在调控作物含油量中的应用 |
Also Published As
Publication number | Publication date |
---|---|
US20200407737A1 (en) | 2020-12-31 |
EP3619305A1 (en) | 2020-03-11 |
WO2018202800A1 (en) | 2018-11-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110832074A (zh) | CRISPR-Cas核酸内切酶在植物基因组工程中的应用 | |
US10844389B2 (en) | FAD2 performance loci and corresponding target site specific binding proteins capable of inducing targeted breaks | |
CN108795972B (zh) | 不使用转基因标记序列分离细胞的方法 | |
JP2021035379A (ja) | Fad3性能座および標的化切断を誘導可能である対応する標的部位特異的結合タンパク質 | |
JP2018531024A (ja) | マーカーフリーゲノム改変のための方法および組成物 | |
JP2018531024A6 (ja) | マーカーフリーゲノム改変のための方法および組成物 | |
US20170367280A1 (en) | Use of argonaute endonucleases for eukaryotic genome engineering | |
KR20170121218A (ko) | 증가된 단백질 함량 및 스트레스에 대한 저항성을 위한 nf-yc4 프로모터 내 전사 리프레서 결합 부위의 변형 | |
US20170247711A1 (en) | Zea mays regulatory elements and uses thereof | |
US20230313162A1 (en) | Use of crispr-cas endonucleases for plant genome engineering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200221 |
|
WD01 | Invention patent application deemed withdrawn after publication |