CN117999352A - 用于植物细胞的序列和启动子以及制备和使用此类序列的方法 - Google Patents
用于植物细胞的序列和启动子以及制备和使用此类序列的方法 Download PDFInfo
- Publication number
- CN117999352A CN117999352A CN202280057565.6A CN202280057565A CN117999352A CN 117999352 A CN117999352 A CN 117999352A CN 202280057565 A CN202280057565 A CN 202280057565A CN 117999352 A CN117999352 A CN 117999352A
- Authority
- CN
- China
- Prior art keywords
- nucleic acid
- sequence
- seq
- plant
- sequences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 241000196324 Embryophyta Species 0.000 claims abstract description 97
- 241001515826 Cassava vein mosaic virus Species 0.000 claims abstract description 26
- 241000701484 Figwort mosaic virus Species 0.000 claims abstract description 26
- 150000007523 nucleic acids Chemical group 0.000 claims description 59
- 244000166124 Eucalyptus globulus Species 0.000 claims description 34
- 108090000623 proteins and genes Proteins 0.000 claims description 29
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 26
- 102000039446 nucleic acids Human genes 0.000 claims description 23
- 108020004707 nucleic acids Proteins 0.000 claims description 23
- 108091033409 CRISPR Proteins 0.000 claims description 16
- 238000010354 CRISPR gene editing Methods 0.000 claims description 14
- 102000004169 proteins and genes Human genes 0.000 claims description 13
- 108091027544 Subgenomic mRNA Proteins 0.000 claims description 8
- 238000010362 genome editing Methods 0.000 claims description 7
- 230000010354 integration Effects 0.000 claims description 7
- 241000209510 Liliopsida Species 0.000 claims description 5
- 241001233957 eudicotyledons Species 0.000 claims description 5
- 230000002103 transcriptional effect Effects 0.000 claims description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 2
- 238000010459 TALEN Methods 0.000 claims description 2
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 claims description 2
- 108700019146 Transgenes Proteins 0.000 abstract description 13
- 230000009261 transgenic effect Effects 0.000 abstract description 10
- 230000003612 virological effect Effects 0.000 abstract description 7
- 239000000203 mixture Substances 0.000 abstract description 4
- 230000014509 gene expression Effects 0.000 description 60
- 210000004027 cell Anatomy 0.000 description 33
- 108020004414 DNA Proteins 0.000 description 30
- 239000002773 nucleotide Substances 0.000 description 20
- 125000003729 nucleotide group Chemical group 0.000 description 20
- 241000006105 Eucalyptus coccifera Species 0.000 description 19
- 239000013598 vector Substances 0.000 description 18
- 241000018646 Pinus brutia Species 0.000 description 15
- 239000005090 green fluorescent protein Substances 0.000 description 15
- 235000011613 Pinus brutia Nutrition 0.000 description 14
- 230000009466 transformation Effects 0.000 description 14
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 13
- 210000001938 protoplast Anatomy 0.000 description 13
- 102000053602 DNA Human genes 0.000 description 12
- 244000103090 Eucalyptus robusta Species 0.000 description 10
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 10
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 10
- 240000001416 Pseudotsuga menziesii Species 0.000 description 10
- 239000004009 herbicide Substances 0.000 description 10
- 235000005221 swamp mahogany Nutrition 0.000 description 10
- 235000008572 Pseudotsuga menziesii Nutrition 0.000 description 9
- 210000001519 tissue Anatomy 0.000 description 9
- 108091026890 Coding region Proteins 0.000 description 8
- 235000004692 Eucalyptus globulus Nutrition 0.000 description 8
- 238000002869 basic local alignment search tool Methods 0.000 description 8
- 102000040430 polynucleotide Human genes 0.000 description 8
- 108091033319 polynucleotide Proteins 0.000 description 8
- 239000002157 polynucleotide Substances 0.000 description 8
- 230000001105 regulatory effect Effects 0.000 description 8
- 238000011144 upstream manufacturing Methods 0.000 description 8
- 239000002609 medium Substances 0.000 description 7
- 239000013612 plasmid Substances 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- 241000700605 Viruses Species 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000002363 herbicidal effect Effects 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 108010020183 3-phosphoshikimate 1-carboxyvinyltransferase Proteins 0.000 description 5
- 241000589158 Agrobacterium Species 0.000 description 5
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 5
- NWBJYWHLCVSVIJ-UHFFFAOYSA-N N-benzyladenine Chemical compound N=1C=NC=2NC=NC=2C=1NCC1=CC=CC=C1 NWBJYWHLCVSVIJ-UHFFFAOYSA-N 0.000 description 5
- 108700026226 TATA Box Proteins 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 230000008929 regeneration Effects 0.000 description 5
- 238000011069 regeneration method Methods 0.000 description 5
- 244000107602 Corymbia citriodora Species 0.000 description 4
- 235000004722 Eucalyptus citriodora Nutrition 0.000 description 4
- 108020005004 Guide RNA Proteins 0.000 description 4
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 4
- 235000005590 Larix decidua Nutrition 0.000 description 4
- 241000218657 Picea Species 0.000 description 4
- 241000723873 Tobacco mosaic virus Species 0.000 description 4
- 108700009124 Transcription Initiation Site Proteins 0.000 description 4
- 108090000765 processed proteins & peptides Proteins 0.000 description 4
- 230000000644 propagated effect Effects 0.000 description 4
- 235000014081 Abies amabilis Nutrition 0.000 description 3
- 235000017894 Abies grandis Nutrition 0.000 description 3
- 241000589156 Agrobacterium rhizogenes Species 0.000 description 3
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 3
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 241000218218 Ficus <angiosperm> Species 0.000 description 3
- 239000005562 Glyphosate Substances 0.000 description 3
- 241000218652 Larix Species 0.000 description 3
- 238000011529 RT qPCR Methods 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- 108700008625 Reporter Genes Proteins 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 239000012877 elongation medium Substances 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 3
- 229940097068 glyphosate Drugs 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 238000000520 microinjection Methods 0.000 description 3
- 239000006870 ms-medium Substances 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 238000007480 sanger sequencing Methods 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 244000101408 Abies amabilis Species 0.000 description 2
- 244000283070 Abies balsamea Species 0.000 description 2
- 235000007173 Abies balsamea Nutrition 0.000 description 2
- 244000178606 Abies grandis Species 0.000 description 2
- 235000004710 Abies lasiocarpa Nutrition 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- 108091079001 CRISPR RNA Proteins 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 240000005979 Hordeum vulgare Species 0.000 description 2
- 235000007340 Hordeum vulgare Nutrition 0.000 description 2
- 241001235216 Larix decidua Species 0.000 description 2
- 241000534018 Larix kaempferi Species 0.000 description 2
- 235000008119 Larix laricina Nutrition 0.000 description 2
- 241000218653 Larix laricina Species 0.000 description 2
- 235000008122 Larix occidentalis Nutrition 0.000 description 2
- 244000193510 Larix occidentalis Species 0.000 description 2
- 244000207740 Lemna minor Species 0.000 description 2
- 235000006439 Lemna minor Nutrition 0.000 description 2
- 240000003183 Manihot esculenta Species 0.000 description 2
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 2
- 241000001463 Niaceae Species 0.000 description 2
- 235000008124 Picea excelsa Nutrition 0.000 description 2
- 240000000020 Picea glauca Species 0.000 description 2
- 235000008127 Picea glauca Nutrition 0.000 description 2
- 240000009002 Picea mariana Species 0.000 description 2
- 241000218594 Picea pungens Species 0.000 description 2
- 241000218596 Picea rubens Species 0.000 description 2
- 235000005018 Pinus echinata Nutrition 0.000 description 2
- 241000592226 Pinus nigra Species 0.000 description 2
- 235000016421 Pinus nigra Nutrition 0.000 description 2
- 235000013697 Pinus resinosa Nutrition 0.000 description 2
- 241000534656 Pinus resinosa Species 0.000 description 2
- 235000001855 Portulaca oleracea Nutrition 0.000 description 2
- 244000078534 Vaccinium myrtillus Species 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical group N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 229960004261 cefotaxime Drugs 0.000 description 2
- AZZMGZXNTDTSME-JUZDKLSSSA-M cefotaxime sodium Chemical compound [Na+].N([C@@H]1C(N2C(=C(COC(C)=O)CS[C@@H]21)C([O-])=O)=O)C(=O)\C(=N/OC)C1=CSC(N)=N1 AZZMGZXNTDTSME-JUZDKLSSSA-M 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 239000013256 coordination polymer Substances 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000010195 expression analysis Methods 0.000 description 2
- 238000000799 fluorescence microscopy Methods 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000003119 immunoblot Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 229910052742 iron Inorganic materials 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000010899 nucleation Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- MGRVRXRGTBOSHW-UHFFFAOYSA-N (aminomethyl)phosphonic acid Chemical compound NCP(O)(O)=O MGRVRXRGTBOSHW-UHFFFAOYSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- PRPINYUDVPFIRX-UHFFFAOYSA-N 1-naphthaleneacetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CC=CC2=C1 PRPINYUDVPFIRX-UHFFFAOYSA-N 0.000 description 1
- 239000005971 1-naphthylacetic acid Substances 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid Chemical compound CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- 241000218642 Abies Species 0.000 description 1
- 235000004507 Abies alba Nutrition 0.000 description 1
- 244000166033 Abies lasiocarpa Species 0.000 description 1
- 241000379225 Abies procera Species 0.000 description 1
- 241000208140 Acer Species 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 244000144725 Amygdalus communis Species 0.000 description 1
- 235000011437 Amygdalus communis Nutrition 0.000 description 1
- 240000007087 Apium graveolens Species 0.000 description 1
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 description 1
- 235000010591 Appio Nutrition 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 235000017060 Arachis glabrata Nutrition 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- 235000010777 Arachis hypogaea Nutrition 0.000 description 1
- 235000018262 Arachis monticola Nutrition 0.000 description 1
- 241001167018 Aroa Species 0.000 description 1
- 244000003416 Asparagus officinalis Species 0.000 description 1
- 235000005340 Asparagus officinalis Nutrition 0.000 description 1
- 235000016068 Berberis vulgaris Nutrition 0.000 description 1
- 241000335053 Beta vulgaris Species 0.000 description 1
- 235000018185 Betula X alpestris Nutrition 0.000 description 1
- 235000018212 Betula X uliginosa Nutrition 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- 241000167854 Bourreria succulenta Species 0.000 description 1
- 244000178993 Brassica juncea Species 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 240000007124 Brassica oleracea Species 0.000 description 1
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 1
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 1
- 235000004221 Brassica oleracea var gemmifera Nutrition 0.000 description 1
- 235000017647 Brassica oleracea var italica Nutrition 0.000 description 1
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 1
- 244000308368 Brassica oleracea var. gemmifera Species 0.000 description 1
- 241001674345 Callitropsis nootkatensis Species 0.000 description 1
- 241000722694 Calocedrus decurrens Species 0.000 description 1
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 1
- 244000020518 Carthamus tinctorius Species 0.000 description 1
- 108700004991 Cas12a Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 241000701489 Cauliflower mosaic virus Species 0.000 description 1
- 241000701459 Caulimovirus Species 0.000 description 1
- 241000723437 Chamaecyparis Species 0.000 description 1
- 241001117253 Chamaecyparis thyoides Species 0.000 description 1
- 235000007542 Cichorium intybus Nutrition 0.000 description 1
- 244000298479 Cichorium intybus Species 0.000 description 1
- 241000207199 Citrus Species 0.000 description 1
- 240000007154 Coffea arabica Species 0.000 description 1
- 235000002787 Coriandrum sativum Nutrition 0.000 description 1
- 244000018436 Coriandrum sativum Species 0.000 description 1
- 241001480079 Corymbia calophylla Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 244000241257 Cucumis melo Species 0.000 description 1
- 235000009847 Cucumis melo var cantalupensis Nutrition 0.000 description 1
- 240000008067 Cucumis sativus Species 0.000 description 1
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 1
- 241000723198 Cupressus Species 0.000 description 1
- 244000019459 Cynara cardunculus Species 0.000 description 1
- 235000019106 Cynara scolymus Nutrition 0.000 description 1
- 235000018782 Dacrydium cupressinum Nutrition 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 235000014466 Douglas bleu Nutrition 0.000 description 1
- 241000970621 Emaravirus Species 0.000 description 1
- 101100491986 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) aromA gene Proteins 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 244000187785 Eucalyptus alba Species 0.000 description 1
- 244000150857 Eucalyptus bancroftii Species 0.000 description 1
- 235000000169 Eucalyptus bancroftii Nutrition 0.000 description 1
- 241001465371 Eucalyptus botryoides Species 0.000 description 1
- 244000239638 Eucalyptus bridgesiana Species 0.000 description 1
- 235000005224 Eucalyptus bridgesiana Nutrition 0.000 description 1
- 240000004181 Eucalyptus cladocalyx Species 0.000 description 1
- 241001074688 Eucalyptus dunnii Species 0.000 description 1
- 241001233195 Eucalyptus grandis Species 0.000 description 1
- 241000763639 Eucalyptus pumila Species 0.000 description 1
- 244000151703 Eucalyptus rostrata Species 0.000 description 1
- 241000404037 Eucalyptus urophylla Species 0.000 description 1
- 240000006927 Foeniculum vulgare Species 0.000 description 1
- 235000004204 Foeniculum vulgare Nutrition 0.000 description 1
- 229930182566 Gentamicin Natural products 0.000 description 1
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 239000005561 Glufosinate Substances 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 1
- 240000007049 Juglans regia Species 0.000 description 1
- 235000009496 Juglans regia Nutrition 0.000 description 1
- 241000721662 Juniperus Species 0.000 description 1
- 235000003228 Lactuca sativa Nutrition 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 241000514697 Lepidothamnus laxifolius Species 0.000 description 1
- 240000007472 Leucaena leucocephala Species 0.000 description 1
- 235000010643 Leucaena leucocephala Nutrition 0.000 description 1
- 241000208682 Liquidambar Species 0.000 description 1
- 235000006552 Liquidambar styraciflua Nutrition 0.000 description 1
- 240000004658 Medicago sativa Species 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 240000007817 Olea europaea Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 244000025272 Persea americana Species 0.000 description 1
- 235000008673 Persea americana Nutrition 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 241000218597 Picea engelmannii Species 0.000 description 1
- 235000008145 Picea mariana Nutrition 0.000 description 1
- 235000017997 Picea mariana var. mariana Nutrition 0.000 description 1
- 235000018000 Picea mariana var. semiprostrata Nutrition 0.000 description 1
- 241000218595 Picea sitchensis Species 0.000 description 1
- 235000010450 Pino mugo Nutrition 0.000 description 1
- 235000005205 Pinus Nutrition 0.000 description 1
- 241000218602 Pinus <genus> Species 0.000 description 1
- 235000009324 Pinus caribaea Nutrition 0.000 description 1
- 241001223353 Pinus caribaea Species 0.000 description 1
- 241001236219 Pinus echinata Species 0.000 description 1
- 235000013264 Pinus jeffreyi Nutrition 0.000 description 1
- 235000008595 Pinus lambertiana Nutrition 0.000 description 1
- 240000008299 Pinus lambertiana Species 0.000 description 1
- 235000016013 Pinus leiophylla var chihuahuana Nutrition 0.000 description 1
- 235000011609 Pinus massoniana Nutrition 0.000 description 1
- 241000018650 Pinus massoniana Species 0.000 description 1
- 241000218617 Pinus monticola Species 0.000 description 1
- 235000017339 Pinus palustris Nutrition 0.000 description 1
- 241000204936 Pinus palustris Species 0.000 description 1
- 235000008577 Pinus radiata Nutrition 0.000 description 1
- 241000218621 Pinus radiata Species 0.000 description 1
- 235000018999 Pinus serotina Nutrition 0.000 description 1
- 241001139411 Pinus serotina Species 0.000 description 1
- 240000007320 Pinus strobus Species 0.000 description 1
- 235000005103 Pinus virginiana Nutrition 0.000 description 1
- 241001236196 Pinus virginiana Species 0.000 description 1
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 1
- 108700001094 Plant Genes Proteins 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 241000219000 Populus Species 0.000 description 1
- 235000009827 Prunus armeniaca Nutrition 0.000 description 1
- 244000018633 Prunus armeniaca Species 0.000 description 1
- 235000005386 Pseudotsuga menziesii var menziesii Nutrition 0.000 description 1
- 244000305267 Quercus macrolepis Species 0.000 description 1
- 102000009572 RNA Polymerase II Human genes 0.000 description 1
- 108010009460 RNA Polymerase II Proteins 0.000 description 1
- 238000010357 RNA editing Methods 0.000 description 1
- 230000026279 RNA modification Effects 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 235000017848 Rubus fruticosus Nutrition 0.000 description 1
- 244000004774 Sabina virginiana Species 0.000 description 1
- 235000008691 Sabina virginiana Nutrition 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 241000422846 Sequoiadendron giganteum Species 0.000 description 1
- 235000003434 Sesamum indicum Nutrition 0.000 description 1
- 244000040738 Sesamum orientale Species 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 1
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 1
- 235000002597 Solanum melongena Nutrition 0.000 description 1
- 244000061458 Solanum melongena Species 0.000 description 1
- 101710135785 Subtilisin-like protease Proteins 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 244000186561 Swietenia macrophylla Species 0.000 description 1
- 240000002871 Tectona grandis Species 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 241000656145 Thyrsites atun Species 0.000 description 1
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 235000003095 Vaccinium corymbosum Nutrition 0.000 description 1
- 235000017537 Vaccinium myrtillus Nutrition 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 235000020224 almond Nutrition 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 101150037081 aroA gene Proteins 0.000 description 1
- 235000016520 artichoke thistle Nutrition 0.000 description 1
- 229910002056 binary alloy Inorganic materials 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000004790 biotic stress Effects 0.000 description 1
- 235000021029 blackberry Nutrition 0.000 description 1
- 235000021014 blueberries Nutrition 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 230000010307 cell transformation Effects 0.000 description 1
- 235000019693 cherries Nutrition 0.000 description 1
- 229930002875 chlorophyll Natural products 0.000 description 1
- 235000019804 chlorophyll Nutrition 0.000 description 1
- ATNHDLDRLWWWCB-AENOIHSZSA-M chlorophyll a Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 ATNHDLDRLWWWCB-AENOIHSZSA-M 0.000 description 1
- 239000003593 chromogenic compound Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 235000016213 coffee Nutrition 0.000 description 1
- 235000013353 coffee beverage Nutrition 0.000 description 1
- 238000001218 confocal laser scanning microscopy Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 231100000676 disease causative agent Toxicity 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000002073 fluorescence micrograph Methods 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 229960002518 gentamicin Drugs 0.000 description 1
- 239000011121 hardwood Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 1
- 229940097277 hygromycin b Drugs 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 229920005610 lignin Polymers 0.000 description 1
- 235000013490 limbo Nutrition 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 244000309711 non-enveloped viruses Species 0.000 description 1
- 235000014571 nuts Nutrition 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 230000003032 phytopathogenic effect Effects 0.000 description 1
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000000751 protein extraction Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 244000000000 soil microbiome Species 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000006032 tissue transformation Effects 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- -1 triplex RNAs Proteins 0.000 description 1
- 101150101900 uidA gene Proteins 0.000 description 1
- 230000001018 virulence Effects 0.000 description 1
- 235000020234 walnut Nutrition 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/00041—Use of virus, viral particle or viral elements as a vector
- C12N2710/00043—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Virology (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
Abstract
本公开涉及由病毒元件构建的新的序列,其用作转基因启动子;例如,在转基因植物中。更具体地,本公开涉及嵌合转基因启动子序列,其包括衍生自玄参花叶病毒(FMV/FiMV)基因组的部分和衍生自木薯脉花叶病毒(CsVMV)基因组的部分。本公开提供用于制备和使用此类转基因启动子的方法和组合物。
Description
技术领域
本发明总体上涉及可用作启动子用于转基因表达的核酸序列。更具体地,本发明涉及衍生自病毒启动子的序列元件以及这些序列元件的组合在植物中表达编码序列或功能性RNA的用途。
序列表
本申请包含已作为命名为“30407-0016WO1_SL_ST26.xml.”的XML文件电子提交的序列表。该XML文件创建于2022年8月22日,大小为55,300字节。XML文件中的内容通过引用以其整体并入本文。
背景技术
植物基因工程的目标之一是生产具有工效学上优选的特征或性状的植物,并为此目的-提高或降低基因产物(一种以上)或功能性RNA的表达水平。这样的表达改变通常需要使用非内源性启动子。
然而,对于一些植物和作物,有大量的可用于转基因用途的启动子集合,而其它植物和作物,例如桉树(Eucalyptus),则仅有几个被充分表征为功能性的、甚至用于组成型转基因表达的非内源性启动子。因此,构建用于此类作物的启动子是有价值的。
发明内容
在一方面,本公开提供(I)一种核酸序列,其包括(i)衍生自玄参花叶病毒(Figwort Mosaic Virus,FMV,FiMV)的亚基因组转录物(Sgt)启动子的转录调控元件,其不包括启动子的TATA部分,和(ii)衍生自木薯脉花叶病毒(Casava Vein Mosaic Virus,CsVMV)基因组启动子的转录调控元件,其不包括TAT部分,或(II)一种核酸序列,其包括与上述(i)和(ii)序列基本上相似的序列。
在另一方面,本公开提供包括上述核酸序列的细菌-克隆繁殖的质粒,并且其可以在植物细胞中起到表达载体的作用。
本公开还提供在基因组中具有上述核酸序列的转化的植物细胞,以及包括此类植物细胞的转基因植物或种子。
附图说明
图1
示意性地描述包括pFSgt-CsVMV序列的非限制性核酸构建体。描述的构建体(4478bp长)包括克隆至pUC57载体骨架的SEQ ID NO:1的pFSgt-CsVMV。
图2
示意性地描述包括pFSgt-BRRV序列的非限制性核酸构建体:DNA构建体(4335bp长)包括克隆至pUC57载体骨架的pFSgt-BRRV SEQ ID NO:2。
图3
示意性地描述包括pFSgt-PFIt序列的构建体:DNA构建体(4344bp长)包括克隆至pUC57载体骨架的SEQ ID NO:3。
图4
示意性地描述包括CaMV 35S序列的构建体:DNA构建体(4367bp长)包括克隆至pUC57载体骨架的SEQ ID NO:4。
图5
显示来自包括图1至4中描述的四种构建体的原生质体细胞的GFP的荧光显微成像:具体地,显微图像显示来自用实施例3中描述的表达构建体转化并在转化后24小时观察的桉树原生质体细胞的GFP荧光,作为表达的指示。叶绿素自发荧光呈现为红色。
图6
来自图5中所示的表达实验的荧光定量:来自图5中所示的转化的桉树原生质体的GFP荧光强度的定量。使用ImageJ定量强度并对细胞尺寸归一化。平均值±SEM。
图7A
示意性地描述包括可操作地连接至mCherry报告基因的pFSgt-CsVMV(SEQ ID NO:1)的双元载体构建体:DNA构建体(12830bp长)完整地提供为SEQ ID NO:17(pFSgt-CsVMV合成载体)。
图7B
示意性地描述包括pFSgt-CsVMV(SEQ ID NO:1)、下游为可操作地连接至mCherry报告基因的Omega(Om)序列的双元载体构建体:DNA构建体(12909bp长)完整地提供为SEQID NO:18(pFSgt-CsVMV合成载体+TMV omega 5’UTR)。
图8的A-H
显示用包括pFSgt-CsVMV启动子序列的构建体转化的桉树外植体/愈伤组织中的mCherry荧光(表达)的荧光图像。图8的A、C、E和G显示用图7A中描述的双元载体(图8的A、C)或用图7B中描述的双元载体(图8的E、G)转化的细胞的光图像。图8的B、D、F和H分别显示对应于图8的A、C、E和G的相应mCherry发射(emissions)-显示为红色。
图9
显示本文公开的序列。
具体实施方式
本文描述用于驱动转基因的表达的序列、组合物和方法。具体地,本文描述起到启动子的作用的序列和携带其的表达载体,用于植物细胞。如下文的实验例中详细说明的,pFSgt-CsVMV序列用于转基因表达并且发现在植物细胞中为功能性的。
我们根据衍生自感染植物的两种病毒的基因组:玄参花叶病毒(FMV/FiMV,NCBIID:10649)和木薯脉花叶病毒(CsVMV,NCBI ID:38062)的序列设计了非天然存在的核酸序列,将其称为pFSgt-CsVMV。
本文描述的核酸序列总体上包括(1)一种分离的非天然存在的核酸序列,其包括(i)第一序列,其与玄参花叶病毒(FMV,FiMV)亚基因组转录物(Sgt/sg)启动子(sgFiMV,SEQID NO:16)的部分基本上相似,其缺少TATA盒,和(ii)第二、含TATA部分,其与木薯脉花叶病毒(CsVMV)基因组的片段基本上相似。除了pFSgt-CsVMV核酸序列以外,还提供了(2)携带前述分离的核酸序列的细胞,(3)包括至少一个携带前述核酸序列的细胞的植物,和(4)使用前述核酸序列制备转基因植物的方法。
可以以多种方式构建pFSgt-CsVMV序列,但更具体地(从5’至3’方向)包括:
(1)sgFiMV启动子区域的第一部分(sgFiMV启动子为SEQ ID NO:16-FMV参照基因组的核苷酸(nt.)5063-5363;NC_003554.1)-但此类部分缺少sgFiMV TATA盒(位于nt.5287-5293)及其周围的核苷酸(自每侧起10个核苷酸),或其相似序列。该第一部分之后为
(2)衍生自作为SEQ ID NO:6提供的来自NCBI ID U59751.1的区段7162-7604的木薯脉花叶病毒(CsVMV)基因组(并且具体地超过200nt.)的序列部分,或其相似序列)。
如本文所描述的核酸序列的非限制性实例为SEQ ID NO:1的pFSgt-CsVMV,其包含:(i)缺少FMV衍生的TATA盒的衍生自sgFiMV转录物启动子的(超过200个核苷酸碱基的)序列、及其周围的核苷酸;和(ii)来自CsVMV启动子的(超过400个核苷酸碱基长的)序列-包括CsVMV衍生的TATA盒。
CsVMV序列部分在转录起始位点(TSS)近端并且在可操作地连接的转录序列近端-当pFSgt-CsVMV用作转基因启动子时。
更具体地:SEQ ID NO:1的pFSgt-CsVMV包括(a)衍生自FMV基因组的核苷酸序列,具体地SEQ ID NO:5-其缺少天然FMV启动子的‘近端启动子’(即在TSS近端)部分,和(b)呈现CsVMV启动子的近端启动子部分的来自CsVMV基因组(具体地SEQ ID NO:6)的核苷酸序列,并且可包括UTR部分(SEQ ID NO:8)。
用于构建SEQ ID NO:1的SEQ ID NO:6-与(GenBank Seq.ID U59751.1)CsVMV基因组的区别在于1个碱基对,用腺嘌呤(A)取代位置7234处的鸟嘌呤(G),以消除SacI限制位点(GAGCTC至AAGCTC)来简化随后的克隆。如GenBank Seq.ID U59751.1中的参照非突变型Cassava序列提供为SEQ ID NO:7。
pFSgt-CsVMV序列的另一示例性构建提供为SEQ ID NO:9。
据称pFSgt-CsVMV包括第一和第二部分。当用于驱动转基因的表达时,就转录序列而言-或更准确地就转录起始位点(TSS)而言,第一部分(衍生自FMV的亚基因组转录物启动子,SEQ ID NO:16)可被描述为远端,第二部分(衍生自CsVMV)可被描述为近端。注意,这两部分有时被称为“核心启动子”,其包括TATA和“调控模块”(上游部分),例如pFSgt-CsVMV可被描述为(1)核酸序列,其包括与FMV的亚基因组转录物启动子的调控模块基本上相似的第一序列、和与CsVMV的核心启动子基本上相似的第二序列,或可选地描述为(2)杂合启动子序列,其包括(i)FMV启动子的亚基因组转录物启动子的调控模块或与其基本上相似的序列、和(ii)CsVMV的核心启动子或与其基本上相似的序列。
本文描述的核酸序列可用作用于不同目的的启动子-所述启动子包括但不限于-蛋白质编码序列的表达或用于功能性RNA的转录。功能性RNA在本领域被认为是具有细胞-生物学功能的转录的RNA分子,诸如,例如:mRNA、miRNA、tRNA、dsRNA、三链体RNA、核酶、长非编码RNA、snoRNA、snRNA、增强子ncRNA、Piwi-相互作用RNA(piRNA)、CRISPR向导RNA(gRNA)、CRISPR RNA(crRNA)、反式激活CRISPR RNA(tracrRNA)、供体-RNA和海绵(sponge)RNA。
要表达的蛋白质编码序列(例如基因)的非限制性实例包括可用于在栽培植物中提供期望的性状的基因,例如提高的生物质、对虫害(例如昆虫、真菌和其它病原体)的抗性、提高的对除草剂的耐受性、对例如干旱等生物胁迫的环境耐受性、和提高的包括木材木质素在内的植物来源的产物(一种以上)的加工性。
本公开描述通过诱导将pFSgt-CsVMV导入植物细胞中的步骤而在植物中表达转录元件的方法。
任选地和优选地,此类方法进一步包括选择对转基因序列为阳性的植物细胞或选择转基因植物,并且基于期望的表型(一种以上)。在此类方法中-可以通过选自TALEN或CRISPR的基因组编辑方法、特别是通过CRISPR定点整合(Site Directed Integration,SDI)来实现将pFSgt-CsVMV导入植物基因组中。
为了清楚起见:本领域已知被称为“FMV”的两种不相关的病毒:本公开的焦点在于来自双链DNA(dsDNA)玄参花叶病毒(FMV;NCBI ID:10649)(非包膜病毒)的序列。如上所述,FMV;NCBI ID:10649的基因组由Shepherd(NC_003554.1GI:20143424)提供。另一种不相关的病毒是无花果花叶病毒(环斑病毒属(emaravirus))(FMV;NCBI ID:54539),一种分节段的负义单链RNA病毒,其是无花果植物中无花果花叶病(FMD)的病原体。后者与本公开不相关。
在植物转基因领域中,通常根据启动子指导期望的表达序列(例如编码序列或功能性RNA)(在转化的细胞或植物中的)以足以提供所需的生物学功能或效果的表达水平转录的能力来选择启动子。本文描述的核酸为特定值的,因为在同一细胞中使用冗余的同一启动子会稀释其效力。
pFSgt-CsVMV可以与另一高表达启动子平行使用,并且共表达不会受到与当单个启动子用于同一细胞中的两种转基因时所呈现的稀释作用相同的影响。
本文描述的方法和组合物可以无限制地应用于任何单子叶和双子叶植物或植物细胞,并且以提供基因表达。
相关的示例植物包括木本植物(具有细长的硬木质化茎的多年生植物;即树木),例如桉树、杨树、松树、冷杉、云杉、金合欢树、枫香树、白蜡树、桦树、橡树、柚木、桃花心木、糖枫树(sugar)和蒙特雷树(Monterey),坚果树,例如核桃和杏仁,和果树,例如苹果、李子、樱桃、柑橘和杏。其它值得注意的实例为树木和植物,可以是苜蓿、朝鲜蓟、芝麻菜、芦笋、酪梨、香蕉、大麦、豆类、甜菜、黑莓、蓝莓、西兰花、抱子甘蓝、卷心菜、油菜、麝香甜瓜、胡萝卜、木薯、花椰菜、芹菜、芫荽、咖啡、玉米、棉花、黄瓜、浮萍、茄子、苦苣、阔叶莴苣、茴香、葫芦、印度芥菜、红花、橄榄、大米、大麦、甘蔗、小麦、浮萍。桉树和相关的植物是特别令人感兴趣的。可进行修改以与本文描述的核酸一起使用的相关的树木亚型包括但不限于桉树和松树物种,例如,桉树(例如大桉(Eucalyptus grandis))或其杂交种,或松树亚型。例如:白桉(Eucalyptus alba)、班氏桉(Eucalyptus bancroftii)、葡萄桉(Eucalyptusbotryoides)、金钱桉(Eucalyptus bridgesiana)、美叶桉(Eucalyptus calophylla)、赤桉(Eucalyptus camaldulensis)、柠檬桉(Eucalyptus citriodora)、甜叶桉(Eucalyptuscladocalyx)、浆果桉(Eucalyptus coccifera)、柯蒂斯桉(Eucalyptus curtisii)、山桉(Eucalyptus dalrympleana)、彩虹桉(Eucalyptus deglupta)、王桉(Eucalyptusdelagatensis)、红桉(Eucalyptus diversicolor)、邓恩桉(Eucalyptus dunnii)、红花桉(Eucalyptus ficifolia)、蓝桉(Eucalyptus globulus)、圆头桉(Eucalyptusgomphocephala)、苹果桉(Eucalyptus gunnii)、亨利桉(Eucalyptus henryi)、左叶桉(Eucalyptus laevopinea)、毛皮桉(Eucalyptus macarthurii)、大咀桉(Eucalyptusmacrorhyncha)、斑皮桉(Eucalyptus maculata)、红柳桉(Eucalyptus marginata)、大果桉(Eucalyptus megacarpa)、蜜味桉(Eucalyptus melliodora)、尼科桉(Eucalyptusnicholii)、亮果桉(Eucalyptus nitens)、新英格兰桉(Eucalyptus nova-angelica)、斜叶桉(Eucalyptus obliqua)、西方桉(Eucalyptus occidentalis)、钝花桉(Eucalyptusobtusiflora)、蓝白蜡桉(Eucalyptus oreades)、疏花桉(Eucalyptus pauciflora)、多苞桉(Eucalyptus polybractea)、王桉(Eucalyptus regnans)、树脂桉(Eucalyptusresinifera)、大叶桉(Eucalyptus robusta)、野桉(Eucalyptus rudis)、柳叶桉(Eucalyptus saligna)、铁木桉(Eucalyptus sideroxylon)、Eucalyptus stuartiana、细叶桉(Eucalyptus tereticornis)、毛叶桉(Eucalyptus torelliana)、坛果桉(Eucalyptusurnigera)、尾叶桉(Eucalyptus urophylla)、多枝桉(Eucalyptus viminalis)、青桉(Eucalyptus viridis)、旺杜桉(Eucalyptus wandoo)、和Eucalyptus youmanni,或北美短叶松(Pinus banksiana)、土耳其松(Pinus brutia)、加勒比松(Pinus caribaea)、Pinusclasusa、扭叶松(Pinus contorta)、大果松(Pinus coulteri)、萌芽松(Pinus echinata)、阿富汗松(Pinus eldarica)、湿地松(Pinus ellioti)、杰弗里松(Pinus jeffreyi)、糖松(Pinus lambertiana)、马尾松(Pinus massoniana)、西部白松(Pinus monticola)、欧洲黑松(Pinus nigra)、长叶松(Pinus palustrus)、海岸松(pinus pinaster)、西黄松(Pinusponderosa)、辐射松(Pinus radiata)、美国赤松(Pinus resinosa)、刚松(Pinus rigida)、晚松(Pinus serotina)、北美乔松(Pinus strobus)、欧洲赤松(Pinus sylvestris)、火炬松(Pinus taeda)、矮松(Pinus virginiana)、或太平洋冷杉(Abies amabilis)、香脂冷杉(Abies balsamea)、白冷杉(Abies concolor)、大冷杉(Abies grandis)、高山冷杉(Abieslasiocarpa)、Abies magnifica)、红冷杉(Abies procera)、美国扁柏(Chamaecyparislawsoniona)、北美金柏(Chamaecyparis nootkatensis)、美国尖叶扁柏(Chamaecyparisthyoides)、北美圆柏(Juniperus virginiana)、欧洲落叶松(Larix decidua)、美洲落叶松(Larix laricina)、日本落叶松(Larix leptolepis)、西部落叶松(Larix occidentalis)、新疆落叶松(Larix siberica)、北美翠柏(Libocedrus decurrens)、欧洲云杉(Piceaabies)、恩格曼云杉(Picea engelmanni)、白云杉(Picea glauca)、黑云杉(Piceamariana)、蓝云杉(Picea pungens)、红云杉(Picea rubens)、北美云杉(Piceasitchensis)、花旗松(Pseudotsuga menziesii)、巨杉(Sequoia gigantea)、红杉(Sequoiasempervirens)、落羽杉(Taxodium distichum)、加拿大铁杉(Tsuga canadensis)、异叶铁杉(Tsuga heterophylla)、长果铁杉(Tsuga mertensiana)、北美香柏(Thujaoccidentalis)、北美乔柏(Thuja plicata)。
如本文所用,词语“基因表达”可理解为是指众所周知的用于表达感兴趣的核酸或氨基酸(无论是肽、蛋白质或各种功能性RNA)的方法。上文已经提供了功能性RNA的实例。
如本文所用,术语“核酸”是指从5’端至3’端阅读的脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链聚合物。“核酸”也可以任选地包含允许聚合酶的正确通读并且不降低该核酸编码的多肽的表达的非天然存在的或改变的核苷酸碱基。
如本文所用,术语“DNA”或“DNA分子”是指基因组来源或合成来源的双链DNA分子,即脱氧核糖核苷酸碱基的聚合物或多核苷酸分子,从5’(上游)端至3’(下游)端阅读。
如本文所用,术语“DNA序列”是指DNA分子的核苷酸序列。本文使用的术语是美国联邦法规(United States Code of Federal Regulations)§1.822第37卷所要求的术语,并记载于WIPO标准ST.25(WIPOStandard ST.25)(1998),附录2,表1和表3中。
在转基因启动子领域中,人们普遍认为-对于一定长度的启动子和调控核酸元件而言-并非所有的核苷酸都发挥可测量的功能效应。因此,基本上相似的序列-例如,具有至少80%同一性、或90%同一性,或至少95%同一性、或至少98%同一性、或至少99%同一性的序列-将很可能具有相同的功能属性-即:具有基本上相似的序列的启动子将具有相似的表达模式。
在分子生物学中,术语“转录起始位点”(TSS)是DNA链上第一个核苷酸被转录成RNA的位置。值得注意的是,使用生物信息学难以确定TSS的精确位置,但可以使用实验方法对其进行定位,特别是高通量测序。
术语TATA盒(或Goldberg-Hogness盒)是在RNA聚合酶II转录的真核核心启动子区域的一部分中发现的DNA共有序列。它是包含共有序列5’-TATA(A/T)A(A/T)-3’的序列,并且位于转录起始位点的上游约25-35个碱基对,从该转录起始位点可以检测到转录。
启动子中更靠近(近端)TSS的部分被称为近端启动子(例如,在TSS的上游延伸约200-250个碱基对,包含主要调控元件)。相应地,启动子的远端部分是在TSS的上游但与TSS分离的序列,并且可能包含额外的调控元件。
(i)FMV亚基因组转录物启动子和(ii)CsVMV启动子都是含TATA盒的启动子。FMV亚基因组转录物启动子的部分描述为ID NO.5,缺少TATA-盒序列和周围(近端启动子)序列。
编码序列(CDS)是描述编码例如蛋白质等基因产物的DNA的技术术语。
用于通过分子生物学工具包含转基因启动子的DNA元件可以通过聚合酶链(PCR)扩增从多种来源的集合获得,例如基因组序列、质粒和核酸序列的文库,其中许多是公开可得的。可选地,此类DNA元件可以基于在存储库(depositories)中电子地描述的序列进行化学合成。此类DNA可以全部或者部分地合成、随后将其结合以形成完整的启动子。
术语“重组DNA”或“重组核苷酸序列”在本领域中被理解为包含通过经由诱变、限制酶和连接等操作进行的基因工程化修饰的DNA。
短语“在植物中为功能性的”,例如对于起到启动子的作用的核酸,可以是指当与要表达的序列可操作地连接时,该核酸驱动植物细胞核中的表达的能力。当启动子和表达序列连接作为同一核酸分子的一部分并适当地定位和定向用于起始转录时-启动子和表达序列是可操作连接的。
本文描述的核酸序列可以在植物细胞中起到启动子的作用。例如,我们检验了以下在植物中的表达:在pFSgt-CsVMV核酸序列之后可操作地连接的编码序列,具有或不具有插入的omega 5’UTR序列元件(“Om”);SEQ ID NO:11的转录成TMV RNA的omega前导序列的核酸序列。烟草花叶病毒(TMV)的omega前导序列可以在体内和在体外增强外源RNA的翻译;在转录时,它可以在各种细胞类型和不同的无细胞翻译系统中起到翻译增强子的作用。增强效果可能是由于omega序列的稳定的紧凑结构避免了降解。
对于一些应用,优选在植物基因组中的非特异性位置处导入功能性重组DNA,这是通过随机基因组整合来实现的。在特殊情况下,优选通过定点整合来插入重组DNA构建体。两者都可能与本文描述的方法相关。定点重组系统包括美国专利No.4,959,317中公开的cre-10x和美国专利No.5,527,695中公开的FLP-FRT,并且使用定点整合使用如中国专利申请公开CN 107,142,282中所公开的CRISPR基因组编辑方法。
本领域已知几种基因组编辑方法。CRISPR基因组编辑是使用CRISPR-Cas系统(衍生自原核生物获得性免疫系统)以实现定点改变以及较大元件向基因组的位点选择性插入的方法。本文描述的核酸可以以几种方式与CRISPR使用相结合:(1)CRISPR可用于将如本文描述的启动子导入植物的基因组中以驱动内源性或外源性序列的表达;(2)如本文描述的启动子可用于驱动CRISPR基因组编辑系统的元件(即:Cas蛋白、向导RNA和模板RNA等)的表达;或(3)如本文描述的启动子可用于不同的基于CRISPR的系统的元件的表达(例如基于CRISPR的基因组标记或RNA编辑)。
CRISPR系统对真核生物的适应性可以在美国申请No.15/981,807(加州大学伯克利分校)和美国专利No.8,697,359(Broad Institute)中找到,并且在一些申请中明确提供了植物用途,例如美国公开No.US2020/0299717(Ceres Inc.)。
用于将外源基因导入植物中的许多方法是已知的,并且可用于将功能性多核苷酸插入植物宿主中,包括生物和物理的植物转化方案。参见,例如,Miki等人,"Procedure forIntroducing Foreign DNA into Plants,"in Methods in Plant Molecular Biologyand Biotechnology,Glick and Thompson,编辑,CRC Press,Inc.,Boca Raton,pp.67-88(1993)。
所选择的方法因宿主植物而变化,并且包括例如磷酸钙等化学转染方法、例如农杆菌(Agrobacterium)(Horsch等人,Science 227:1229-31(1985))等微生物介导的基因转移、电穿孔、显微注射和基因枪轰击法(biolistic bombardment)。
用于植物细胞或组织转化和植物的再生的表达盒和载体以及体外培养方法是已知的且可获得的。参见,例如,Gruber等人,"Vectors for Plant Transformation,"inMethods in Plant Molecular Biology and Biotechnology,supra,pp.89-119。分离的多核苷酸或多肽可以通过一种以上的通常用于直接递送至细胞中的技术而导入植物中。这样的方案可以取决于基因修饰所针对的生物体、细胞、植物或植物细胞的类型(即单子叶植物或双子叶植物)而改变。转化植物细胞的合适的方法包括显微注射(美国专利No.6,300,543)、电穿孔(Riggs,等人,(1986)Proc.Natl.Acad.Sci.USA83:5602-5606、直接基因转移(Paszkowski等人,(1984)EMBO J.3:2717-2722)、和弹道颗粒加速(美国专利No.4,945,050)。农杆菌介导的玉米转化(美国专利No.5,981,840);聚乙二醇方法(Krens,等人,(1982)Nature 296:72-77);单子叶和双子叶植物细胞的原生质体可以使用电穿孔(Fromm,等人,(1985)Proc.Natl.Acad.Sci.USA 82:5824-5828)和显微注射(Crosswa等人,(1986)Mol.Gen.Genet.202:179-185)转化。
用于将表达载体导入植物中的最广泛使用的方法是基于农杆菌的天然转化系统。根癌农杆菌(Agrobacterium(Agro)tumefaciens,A.tumefaciens))和发根农杆菌(A.rhizogenes)是植物病原性土壤细菌,它们对植物细胞进行遗传转化。用于农杆菌介导的基因转移的系统和方法提供于Gruber,等人,同上;Miki,等人,同上;和Moloney,等人,(1989)Plant Cell Reports 8:238。类似地,可以将基因分别插入衍生自根癌农杆菌或发根农杆菌的Ti或Ri质粒的T-DNA区域。兼容性NOS启动子和终止子存在于质粒pARC2(ATCC登录号67238)中。来自Ti或Ri质粒的与T-DNA部分一起的、或者经由双元系统(其中vir基因存在于单独的载体上)的毒力(vir)基因在美国专利No.5,262,306中已知并引用。上述所有参考文献都以其整体通过引用并入本文。EPO No.604662中提供了单子叶植物转化。
与本文描述的启动子组合,可以使用(i)选择标记或(ii)可筛选标记。例如,
(i)常用的选择标记基因包括赋予对例如卡那霉素(nptl)、潮霉素B(aph IV)和庆大霉素(aac3和aacC4)等抗生素的抗性、或对例如草铵膦(bar或pat)、草甘膦(EPSPS)和AMPA(phno)等除草剂的抗性/耐受性的选择标记基因。本文提及的EPSPS(cp4 epsps(aroA:CP4))是5-烯醇丙酮莽草酸-3-磷酸合酶(EPSPS)酶的除草剂耐受形式,其降低了对草甘膦的结合亲和力,从而赋予对草甘膦除草剂的提高的耐受性。此类选择标记的实例在美国专利Nos.5,550,318;5,633,435;5,780,708和6,118,047中进行了说明。
(ii)可筛选标记,其提供在视觉上鉴定转化体和表达的能力,此外,在下文的实施例中用作表达和表达水平的指标的绿色荧光蛋白(GFP)和mCherry包括:β-葡萄糖醛酸酶或uidA基因(GUS),其各种发色底物是已知的。荧光,例如通过显微成像获得并测定的荧光,最常由(相对和)任意单位[A.u.]表示。
为了定量来自荧光显微镜的图像并评价表达蛋白质的总量-可以使用假定荧光与蛋白质量呈线性比例的工具和算法。ImageJ软件(Rasband,W.S.,ImageJ,U.S.NationalInstitutes of Health,Bethesda,Maryland,USA出版;已在本工作中使用-并且处于公有领域-不受版权保护)。
术语“分离的DNA分子”可被理解为至少部分地与在天然状态下通常与该DNA分子结合的其它分子分离的DNA分子。在一个实施方案中,术语“分离的”在本文中也用于指代至少部分地与在天然状态下通常位于DNA分子侧翼的核酸分离的DNA分子。因此,与通常不缔合的调控或编码序列融合的DNA分子,例如作为重组技术的结果,在本文中被认为是分离的。此类分子即使在存在于例如宿主细胞的染色体中或者溶液中的质粒构建体中也被认为是分离的。在本上下文中,术语“分离的”包括在天然状态或环境中不存在的分子。
如本文所用,“序列同一性”是指两个最佳比对的多核苷酸或多肽序列在整个比对窗口(例如核苷酸或氨基酸的比对窗口)中相同的程度。其中“最佳比对”符合算法所基于的标准。
测试序列和参考序列的比对片段的“同一性分数”是两条比对序列共有的相同组分的数量除以参考序列片段中的组分的总数,即,整个参考序列或参考序列的较小限定部分。
如本文所用,术语“百分比序列同一性”或“百分比同一性”是指当两条序列为最佳比对(在比较窗口中具有合适的核苷酸插入、缺失或空位,总计小于参考序列的给定百分比)时,与测试(“受试”)多核苷酸分子(或其互补链)相比较,参考(“查询”)多核苷酸分子(或其互补链)的线性多核苷酸序列中的相同核苷酸的百分比。用于比对比较窗口的序列的最佳比对是本领域技术人员所熟知的。
BLAST(基本局部比对搜索工具)是本领域已知的用于比较例如蛋白质的氨基酸序列或DNA和/或RNA序列的核苷酸等一级生物序列信息的主要算法和程序。BLAST是NCBI美国国家医学图书馆(National Library of Medicine)(National Center forBiotechnology Information,U.S.National Library of Medicine,8600RockvillePike,Bethesda MD,20894USA)的注册商标。在研究基因时用于序列比较,BLAST可以定位两个相关物种的共同基因,并且可以用于将来自一个生物体的注释映射至另一生物体。BLAST的常用输出包括序列同一性和/或相似性的指示、以及关于零假设情况的比对概率的统计。BLAST通过定位两条序列之间的短匹配来找到相似的序列。这个寻找相似序列的过程被称为种子化(seeding)。在该第一次匹配后,BLAST开始进行局部比对。在试图寻找序列的相似性的同时,常见字母集(称为单词)和BLAST的启发式算法在感兴趣的序列和来自数据库的命中序列(一条以上)之间定位所有单词。然后,该结果将用于构建比对。当使用评分矩阵进行比较时,这些单词必须满足具有至少阈值T的评分的要求。
对于蛋白质序列的比较-通常使用BLASTP,对于DNA与它可能编码的蛋白质的比较,BLASTX(翻译的核苷酸序列;BLASTX版本2.0)和BLASTN版本2.0用于相互地、鉴定可翻译成蛋白质查询的多核苷酸序列。
除非另有说明,否则本说明书中使用的上述限定的所有数字在所有情况下都应理解为由术语“约”修饰。因此,除非有相反的指示,否则本说明书记载的数值参数是近似值,其可变化至多加或减5%。
转基因在一种以上的靶细胞类型或组织中的高表达被默认限定是与对照相比较的,例如诸如本领域常用的启动子。可用于进行比较以确定本文公开的调控元件的高的或增加的转基因表达的额外的对照包括单独的载体、来自病毒来源的基本启动子(minimalpromoter)或通常不驱动表达的序列。转基因的高表达可以是在细胞内、或在体内、在体外和/或离体的。
存在可用于产生本文描述的任何植物的许多变体或启动子序列和转化方法。例如:
·Odell,J.T.,Nagy,F.,&Chua,N.H.(1985).Identification of DNA sequencesrequired for activity of the cauliflower mosaic virus 35S promoter.Nature,313(6005),810-812.
·Acharya,S.,Ranjan,R.,Pattanaik,S.,Maiti,I.B.,&Dey,N.(2014).Efficient chimeric plant promoters derived from plant infecting viralpromoter sequences.Planta,239(2),381-396
·Timko MP,Kausch AP,Castresana C,Fassler J,Herrera-Estrella L,Vanden Broeck G,Van Montagu M,Schell J,Cashmore AR.Light regulation of plantgene expression by an upstream enhancer-like element.Nature.1985Dec 12-18;318(6046):579-82.doi:10.1038/318579a0.PMID:3865055.
·Deepak Kumar et al.published in PLOS in 2011“Development of UsefulRecombinant Promoter and Its Expression Analysis in Different Plant CellsUsing Confocal Laser Scanning Microscopy”
·Acharya et al.Planta,2014“Efficient chimeric plant promotersderived from plant infecting viral promoter sequences”
·Yoo S.D.Cho Y.J.,Sheen J.“Arabidopsis mesophyll protoplasts:aversatile cell system for transient gene expression analysis”Nat Protocols2007;2(7):1565-72.doi:10.1038/nprot.2007.199
现在将通过以下非限制性实施例来说明本文描述的组合物和方法。
实施例
实施例1:要用作启动子的序列的构建:
基于来自病毒基因组的DNA序列-片段构建用于在双子叶植物中的组成型表达的用作启动子的非天然存在的序列:
1)SEQ ID NO:1(pFSgt-CsVMV)是包含726个核苷酸的psgFiMV-CsVMV启动子的非限制性实例-基于两条病毒基因组序列的部分:第一部分衍生自玄参花叶病毒的基因组,第二部分衍生自木薯脉花叶病毒的基因组。第二部分(含TATA)与SEQ ID NO:6和SEQ ID NO:8相当,如下
表1所示。
2)SEQ ID NO:2是pFSgt-BRRV序列(583个核苷酸)的实例。SEQ ID NO:2是合成的并且由以下DNA片段构成:
关于典型CsVMV基因组(ID U59751.1;SEQ ID NO:7)-用腺嘌呤(A)替代位置7234(在SEQ ID NO:6内)的鸟嘌呤(G),以消除SacI限制位点(GAGCTC至AAGCTC)来简化克隆。
pFSgt-CsVMV和pFSgt-BRRV序列的合成-后来被克隆用于表达载体-是使用GeneWiz的服务完成的并通过Sanger测序进行了验证。
合成了两条额外的序列,后来用作对照:(I)pFSgt-PFIt和CaMV 35S。pFSgt-PFIt序列包括来自花生枯条病(花椰菜病毒属(Caulimovirus))病毒(PClSV;NCBI:txid 35593)启动子的部分,其具有来自玄参花叶病毒启动子的(近端、含TATA盒的部分)片段;和(II)本领域常用的CaMV 35S启动子。
实施例2:表达构建体的克隆:
为了在体内在功能上评价新的嵌合启动子的转录活性,将四种启动子(如上所述和下文中列出的)克隆至pUC57载体骨架,在绿色荧光蛋白(GFP;GenBank Seq.IDX96418.1)编码序列(CDS)的上游,然后是根癌农杆菌NOS终止子(GenBank登录号MK439386.1的21790-21538nt)。使用的四种启动子如下:
(I)pFSgt-CsVMV启动子(SEQ ID NO:1);
(II)pFSgt-BRRV启动子(SEQ ID NO:2);
(III)pFSgt-PFIt启动子(SEQ ID NO:3);
(IV)CaMV 35S启动子(SEQ ID NO:4)。
将pFSgt-CsVMV启动子在pUC57载体骨架内重新测序。来自Sanger测序的反向互补片段(800nt)提供为SEQ ID NO:9。将所有4种构建体(每个的方案分别在图1-4中提供)转化至原生质体中:
具体而言,如Yoo等人,2007,Nature Protocols,2:1565-72中所述,提取并转化(PEG转化)源自大桉的植物叶的分离的原生质体。将原生质体在渗透溶液中、在25℃孵育过夜,并在转化后24小时观察GFP表达。
实施例3:原生质体表达检测:
为了评价平均表达水平,在荧光立体显微镜下观察转化的原生质体,定量GFP强度作为表达水平的代表(使用ImageJ)。图5显示,在转化后24小时,与表达来自CaMV 35S启动子的GFP报道基因的原生质体相比,pFSgt-CsVMV-GFP原生质体具有更高的表达。通过类似的比较,发现与CaMV 35S-GFP相比,pFSgt-BRRV-GFP具有相对低的表达水平。图6提供了图5中目视观察到的GFP强度的定量,作为表达水平的代表,表明与CaMV 35S-GFP对照相比,pFSgt-CsVMV-GFP原生质体具有高出3倍以上的表达。
实施例4:克隆和转化至植物:
为了评价新的启动子在植物中的表达谱,如下所述用携带pFSgt-CsVMV启动子的构建体转化桉树细胞。
具体而言,使用图7A中的HindIII-XbaI位点,通过将pFSgt:CsVMV克隆至pBI121骨架中而产生了包含pFSgt-CsVMV启动子(SEQ ID NO:1)的合成序列的DNA构建体。SEQ IDNO:1的pFSgt-CsVMV启动子之后是mCherry的CDS和NOS终止子(pFSgt-CsVMV-mCherry),SEQID NO:17。图7B中的构建体与图7A中的构建体基本上相同,除了在SEQ ID NO:1的下游和mCherry序列的上游存在Omega序列。通过Sanger测序对构建体进行了验证,并基本上如Prakash等人,2009,Phcog.Rev.,3:353-8中所述转化至植物中:将桉树的枝在由3%(w/v)蔗糖和0.8%(w/v)琼脂组成的Murashige和Skoog培养基(MS也称为MSO或MS0(MS-zero))基础盐培养基上在体外繁殖。将所有的体外植物材料在25±2℃下用强度为30llEm-2s-1的冷白荧光灯培养16小时光周期。携带含有nptll基因的双元载体pBI121的根癌土壤杆菌菌株LB A4404用于进行转化。使在对数期晚期收集的Agro细菌培养物沉淀并重悬浮在MS基础盐培养基中。收集来自体外材料的叶并用作外植体用于转化实验。将外植体在补充有0.5mg/16-苄氨基嘌呤(BAP)和0.1mg/1NAA的MS再生培养基上预培养2天。然后,将预培养的叶外植体在细菌悬浮液中轻轻摇动10分钟,并在无菌滤纸上吸干。然后在预培养条件下在培养基中培养外植体两天。
在共培养后,将(例如用包含pFSgt-CsVMV-mCherry的构建体转化的)外植体在MS液体培养基中洗涤,在无菌滤纸上吸干,并转移至补充有40mg/l卡那霉素和300mg/l头孢噻肟的含有0.5mg/l 6-苄氨基嘌呤和0.1mg/l 1-萘乙酸的MS再生培养基中。在培养4-5周后,观察到再生,并将外植体转移至在纸桥上的液体伸长培养基(liquid elongation medium)(补充有0.5mg/1BAP、40mg/1卡那霉素和300mg/1头孢噻肟的MS培养基)中。伸长的枝(1.5-2cm)在含有0.1mg/1BAP的MS培养基上繁殖。叶片段再生,阳性外植体在含有0.04mg/L BAP的MS培养基上生长。
为了表明成功的转化和启动子在植物组织中的功能性,在转化的外植体中使mCherry的表达可视化。具体而言,通过Olympus SZX16荧光显微镜(由Olympus DP72相机捕获,和cellSense采集软件)使荧光发射(600nm)可视化。图8显示再生的桉树外植体的图像,具有愈伤组织和主枝中的荧光。为了评价表达谱,对植物组织进行采样并通过qRT-PCR和免疫印迹来评价表达水平。
实施例5:植物组织中的表达水平的评价(转录物):
在切下主枝并在组织培养中在伸长培养基上生长后,使它们繁殖、然后送到温室用于培养成成熟植物。取得来自3月龄pFSgt-CsVMV-mCherry和对照植物的叶、茎和根组织的样品,并使用植物/真菌总RNA纯化试剂盒(Plant/Fungi Total RNA Purification Kit)(Cat.25800,Norgen Biotek)、根据制造商的说明进行RNA提取。为了检测转基因转录物表达的程度,使用逆转录、然后是实时qPCR。用于mCherry和“管家”参考转录物扩增子的引物对列于表3中。
表3:
1 | p3155 CherryFw | GCCCCGTAATGCAGAAGAAG | SEQ ID NO:12 |
2 | p3156 CherryRev | TCTTGACCTCAGCGTCGTAG | SEQ ID NO:13 |
3 | p1464Fw | TCCAATCCGAGTCGCTGTCATTGT | SEQ ID NO:14 |
4 | p1465Rev | TGATGAGCCTCTCTGGTTTGACCT | SEQ ID NO:15 |
使用Applied Biosystems StepOnePlusTM实时机器进行qRT-PCR扩增和检测。
实施例6:植物组织中的表达水平的评价(蛋白质):
对于从植物组织中提取蛋白质,使用由50mM Tris-HCl PH 7.5和蛋白酶抑制剂(100X蛋白酶抑制剂混合物用于植物细胞和组织提取物,DMSO溶液,P9599,Merck)构成的缓冲液。使用来自INVITROGEN的E-PAGETM48系统进行免疫印迹,并使用INVITROGEN-iBlotTM干印迹系统进行转移,两者均是根据制造商的说明进行的。
实施例7:pFSgt-CsVMV和第二组成型启动子的叠加性状:
为了提供对广泛使用的非选择性除草剂具有更高的抗性的植物,需要确保除草剂耐受基因的组合的充分表达,并避免由于使用冗余的启动子而导致的降低的表达水平。
这可以通过对期望表达的每种核酸使用不同的启动子来实现。桉树中的Agro转化用于导入两种编码序列:除草剂抗性1和除草剂抗性2。具体而言,将表达除草剂抗性1的CaMV 35S和表达除草剂抗性2的pFSgt-CsVMV分别克隆至pBI121双元载体(Clontech)中,使用所述的Agro转化来转化至不同的植物中,使衍生的耐受植物杂交以产生双转基因子代植物。
实施例8:将pFSgt-CsVMV编辑至植物的基因组中:
为了诱导内源性靶转录元件(例如编码序列或功能性RNA)的高表达,CRISPR基因组编辑用于经由定点整合(SDI)将pFSgt-CsVMV序列导入至要表达的内源性靶序列的基因组位置附近。为此目的,‘强’启动子(例如CaMV 35S或pFSgt-CsVMV)用于驱动Cas9或Cas12a的表达(又名Cas表达盒)。(RNA-pol-III)U6启动子用于驱动靶向基因组靶序列的gRNA的表达,所述基因组靶序列接近靶转录元件。U6-gRNA由与Cas表达盒相同或不同的质粒提供。如本领域中所提供的,向导RNA序列与Cas9或Cas12a兼容。
本文描述的pFSgt-CsVMV的序列提供在供体-RNA模板上(环状或线性DNA形式),以在靶位点中替代或包含pFSgt-CsVMV。对于功能性,pFSgt-CsVMV序列以5’至3’方向可操作地并入在要表达的内源性靶转录元件的5’端之前。如本领域已知的,进行编辑的细胞至成熟植物的进一步选择和繁殖阶段。
Claims (20)
1.一种核酸序列,其包括:
(i)第一分离的核酸部分,其与SEQ ID NO:5的玄参花叶病毒(FMV,FiMV)‘亚基因组’转录物启动子序列部分具有至少80%序列同一性,其中所述第一核酸部分缺少启动子-TATA-盒序列;和
(ii)第二分离的核酸部分,其包含与SEQ ID NO:6的木薯脉花叶病毒(CsVMV)序列具有至少80%序列同一性的核酸,其中所述第二核酸部分包含启动子-TATA-盒序列。
2.根据权利要求1所述的核酸序列,其中所述第一核酸部分序列与SEQ ID NO:5具有至少90%序列同一性。
3.根据权利要求1所述的核酸序列,其中所述第二核酸部分序列与SEQ ID NO:6具有至少90%序列同一性。
4.根据权利要求2所述的核酸序列,其中所述第二核酸部分序列与SEQ ID NO:6具有至少90%序列同一性。
5.根据权利要求1所述的核酸序列,其与SEQ ID NO:1具有至少90%序列同一性。
6.根据权利要求1所述的核酸序列,其与SEQ ID NO:1具有至少95%序列同一性。
7.根据权利要求1所述的核酸序列,其与SEQ ID NO:1具有至少99%序列同一性。
8.根据权利要求1所述的核酸序列,其具有SEQ ID NO:1或SEQ ID NO:9的核酸序列。
9.一种构建体,其包括前述权利要求中任一项所述的核酸序列。
10.根据权利要求9所述的构建体,其中所述核酸序列可操作地连接至(i)编码蛋白质的核酸序列或(ii)转录产生功能性RNA的核酸序列。
11.一种植物细胞,其包括根据权利要求1至8所述的核酸序列中的任一者。
12.一种植物细胞,其包括根据权利要求9或10所述的构建体中的任一者。
13.一种植物,其包括根据权利要求11或12所述的植物细胞。
14.根据权利要求13所述的植物,其中所述植物为双子叶植物。
15.根据权利要求13所述的植物,其中所述植物为单子叶植物。
16.一种在植物中表达转录元件的方法,所述方法包括将根据权利要求1至8中任一项所述的核酸序列导入植物细胞中的步骤。
17.根据权利要求16所述的方法,其中将根据权利要求1至8中任一项所述的核酸序列通过选自TALEN或CRISPR的基因编辑方法导入植物细胞基因组中。
18.根据权利要求17所述的方法,其中将根据权利要求1至8中任一项所述的核酸序列通过CRISPR定点整合(SDI)导入植物细胞基因组中。
19.根据权利要求16至18中任一项所述的方法,其中所述植物选自桉树亚型。
20.根据权利要求16至19中任一项所述的方法,所述方法还包括选择具有期望的表型的植物或植物细胞的步骤。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163236474P | 2021-08-24 | 2021-08-24 | |
US63/236,474 | 2021-08-24 | ||
PCT/IB2022/057897 WO2023026194A1 (en) | 2021-08-24 | 2022-08-23 | Sequences and promoters for use in plant cells and methods of making and using such sequences |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117999352A true CN117999352A (zh) | 2024-05-07 |
Family
ID=85322748
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280057565.6A Pending CN117999352A (zh) | 2021-08-24 | 2022-08-23 | 用于植物细胞的序列和启动子以及制备和使用此类序列的方法 |
Country Status (5)
Country | Link |
---|---|
CN (1) | CN117999352A (zh) |
BR (1) | BR112024002008A2 (zh) |
CA (1) | CA3227865A1 (zh) |
IL (1) | IL311032A (zh) |
WO (1) | WO2023026194A1 (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2339005A3 (en) * | 1999-12-16 | 2011-10-12 | Monsanto Technology LLC | Dna constructs for expression of heterologous polypeptides in plants |
US7132291B2 (en) * | 2003-05-05 | 2006-11-07 | Dow Agro Sciences Llc | Vectors and cells for preparing immunoprotective compositions derived from transgenic plants |
WO2016108236A1 (en) * | 2014-12-29 | 2016-07-07 | Futuragene Israel Ltd. | Nucleic acid constructs, plants comprising same and uses thereof in enhancing plant pest resistance and altering plant monoterpene profile |
US11236350B2 (en) * | 2017-10-04 | 2022-02-01 | Corteva Agriscience Llc | Plant promoter for transgene expression |
-
2022
- 2022-08-23 IL IL311032A patent/IL311032A/en unknown
- 2022-08-23 BR BR112024002008A patent/BR112024002008A2/pt unknown
- 2022-08-23 WO PCT/IB2022/057897 patent/WO2023026194A1/en active Application Filing
- 2022-08-23 CN CN202280057565.6A patent/CN117999352A/zh active Pending
- 2022-08-23 CA CA3227865A patent/CA3227865A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2023026194A9 (en) | 2024-03-07 |
WO2023026194A1 (en) | 2023-03-02 |
IL311032A (en) | 2024-04-01 |
CA3227865A1 (en) | 2023-03-02 |
BR112024002008A2 (pt) | 2024-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230141324A1 (en) | Plant regulatory elements and uses thereof | |
US20230146220A1 (en) | Plant terminator for transgene expression | |
US11053510B2 (en) | Plant regulatory elements and uses thereof | |
WO2017030864A1 (en) | Plant promotor and 3' utr for transgene expression | |
AU2017269292B2 (en) | Plant regulatory elements and uses thereof | |
CN117999352A (zh) | 用于植物细胞的序列和启动子以及制备和使用此类序列的方法 | |
US10731171B2 (en) | Plant promoter for transgene expression | |
AU2016250065A1 (en) | Plant promoter for transgene expression | |
WO2019060145A1 (en) | USE OF A NON-TRANSLATED CORN REGION FOR TRANSGENIC EXPRESSION IN PLANTS | |
WO2024059464A1 (en) | Plant regulatory elements and uses thereof | |
US20170121726A1 (en) | Plant promoter for transgene expression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |