CN113166774A - 藻类基因的诱导表达 - Google Patents
藻类基因的诱导表达 Download PDFInfo
- Publication number
- CN113166774A CN113166774A CN201980076484.9A CN201980076484A CN113166774A CN 113166774 A CN113166774 A CN 113166774A CN 201980076484 A CN201980076484 A CN 201980076484A CN 113166774 A CN113166774 A CN 113166774A
- Authority
- CN
- China
- Prior art keywords
- dna
- interest
- sequence
- promoter
- algal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 216
- 230000014509 gene expression Effects 0.000 title claims abstract description 88
- 230000001939 inductive effect Effects 0.000 title claims abstract description 18
- 238000000034 method Methods 0.000 claims abstract description 33
- 241000894007 species Species 0.000 claims abstract description 29
- 108700007698 Genetic Terminator Regions Proteins 0.000 claims abstract description 21
- IOVCWXUNBOPUCH-UHFFFAOYSA-M Nitrite anion Chemical compound [O-]N=O IOVCWXUNBOPUCH-UHFFFAOYSA-M 0.000 claims abstract description 18
- 229910002651 NO3 Inorganic materials 0.000 claims abstract description 16
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 claims abstract description 11
- 108020004414 DNA Proteins 0.000 claims description 174
- 108010025915 Nitrite Reductases Proteins 0.000 claims description 74
- 102000004169 proteins and genes Human genes 0.000 claims description 65
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 62
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 62
- 229920001184 polypeptide Polymers 0.000 claims description 61
- 241000195649 Chlorella <Chlorellales> Species 0.000 claims description 58
- 108090000913 Nitrate Reductases Proteins 0.000 claims description 50
- 102000053602 DNA Human genes 0.000 claims description 47
- 239000002773 nucleotide Substances 0.000 claims description 45
- 125000003729 nucleotide group Chemical group 0.000 claims description 45
- 241000195493 Cryptophyta Species 0.000 claims description 39
- 108091092195 Intron Proteins 0.000 claims description 33
- 241001103621 Psychotria Species 0.000 claims description 30
- 235000011205 Ocimum Nutrition 0.000 claims description 28
- 241001529734 Ocimum Species 0.000 claims description 28
- 239000003550 marker Substances 0.000 claims description 22
- 241000195620 Euglena Species 0.000 claims description 21
- 239000002609 medium Substances 0.000 claims description 21
- 238000013518 transcription Methods 0.000 claims description 19
- 230000035897 transcription Effects 0.000 claims description 19
- 241000722337 Pholiota Species 0.000 claims description 18
- 102000004190 Enzymes Human genes 0.000 claims description 14
- 108090000790 Enzymes Proteins 0.000 claims description 14
- 239000004055 small Interfering RNA Substances 0.000 claims description 13
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 11
- 108010051219 Cre recombinase Proteins 0.000 claims description 11
- 230000015572 biosynthetic process Effects 0.000 claims description 11
- 229910052799 carbon Inorganic materials 0.000 claims description 11
- 241000199919 Phaeophyceae Species 0.000 claims description 9
- 108091027967 Small hairpin RNA Proteins 0.000 claims description 9
- 150000002632 lipids Chemical class 0.000 claims description 9
- 101710088194 Dehydrogenase Proteins 0.000 claims description 8
- 108020005004 Guide RNA Proteins 0.000 claims description 8
- 108010091086 Recombinases Proteins 0.000 claims description 8
- 102000018120 Recombinases Human genes 0.000 claims description 8
- 108020004459 Small interfering RNA Proteins 0.000 claims description 8
- 108091023040 Transcription factor Proteins 0.000 claims description 8
- 102000040945 Transcription factor Human genes 0.000 claims description 8
- 230000029553 photosynthesis Effects 0.000 claims description 8
- 238000010672 photosynthesis Methods 0.000 claims description 8
- 108010078791 Carrier Proteins Proteins 0.000 claims description 7
- 108090000994 Catalytic RNA Proteins 0.000 claims description 7
- 102000053642 Catalytic RNA Human genes 0.000 claims description 7
- 108090001060 Lipase Proteins 0.000 claims description 7
- 102000004882 Lipase Human genes 0.000 claims description 7
- 239000004367 Lipase Substances 0.000 claims description 7
- 241000196321 Tetraselmis Species 0.000 claims description 7
- 230000000692 anti-sense effect Effects 0.000 claims description 7
- 230000005754 cellular signaling Effects 0.000 claims description 7
- 235000019421 lipase Nutrition 0.000 claims description 7
- 108091092562 ribozyme Proteins 0.000 claims description 7
- 108091006024 signal transducing proteins Proteins 0.000 claims description 7
- 102000034285 signal transducing proteins Human genes 0.000 claims description 7
- 241000195585 Chlamydomonas Species 0.000 claims description 6
- 239000012190 activator Substances 0.000 claims description 6
- 241000227752 Chaetoceros Species 0.000 claims description 5
- 241000180279 Chlorococcum Species 0.000 claims description 5
- 241000206766 Pavlova Species 0.000 claims description 5
- 241000316848 Rhodococcus <scale insect> Species 0.000 claims description 5
- 230000002503 metabolic effect Effects 0.000 claims description 5
- 235000012162 pavlova Nutrition 0.000 claims description 5
- 241000199913 Crypthecodinium Species 0.000 claims description 4
- 241001501885 Isochrysis Species 0.000 claims description 4
- 241000195644 Neochloris Species 0.000 claims description 4
- 241000206733 Skeletonema Species 0.000 claims description 4
- 241001411205 Viridiella Species 0.000 claims description 4
- 238000004520 electroporation Methods 0.000 claims description 4
- 241000308615 Bolidomonas Species 0.000 claims description 3
- 241000544583 Heterococcus <yellow-green algae> Species 0.000 claims description 3
- 241000224474 Nannochloropsis Species 0.000 claims description 3
- 241001221669 Ostreococcus Species 0.000 claims description 3
- 241001036353 Parachlorella Species 0.000 claims description 3
- 235000006753 Platycodon grandiflorum Nutrition 0.000 claims description 3
- 240000003582 Platycodon grandiflorus Species 0.000 claims description 3
- 241000202221 Weissella Species 0.000 claims description 3
- 150000003863 ammonium salts Chemical class 0.000 claims description 3
- 239000002245 particle Substances 0.000 claims description 3
- 241001607836 Achnanthes Species 0.000 claims description 2
- 241000611184 Amphora Species 0.000 claims description 2
- 241000258746 Asterina <sea star> Species 0.000 claims description 2
- 241000196313 Asteromonas Species 0.000 claims description 2
- 241001536324 Botryococcus Species 0.000 claims description 2
- 241000218459 Carteria Species 0.000 claims description 2
- 241000186321 Cellulomonas Species 0.000 claims description 2
- 241000159512 Geotrichum Species 0.000 claims description 2
- 241000801118 Lepidium Species 0.000 claims description 2
- 241000936931 Lepocinclis Species 0.000 claims description 2
- 241000192041 Micrococcus Species 0.000 claims description 2
- 241000180113 Monodus Species 0.000 claims description 2
- 241000502321 Navicula Species 0.000 claims description 2
- 241001148696 Stichococcus Species 0.000 claims description 2
- 241000199474 Tribonema Species 0.000 claims description 2
- 241000195615 Volvox Species 0.000 claims description 2
- 241000589634 Xanthomonas Species 0.000 claims description 2
- 239000001963 growth medium Substances 0.000 claims description 2
- 239000002679 microRNA Substances 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims 16
- 108700011259 MicroRNAs Proteins 0.000 claims 1
- 241001126829 Nosema Species 0.000 claims 1
- 240000008345 Thalassia hemprichii Species 0.000 claims 1
- 230000001105 regulatory effect Effects 0.000 abstract description 33
- 244000005700 microbiome Species 0.000 abstract description 15
- 108700019146 Transgenes Proteins 0.000 abstract description 5
- 210000004027 cell Anatomy 0.000 description 80
- 150000007523 nucleic acids Chemical group 0.000 description 66
- 108091070501 miRNA Proteins 0.000 description 47
- 108091028043 Nucleic acid sequence Proteins 0.000 description 34
- 102000039446 nucleic acids Human genes 0.000 description 33
- 108020004707 nucleic acids Proteins 0.000 description 33
- -1 nitrate ions Chemical class 0.000 description 21
- 239000013598 vector Substances 0.000 description 21
- 108091026890 Coding region Proteins 0.000 description 18
- 150000001413 amino acids Chemical group 0.000 description 18
- 101150036876 cre gene Proteins 0.000 description 12
- 240000009108 Chlorella vulgaris Species 0.000 description 11
- 235000007089 Chlorella vulgaris Nutrition 0.000 description 11
- 102000040430 polynucleotide Human genes 0.000 description 11
- 108091033319 polynucleotide Proteins 0.000 description 11
- 239000002157 polynucleotide Substances 0.000 description 11
- 229940088598 enzyme Drugs 0.000 description 10
- 238000003780 insertion Methods 0.000 description 10
- 230000037431 insertion Effects 0.000 description 10
- 108091036066 Three prime untranslated region Proteins 0.000 description 8
- 230000001965 increasing effect Effects 0.000 description 8
- 230000035772 mutation Effects 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- 108010020183 3-phosphoshikimate 1-carboxyvinyltransferase Proteins 0.000 description 7
- 108010027912 Sulfite Oxidase Proteins 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 238000012217 deletion Methods 0.000 description 7
- 230000037430 deletion Effects 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 6
- 238000010353 genetic engineering Methods 0.000 description 6
- 230000012010 growth Effects 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 5
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 5
- 241000894422 Pseudochlorella Species 0.000 description 5
- 108700008625 Reporter Genes Proteins 0.000 description 5
- 108091023045 Untranslated Region Proteins 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 108020001580 protein domains Proteins 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 238000001262 western blot Methods 0.000 description 5
- 108010000700 Acetolactate synthase Proteins 0.000 description 4
- 102000000452 Acetyl-CoA carboxylase Human genes 0.000 description 4
- 108010016219 Acetyl-CoA carboxylase Proteins 0.000 description 4
- 108010018763 Biotin carboxylase Proteins 0.000 description 4
- 241000196319 Chlorophyceae Species 0.000 description 4
- 102000004316 Oxidoreductases Human genes 0.000 description 4
- 108090000854 Oxidoreductases Proteins 0.000 description 4
- 238000011529 RT qPCR Methods 0.000 description 4
- 102000043440 Sulfite oxidase Human genes 0.000 description 4
- 230000004075 alteration Effects 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 238000002869 basic local alignment search tool Methods 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000006698 induction Effects 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- KWGKDLIKAYFUFQ-UHFFFAOYSA-M lithium chloride Chemical compound [Li+].[Cl-] KWGKDLIKAYFUFQ-UHFFFAOYSA-M 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000006798 recombination Effects 0.000 description 4
- 238000005215 recombination Methods 0.000 description 4
- 210000000130 stem cell Anatomy 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 102100037563 40S ribosomal protein S2 Human genes 0.000 description 3
- 108020005544 Antisense RNA Proteins 0.000 description 3
- 108010006654 Bleomycin Proteins 0.000 description 3
- 241000195628 Chlorophyta Species 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 108700010070 Codon Usage Proteins 0.000 description 3
- NDUPDOJHUQKPAG-UHFFFAOYSA-N Dalapon Chemical compound CC(Cl)(Cl)C(O)=O NDUPDOJHUQKPAG-UHFFFAOYSA-N 0.000 description 3
- 108010006731 Dimethylallyltranstransferase Proteins 0.000 description 3
- 102000005454 Dimethylallyltranstransferase Human genes 0.000 description 3
- 241000195634 Dunaliella Species 0.000 description 3
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 239000005562 Glyphosate Substances 0.000 description 3
- MFESCIUQSIBMSM-UHFFFAOYSA-N I-BCP Chemical compound ClCCCBr MFESCIUQSIBMSM-UHFFFAOYSA-N 0.000 description 3
- 241000192701 Microcystis Species 0.000 description 3
- 108091005461 Nucleic proteins Proteins 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 241000196250 Prototheca Species 0.000 description 3
- 108700005078 Synthetic Genes Proteins 0.000 description 3
- 108020004566 Transfer RNA Proteins 0.000 description 3
- 229960001561 bleomycin Drugs 0.000 description 3
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 108091006047 fluorescent proteins Proteins 0.000 description 3
- 102000034287 fluorescent proteins Human genes 0.000 description 3
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 3
- 229940097068 glyphosate Drugs 0.000 description 3
- 239000005090 green fluorescent protein Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 210000003250 oocyst Anatomy 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 239000006152 selective media Substances 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000011426 transformation method Methods 0.000 description 3
- 230000009261 transgenic effect Effects 0.000 description 3
- VRYALKFFQXWPIH-PBXRRBTRSA-N (3r,4s,5r)-3,4,5,6-tetrahydroxyhexanal Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)CC=O VRYALKFFQXWPIH-PBXRRBTRSA-N 0.000 description 2
- WBQDXWRDENKVSJ-UHFFFAOYSA-N 1-(dichloromethyl)-3-methyl-1-phenylurea Chemical compound CNC(=O)N(C(Cl)Cl)C1=CC=CC=C1 WBQDXWRDENKVSJ-UHFFFAOYSA-N 0.000 description 2
- YVLPJIGOMTXXLP-UHFFFAOYSA-N 15-cis-phytoene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC(C)=CC=CC=C(C)CCC=C(C)CCC=C(C)CCC=C(C)C YVLPJIGOMTXXLP-UHFFFAOYSA-N 0.000 description 2
- QRBLKGHRWFGINE-UGWAGOLRSA-N 2-[2-[2-[[2-[[4-[[2-[[6-amino-2-[3-amino-1-[(2,3-diamino-3-oxopropyl)amino]-3-oxopropyl]-5-methylpyrimidine-4-carbonyl]amino]-3-[(2r,3s,4s,5s,6s)-3-[(2s,3r,4r,5s)-4-carbamoyl-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-4,5-dihydroxy-6-(hydroxymethyl)- Chemical compound N=1C(C=2SC=C(N=2)C(N)=O)CSC=1CCNC(=O)C(C(C)=O)NC(=O)C(C)C(O)C(C)NC(=O)C(C(O[C@H]1[C@@]([C@@H](O)[C@H](O)[C@H](CO)O1)(C)O[C@H]1[C@@H]([C@](O)([C@@H](O)C(CO)O1)C(N)=O)O)C=1NC=NC=1)NC(=O)C1=NC(C(CC(N)=O)NCC(N)C(N)=O)=NC(N)=C1C QRBLKGHRWFGINE-UGWAGOLRSA-N 0.000 description 2
- 108020003589 5' Untranslated Regions Proteins 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 108010037870 Anthranilate Synthase Proteins 0.000 description 2
- 241001167018 Aroa Species 0.000 description 2
- 241000512260 Ascophyllum Species 0.000 description 2
- 101100345994 Aspergillus oryzae (strain ATCC 42149 / RIB 40) mns1B gene Proteins 0.000 description 2
- 108010000755 Bromoxynil nitrilase Proteins 0.000 description 2
- 108091079001 CRISPR RNA Proteins 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 102000018832 Cytochromes Human genes 0.000 description 2
- 108010052832 Cytochromes Proteins 0.000 description 2
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 2
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 2
- 101100379627 Dictyostelium discoideum argJ gene Proteins 0.000 description 2
- 102000016680 Dioxygenases Human genes 0.000 description 2
- 108010028143 Dioxygenases Proteins 0.000 description 2
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 2
- 101100437498 Escherichia coli (strain K12) uidA gene Proteins 0.000 description 2
- 241000224472 Eustigmatophyceae Species 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 2
- 108010060309 Glucuronidase Proteins 0.000 description 2
- 108010063907 Glutathione Reductase Proteins 0.000 description 2
- 102100036442 Glutathione reductase, mitochondrial Human genes 0.000 description 2
- 108030006517 Glyphosate oxidoreductases Proteins 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 101150009006 HIS3 gene Proteins 0.000 description 2
- 101000732165 Homo sapiens 40S ribosomal protein S4, X isoform Proteins 0.000 description 2
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 2
- 108091029795 Intergenic region Proteins 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- 102000004195 Isomerases Human genes 0.000 description 2
- 108090000769 Isomerases Proteins 0.000 description 2
- 108010025815 Kanamycin Kinase Proteins 0.000 description 2
- 108060001084 Luciferase Proteins 0.000 description 2
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 2
- 108091022912 Mannose-6-Phosphate Isomerase Proteins 0.000 description 2
- 101100261636 Methanothermobacter marburgensis (strain ATCC BAA-927 / DSM 2133 / JCM 14651 / NBRC 100331 / OCM 82 / Marburg) trpB2 gene Proteins 0.000 description 2
- 101100346210 Neosartorya fumigata (strain ATCC MYA-4609 / Af293 / CBS 101355 / FGSC A1100) pmi1 gene Proteins 0.000 description 2
- GRYLNZFGIOXLOG-UHFFFAOYSA-N Nitric acid Chemical compound O[N+]([O-])=O GRYLNZFGIOXLOG-UHFFFAOYSA-N 0.000 description 2
- 241000514008 Oocystis Species 0.000 description 2
- 108700005126 Ornithine decarboxylases Proteins 0.000 description 2
- 101150053185 P450 gene Proteins 0.000 description 2
- 241000192001 Pediococcus Species 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- LTQCLFMNABRKSH-UHFFFAOYSA-N Phleomycin Natural products N=1C(C=2SC=C(N=2)C(N)=O)CSC=1CCNC(=O)C(C(O)C)NC(=O)C(C)C(O)C(C)NC(=O)C(C(OC1C(C(O)C(O)C(CO)O1)OC1C(C(OC(N)=O)C(O)C(CO)O1)O)C=1NC=NC=1)NC(=O)C1=NC(C(CC(N)=O)NCC(N)C(N)=O)=NC(N)=C1C LTQCLFMNABRKSH-UHFFFAOYSA-N 0.000 description 2
- 108010035235 Phleomycins Proteins 0.000 description 2
- 101100124346 Photorhabdus laumondii subsp. laumondii (strain DSM 15139 / CIP 105565 / TT01) hisCD gene Proteins 0.000 description 2
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 2
- 238000003559 RNA-seq method Methods 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 2
- 241000195663 Scenedesmus Species 0.000 description 2
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 2
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 101100075926 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) pmi gene Proteins 0.000 description 2
- 102000019197 Superoxide Dismutase Human genes 0.000 description 2
- 108010012715 Superoxide dismutase Proteins 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 241001491691 Thalassiosira Species 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- 108020004440 Thymidine kinase Proteins 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- 108060008724 Tyrosinase Proteins 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 108010084455 Zeocin Proteins 0.000 description 2
- QCWXUUIWCKQGHC-UHFFFAOYSA-N Zirconium Chemical compound [Zr] QCWXUUIWCKQGHC-UHFFFAOYSA-N 0.000 description 2
- 108020002494 acetyltransferase Proteins 0.000 description 2
- 102000005421 acetyltransferase Human genes 0.000 description 2
- 108090000637 alpha-Amylases Proteins 0.000 description 2
- PMMURAAUARKVCB-UHFFFAOYSA-N alpha-D-ara-dHexp Natural products OCC1OC(O)CC(O)C1O PMMURAAUARKVCB-UHFFFAOYSA-N 0.000 description 2
- 108010030291 alpha-Galactosidase Proteins 0.000 description 2
- 102000006646 aminoglycoside phosphotransferase Human genes 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 239000002551 biofuel Substances 0.000 description 2
- 238000010170 biological method Methods 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 229910002092 carbon dioxide Inorganic materials 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000004009 herbicide Substances 0.000 description 2
- 101150113423 hisD gene Proteins 0.000 description 2
- 101150032598 hisG gene Proteins 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- PHTQWCKDNZKARW-UHFFFAOYSA-N isoamylol Chemical compound CC(C)CCO PHTQWCKDNZKARW-UHFFFAOYSA-N 0.000 description 2
- 101150066555 lacZ gene Proteins 0.000 description 2
- 108060004506 lycopene beta-cyclase Proteins 0.000 description 2
- 108060004507 lycopene cyclase Proteins 0.000 description 2
- 101150026430 manA gene Proteins 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 210000000472 morula Anatomy 0.000 description 2
- 101150015787 nit1 gene Proteins 0.000 description 2
- 229910017604 nitric acid Inorganic materials 0.000 description 2
- 108010034764 nitric acid reductase Proteins 0.000 description 2
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 2
- 108010082527 phosphinothricin N-acetyltransferase Proteins 0.000 description 2
- 230000000243 photosynthetic effect Effects 0.000 description 2
- 230000009564 phototrophic growth Effects 0.000 description 2
- 108010001545 phytoene dehydrogenase Proteins 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 229950003776 protoporphyrin Drugs 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 230000001718 repressive effect Effects 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 108020004418 ribosomal RNA Proteins 0.000 description 2
- 239000012146 running buffer Substances 0.000 description 2
- MSXHSNHNTORCAW-MPGIDXPLSA-M sodium;(3s,4s,5s,6r)-3,4,5,6-tetrahydroxyoxane-2-carboxylate Chemical compound [Na+].O[C@@H]1OC(C([O-])=O)[C@@H](O)[C@H](O)[C@@H]1O MSXHSNHNTORCAW-MPGIDXPLSA-M 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 101150081616 trpB gene Proteins 0.000 description 2
- 101150111232 trpB-1 gene Proteins 0.000 description 2
- 101150011516 xlnD gene Proteins 0.000 description 2
- 101150052264 xylA gene Proteins 0.000 description 2
- 229910052726 zirconium Inorganic materials 0.000 description 2
- SGKRLCUYIXIAHR-AKNGSSGZSA-N (4s,4ar,5s,5ar,6r,12ar)-4-(dimethylamino)-1,5,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4a,5,5a,6-tetrahydro-4h-tetracene-2-carboxamide Chemical compound C1=CC=C2[C@H](C)[C@@H]([C@H](O)[C@@H]3[C@](C(O)=C(C(N)=O)C(=O)[C@H]3N(C)C)(O)C3=O)C3=C(O)C2=C1O SGKRLCUYIXIAHR-AKNGSSGZSA-N 0.000 description 1
- VOYADQIFGGIKAT-UHFFFAOYSA-N 1,3-dibutyl-4-hydroxy-2,6-dioxopyrimidine-5-carboximidamide Chemical compound CCCCn1c(O)c(C(N)=N)c(=O)n(CCCC)c1=O VOYADQIFGGIKAT-UHFFFAOYSA-N 0.000 description 1
- XUHGTGGPZFJRMF-UHFFFAOYSA-N 1,3-dihydropyrazole-2-carboxylic acid Chemical compound OC(=O)N1CC=CN1 XUHGTGGPZFJRMF-UHFFFAOYSA-N 0.000 description 1
- JDTMUJBWSGNMGR-UHFFFAOYSA-N 1-nitro-4-phenoxybenzene Chemical compound C1=CC([N+](=O)[O-])=CC=C1OC1=CC=CC=C1 JDTMUJBWSGNMGR-UHFFFAOYSA-N 0.000 description 1
- YVLPJIGOMTXXLP-UUKUAVTLSA-N 15,15'-cis-Phytoene Natural products C(=C\C=C/C=C(\CC/C=C(\CC/C=C(\CC/C=C(\C)/C)/C)/C)/C)(\CC/C=C(\CC/C=C(\CC/C=C(\C)/C)/C)/C)/C YVLPJIGOMTXXLP-UUKUAVTLSA-N 0.000 description 1
- YVLPJIGOMTXXLP-BAHRDPFUSA-N 15Z-phytoene Natural products CC(=CCCC(=CCCC(=CCCC(=CC=C/C=C(C)/CCC=C(/C)CCC=C(/C)CCC=C(C)C)C)C)C)C YVLPJIGOMTXXLP-BAHRDPFUSA-N 0.000 description 1
- AAILEWXSEQLMNI-UHFFFAOYSA-N 1h-pyridazin-6-one Chemical compound OC1=CC=CN=N1 AAILEWXSEQLMNI-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- ZTTKDUXKVPEXCG-UHFFFAOYSA-N 2-cyano-3-cyclopropyl-1-(2-mesyl-4-trifluoromethylphenyl)propan-1,3-dione Chemical compound CS(=O)(=O)C1=CC(C(F)(F)F)=CC=C1C(=O)C(C#N)C(=O)C1CC1 ZTTKDUXKVPEXCG-UHFFFAOYSA-N 0.000 description 1
- IEGRLEZDTRNPRH-UHFFFAOYSA-N 2-hydroxyiminocyclohexan-1-one Chemical compound ON=C1CCCCC1=O IEGRLEZDTRNPRH-UHFFFAOYSA-N 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- UPMXNNIRAGDFEH-UHFFFAOYSA-N 3,5-dibromo-4-hydroxybenzonitrile Chemical compound OC1=C(Br)C=C(C#N)C=C1Br UPMXNNIRAGDFEH-UHFFFAOYSA-N 0.000 description 1
- XMTQQYYKAHVGBJ-UHFFFAOYSA-N 3-(3,4-DICHLOROPHENYL)-1,1-DIMETHYLUREA Chemical compound CN(C)C(=O)NC1=CC=C(Cl)C(Cl)=C1 XMTQQYYKAHVGBJ-UHFFFAOYSA-N 0.000 description 1
- QXDOFVVNXBGLKK-UHFFFAOYSA-N 3-Isoxazolidinone Chemical compound OC1=NOCC1 QXDOFVVNXBGLKK-UHFFFAOYSA-N 0.000 description 1
- FRRTWPSQWYNGEG-UHFFFAOYSA-N 3-phenoxybenzamide Chemical compound NC(=O)C1=CC=CC(OC=2C=CC=CC=2)=C1 FRRTWPSQWYNGEG-UHFFFAOYSA-N 0.000 description 1
- WEQPBCSPRXFQQS-UHFFFAOYSA-N 4,5-dihydro-1,2-oxazole Chemical compound C1CC=NO1 WEQPBCSPRXFQQS-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- KKADPXVIOXHVKN-UHFFFAOYSA-N 4-hydroxyphenylpyruvic acid Chemical compound OC(=O)C(=O)CC1=CC=C(O)C=C1 KKADPXVIOXHVKN-UHFFFAOYSA-N 0.000 description 1
- GCNTZFIIOFTKIY-UHFFFAOYSA-N 4-hydroxypyridine Chemical compound OC1=CC=NC=C1 GCNTZFIIOFTKIY-UHFFFAOYSA-N 0.000 description 1
- 101710107640 40S ribosomal protein S2 Proteins 0.000 description 1
- 101710107639 40S ribosomal protein S4 Proteins 0.000 description 1
- QRXMUCSWCMTJGU-UHFFFAOYSA-N 5-bromo-4-chloro-3-indolyl phosphate Chemical compound C1=C(Br)C(Cl)=C2C(OP(O)(=O)O)=CNC2=C1 QRXMUCSWCMTJGU-UHFFFAOYSA-N 0.000 description 1
- PXZWKVIXSKSCFR-UHFFFAOYSA-N 7,8-dihydropterin Chemical compound N1=CCNC2=C1C(=O)N=C(N)N2 PXZWKVIXSKSCFR-UHFFFAOYSA-N 0.000 description 1
- 108700037654 Acyl carrier protein (ACP) Proteins 0.000 description 1
- 102000048456 Acyl carrier protein (ACP) Human genes 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- KLSJWNVTNUYHDU-UHFFFAOYSA-N Amitrole Chemical compound NC1=NC=NN1 KLSJWNVTNUYHDU-UHFFFAOYSA-N 0.000 description 1
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- JTRCEEDCNBSKLP-UHFFFAOYSA-N Andrimid Natural products CC=CC=CC=CC(=O)NC(C(=O)NC(C(=O)C1C(C)C(=O)NC1=O)C(C)(C)C)c2ccccc2 JTRCEEDCNBSKLP-UHFFFAOYSA-N 0.000 description 1
- 241001425589 Auxenochlorella Species 0.000 description 1
- 101100130094 Bacillus subtilis (strain 168) metK gene Proteins 0.000 description 1
- 240000000724 Berberis vulgaris Species 0.000 description 1
- 241000534000 Berula erecta Species 0.000 description 1
- 108020004256 Beta-lactamase Proteins 0.000 description 1
- ROFVEXUMMXZLPA-UHFFFAOYSA-N Bipyridyl Chemical compound N1=CC=CC=C1C1=CC=CC=N1 ROFVEXUMMXZLPA-UHFFFAOYSA-N 0.000 description 1
- 239000005489 Bromoxynil Substances 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 101710184216 Cardioactive peptide Proteins 0.000 description 1
- 241000195627 Chlamydomonadales Species 0.000 description 1
- 241000818164 Chlorodendrophyceae Species 0.000 description 1
- 241000317914 Chrysis Species 0.000 description 1
- 241000391097 Chrysosphaera Species 0.000 description 1
- 241000196224 Codium Species 0.000 description 1
- 241000254173 Coleoptera Species 0.000 description 1
- 108020005199 Dehydrogenases Proteins 0.000 description 1
- 239000005504 Dicamba Substances 0.000 description 1
- 108700016256 Dihydropteroate synthases Proteins 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 108010016626 Dipeptides Proteins 0.000 description 1
- 239000005510 Diuron Substances 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 101100491986 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) aromA gene Proteins 0.000 description 1
- MBYXEBXZARTUSS-QLWBXOBMSA-N Emetamine Natural products O(C)c1c(OC)cc2c(c(C[C@@H]3[C@H](CC)CN4[C@H](c5c(cc(OC)c(OC)c5)CC4)C3)ncc2)c1 MBYXEBXZARTUSS-QLWBXOBMSA-N 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 108090000371 Esterases Proteins 0.000 description 1
- 241000195623 Euglenida Species 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 101150066002 GFP gene Proteins 0.000 description 1
- 229930182566 Gentamicin Natural products 0.000 description 1
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 241000168525 Haematococcus Species 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 241000457035 Heveochlorella Species 0.000 description 1
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- 241000885748 Microlepis Species 0.000 description 1
- 240000003433 Miscanthus floridulus Species 0.000 description 1
- 235000003990 Monochoria hastata Nutrition 0.000 description 1
- 240000000178 Monochoria vaginalis Species 0.000 description 1
- 241000192656 Nostoc Species 0.000 description 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 241001036351 Parachlorella beijerinckii Species 0.000 description 1
- 241001628145 Parachlorella hussii Species 0.000 description 1
- 241000122116 Parvimonas Species 0.000 description 1
- 241001494897 Pelagomonas Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- 241000206731 Phaeodactylum Species 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 108010060806 Photosystem II Protein Complex Proteins 0.000 description 1
- 241000222350 Pleurotus Species 0.000 description 1
- 241000196315 Prasinocladus Species 0.000 description 1
- 108020001991 Protoporphyrinogen Oxidase Proteins 0.000 description 1
- 102000005135 Protoporphyrinogen oxidase Human genes 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- AUVVAXYIELKVAI-UHFFFAOYSA-N SJ000285215 Natural products N1CCC2=CC(OC)=C(OC)C=C2C1CC1CC2C3=CC(OC)=C(OC)C=C3CCN2CC1CC AUVVAXYIELKVAI-UHFFFAOYSA-N 0.000 description 1
- 101100214703 Salmonella sp aacC4 gene Proteins 0.000 description 1
- 241000195474 Sargassum Species 0.000 description 1
- 241000222480 Schizophyllum Species 0.000 description 1
- 241000196294 Spirogyra Species 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 229940100389 Sulfonylurea Drugs 0.000 description 1
- 241000192584 Synechocystis Species 0.000 description 1
- 241000513961 Tetrachlorella Species 0.000 description 1
- 241001537924 Tetracoccus <angiosperm> Species 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 241000223996 Toxoplasma Species 0.000 description 1
- 108091028113 Trans-activating crRNA Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 241001293481 Trebouxiophyceae Species 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 1
- 241000200212 Vaucheria Species 0.000 description 1
- 241001429032 Veronicella Species 0.000 description 1
- 241000180093 Vischeria Species 0.000 description 1
- 241001671190 Xanthophyllum Species 0.000 description 1
- NRAUADCLPJTGSF-ZPGVOIKOSA-N [(2r,3s,4r,5r,6r)-6-[[(3as,7r,7as)-7-hydroxy-4-oxo-1,3a,5,6,7,7a-hexahydroimidazo[4,5-c]pyridin-2-yl]amino]-5-[[(3s)-3,6-diaminohexanoyl]amino]-4-hydroxy-2-(hydroxymethyl)oxan-3-yl] carbamate Chemical compound NCCC[C@H](N)CC(=O)N[C@@H]1[C@@H](O)[C@H](OC(N)=O)[C@@H](CO)O[C@H]1\N=C/1N[C@H](C(=O)NC[C@H]2O)[C@@H]2N\1 NRAUADCLPJTGSF-ZPGVOIKOSA-N 0.000 description 1
- 101150067314 aadA gene Proteins 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 229960004821 amikacin Drugs 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 101150073130 ampR gene Proteins 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- OHDXGZAYYBMHCY-QSUIEZAASA-N andrimid Chemical compound O=C([C@H](C(C)C)NC(=O)C[C@H](NC(=O)/C=C/C=C/C=C/C)C=1C=CC=CC=1)[C@H]1[C@H](C)C(=O)NC1=O OHDXGZAYYBMHCY-QSUIEZAASA-N 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000008346 aqueous phase Substances 0.000 description 1
- 101150037081 aroA gene Proteins 0.000 description 1
- MXWJVTOOROXGIU-UHFFFAOYSA-N atrazine Chemical compound CCNC1=NC(Cl)=NC(NC(C)C)=N1 MXWJVTOOROXGIU-UHFFFAOYSA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 1
- 229930189065 blasticidin Natural products 0.000 description 1
- 101150038738 ble gene Proteins 0.000 description 1
- 108091005948 blue fluorescent proteins Proteins 0.000 description 1
- 230000005587 bubbling Effects 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 239000003593 chromogenic compound Substances 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 238000002247 constant time method Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 101150041868 cry1Aa gene Proteins 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 108010082025 cyan fluorescent protein Proteins 0.000 description 1
- IWEDIXLBFLAXBO-UHFFFAOYSA-N dicamba Chemical compound COC1=C(Cl)C=CC(Cl)=C1C(O)=O IWEDIXLBFLAXBO-UHFFFAOYSA-N 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 229960003722 doxycycline Drugs 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- AUVVAXYIELKVAI-CKBKHPSWSA-N emetine Chemical compound N1CCC2=CC(OC)=C(OC)C=C2[C@H]1C[C@H]1C[C@H]2C3=CC(OC)=C(OC)C=C3CCN2C[C@@H]1CC AUVVAXYIELKVAI-CKBKHPSWSA-N 0.000 description 1
- 229960002694 emetine Drugs 0.000 description 1
- AUVVAXYIELKVAI-UWBTVBNJSA-N emetine Natural products N1CCC2=CC(OC)=C(OC)C=C2[C@H]1C[C@H]1C[C@H]2C3=CC(OC)=C(OC)C=C3CCN2C[C@H]1CC AUVVAXYIELKVAI-UWBTVBNJSA-N 0.000 description 1
- 229960003276 erythromycin Drugs 0.000 description 1
- DNJIEGIFACGWOD-UHFFFAOYSA-N ethyl mercaptane Natural products CCS DNJIEGIFACGWOD-UHFFFAOYSA-N 0.000 description 1
- 239000011536 extraction buffer Substances 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 238000012921 fluorescence analysis Methods 0.000 description 1
- 229940124307 fluoroquinolone Drugs 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 231100000118 genetic alteration Toxicity 0.000 description 1
- 229960002518 gentamicin Drugs 0.000 description 1
- 238000000227 grinding Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000002363 herbicidal effect Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 1
- 229940097277 hygromycin b Drugs 0.000 description 1
- YAMHXTCMCPHKLN-UHFFFAOYSA-N imidazolidin-2-one Chemical compound O=C1NCCN1 YAMHXTCMCPHKLN-UHFFFAOYSA-N 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- UFHLMYOGRXOCSL-UHFFFAOYSA-N isoprothiolane Chemical compound CC(C)OC(=O)C(C(=O)OC(C)C)=C1SCCS1 UFHLMYOGRXOCSL-UHFFFAOYSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- BTNMPGBKDVTSJY-UHFFFAOYSA-N keto-phenylpyruvic acid Chemical compound OC(=O)C(=O)CC1=CC=CC=C1 BTNMPGBKDVTSJY-UHFFFAOYSA-N 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 101150033534 lysA gene Proteins 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 101150108178 metE gene Proteins 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- NVGOPFQZYCNLDU-UHFFFAOYSA-N norflurazon Chemical compound O=C1C(Cl)=C(NC)C=NN1C1=CC=CC(C(F)(F)F)=C1 NVGOPFQZYCNLDU-UHFFFAOYSA-N 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000001668 nucleic acid synthesis Methods 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- WCPAKWJPBJAGKN-UHFFFAOYSA-N oxadiazole Chemical compound C1=CON=N1 WCPAKWJPBJAGKN-UHFFFAOYSA-N 0.000 description 1
- 150000002960 penicillins Chemical class 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 235000011765 phytoene Nutrition 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 241000196307 prasinophytes Species 0.000 description 1
- 230000026447 protein localization Effects 0.000 description 1
- 230000018883 protein targeting Effects 0.000 description 1
- 230000004844 protein turnover Effects 0.000 description 1
- 101150075980 psbA gene Proteins 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000009711 regulatory function Effects 0.000 description 1
- 230000032537 response to toxin Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 239000012723 sample buffer Substances 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 239000002002 slurry Substances 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 210000001324 spliceosome Anatomy 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical class OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 1
- 101150015970 tetM gene Proteins 0.000 description 1
- 101150004433 tetQ gene Proteins 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 230000009105 vegetative growth Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 1
- 150000003952 β-lactams Chemical class 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
- C12N15/8237—Externally regulated expression systems
- C12N15/8238—Externally regulated expression systems chemically inducible, e.g. tetracycline
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
- C12N15/8218—Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y107/00—Oxidoreductases acting on other nitrogenous compounds as donors (1.7)
- C12Y107/01—Oxidoreductases acting on other nitrogenous compounds as donors (1.7) with NAD+ or NADP+ as acceptor (1.7.1)
- C12Y107/01001—Nitrate reductase (NADH) (1.7.1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y107/00—Oxidoreductases acting on other nitrogenous compounds as donors (1.7)
- C12Y107/01—Oxidoreductases acting on other nitrogenous compounds as donors (1.7) with NAD+ or NADP+ as acceptor (1.7.1)
- C12Y107/01004—Nitrite reductase [NAD(P)H] (1.7.1.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/11—Antisense
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/14—Type of nucleic acid interfering N.A.
- C12N2310/141—MicroRNAs, miRNAs
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Gastroenterology & Hepatology (AREA)
- Virology (AREA)
- Botany (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Chemical & Material Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本申请提供了新型藻类调控元件,包括硝酸盐/亚硝酸盐诱导型启动子序列和终止子序列。本申请还公开了包含这些新型调控元件的DNA构建体,和包含这些调控元件的重组微生物。还公开了修饰、制备和使用调控元件的方法。本申请公开的方法适用于基因诸如藻类物种中的转基因或天然基因的诱导表达。
Description
相关申请的交叉引用
本申请依照35 U.S.C.§119(e)要求2018年12月19日提交的美国申请序列号62/782,152的优先权益,其全部内容通过引用整体并入本文。
序列表的并入
所附序列表中的材料在此通过引用并入本申请。名为SGI2220_1WO_序列表.txt的随附序列表文本文件创建于2019年12月18日,大小为107kb。可以在使用Windows OS的计算机上使用Microsoft Word访问该文件。
技术领域
本发明总体上涉及用于选择性表达目的基因的藻类细胞的基因工程领域。
背景技术
藻类细胞是有前途的生物燃料来源(Wijffels&Barbosa(2010)《科学(Science)》329:796-799)。它们利用太阳能将二氧化碳转化为富含碳的脂类的能力已经超过了产油作物的能力,另外的优势在于,用于生物燃料的藻类不会与产油作物争夺农业用地(Wijffels&Barbosa,2010)。为了使藻类燃料产量最大化,需要工程改造新的藻类菌株以实现工业规模的生长和碳固定(Wijffels&Barbosa,2010)。
进一步地,现代重组菌株的开发需要强大而有效的工具来表达转基因以及内源基因,以所需的方式改变细胞的代谢和生理学。任何基因工程“工具包”的基本组成部分都是驱动转基因或内源基因表达的一套功能性启动子和终止子。需要从正在开发重组DNA技术的菌株中克隆和验证的内源启动子,以及其他的策略来增加微生物(诸如藻类)的转化和改进异源基因的表达。
发明内容
本文提供了用于在藻类细胞中诱导表达天然和异源DNA序列的新型藻类诱导型启动子和终止子序列。还提供了包含新型藻类诱导型启动子和/或终止子序列的DNA构建体和表达盒。还提供了包含DNA构建体的藻类突变体,所述DNA构建体包含新型藻类诱导型启动子和/或终止子序列,以及在藻类细胞中选择性表达目的DNA的方法。
一方面,本公开提供了藻类诱导型硝酸还原酶和亚硝酸还原酶启动子序列,所述启动子序列包含与选自由SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49和51组成的群组中的序列的至少100、至少200、至少300、至少400或至少500个连续核苷酸或全序列具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%或100%序列同一性(但任选地在任何实施方案中小于100%序列同一性)的核酸序列。例如,启动子可包含与选自由SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49和51组成的群组中的序列的至少100、至少200、至少300、至少400或至少500个从3'端沿5'方向(或可替代地从5'端沿3'方向)延伸的连续核苷酸具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%(但任选地在任何实施方案中小于100%)同一性的序列。在另一示例中,启动子可包含与任何命名序列或至少500个从3'端沿5'方向延伸的连续核苷酸至少90%但小于100%同一性的序列。在一些实施方案中,硝酸还原酶和亚硝酸还原酶启动子位于硝酸还原酶和亚硝酸还原酶基因之间的基因间区域。在一些实施方案中,硝酸盐和亚硝酸还原酶启动子分别位于硝酸盐和亚硝酸还原酶基因的5'-UTR区域。
一方面,本公开提供了藻类硝酸还原酶和亚硝酸还原酶终止子序列,所述终止子子序列包含与选自由SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50和52组成的群组中的序列的至少25、至少50、至少75、至少100或至少150个连续核苷酸或全长序列具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%同一性(但任选地在任何实施方案中小于100%)的核酸序列。在一些实施方案中,硝酸和亚硝酸还原酶终止子分别位于硝酸和亚硝酸还原酶基因的3'-UTR区域。
一方面,本公开提供了分离的DNA分子,所述分离的DNA分子包含可操作地连接到编码多肽或功能性RNA的目的DNA的藻类硝酸还原酶或亚硝酸还原酶诱导型启动子,其中编码多肽或功能性RNA的目的DNA不受自然界中的启动子调控或未可操作地连接到启动子。藻类硝酸还原酶或亚硝酸还原酶诱导型启动子与选自由SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49和51组成的群组中的序列的至少100、至少200、至少300、至少400或至少500个连续核苷酸(或全长序列)具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性(但任选地在任何实施方案中小于100%序列同一性)。例如,分离的DNA分子可包含与选自由SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49和51组成的群组中的序列的至少100、至少200、至少300、至少400或至少500个从3'端沿5'方向(或可替代地从5'端沿3'方向)延伸的连续核苷酸具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%(但任选地在任何实施方案中小于100%)序列同一性的序列。本申请的藻类硝酸还原酶或亚硝酸还原酶启动子可以同与藻类物种异源或同源的任何目的DNA可操作地连接。对于与藻类同源的目的DNA,这些启动子不与自然界中的这些目的DNA并置,并且不调节这些DNA目的在自然界中的表达。
在一些实施方案中,分离的DNA分子包含可操作地连接到编码多肽或功能性RNA的目的DNA的藻类硝酸还原酶或亚硝酸还原酶终止子序列,所述终止子序列包含与选自由SEQID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50和52组成的群组中的序列的至少25、至少50、至少75、至少100或至少150个连续核苷酸(或全长序列)具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性(并且任选地在任何实施方案中小于100%)的核酸序列。
一方面,本文提供了基因工程藻类,所述基因工程藻类包含与目的DNA可操作地连接的DNA分子或序列,所述DNA分子或序列包含藻类硝酸还原酶或亚硝酸还原酶诱导型启动子,其中目的DNA不受自然界中的启动子调控。在一些实施方案中,DNA分子整合到藻类基因组中。目的DNA可以与藻类物种异源或同源。对于与藻类同源的目的DNA,启动子不与自然界中的目的DNA并置,并且不调节目的DNA在自然界中的表达。
一方面,本文提供了包含DNA分子的表达盒,所述DNA分子包含可操作地连接到编码多肽或功能性RNA的目的DNA的藻类硝酸还原酶或亚硝酸还原酶诱导型启动子,其中编码多肽或功能性RNA的目的DNA不受自然界中的启动子调控,其中目的DNA编码(a)与脂质生物合成相关的蛋白质、(b)脂肪酶、(c)参与光合作用的蛋白质、(d)与碳固定相关的蛋白质、(e)转运蛋白、(f)脱氢酶、(g)转录因子、(h)转录激活剂、(i)细胞信号蛋白、(j)代谢酶、(k)报告蛋白、(l)选择标记、(m)重组酶、n)反义序列、(o)短发夹RNA(shRNA)、(p)小干扰RNA(siRNA)、(q)gRNA(gRNA)或(r)核酶。在一些实施方案中,表达盒进一步包含藻类硝酸还原酶或亚硝酸还原酶终止子序列,其可操作地连接到编码多肽或功能性RNA的目的DNA。目的DNA可以与藻类物种异源或同源。对于与藻类同源的目的DNA,这些启动子不与自然界中的这些目的DNA并置,并且不调节这些目的DNA在自然界中的表达。
一方面,本文提供了一种在藻类细胞中选择性表达目的DNA的方法,所述方法包括:a)用分离的DNA分子转化藻类细胞,所述分离的DNA分子包含与编码目的DNA的目的DNA可操作地连接的藻类硝酸还原酶或亚硝酸还原酶诱导型启动子,其中编码目的DNA的目的DNA在自然界中不受启动子调控,从而产生转化的藻类细胞,或本文所述的任何DNA分子或序列;和b)使转化的藻类细胞在培养基中生长,所述培养基选择性允许在藻类细胞中表达目的DNA。在一些实施方案中,通过粒子轰击引入分离的DNA分子。在一些实施方案中,通过电穿孔引入分离的DNA分子。在一些实施方案中,启动子序列是亚硝酸还原酶,并且其中藻类细胞在包含硝酸盐的培养基中生长,其中诱导目的DNA的表达。在一些实施方案中,启动子序列是亚硝酸还原酶,并且其中藻类细胞在包含铵盐的培养基中生长,其中抑制目的DNA的表达。
在上述方面的一些实施方案中,藻类硝酸还原酶或亚硝酸还原酶终止子来自与启动子相同的物种。在上述方面的一些实施方案中,编码多肽或功能性RNA的目的DNA与启动子序列异源。在上述方面的一些实施方案中,编码多肽或功能性RNA的目的DNA和启动子来自相同的藻类物种,其中编码目的DNA和启动子在自然界中并不并置。
在上述方面的一些实施方案中,编码多肽或功能性RNA的目的DNA经基因工程改造以包括至少一个、至少两个、至少三个、至少四个、至少五个内含子,其中所述内含子与编码多肽或功能性RNA的目的DNA异源。在上述方面的一些实施方案中,内含子与启动子来自相同的藻类物种。在上述方面的一些实施方案中,两个或更多个异源内含子,例如,至少两个、至少三个、至少四个、至少五个内含子可以来自同一基因。在上述方面的一些实施方案中,一个或多个内含子和启动子可以来自同一基因。
在上述方面的一些实施方案中,目的DNA编码选自由反义序列、微小RNA(miRNA)、shRNA、siRNA、gRNA和核酶组成的群组中的功能性RNA。
在上述方面的一些实施方案中,启动子与终止子来自同一基因。在上述方面的一些实施方案中,启动子与终止子来自不同基因。
在上述方面的一些实施方案中,目的DNA编码(a)与脂质生物合成相关的蛋白质、(b)脂肪酶、(c)参与光合作用的蛋白质、(d)与碳固定相关的蛋白质、(e)转运蛋白、(f)脱氢酶、(g)转录因子、(h)转录激活剂、(i)细胞信号蛋白、(j)酶、(k)报告蛋白、(l)选择标记或(m)重组酶。在上述方面的一些实施方案中,目的DNA编码Cre重组酶。
在一些实施方案中,突变藻类属于选自由以下组成的群组中的任何一个或多个的属:曲壳藻属(Achnanthes)、茧形藻属(Amphiprora)、双眉藻属(Amphora)、纤维藻属(Ankistrodesmus)、星胞藻属(Asteromonas)、黄金色藻属(Boekelovia)、Bolidomonas属、Borodinella属、气球藻属(Botrydium)、葡萄藻属(Botryococcus)、Bracteococcus属、角毛藻属(Chaetoceros)、四鞭藻属(Carteria)、衣藻属(Chlamydomonas)、绿球藻属(Chlorococcum)、绿梭藻属(Chlorogonium)、小球藻属(Chlorella)、蓝隐藻属(Chroomonas)、金球藻属(Chrysosphaera)、Cricosphaera属、隐甲藻属(Crypthecodinium)、隐藻属(Cryptomonas)、小环藻属(Cyclotella)、杜氏藻属(Dunaliella)、Ellipsoidon属、圆石藻属(Emiliania)、独球藻属(Eremosphaera)、Ernodesmius属、裸藻属(Euglena)、真眼点藻属(Eustigmatos)、披刺藻属(Franceia)、脆杆藻属(Fragilaria)、丽丝藻属(Gloeothamnion)、红球藻属(Haematococcus)、Halocafeteria属、异弯藻属(Heterosigma)、膜胞藻属(Hymenomonas)、等鞭金藻属(Isochrysis)、鳞孔藻属(Lepocinclis)、微芒藻属(Micractinium)、蒜头藻属(Monodus)、单针藻属(Monoraphidium)、微球藻属(Nannochloris)、微拟球藻属(Nannochloropsis)、舟形藻属(Navicula)、新绿藻属(Neochloris)、肾鞭藻属(Nephrochloris)、肾藻属(Nephroselmis)、菱形藻属(Nitzschia)、棕鞭藻属(Ochromonas)、鞘藻属(Oedogonium)、卵囊藻属(Oocystis)、蚝球藻属(Ostreococcus)、巴夫藻属(Pavlova)、拟小球藻属(Parachlorella)、帕氏藻属(Pascheria)、Pelagomonas属、褐指藻属(Phaeodactylum)、噬菌体属(Phagus)、微绿藻属(Picochlorum)、扁藻属(Platymonas)、颗石藻属(Pleurochrysis)、肋球藻属(Pleurococcus)、原囊藻属(Prototheca)、拟绿球藻属(Pseudochlorella)、拟新绿藻属(Pseudoneochloris)、拟角星鼓藻属(Pseudostaurastrum)、塔胞藻属(Pyramimonas)、桑椹藻属(Pyrobotrys)、栅列藻属(Scenedesmus)、骨条藻属(Skeletonema)、Spyrogyra属、裂丝藻属(Stichococcus)、海链藻属(Thalassiosira)、黄丝藻属(Tribonema)、无隔藻属(Vaucheria)、Viridiella属、魏氏藻属(Vischeria)和团藻属(Volvox)。这些属在此以每种可能的组合和子组合公开,如同在此充分阐述一样。
在上述方面的一些实施方案中,藻类诱导型硝酸还原酶或亚硝酸还原酶启动子序列与目的DNA可操作地连接。在一些实施方案中,在存在硝酸根离子的情况下,与硝酸还原酶或亚硝酸还原酶启动子序列可操作地连接的目的DNA的表达增加。在一些实施方案中,在存在铵离子的情况下,与硝酸还原酶或亚硝酸还原酶启动子序列可操作地连接的目的DNA的表达受到抑制。
在上述方面的一些实施方案中,藻类硝酸还原酶和亚硝酸还原酶终止子序列包含与选自由SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50和52组成的群组中的序列的至少25、至少50、至少75、至少100或至少150个连续核苷酸具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的核酸序列。在上述方面的一些实施方案中,藻类硝酸还原酶或亚硝酸还原酶终止子序列与目的DNA可操作地连接。
一方面,本公开提供了载体,所述载体包含如本文公开的表达盒以及自主复制序列和选择标记基因之一或两者。在一些实施方案中,载体包括至少一个复制起点。在一些实施方案中,载体进一步包括可操作地连接到选择标记或报告基因的附加启动子,诸如但不限于本文所公开的启动子。
在一些实施方案中,载体用于真核细胞(诸如但不限于真核微藻细胞或浮游植物细胞)的转化,其中所述载体包括可操作地连接到如本文所提供的启动子的选择标记基因,例如,包含与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49或51中的任一个的至少100、至少200、至少300、至少400、至少500、至少600、至少700或至少800个连续核苷酸(或全长序列)具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%序列同一性(并且任选地在任何实施方案中小于100%)的核苷酸序列的启动子。转化载体进一步可包括一个或多个用于转移到宿主细胞中的附加基因或构建体,诸如编码多肽的基因,诸如但不限于上文所公开的任何基因或编码功能性RNA的构建体,其中编码多肽或功能性RNA的基因可任选地与本文所述的启动子可操作地连接,或可任选地与另一启动子可操作地连接。
此外,或可替代地,本文提供的载体可包括本文提供的终止子。例如,本发明的载体可包括与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50和52中的任一个的至少100、至少200、至少300、至少400、至少500、至少600、至少700或至少800个连续核苷酸(或全长序列)具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性(并且任选地在任何实施方案中小于100%)的核苷酸序列。本发明载体上的目的DNA或选择标记基因可以可操作地连接至本文提供的终止子序列。
在一些实施方案中,选择标记基因选自由以下组成的群组:对抗生素(例如,四环素、强力霉素或其类似物、嘌呤霉素、潮霉素、杀稻瘟菌素、博来霉素或腐草霉素(ZeocinTM)、诺尔斯菌素)产生抗性的基因;对除草剂产生抗性的基因;编码乙酰辅酶A羧化酶(ACCase)的基因;编码乙酰羟酸合酶(ahas)的基因;编码乙酰乳酸合酶的基因;编码氨基糖苷磷酸转移酶的基因;编码邻氨基苯甲酸合酶的基因;编码溴苯腈腈水解酶的基因;编码细胞色素P450-NADH-细胞色素P450氧化还原酶的基因;编码茅草枯脱卤素酶的基因;编码二氢蝶酸合酶的基因;编码I类5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSPS)的基因;编码II类EPSPS(aroA)的基因;编码非I/II类EPSPS的基因;编码谷胱甘肽还原酶的基因;编码草甘膦乙酰转移酶的基因;编码草甘膦氧化还原酶的基因;编码羟苯基丙酮酸脱氢酶的基因;编码羟基苯丙酮酸双加氧酶的基因;编码异戊二烯基焦磷酸异构酶的基因;编码番茄红素环化酶的基因;编码膦丝菌素乙酰转移酶的基因;编码八氢番茄红素去饱和酶的基因;编码异戊二烯基转移酶的基因;编码原卟啉氧化酶的基因;编码超氧化物歧化酶arg7、his3、hisD、hisG、manA、nit1、trpB、uidA、xylA的基因;二氢叶酸还原酶基因;甘露糖6-磷酸异构酶基因;硝酸还原酶基因;鸟氨酸脱羧酶基因;胸苷激酶基因;2-脱氧葡萄糖抗性基因或R基因座基因。可检测的标记基因可以是例如酪氨酸酶基因、lacZ、碱性磷酸酶基因、α-淀粉酶基因、辣根过氧化物酶基因、α-半乳糖苷酶基因、萤光素/萤光素酶基因、β-葡萄糖醛酸苷酶基因(GUS)或编码荧光蛋白的基因。
附图说明
本文描述的附图仅出于对所选实施例,而不是所有可能实现方式的说明,并且无意于限制本公开的范围。
图1.图1示出了在选择性培养基中表达Cre重组酶的拟小球藻细胞(Parachlorella cell)中诱导和抑制与拟小球藻亚硝酸还原酶启动子可操作地连接的Cre重组酶基因表达的qRT-PCR结果。在阻遏性培养基(RM-NH4+/NO3-)下生长的重组拟小球藻细胞被抑制(左栏),而在诱导培养基(IM-NO3-)上生长的重组拟小球藻细胞则被诱导(右栏)。
图2.图2示出了在选择性培养基中表达Cre重组酶的拟小球藻细胞中诱导和抑制与拟小球藻亚硝酸还原酶启动子可操作地连接的Cre重组酶基因表达的蛋白质免疫印迹(Western Blot)结果。在阻遏性培养基(RM-NH4+/NO3-)下生长的重组拟小球藻细胞被抑制(中间栏),而在诱导培养基(IM-NO3-)上生长的重组拟小球藻细胞则被诱导(右栏)。野生型拟小球藻细胞的结果显示在左栏中。
图3.图3示出了拟小球藻中亚硝酸/亚硫酸还原酶基因的Blast比对结果。结果显示最多的Pfam命中片段均为亚硝酸/亚硫酸还原酶基因。
图4.图4示出了拟小球藻硝酸和亚硝酸还原酶基因的编码序列以及两个基因之间的基因间非翻译区的示意图,这两个基因分别以相反方向包含硝酸和亚硝酸还原酶启动子序列。图4还示出了亚硝酸还原酶基因的3'-UTR区域的亚硝酸还原酶终止子。
图5.图5示出了质粒pSGE06785的质粒图谱,所述质粒通过使用亚硝酸还原酶启动子/终止子在不存在铵的情况下表达Cre重组酶(含有天然拟小球藻内含子)。BleR和GFP基因的表达由组成型启动子/终止子驱动。
具体实施方式
基于RNA测序数据、隐马尔可夫模型分析、BLAST分析以及PfamPF01077和PF03460的Pfam分析,本申请鉴定了藻类硝酸还原酶和亚硝酸还原酶基因的5'-和3'-非翻译区(UTR)中的新型藻类硝酸和亚硝酸/亚硫酸还原酶启动子和终止子序列。在一些实施方案中,亚硝酸还原酶和亚硝酸还原酶基因在藻类同一染色体的相反方向上。在一些实施方案中,亚硝酸还原酶和亚硝酸还原酶启动子位于两个基因的基因间区域中(图4)。在一些实施方案中,亚硝酸还原酶和亚硝酸还原酶终止子分别位于亚硝酸还原酶和亚硝酸还原酶基因的3'-UTR区域中(图4)。
本申请公开了几种来自各种藻类例如拟小球藻属、卵囊藻属、微绿藻属和四爿藻属(Tetraselmis)的新型藻类诱导型硝酸还原酶或亚硝酸/亚硫酸还原酶启动子序列。此类藻类硝酸还原酶或亚硝酸/亚硫酸还原酶启动子序列的非限制性示例以SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49和51列出,如下所示。
本申请公开了几种来自各种藻类例如拟小球藻属、卵囊藻属、微绿藻属和四爿藻属的新型藻类硝酸还原酶或亚硝酸还原酶终止子序列。此类藻类硝酸还原酶或亚硝酸/亚硫酸还原酶终止子序列的非限制性示例以SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50和52列出,如下所示。
本申请还公开了DNA构建体,所述DNA构建体包含本文所述的新型藻类诱导型硝酸还原酶或亚硝酸还原酶启动子序列,所述启动子序列可操作地连接到编码多肽或功能性RNA的目标DNA,其中目的DNA编码的多肽或功能性RNA不受自然界中(例如,在野生型生物中)启动子的调节或不能可操作地连接。在一些实施方案中,启动子可以是异源启动子。在一些实施方案中,DNA构建体还包含与目的DNA可操作地连接的藻类硝酸还原酶或亚硝酸还原酶终止子序列。本申请还公开了包含DNA构建体的表达载体。调控序列是否调控自然界中的核酸序列可以通过调控序列是否调控野生型有机体中的核酸序列来确定。
本申请还公开了使用与目的DNA可操作地连接的新型藻类诱导型硝酸还原酶或亚硝酸还原酶启动子序列在藻类中选择性表达目的DNA的方法。可操作地连接至目的DNA的包含新型藻类诱导型硝酸还原酶或亚硝酸还原酶启动子的基因工程藻类在选择性培养基(例如,包含硝酸盐的培养基)中生长,以诱导或表达目标DNA的基因工程藻类,或者基因工程藻类可以在包含铵离子的培养基中生长以抑制目的DNA的表达。
下面列出的是来自各种藻类物种的示例性新型藻类硝酸还原酶或亚硝酸还原酶启动子和终止子序列。
除非另外定义,否则本文所使用的所有技术术语、符号以及其他科学术语或专有名词意图具有本发明所属领域的技术人员所通常理解的含义。在一些情况下,为了清楚起见和/或为了及时参考,在本文中对具有通常所理解的含义的术语进行定义,并且在本文中包括这些定义不应当一定被解释为代表相对于本领域中一般所理解的含义存在实质性的差异。本文所描述或提到的许多技术和程序由本领域技术人员很好地理解并且通常使用常规的方法加以利用。
除非上下文另外明确规定,否则单数形式“一个”、“一种”和“所述”包括复数指代对象。举例来说,术语“一个细胞”包括一个或多个细胞,包括其混合物。“A和/或B”在本文用于包括所有以下替代方案:“A”、“B”以及“A和B”。
如本文所使用的,当指代任何数值时,术语“约”或“大约”意指在所提供的值加上或减去10%以内。例如,“约50摄氏度”(或“大约50摄氏度”)涵盖从45摄氏度到55摄氏度(包括端值)的温度范围。类似地,“约100mM”(或“大约100mM”)涵盖从90mM至110mM(包括端值)的浓度范围。或者,“约”或“大约”可以表示在所述值的5%之内,或者在一些情况下在所述值的2.5%之内,或者,“约”可以表示四舍五入到最接近的有效数字。本申请提供的所有范围都包括所述范围的上下两端的值。
本文中使用的术语“细胞”、“细胞培养”、“细胞系”、“重组宿主细胞”、“受体细胞”和“宿主细胞”包括主要受试细胞及其任何子代,而不考虑转移次数。应当理解,并非所有子代都与亲代细胞完全相同(由于环境中有意或无意的突变或差异)。但是,只要子代保留与最初转化细胞相同的功能,这些术语中就包括这些改变的子代。
如本文所用,术语“构建体”旨在表示任何重组核酸分子,诸如表达盒、质粒、黏粒、病毒、自主复制的多核苷酸分子、噬菌体或衍生自任何来源的线性或环状、单链或双链、能够进行基因组整合或自主复制的DNA或RNA多核苷酸分子,其包含核酸分子,其中一个或多个核酸序列已以功能操作方式连接(即可操作地连接)。
本文所用的“对照有机体”、“对照微生物”或“对照细胞”是指与受试有机体、微生物或细胞基本相同(除了为受试有机体、微生物或细胞公开的工程遗传操作或引入的突变)并可为测量受试有机体或细胞表型的变化提供参考点的有机体、微生物或细胞。因此,“基本相同”包括,例如,与受试微生物中的目的基因型、表型、参数或基因表达水平无关的基因组序列(“SNP”)的小的随机变异。取决于其用途的特定目的,对照有机体或细胞可包括例如(a)相对于受试有机体、微生物或细胞的祖细胞株或物种、细胞或微生物群体或有机体,其中祖细胞缺乏引入祖细胞株、物种、有机体或细胞或微生物群体以产生受试有机体、微生物或细胞中的基因工程构造或改变;(b)野生型有机体或细胞,即与导致受试有机体或细胞的遗传改变的起始物质相同的基因型;(c)基因型与起始材料相同但已用无效构建体转化的有机体或细胞(即对目的性状没有已知作用的构建体,诸如包含报告基因的构建体);(d)在受试有机体、微生物或细胞的子代中是未转化分离子的有机体或细胞;或(e)在不表达目的基因的情况下,目标有机体体或细胞本身。在一些情况下,“对照有机体”可以指不含目的转基因有机体中存在的外源核酸,但具有与此类转基因有机体相同或非常相似的遗传背景的有机体。
如本文所用,“基因工程”藻类是指具有改变的基因组的核苷酸组成或改变的基因表达的非天然存在的重组藻类细胞,包括在不同的时间、生物或环境调节下和/或在不同于天然发生程度的程度上的基因表达的过表达或抑制,和/或在重组细胞中非天然表达的基因的表达。改变的核苷酸组成(一个或多个核苷酸的改变、缺失和/或插入)可以在基因的编码区域中,或者可以在内含子、3'UTR、5'UTR或启动子区域中,例如在转录起始位点的2kb内或翻译起始位点的3kb内。例如,如本文所公开的具有改变的基因表达的基因工程藻类可以具有改变的核苷酸组成,其可为转录起始位点的基因5'区域中的一个或多个核碱基变化和/或一个或多个核碱基缺失和/或一个或多个核碱基插入,诸如,在非限制性示例中,在已知或推定的转录起始位点的约2kb内、1.5kb内、1kb内或0.5kb内,或在翻译起始位点的约3kb内、2.5kb内、2kb内、1.5kb内、1kb内或约0.5kb内。基因改造的藻类细胞是指已通过将异源或外源(例如,非天然)重组核酸序列引入有机体而操作的藻类细胞,并且包括,但不限于,基因敲除、靶向突变,和基因置换、启动子置换、缺失或插入,或将核酸分子例如转基因、合成基因、启动子或其他序列转运到有机体。基因改造的藻类细胞还包括基因改造的亲代细胞的后代。
本文所使用的术语“表达盒”是指编码可操作地连接到表达调控元件(诸如启动子)的蛋白质或功能性RNA的核酸构建体,和任选地,影响基因转录或翻译的任何或其他核酸序列的组合,诸如但不限于转录终止子、核糖体结合位点、剪接位点或剪接识别序列、内含子、增强子、多聚腺苷酸化信号、内部核糖体进入位点等。
“功能性RNA分子”是可与一种或多种蛋白质或核酸分子相互作用的RNA分子,以执行或参与影响基因或基因产物(而非产生功能性RNA的基因)的表达或活性的结构、催化或调节功能。功能性RNA可以是,例如,转运RNA(tRNA)、核糖体RNA(rRNA)、反义RNA(asRNA)、微小RNA(miRNA)、短发夹RNA(shRNA)、小干扰RNA(siRNA)、引导RNA(gRNA)、CRISPR RNA(crRNA)或CRISPR系统的反式激活RNA(tracrRNA)、小核仁RNA(snoRNA)、piwi相互作用RNA(piRNA)或核酶。
术语“目的DNA”被广泛地用来指编码多肽或表达的RNA的DNA分子的任何片段。因此,目的DNA包括编码表达的RNA的序列,其可以包括多肽编码序列或例如功能性RNA。目的DNA可进一步包含其表达需要或影响其表达的调控序列,以及与处于其天然状态的蛋白质或RNA编码序列相关的序列,诸如例如内含子序列、5'或3'非翻译序列等。在一些示例中,“目的DNA”可以仅指DNA或RNA分子的蛋白质编码部分,其可以包括或可以不包括内含子。目的DNA可以任选地包含异源内含子,即不是衍生出蛋白质或功能性RNA编码序列的基因天然的内含子。目的基因的长度优选为大于50个核苷酸,长度更优选为大于100个核苷酸,并且例如长度可以为50个核苷酸至500,000个核苷酸,诸如长度为100个核苷酸至100,000个核苷酸或长度为约200个核苷酸至约50,000个核苷酸,或长度为约200个核苷酸至约20,000个核苷酸。目的DNA可以从多种来源获得,包括从目标来源克隆或从已知或预测的序列信息合成。
目的DNA编码的蛋白质的非限制性示例包括与脂质生物合成相关的蛋白质脂肪酶、参与光合作用的蛋白质、与碳固定相关的蛋白质、转运蛋白、脱氢酶、转录因子、转录激活剂、细胞信号蛋白、酶、报告蛋白、选择标记和重组酶。
与脂质生物合成相关的蛋白质、与碳固定和/或光合作用相关的蛋白质的非限制性示例包括在美国申请公开第20140220638号、美国申请公开第20160304896号、美国申请公开第2017005830303号、美国申请公开第20180186842号中描述的那些。这些专利申请公开中的每一个均通过引用整体并入本文。
酶的非限制性示例包括重组酶,例如Cre(NCBI蛋白质数据库登记号:YP_006472.1、WP_063075144、WP_052200029.1)、CRISPRCas9(NCBI蛋白质数据库登记号WP_117329810)。
包含N末端核定位信号和六个拟小球藻亚硝酸还原酶内含子的Cre重组酶的一种示例性核酸序列如下所示。
报告蛋白的非限制性示例包括(NCBI蛋白质数据库登记号:YP_002302326.1)。Cre重组酶的一种示例性序列如下所示。
如本文所用,术语“蛋白质”或“多肽”旨在涵盖单数“多肽”以及多个“多肽”,并且是指由通过酰胺键(也称为肽键)线性连接的单体(氨基酸)构成的分子。术语“多肽”是指两个或更多个氨基酸的任何一条或多条链,并且不指产物的特定长度。因此,“多肽”的定义中包括肽、二肽、三肽、寡肽、“蛋白质”、“氨基酸链”或用于指代两个或更多个氨基酸的一条或多条链的任何其他术语,并且术语“多肽”可以代替或与这些术语中的任一种互换使用。
DNA分子可以“源自”指定的来源,其包括从指定的来源(全部或部分)分离核酸片段。DNA分子也可以通过例如从指定的多核苷酸源直接克隆、PCR扩增或人工合成而源自指定的源,或基于与指定的多核苷酸源相关的序列。DNA分子可以是藻类基因组的一部分,也可以是外源DNA序列。DNA分子可以是整合到藻类基因组中的外源DNA。DNA分子可包括一个或多个基因,5'-和3'-非翻译区(UTR)。在一些实施方案中,5'-或3'-UTR可包括一个或多个调控元件。
源自特定来源或物种的DNA分子或目的DNA还包括相对于来源核酸分子具有序列修饰的基因或核酸分子。例如,源自来源的DNA分子或目的DNA(例如,特定参考基因)可以包括相对于来源基因或核酸分子的一种或多种突变,所述突变是非故意的或故意引入的,并且如果故意引入一种或多种突变,包括取代、缺失或插入,则可以通过细胞或核酸的随机或靶向突变、通过扩增或其他分子生物学技术或通过化学合成或其任何组合来引入序列改变。
如本文所用,将“分离的”核酸或蛋白质从其自然环境或核酸或蛋白质天然存在的背景中去除。例如,将分离的蛋白质或核酸分子从在其天然或自然环境中与其相关的细胞或有机体中去除。在一些情况下,分离的核酸或蛋白质可以被部分或基本上纯化,但是分离不需要特定的纯化水平。因此,例如,分离的核酸分子可以是已经从其自然整合的染色体、基因组或附加体切除的核酸序列。
“纯化的”核酸分子或核苷酸序列或蛋白质或多肽序列基本上不含细胞物质和细胞组分。例如,纯化的核酸分子或蛋白质可以不含除缓冲液或溶剂之外的化学物质。“基本上不含”并不旨在表示不可检测到除新核酸分子之外的其他组分。
术语“天然存在的”和“野生型”是指在自然界中存在的形式。例如,天然存在的或野生型核酸分子、核苷酸序列或蛋白质可以存在于天然来源中或与天然来源分离,并且未被人为操纵进行有意修饰。
如本文所用,“表达”包括至少在RNA产生水平上的基因表达,并且“表达产物”包括所得产物,例如表达的基因的多肽或功能性RNA(例如,核糖体RNA、tRNA、反义RNA、微小RNA、shRNA、核酶等)。术语“增加的表达”包括基因表达的改变以促进mRNA产生的增加和/或多肽表达的增加。当指由基因表达、蛋白质转换率、蛋白质活化状态等产生的蛋白质丰度或活性蛋白质丰度时,“增加的产生”包括与多肽的天然产生或酶活性相比,多肽表达、多肽的酶活性水平或两者的组合的增加。
如本文所用,术语“诱导目的DNA的表达”是指与在不存在这种条件下的目的DNA的表达相比,在给定条件下目的DNA的表达的选择性增加。例如,当包含由藻类亚硝酸还原酶启动子调控的目标DNA的藻类在包含硝酸根离子的培养基中生长时,与在没有硝酸根离子的培养基中生长时的目标DNA的表达水平相比,目标DNA的表达增加。
如本文所用,术语“抑制目的DNA的表达”是指与在不存在这种条件下的目的DNA的表达相比,在给定条件下目的DNA的表达的选择性减小减小。例如,当包含由藻类亚硝酸还原酶启动子调控的目标DNA的藻类在包含铵离子的培养基中生长时,与在没有铵离子的培养基中生长时的目标DNA的表达水平相比,目标DNA的表达减小。
进一步地,如本文在基因或蛋白质的上下文中所使用的术语“外源”是指并非衍生自宿主生物物种的基因或蛋白质。
如本文所用,术语“转基因”是指外源基因,即通过人为干预引入微生物或祖细胞中的基因。
如本文所用,术语基因或蛋白质的“直系同源物”是指其在另一物种中的功能等同物。
基因和蛋白质登记号(本文中通常在括号后接基因或物种名称来提供)是在美国国家卫生研究院(United States National Institutes of Health)所维护的美国国家生物技术信息中心(National Center for Biotechnology Information,NCBI)网址(ncbi.nlm.nih.gov)处可公开获得的序列记录的唯一标识符。“基因信息标识符”(GenInfoIdentifier,GI)序列识别号特定于核苷酸或氨基酸序列。如果序列以任何方式改变,则指定新的GI编号。序列修订历史(Sequence revision History)工具可用来跟踪在特定GenBank记录中出现的序列的各种GI编号、版本号以及更新日期。基于登记号和GI编号搜索和获取核酸或基因序列或蛋白质序列在例如细胞生物学、生物化学、分子生物学和分子遗传学领域是众所周知的。
如本文所用,相对于核酸或多肽序列的术语“同一性百分比”或“同源性”定义为在为了最大同一性百分比比对序列和必要时引入空位以实现最大同源性百分比之后,在候选序列中与已知多肽相同的核苷酸或氨基酸残基的百分比。N末端或C末端插入或缺失不应当被解释为影响同源性,且内部缺失和/或将小于约30个、小于约20个或小于约10个氨基酸残基插入多肽序列不应被解释为影响同源性。核苷酸或氨基酸序列水平的同源性或同一性可通过使用由程序blastp、blastn、blastx、tblastn和tblastx采用的算法的BLAST(基本局部比对搜索工具(Basic Local Alignment Search Tool))分析(Altschul(1997),《核酸研究(Nucleic Acids Res.)》25,3389-3402,和Karlin(1990),《美国科学院院刊(Proc.Natl.Acad.Sci.USA)》87,2264-2268)来确定,所述程序经设计用于序列相似性搜索。由BLAST程序使用的方法是:首先考虑查询序列和数据库序列之间具有和不具有空位的类似的片段,然后评估所有被识别的匹配的统计显着性,最后只总结那些满足预选显着性阈值的匹配。对于在序列数据库相似性搜索的基本问题的论述,参见Altschul(1994),《自然遗传学(Nature Genetics)》6,119-129。用于柱状图、描述、比对、期望值(即,针对数据库序列报告匹配性所用的统计显著性阈值)、截短、矩阵和过滤器(低复杂性)的搜索参数可以是默认设置。由blastp、blastx、tblastn和tblastx使用的默认计分矩阵是BLOSUM62矩阵(Henikoff(1992),《美国科学院院刊》89,10915-10919),推荐的查询序列长度超过85(核苷酸碱基或氨基酸)。
对于blastn,设计用于比较的核苷酸序列中,计分矩阵由M(即,对一对匹配残基的奖励分数)与N(即,对错配残基的罚分)的比率设定,其中,M和N的默认值可以分别是+5和-4。四个blastn参数可调整如下:Q=10(空位生成罚分);R=10(空位扩展罚分);闪烁=1(沿着每个查询在每个闪烁位置生成字命中);以及gapw=16(设置其内产生空位比对的窗口宽度)。对氨基酸序列的比较的等效Blastp参数设置可以是:Q=9;R=2;闪烁=1;以及gapw=32。在GCG软件包版本10.0中可用的序列之间最佳拟合的比较可使用DNA参数GAP=50(空位生成罚分)和LEN=3(空位扩展罚分),并且蛋白质比较的等效设置可以是GAP=8和LEN=2。
因此,当涉及本发明的多肽或核酸序列时,包括与全长多肽或核酸序列或其包含整个蛋白的至少100、至少125、至少150或更多个氨基酸残基的连续序列的片段具有至少40%、至少45%、至少50%、至少55%、至少为70%、至少65%、至少70%、至少75%、至少80%或至少85%、例如至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或约100%的序列同一性的序列;此类序列的变体,例如,其中至少一个氨基酸残基已被插入N和/或C末端,和/或在含有插入和取代的公开的序列内。设想的变体可额外地或替代地包括含有通过例如同源重组或定点或PCR诱变实现的预定突变的那些;以及其他物种的相应的多肽或核酸,包括但不限于,本文中所描述的那些;含有插入和取代的等位基因或多肽或核酸家族的其他天然存在的变体;和/或衍生物,其中多肽已经通过取代、化学、酶或其他适当方式被共价修饰了一部分,除含有插入和取代的天然存在的氨基酸外(例如,可检测部分,诸如酶)。
本文中使用的术语“天然”是指天然存在于宿主中的核酸序列或氨基酸序列。本文中使用的术语“非天然”是指并非天然存在于宿主中的核酸序列或氨基酸序列。经历实验室操作并引入或再引入宿主细胞的已从细胞移除的核酸序列或氨基酸序列被认为是“非天然的”。引入宿主细胞中的合成基因或部分合成基因是“非天然的”。非天然基因进一步包括对可操作地连接至一个或多个异源调控序列的宿主微生物为内源的基因,所述异源调控序列已重组进入宿主基因组中。
“重组”或“工程化的”核酸分子是已通过人为操作改变的核酸分子。作为非限制性示例,重组核酸分子包括以下任何核酸分子:1)例如使用化学技术或酶促技术(例如,通过利用化学核酸合成或通过利用用于核酸分子的复制、聚合、消化(外切核苷酸或内切核苷酸)、连接、反转录、转录、碱基修饰(包括例如,甲基化)、整合或重组(包括同源和特异性位点重组)已部分地或完全地体外合成或修饰的酶);2)包括在自然界中不结合的那些结合核苷酸序列;3)已使用分子克隆技术工程化,以使其相对于天然存在的核酸分子序列而言缺乏一个或多个核苷酸;和/或4)已使用分子克隆技术操作,以使其相对于天然存在的核酸序列而言具有一个或多个序列变化或重排。作为非限制性示例,cDNA是重组DNA分子,如同已通过体外聚合酶反应产生的任何核酸分子一样,或已连接连接子的分子,或已整合到载体(诸如克隆载体或表达载体)中的分子。
如本文所用的术语“重组蛋白”是指通过基因工程产生的蛋白质。
当关于多核苷酸、基因、核酸、多肽或酶使用时,术语“异源的”是指并非源自宿主物种的多核苷酸、基因、核酸、多肽或酶。例如,如本文所用的“异源基因”或“异源核酸序列”是指来自与引入其的宿主有机体的物种不同的物种的基因或核酸序列。当涉及用来操作基因序列的基因调控序列或辅助核酸序列(例如,5'非翻译区、3'非翻译区、多聚腺苷酸增加序列、内含子序列、剪接位点、核糖体结合位点、内部核糖体进入序列、基因组同源区、重组位点等)或编码蛋白质结构域或蛋白质定位序列的核酸序列时,“异源”意指调控序列或辅助序列或编码蛋白质结构域的序列或定位序列与调控或辅助核酸序列或编码蛋白质结构域或定位序列的核酸序列在基因组、染色体或附加体中并置的基因来源不同。因此,在本文中可操作地连接至在自然状态下不能可操作地连接的基因的启动子(例如,在非基因工程化的有机体的基因组中)被称为“异源启动子”,即使启动子可源自与其所连接的基因相同的物种(或,在一些情况下,相同有机体)。插入自然界中不相关的基因的内含子(例如,源自不同基因的内含子)在本文中也被称为“异源内含子”,即使启动子可源自相同物种(或,在一些情况下,相同有机体)。类似地,当涉及工程蛋白质的蛋白质定位序列或蛋白质结构域时,“异源”是指定位序列或蛋白质结构域源自与通过基因工程将其掺入其中的蛋白质不同的蛋白质。
“调控序列”、“调控元件”或“调控元件序列”是指位于编码序列上游(5'),内部或下游(3')的核苷酸序列。编码序列的转录和/或由编码序列的转录产生的RNA分子的翻译通常受调控序列的存在或不存在的影响。这些调控元件序列可以包含启动子、顺式元件、增强子、终止子或内含子。调控元件可以从特定多核苷酸序列的非翻译区(UTR)中分离或鉴定。本文所述的任何调控元件均可以存在于嵌合或杂合调控表达元件中。本文所述的任何调控元件可存在于本发明的重组构建体中。
术语“启动子”、“启动子区域”或“启动子序列”是指能够结合RNA聚合酶以启动基因在5'至3'(“下游”)方向上的转录的核酸序列。当RNA聚合酶与启动子的结合是基因转录的最直接原因时,所述基因就处于“受启动子控制”或“受其调控”状态。启动子或启动子区域通常提供RNA聚合酶和其他适当转录起始所必需的因子的识别位点。可以从基因的基因组拷贝的5'非翻译区(5'UTR)分离启动子。或者,可以通过改变已知的DNA元件来合成产生或设计启动子。还考虑了将一个启动子的序列与另一启动子的序列结合的嵌合启动子。启动子可基于例如代谢、环境或发育条件由其表达模式来定义。启动子可用作调控元件,用于调节可操作地连接的可转录多核苷酸分子(例如,编码序列)的表达。除了RNA聚合酶识别的序列和优选的其他转录因子外,启动子还可以包含调控序列元件,诸如影响可操作地连接基因转录的顺式元件或增强子结构域。“藻类启动子”是在藻类细胞中起作用的天然或非天然启动子。
如本文所用,术语“可操作地连接”是指这样的构型,其中将控制序列置于相对于多核苷酸序列的编码序列的适当位置,以使得控制序列指导或调节多肽和/或功能性RNA的编码序列的表达。因此,如果启动子可以介导核酸序列的转录,则它与核酸序列可操作地连接。如果终止子可以介导核酸序列的终止,则它与核酸序列可操作地连接。当导入宿主细胞中时,表达盒可以在适当的条件下引起编码的RNA或多肽的转录和/或翻译。此定义不排除未翻译或无法翻译的正义或反义结构。在转基因的表达和内源基因的抑制(例如,通过反义或RNAi)的情况下,本领域普通技术人员将认识到插入的多核苷酸序列不必相同,而可能仅与从其衍生的基因序列基本相同。如本文所述,这些基本相同的变体通过参考特定的核酸序列被特异性地覆盖。当控制序列(例如,启动子或终止子)调节核酸序列的转录或转录终止时,它可操作地连接至其调节的序列。
本文所用的术语“选择标记”或“选择标记基因”包括在表达它的细胞上赋予表型的任何基因,以便于选择被本发明的核酸构建体转染或转化的细胞。所述术语也可以用来指实现所述表型的基因产物。选择标记的非限制性示例包括:1)抗生素抗性基因诸如对丁胺卡那霉素(aphA6)、氨苄青霉素(ampR)、稻瘟霉素(bis、bsr、bsd)、博来霉素或腐草霉素(ZEOCINTM)(ble)、氯霉素(cat)、吐根碱(RBS14p或cry1-1)、红霉素(ermE)、G418(GENETICINTM)(neo)、庆大霉素(aac3或aacC4)、潮霉素B(aphIV、hph、hpt)、卡那霉素(nptll)、甲氨蝶呤(DHFR-mtxR)、青霉素和其他β-内酰胺(β-内酰胺酶)、链霉素或大观霉素(aadA、spec/strep)和四环素(tetA、tetM、tetQ);2)抗除草剂的基因,诸如氨基三唑、杀草强、andrimid、芳氧苯氧丙酸酯、莠去津、联吡啶、溴苯腈、环己二酮肟茅草枯、麦草畏、diclfop、二氯苯基二甲基脲(DCMU)、二呋喃酮、二酮腈、敌草隆、氟利酮、草甘膦、卤代氢化苯甲腈、氟吡甲禾灵、4-羟基吡啶、咪唑啉酮、异恶唑啉、异恶唑烷酮、米罗酰胺B、对硝基二苯醚、达草灭、恶二唑、间苯氧基苯甲酰胺、N-苯基酰亚胺、匹诺沙丁(pinoxadin)、原卟啉原氧化酶抑制剂、哒嗪酮、pyrazolinate、磺酰脲、1,2,4-三唑嘧啶、三酮或尿素;乙酰辅酶A羧基酶(ACCase);乙酰羟酸合酶(ahas);乙酰乳酸合酶(als、csr1-1、csr1-2、imr1、imr2)、氨基糖苷磷酸转移酶(apt)、邻氨基苯甲酸合酶、溴苯腈腈水解酶(bxn)、细胞色素P450-NADH-细胞色素P450氧化还原酶、茅草枯脱卤酶(dehal)、二氢蝶呤合酶(sul)、I类5-烯醇丙酮莽草酸-3-磷酸合酶(EPSPS)、II类EPSPS(aroA)、非I/II类EPSPS、谷胱甘肽还原酶、草甘膦乙酰转移酶(gat)、草甘膦氧化还原酶(gox)、羟苯基丙酮酸脱氢酶、羟基苯基丙酮酸双加氧酶(hppd)、异戊二烯焦磷酸异构酶、番茄红素环化酶、膦丝菌素乙酰基转移酶(pat、bar)、八氢番茄红素去饱和酶(crtl)、异戊二烯基转移酶、原卟啉氧化酶、psbA光系统II多肽(psbAase)和SMM酯酶(SulE)超氧化物歧化酶(sod);3)可用于营养缺陷型菌株或赋予其他代谢作用的基因,诸如arg7、his3、hisD、hisG、lysA、manA、metE、nit1、trpB、ura3、xylA、二氢叶酸还原酶基因、甘露糖6-磷酸异构酶基因、硝酸还原酶基因或鸟氨酸脱羧酶基因;负选择因子,诸如胸苷激酶;或毒素抗性因子,诸如2-脱氧葡萄糖抗性基因。
“报告基因”是编码可检测蛋白质或具有产生可检测产物的活性的蛋白质的基因。报告基因可以编码产生可检测信号的视觉标记或酶,诸如cat、lacZ、uidA、xylE、碱性磷酸酶基因、α-淀粉酶基因、α-半乳糖苷酶基因、β-葡糖醛酸糖苷酶基因、β-内酰胺酶基因、辣根过氧化物酶基因、萤光素/萤光素酶基因、R-基因座基因、酪氨酸酶基因或编码荧光蛋白的基因,包括但不限于蓝色、青色、绿色、红色或黄色荧光蛋白,光转换、光控开关或高亮荧光蛋白或其任何变体,包括但不限于密码子优化、快速折叠、单体、增加的稳定性和增强的荧光变体。
如本文所用,术语“终止子”或“终止子序列”或“转录终止子”是指通常以常规方式向RNA聚合酶发出信号以终止转录的基因序列的调控部分。终止子通常可以标记DNA中基因、编码序列或操纵子的端。
如本文所用,术语“转化”是指通过使用一种或多种物理、化学或生物学方法将一种或多种外源核酸序列或多核苷酸引入宿主细胞或有机体中。作为非限制性示例,转换的物理和化学方法(即“转染”)包括电穿孔、粒子轰击和脂质体递送。转换的生物方法(即“转导”)包括使用工程病毒或微生物(例如,土壤杆菌)转移DNA。
如本文所用,术语“内含子”是指基因内的核苷酸序列,所述核苷酸序列通过RNA剪接从基因转录的RNA中去除(术语内含子用于指剪接之前在RNA分子中出现的RNA序列,以及在基因中出现的DNA序列。)。本文公开的内含子是天然存在于真核生物的核基因中的“剪接内含子”,并通过真核细胞的剪接机制(剪接体)剪接。还考虑了源自天然存在的内含子的内含子,例如与天然存在的内含子或其内部缺失的变体的序列至少65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的内含子,例如,从内含子边界内缺失1至1000bp的变体。还考虑了包含两个或更多个天然存在的内含子的内含子序列的嵌合内含子。内含子包括在5'端的GT(主要RNA转录物中的GU)、内含子3'端附近的分支位点序列和内含子3'端的AG受体位点。周围的外显子序列包括位于内含子5'边界处的GG和位于内含子3'端AG之后的G。这样的序列可以任选地在内含子插入位点被工程化为如本文提供的基因的编码序列。
如本文提供的内含子化的基因被工程化以包括至少一个异源内含子,即,在编码由工程基因编码的多肽的基因中非天然存在的至少一个内含子,并且在一些实施方案中,优选将内含子化的基因工程化以包括至少三个、至少四个或至少五个异源内含子,即,基因中非天然存在的至少三个、至少四个或至少五个内含子。例如,工程基因的氨基酸编码序列可编码并非由衍生异源内含子的基因编码的多肽。例如,利用基因工程或基因合成技术,将异源内含子插入到它们不天然存在的基因中。可以任选地改变工程基因的氨基酸编码序列,例如以产生紧邻异源内含子的序列,从而允许正确剪接引入的内含子和/或改变密码子用法(例如,以反映宿主的密码子偏好)和/或引入突变。在一些实施方案中,至少三个异源内含子源自一个或多个基因(除了衍生出所述工程基因的氨基酸编码序列的基因外),例如,至少三个外源内含子可以源自天然存在的内含子。在各种实施方案中,至少三个、至少四个或至少五个外源内含子可以是来自相同或不同有机体的另一基因(从中衍生出工程基因的氨基酸编码序列)的天然存在的内含子,或者可以例如,通过一个或多个序列修饰或从天然存在的内含子中的序列的内部缺失源自来自相同或不同有机体的另一基因(从中衍生出工程基因的氨基酸编码序列)的天然存在的内含子。在一些实施方案中,插入工程基因中的至少三个、至少四个或至少五个外源内含子均为同一基因的天然存在的内含子,并且在一些实施方案中,可以将同一天然存在基因的多个内含子以它们在衍生出它们的天然存在基因中出现的同一顺序引入工程基因中。在一些实施方案中,工程基因与启动子可操作地连接,并且启动子和外源内含子可以任选地衍生自同一有机体。在一些实施方案中,工程基因与启动子和终止子可操作地连接,并且启动子、终止子和外源内含子均可源自同一有机体,并且均可源自同一基因。进一步地,在各种实施方案中,可以对工程基因的氨基酸编码序列进行密码子优化,并且在一些示例中可以对密码子进行优化,以在衍生出外源内含子的有机体中表达。
表达盒
本文公开的表达盒包含一种或多种本文所述的调控元件,以驱动目的DNA的表达。这些盒包含DNA分子,所述DNA分子包含可操作地连接至目标DNA的本文所述的藻类硝酸还原酶或亚硝酸还原酶启动子序列中的任何一个,其中目的DNA位于启动子序列的下游,并且任选地本文所述的藻类硝酸还原酶或亚硝酸还原酶终止子序列中的任一个或其任何组合可操作地连接在目的DNA的下游。本发明的藻类硝酸还原酶和亚硝酸还原酶启动子可以与任何目的异源或同源DNA一起使用。在同源基因的情况下,这些启动子不与自然界中这些目的同源基因并置。因此,藻类硝酸还原酶和亚硝酸还原酶启动子不能调节自然界中这些目的同源基因的表达。目的DNA可以任选地包含异源内含子,即不是衍生出蛋白质或功能性RNA编码序列的基因的天然内含子。在一些实施方案中,表达盒可以整合到藻类细胞或有机体的基因组中。在一些实施方案中,整合通过细胞或有机体的转化而发生。
将两个或更多个DNA序列可操作地连接在一起的基本技术是本领域技术人员所熟悉的,并且这些方法已在许多标准分子生物学操作的教科书中进行了描述(例如,参见《分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual)》,第2版,美国冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),纽约冷泉港;Gibson等人;(2009)《自然方法(Nature Methods)》6:343-345)。
载体
本发明还提供了可以包含本文所述的调控元件和/或表达盒的载体。载体可以进一步任选地包含用于在细胞中复制的至少一个复制起点(“ORI”)序列。载体可进一步任选地包含一个或多个受一个或多个真核启动子控制的选择标记、一个或多个受一个或多个原核启动子控制的选择标记和/或一个或多个介导外源核酸序列重组到目标细胞基因组中的序列。在一些实施方案中,载体可以整合到藻类细胞或有机体的基因组中。在一些实施方案中,整合通过细胞或有机体的转化而发生。
另外,本文所述的载体还可以包含如上所述的选择标记。
选择标记基因可以可操作地连接至本文提供的启动子和/或在其控制下。调节选择标记的表达的启动子可以是条件性的或可诱导的,但优选是组成型的,并且可以是例如本文公开的任何启动子或另一个启动子。可替代地,可以将选择标记置于表达盒启动子的控制下。如果将选择标记置于表达盒启动子的控制下,则选择标记和表达盒可以与表达盒和选择标记之间的内部核糖体进入位点(“IRES”)元件(Komar&Hatzoglou(2011)《细胞周期(Cell Cycle)》10:229-240和Hellen&Samow(2001)《基因与发展(Genes&Dev.)》15:1593-1612,通过引用整体并入)或“2A”序列(Kim等人,(2011)美国公共科学图书馆(PLoS One)6(4):e18556,通过引用整体并入)可操作地连接。
转化方法
本发明还提供了转化方法,其中用本文所述的表达载体转化真核细胞。所述方法包括引入如本文提供的表达载体,所述表达载体包括至少一个如本文提供的启动子或DNA序列;然后选择转化体。可以通过本领域技术人员熟悉的许多方法来引入表达载体,包括美国专利10,041,079和美国专利申请公开第2017/0073695号中描述的那些方法,其全部内容通过引用并入本文。
藻类细胞可以是绿藻,诸如曲壳藻属、茧形藻属、双眉藻属、纤维藻属、星胞藻属、黄金色藻属、Bolidomonas属、Borodinella属、气球藻属、葡萄藻属、Bracteococcus属、角毛藻属、四鞭藻属、衣藻属、绿球藻属、绿梭藻属、小球藻属、蓝隐藻属、金球藻属、Cricosphaera属、隐甲藻属、隐藻属、小环藻属、杜氏藻属、Ellipsoidon属、圆石藻属、独球藻属、Ernodesmius属、裸藻属、真眼点藻属、披刺藻属、脆杆藻属、丽丝藻属、红球藻属、Halocafeteria属、异弯藻属、膜胞藻属、等鞭金藻属、鳞孔藻属、微芒藻属、单针藻属、微球藻属、微拟球藻属、舟形藻属、新绿藻属、肾鞭藻属、肾藻属、菱形藻属、棕鞭藻属、鞘藻属、卵囊藻属、蚝球藻属、巴夫藻属、拟小球藻属、帕氏藻属、Pelagomonas属、褐指藻属、噬菌体属、微绿藻属、扁藻属、颗石藻属、肋球藻属、原囊藻属、拟绿球藻属、拟新绿藻属、拟角星鼓藻属、塔胞藻属、桑椹藻属、栅列藻属、骨条藻属、Spyrogyra属、裂丝藻属、四爿藻属、海链藻属、黄丝藻属、无隔藻属、Viridiella属、魏氏藻属和团藻属。例如,使用本文提供的方法转化的真核细可胞以任选地是拟小球藻物种,诸如非限制性示例:凯氏拟小球藻、胡斯类拟小球藻(P.hussii)、贝氏拟小球藻(P.beijerinckii)、拟小球藻属CCAP 206/1或拟小球藻属pgu003.
在其他实施方案中,藻类细胞可以是任何真核微藻类,诸如但不限于绿藻类,Ochrophyte或轮藻类。在一些实施方案中,藻类可以是分类学绿藻纲(Chlorophyceace)、四爿藻纲(Chlorodendrophyceae)、青绿藻纲(Prasinophyceae)、共球藻纲(Trebouxiophyceae)或真眼点藻纲(Eustigmatophyceae)的绿藻。在一些实施方案中,藻类可以是绿藻纲的成员,诸如星胞藻属、纤维藻属、四鞭藻属、衣藻属、绿球藻属、绿梭藻属、Chlorodendrales属、Chloroellales属、Chrysosphaera属、杜氏藻属、红球藻属、单针藻属、新绿藻属、鞘藻属、Pelagomonas、肋球藻属联球藻属、桑椹藻属、栅列藻属、团藻属中的任何一种或多种的物种。其他实施方案中,藻类可以是四爿藻纲的成员,诸如绿枝藻属(Prasinocladus)、Scherffelia属或四爿藻属中的任何一个或多个属的物种。在进一步的替代实施方案中,藻类可以是青绿藻纲的成员,任选地是Ostreococcus属或微单胞藻属(Micromonas)中的任何一个或多个的物种。进一步可替代地,藻类可以是共球藻纲的成员,并且任选地是小球藻目的成员,并且任选地是选自葡萄球菌属、小球藻属、原壳藻属(Auxenochlorella)、Heveochlorella属、Marinicholella属、卵囊藻属、拟小球藻属、拟绿球藻属、四球藻属(Tetrachlorella)、独球藻属、披刺藻属、微芒藻属、微球藻属、微绿藻属、原囊藻属、裂丝藻属或Viridiella属中的任何一个或多个的属,或所有可能的属的组合或子组合。在另一个实施方案中,藻类是共球藻纲,小球藻目,卵囊藻科,小球藻科或真眼点藻纲的绿藻藻类,并且任选地选自卵囊藻、拟小球藻、微绿藻、微拟球藻和四爿藻中的一种或多种的藻类。藻类也可来自卵囊藻属、拟小球藻属或微绿藻属或四爿藻属,或来自所公开属的所有可能的组合和子组合中的任何一种。本文所述的任何藻类均可包含本发明的DNA分子或序列,诸如包含可操作地连接至目的DNA的藻类硝酸还原酶或亚硝酸还原酶启动子,如本文所述。
培养
可以将转化的藻类细胞培养物稀释,铺在琼脂上,使其生长,直到可以选择分离的菌落作为克隆菌株进一步繁殖。
以在诱导培养基(IM)中,例如在硝酸根离子或亚硝酸根离子的存在下培养转化的藻类细胞,从而诱导目的DNA的表达。转化的藻类细胞也可以在抑制性培养基(RM)中,诸如在铵盐的存在下培养,从而抑制目的DNA的表达。
另外,光合有机体可以混合营养培养,其中有机体在光的存在下在一天的至少一部分时间生长,并且还提供有一个或多个还原碳源。光合有机体可以混合营养生长一段时间,然后进行一段时间的光营养生长,反之亦然。
用于藻类的光养或混合营养生长的培养基是本领域已知的,并且可以对培养基进行优化以增强特定物种的脂肪酸产物的生长或产量。人造光源可用作唯一光源或增强或扩展自然光。
藻类的生长可以在开放区域中,诸如例如池塘、运河、河道、水道或水箱中,或者可以在生物反应器中。生物反应器对于混合营养生长是优选的,并且也可以用于光养生长。生物反应器可以具有任何尺寸和形式,并且可以包括用于提供营养物,添加剂或气体(诸如例如但不限于空气或CO2)的入口。生物反应器优选还具有用于培养物采样的出口。可以配置生物反应器,以便在生长期间混合藻类培养物,例如,通过培养物中的气体进行搅拌、摇动、震动、倒置、鼓泡等。室外池塘、水道、水箱、运河等也可以设计成用于混合培养物,例如,通过用于培养基循环的桨、泵、软管或喷嘴,或用于向培养物供应空气或CO2的管、软管或入口。
实施例
实施例1拟小球藻调控序列的鉴定
评价多个序列作为启动子或终止子的能力。基于野生型拟小球藻菌株WT-1185的基因组装配、RNA测序数据、隐马尔可夫模型分析、BLAST分析以及Pfam PF01077和PF03460的Pfam分析,对硝酸还原酶和亚硝酸还原酶基因两侧的基因间未翻译核酸序列进行启动子序列检测。
拟小球菌的Blast序列比对显示,最多的Pfam命中(PF01077和PF03460)均为亚硝酸/亚硫酸还原酶基因(图3)。拟小球菌菌株WT-1185中亚硝酸还原酶和硝酸还原酶基因在同一条染色体上的方向相反(图4)。在亚硝酸还原酶和硝酸还原酶基因的基因间区域中鉴定了亚硝酸还原酶和亚硝酸还原酶启动子(图4)。亚硝酸还原酶和亚硝酸还原酶终止子分别在亚硝酸还原酶和亚硝酸还原酶基因的3'-UTR区域中鉴定(图4)。
实施例2表达盒的产生
ParaCreXP载体构建体用于成功产生拟小球藻重组菌株(图5)。载体构建体包含用于选择标记博来霉素(Ble)、Cre重组酶和TurboGFP的表达盒。Ble和Cre基因针对拟小球藻密码子使用进行了优化,而TurboGFP直接从购自Evrogen(莫斯科,俄罗斯)的pTurboGFP-C扩增而来。Ble基因包含来自拟小球藻40S核糖体蛋白S4(RPS4)基因的5个内含子,受组成型RPS4启动子和终止子的控制。表达盒还包括绿色荧光蛋白(TurboGFP)报告基因。GFP基因的表达由组成型酰基载体蛋白(ACP)启动子和终止子调控。Cre编码序列(SEQ ID NO:53)包含N末端NLS(sv40)和来自拟小球藻亚硝酸还原酶(NIR)基因的6个内含子,并且受诱导型/抑制型NIR启动子和终止子的控制。Cre基因的表达由拟小球藻亚硝酸还原酶启动子(SEQ IDNO:1)和亚硝酸还原酶终止子(SEQ ID NO:2)调节。使用GibsonHiFi 1步试剂盒(合成基因组学,加利福尼亚州拉荷亚)将载体构建体从这些部分组装成puc19载体骨架。
实施例3通过电穿孔转换
用Ascl/Notl限制性内切酶线性化ParaCreXP载体构建体。使用如US20170073695A1中所述的转化方法,用线性化的载体转化拟小球藻WT-1185菌株,其通过引用整体并入本文。在AccuriTM C6细胞仪(BD生物科学,美国新泽西州富兰克林湖)上分析了几种在其基因组中包含随机整合构建体的拟小球藻转化体,以进行GFP荧光分析,并进行了Western Blot分析。
实施例4培养基配方和培养条件
诱导培养基(IM-NO3-)包含35g/L克水族盐10x F/2痕量金属和维生素,以及0.361mM NaH2PO4。N源是15mM NaNO3。抑制性培养基(RM-NH4+/NO3-)由与IM培养基相同的成分构成,但进一步补充有10mM NH4Cl并以15mM HEPES缓冲,pH 8.0。细胞在带有通气盖的培养瓶中,在装有1%CO2的生长室(25℃)中的定轨振荡器上培养3天,并在冷白色荧光灯的连续光(50μmol光子m-2s-1)下照明。
实施例5RNA提取和QRT-PCR
在IM或RM培养基中使菌株生长至OD730为2.0,并通过离心沉淀5ml培养物。将细胞沉淀物重悬于1.8ml提取液中(5ml的研磨缓冲液、5ml苯酚、1ml 1-溴-3-氯丙烷和20μL巯基乙醇,其中研磨缓冲液包含9ml的1M Tris(pH 8)、5ml 10%SDS,0.6ml 7.5M LiCl和450μl0.5M EDTA(最终体积为50ml),在200pm锆珠存在下于4℃剧烈涡旋5分钟。离心后,将1ml25:24:1苯酚萃取溶液(25ml苯酚(pH 8.1);24ml 1-溴-3-氯丙烷和1ml异戊醇)添加到另一个试管中的水相中。剧烈摇动试管,并以21,000g离心2分钟。用1ml 1-溴-3-氯丙烷重复萃取,并将所得水层用0.356体积的7.5M LiCl处理以在-20℃下将RNA沉淀过夜。LiCl沉淀后,将RNA沉淀物重悬于50μl H2O中,并根据制造商的说明(安捷伦科技公司,加利福尼亚州拉荷亚)使用2100生物分析仪通过芯片凝胶电泳评估RNA质量。
使用iScriptTM逆转录Supermix试剂盒(伯乐,加利福尼亚州赫拉克勒斯)制备cDNA,并用作SsofastTM Supermix(伯乐)的qRT-PCR模板。Cre的引物序列为F:5'-GATCTTTGAGGCAACACATCG-3'(SEQ ID NO:54);R:5'-AATGCTCACTCCAGCTCTTG-3'(SEQ IDNO:55)。评估了qRT-PCR引物的效率,并使用2-ΔΔCT方法评估针对根据经验确定在不同条件下具有较低变异系数的对照基因标准化的基因表达(EMRE3EUKT595283;引物序列为F:5'-GCCTTTGGTTATCGTGCTTTAG-3(SEQ ID NO:56);R:5'-TCCCTCCGATCCTTTACTCTC-3)(SEQID NO:57)。
qRT-PCR结果表明,重组拟小球藻细胞系中Cre的表达在硝酸根离子存在下被诱导,在铵离子存在下被抑制(图1)。
实施例6蛋白质免疫印迹
在IM或RM培养基中,将表达Cre的拟小球藻菌株生长至OD730为2.0,并通过离心沉淀5ml培养物。沉淀物用TBS缓冲液(50mM Tris-Cl(pH 7.6)、150mM NaCl)洗涤一次,然后重悬于300ml SDS-PAGE提取缓冲液中,所述缓冲液由125mM Tris(pH8.8)、10%甘油和2%SDS组成。将100μl锆珠添加到细胞浆液中,将细胞涡旋30秒,然后在85℃培养10分钟。在85℃的培养过程中,将裂解物再涡旋30秒,三次,然后离心并收集上清液。将上清液与样品缓冲液(赛默飞世尔科技公司,马萨诸塞州沃尔瑟姆)以3:1的比例混合,并在85℃培养10分钟,将25μl混合物上样至凝胶的每个孔中。对于CRE检测,使用4-12%Bis-Tris凝胶,并使用MOPS电泳缓冲液(running buffer)进行电泳。使用iBindTM蛋白质印迹设备(赛默飞世尔科技公司,马萨诸塞州沃尔瑟姆)将印迹与一抗和二抗一起培养。将CRE印迹与一抗(兔抗CRE,密理博,以1:1000稀释)和二抗(山羊抗兔AP,NovexTM,以1.5:1000稀释)培养。使用NovexTM AP显色底物BCIP/NBT试剂盒(赛默飞世尔科技公司,马萨诸塞州沃尔瑟姆)检测免疫信号。
比较了缺乏Cre基因的野生型菌株中硝酸盐、铵离子存在下Cre的表达。结果表明,Cre的表达在硝酸根离子的存在下被诱导,而在铵离子的存在下被抑制(图2)。
尽管已经参考以上实施例描述了本发明,但是应当理解,修改和变型包含在本发明的精神和范围内。因此,本发明仅由所附权利要求限定。
Claims (44)
1.一种基因工程藻类,包含DNA分子,所述DNA分子包含与编码多肽或功能性RNA的目的DNA可操作地连接的藻类硝酸还原酶或亚硝酸还原酶诱导型启动子,其中所述编码多肽或功能性RNA的目的DNA在自然界中不受启动子调控,并且其中所述DNA分子被整合到藻类基因组中。
2.根据权利要求1所述的基因工程藻类,其中所述藻类硝酸还原酶或亚硝酸还原酶诱导型启动子来自相同的藻类物种。
3.根据权利要求1至2中任一项所述的基因工程藻类,其中所述目的DNA编码多肽,并且其中所述多肽与所述藻类物种异源。
4.根据权利要求1至3中任一项所述的基因工程藻类,其中所述目的DNA包含至少一个内含子,其中所述内含子与所述编码多肽或功能性RNA的目的DNA异源。
5.根据权利要求1至4中任一项所述的基因工程藻类,其中所述目的DNA编码(a)与脂质生物合成相关的蛋白质、(b)脂肪酶、(c)参与光合作用的蛋白质、(d)与碳固定相关的蛋白质、(e)转运蛋白、(f)脱氢酶、(g)转录因子、(h)转录激活剂、(i)细胞信号蛋白、(j)酶、(k)报告蛋白、(l)选择标记或(m)重组酶。
6.根据权利要求5所述的基因工程藻类,其中所述目的DNA编码Cre重组酶。
7.根据权利要求1至6中任一项所述的基因工程藻类,其中所述藻类硝酸还原酶或亚硝酸还原酶诱导型启动子包含与选自由SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47和49组成的群组中的序列的至少100个连续核苷酸具有至少80%同一性的核苷酸序列。
8.根据权利要求1至7中任一项所述的基因工程藻类,其中所述DNA分子进一步包含与所述编码多肽或功能性RNA的目的DNA可操作地连接的终止子序列。
9.根据权利要求8所述的基因工程藻类,其中终止子包含与选自由SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48和50组成的群组中的序列的至少75个连续核苷酸具有至少80%同一性的序列。
10.根据权利要求1至9中任一项所述的基因工程藻类,其中所述突变藻类属于选自由以下组成的群组中的属:曲壳藻属(Achnanthes)、茧形藻属(Amphiprora)、双眉藻属(Amphora)、纤维藻属(Ankistrodesmus)、星胞藻属(Asteromonas)、黄金色藻属(Boekelovia)、Bolidomonas属、Borodinella属、气球藻属(Botrydium)、葡萄藻属(Botryococcus)、Bracteococcus属、角毛藻属(Chaetoceros)、四鞭藻属(Carteria)、衣藻属(Chlamydomonas)、绿球藻属(Chlorococcum)、绿梭藻属(Chlorogonium)、小球藻属(Chlorella)、蓝隐藻属(Chroomonas)、金球藻属(Chrysosphaera)、Cricosphaera属、隐甲藻属(Crypthecodinium)、隐藻属(Cryptomonas)、小环藻属(Cyclotella)、杜氏藻属(Dunaliella)、Ellipsoidon、圆石藻属(Emiliania)、独球藻属(Eremosphaera)、Ernodesmius、裸藻属(Euglena)、真眼点藻属(Eustigmatos)、披刺藻属(Franceia)、脆杆藻属(Fragilaria)、丽丝藻属(Gloeothamnion)、红球藻属(Haematococcus)、Halocafeteria属、异弯藻属(Heterosigma)、膜胞藻属(Hymenomonas)、等鞭金藻属(Isochrysis)、鳞孔藻属(Lepocinclis)、微芒藻属(Micractinium)、蒜头藻属(Monodus)、单针藻属(Monoraphidium)、微球藻属(Nannochloris)、微拟球藻属(Nannochloropsis)、舟形藻属(Navicula)、新绿藻属(Neochloris)、肾鞭藻属(Nephrochloris)、肾藻属(Nephroselmis)、菱形藻属(Nitzschia)、棕鞭藻属(Ochromonas)、鞘藻属(Oedogonium)、卵囊藻属(Oocystis)、蚝球藻属(Ostreococcus)、巴夫藻属(Pavlova)、拟小球藻属(Parachlorella)、帕氏藻属(Pascheria)、Pelagomonas属、褐指藻属(Phaeodactylum)、噬菌体属(Phagus)、微绿藻属(Picochlorum)、扁藻属(Platymonas)、颗石藻属(Pleurochrysis)、肋球藻属(Pleurococcus)、原囊藻属(Prototheca)、拟绿球藻属(Pseudochlorella)、拟新绿藻属(Pseudoneochloris)、拟角星鼓藻属(Pseudostaurastrum)、塔胞藻属(Pyramimonas)、桑椹藻属(Pyrobotrys)、栅列藻属(Scenedesmus)、骨条藻属(Skeletonema)、Spyrogyra属、裂丝藻属(Stichococcus)、四爿藻属(Tetraselmis)、海链藻属(Thalassiosira)、黄丝藻属(Tribonema)、无隔藻属(Vaucheria)、Viridiella、魏氏藻属(Vischeria)和团藻属(Volvox)。
11.一种包含DNA分子的表达盒,所述DNA分子包含与编码多肽或功能性RNA的目标DNA可操作地连接的藻类硝酸还原酶或亚硝酸还原酶诱导型启动子,其中所述编码多肽或功能性RNA的目的DNA在自然界中不受启动子的调控,其中所述目的DNA编码(a)与脂质生物合成相关的蛋白质、(b)脂肪酶、(c)参与光合作用的蛋白质、(d)与碳固定相关的蛋白质、(e)转运蛋白、(f)脱氢酶、(g)转录因子、(h)转录激活剂、(i)细胞信号蛋白、(j)代谢酶、(k)报告蛋白、(l)选择标记、(m)重组酶、n)反义序列、(o)shRNA、(p)siRNA、(q)gRNA或(r)核酶。
12.根据权利要求11所述的表达盒,进一步包含与所述编码多肽或功能性RNA的目的DNA可操作地连接的终止子序列。
13.根据权利要求11至12中任一项所述的表达盒,其中所述藻类硝酸还原酶或亚硝酸还原酶诱导型启动子包含与选自由SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47和49组成的群组中的序列的至少100个连续核苷酸具有至少80%同一性的核苷酸序列。
14.根据权利要求12所述的表达盒,其中终止子包含与选自由SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48和50组成的群组中的序列的至少75个连续核苷酸具有至少80%同一性的序列。
15.根据权利要求11至14中任一项所述的表达盒,其中所述编码多肽或功能性RNA的DNA分子包含至少一个内含子,其中所述内含子与所述编码多肽或功能性RNA的目的DNA异源。
16.一种在藻类细胞中选择性表达目的DNA的方法,包括:
a)用分离的DNA分子转化藻细胞,所述DNA分子包含与所述编码目的DNA的目的DNA可操作地连接的藻类硝酸还原酶或亚硝酸还原酶诱导型启动子,其中所述编码目的DNA的目的DNA在自然界中不受启动子调控以产生转化的藻类细胞;和
b)使所述转化的藻类细胞在培养基中生长,所述培养基选择性允许在所述藻类细胞中表达所述目的DNA。
17.根据权利要求16所述的方法,其中所述分离的DNA分子通过粒子轰击引入。
18.根据权利要求16所述的方法,其中所述分离的DNA分子通过电穿孔引入。
19.根据权利要求16至18中任一项所述的方法,其中启动子序列是亚硝酸还原酶,并且其中所述藻类细胞在包含硝酸盐的培养基中生长,其中诱导所述目的DNA的表达。
20.根据权利要求16至18中任一项所述的方法,其中启动子序列是亚硝酸还原酶,并且其中所述藻类细胞在包含铵盐的培养基中生长,其中抑制所述目的DNA的表达。
21.根据权利要求16至20中任一项所述的方法,其中所述目的DNA编码(a)与脂质生物合成相关的蛋白质、(b)脂肪酶、(c)参与光合作用的蛋白质、(d)与碳固定相关的蛋白质、(e)转运蛋白、(f)脱氢酶、(g)转录因子、(h)转录激活剂、(i)细胞信号蛋白、(j)代谢酶、(k)报告蛋白、(l)选择标记、(m)重组酶、n)反义序列、(o)shRNA、(p)siRNA、(q)gRNA或(r)核酶。
22.根据权利要求16至21中任一项所述的方法,其中所述藻类硝酸还原酶或亚硝酸还原酶诱导型启动子包含与选自由SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47和49组成的群组中的序列的至少100个连续核苷酸具有至少80%同一性的核苷酸序列。
23.根据权利要求19至22中任一项所述的方法,其中所述DNA分子包含与所述目的DNA可操作地连接的终止子序列。
24.根据权利要求23所述的方法,其中终止子包含与选自由SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48和50组成的群组中的序列的至少75个连续核苷酸具有至少80%同一性的序列。
25.根据权利要求16至24中任一项所述的方法,其中所述编码目的DNA的DNA分子包含至少一个内含子,其中所述内含子与所述目的DNA异源。
26.一种分离的DNA分子,包含与编码多肽或功能性RNA的目标DNA可操作地连接的藻类硝酸还原酶或亚硝酸还原酶诱导型启动子,其中所述编码多肽或功能性RNA的目的DNA在自然界中不受启动子的调控。
27.根据权利要求26所述的分离的DNA分子,包含终止子。
28.根据权利要求25至27中任一项所述的分离的DNA分子,其中所述终止子与所述启动子来自相同物种。
29.根据权利要求28所述的分离的DNA分子,其中所述终止子包含与选自由SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48和50组成的群组中的序列的至少75个连续核苷酸具有至少80%同一性的序列。
30.根据权利要求25至29中任一项所述的分离的DNA分子,其中所述启动子包含与选自由SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47和49组成的群组中的序列的至少100个连续核苷酸具有至少80%同一性的核苷酸序列。
31.根据权利要求26至30中任一项所述的分离的DNA分子,其中所述编码多肽或功能性RNA的目的DNA与所述启动子序列异源。
32.根据权利要求26至30中任一项所述的分离的DNA分子,其中所述编码多肽或功能性RNA的目的DNA和启动子来自相同的藻类物种,其中所述目的DNA和所述启动子在自然界中并不并置。
33.根据权利要求31所述的分离的DNA分子,其中所述编码多肽或功能性RNA的目的DNA包含至少一个内含子,其中所述内含子与所述编码多肽或功能性RNA的目的DNA异源。
34.根据权利要求33所述的分离的DNA分子,其中所述至少一个异源内含子衍生自与所述启动子相同的物种。
35.根权利要求33至34中任一项所述的分离的DNA分子,包含至少三个异源内含子。
36.根权利要求35所述的分离的DNA分子,包含至少五个异源内含子。
37.根据权利要求35所述的分离的DNA分子,其中所述至少三个异源内含子来自与所述启动子相同的物种。
38.根据权利要求37所述的分离的DNA分子,其中所述至少三个异源内含子衍生自同一基因。
39.根据权利要求38所述的分离的DNA分子,其中所述至少三个异源内含子和所述启动子衍生自同一基因。
40.根据权利要求26至39中任一项所述的分离的DNA分子,其中所述目的DNA编码选自由反义序列、微小RNA、shRNA、siRNA、gRNA和核酶组成的群组中的功能性RNA。
41.根据权利要求26至39中任一项所述的分离的DNA分子,其中所述启动子和所述终止子来自相同的的基因。
42.根据权利要求26至39中任一项所述的分离的DNA分子,其中所述启动子和所述终止子来自不同基因。
43.根据权利要求41所述的分离的DNA分子,其中所述目的DNA编码(a)与脂质生物合成相关的蛋白质、(b)脂肪酶、(c)参与光合作用的蛋白质、(d)与碳固定相关的蛋白质、(e)转运蛋白、(f)脱氢酶、(g)转录因子、(h)转录激活剂、(i)细胞信号蛋白、(j)酶、(k)报告蛋白、(l)选择标记或(m)重组酶。
44.根据权利要求43所述的分离的DNA分子,其中所述目的DNA编码Cre重组酶。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862782152P | 2018-12-19 | 2018-12-19 | |
US62/782,152 | 2018-12-19 | ||
PCT/US2019/067127 WO2020132036A1 (en) | 2018-12-19 | 2019-12-18 | Inducible expression of genes in algae |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113166774A true CN113166774A (zh) | 2021-07-23 |
Family
ID=71096812
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980076484.9A Pending CN113166774A (zh) | 2018-12-19 | 2019-12-18 | 藻类基因的诱导表达 |
Country Status (7)
Country | Link |
---|---|
US (2) | US11162106B2 (zh) |
EP (1) | EP3898989A4 (zh) |
CN (1) | CN113166774A (zh) |
AU (1) | AU2019401608A1 (zh) |
IL (1) | IL284049A (zh) |
MX (1) | MX2021007193A (zh) |
WO (1) | WO2020132036A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108026504A (zh) * | 2015-07-14 | 2018-05-11 | 合成基因组股份有限公司 | 脂质产率增加的微生物 |
CN115040446A (zh) * | 2022-06-24 | 2022-09-13 | 曾会明 | 一种sod植物提取物护肤组合物、护肤品及其制备方法 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020132036A1 (en) * | 2018-12-19 | 2020-06-25 | Synthetic Genomics, Inc. | Inducible expression of genes in algae |
US11434493B2 (en) | 2020-02-05 | 2022-09-06 | Viridos, Inc. | Regulatory sequences for expression of transgenes |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170073695A1 (en) * | 2014-12-31 | 2017-03-16 | Synthetic Genomics, Inc. | Compositions and methods for high efficiency in vivo genome editing |
US20170178451A1 (en) * | 2007-08-04 | 2017-06-22 | David Nissen | Gaming chips and table game security system |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070261129A1 (en) * | 2000-04-03 | 2007-11-08 | Andersen Scott E | Nucleic acid molecules and other molecules associated with plants |
US20070178451A1 (en) * | 2001-08-02 | 2007-08-02 | Molian Deng | Nucleic acid sequences from Chlorella sarokiniana and uses thereof |
WO2020132036A1 (en) * | 2018-12-19 | 2020-06-25 | Synthetic Genomics, Inc. | Inducible expression of genes in algae |
-
2019
- 2019-12-18 WO PCT/US2019/067127 patent/WO2020132036A1/en unknown
- 2019-12-18 CN CN201980076484.9A patent/CN113166774A/zh active Pending
- 2019-12-18 US US16/719,013 patent/US11162106B2/en active Active
- 2019-12-18 MX MX2021007193A patent/MX2021007193A/es unknown
- 2019-12-18 EP EP19899121.8A patent/EP3898989A4/en active Pending
- 2019-12-18 AU AU2019401608A patent/AU2019401608A1/en active Pending
-
2021
- 2021-06-15 IL IL284049A patent/IL284049A/en unknown
- 2021-10-12 US US17/499,774 patent/US20220025390A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170178451A1 (en) * | 2007-08-04 | 2017-06-22 | David Nissen | Gaming chips and table game security system |
US20170073695A1 (en) * | 2014-12-31 | 2017-03-16 | Synthetic Genomics, Inc. | Compositions and methods for high efficiency in vivo genome editing |
Non-Patent Citations (3)
Title |
---|
JACKSON ET AL.,: ""An inducible expression system in the algaNannochloropsis gaditanacontrolled by the nitrate reductase promoter"", 《JOURNAL OF APPLIED PHYCOLOGY》, vol. 31, no. 1, pages 269 - 279, XP036701433, DOI: 10.1007/s10811-018-1510-6 * |
JOHN VERRUTO ET AL.,: ""Unrestrained markerless trait stacking in Nannochloropsis gaditana through combined genome editing and marker recycling technologies"", 《PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES》, vol. 15, no. 30, pages 7015 * |
Y.F. NIU ET AL.,: ""A new inducible expression system in a transformed green alga, Chlorella vulgaris"", 《GENETICS AND MOLECULAR RESEARCH》, vol. 10, no. 4, pages 3431 - 3432 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108026504A (zh) * | 2015-07-14 | 2018-05-11 | 合成基因组股份有限公司 | 脂质产率增加的微生物 |
CN115040446A (zh) * | 2022-06-24 | 2022-09-13 | 曾会明 | 一种sod植物提取物护肤组合物、护肤品及其制备方法 |
Also Published As
Publication number | Publication date |
---|---|
US20200199607A1 (en) | 2020-06-25 |
US20220025390A1 (en) | 2022-01-27 |
AU2019401608A1 (en) | 2021-07-29 |
US11162106B2 (en) | 2021-11-02 |
IL284049A (en) | 2021-08-31 |
EP3898989A4 (en) | 2022-12-14 |
WO2020132036A1 (en) | 2020-06-25 |
EP3898989A1 (en) | 2021-10-27 |
JP2022514603A (ja) | 2022-02-14 |
MX2021007193A (es) | 2021-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113166774A (zh) | 藻类基因的诱导表达 | |
US8709766B2 (en) | Use of endogenous promoters in genetic engineering of Nannochloropsis gaditana | |
AU2012396282B2 (en) | Tetraselmis promoters and terminators for use in eukaryotic cells | |
US10612034B2 (en) | Promoters and terminators for use in eukaryotic cells | |
US10041079B2 (en) | Compositions and methods for expressing genes in algae | |
Tran et al. | Achievements and challenges of genetic engineering of the model green alga Chlamydomonas reinhardtii | |
WO1997039106A1 (en) | Methods and tools for transformation of eukaryotic algae | |
Kang et al. | Heterologous overexpression of sfCherry fluorescent protein in Nannochloropsis salina | |
Koh et al. | Advanced multigene expression system for Nannochloropsis salina using 2A self-cleaving peptides | |
US20140234904A1 (en) | Method for harvesting photosynthetic unicells using genetically induced flotation | |
US9506072B2 (en) | Regulated gene expression systems and constructs thereof | |
JP7507156B2 (ja) | 藻類における遺伝子の誘導発現 | |
US9309523B2 (en) | Nannochloropsis kozak consensus sequence | |
EP4032982A1 (en) | Novel promoter hasp1 of phaeodactylum tricornutum and signal peptide thereof, and use thereof | |
Hasnain et al. | A strategy of TaDof1 cassette development in plant expression vector to enhance nitrogen assimilation in wheat. | |
Genot et al. | Transformation of the symbiotic alga Oophila amblystomatis: a new tool for animal-algae symbiosis studies | |
EP2855699B1 (en) | Promoters and terminators for use in eukaryotic cells | |
BR122024004319A2 (pt) | Proteína de fusão compreendendo uma proteína cas9 e uma proteína spo11, e célula hospedeira compreendendo a proteína de fusão |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |